过去几年中,越来越多的研究表明了分析人类大脑实时活动和将大脑的状态转换为动作控制的可能性,例如从虚拟键盘中选择一个字母或者移动一个机器人设备。这些研究包括介入方式(需要用电极植入大脑)或者采用BCI同步数据通信协议。本节描述了一种便携式非插入式的大脑——计算机BCI技术,它可以使用虚拟键盘对迷宫式家居环境中的移动式机器人进行控制。BCI是异步工作的(即人脑发出自我调节的命令,控制一个大脑意识任务转向下一个任务)。使用8个表面电极来测量脑电信号,并采用一个统计分类器从这些脑电信号中识别三种不同的大脑意识状态。这里给出了五位志愿者在他们和移动式机器人以及虚拟键盘之间脑控交互试验的结果。志愿者中的两位志愿者成功地在几个区域里移动了机器人,另外三位志愿者(其中有一位患有脊髓肌肉萎缩症)采用虚拟键盘进行了BCI的信息控制。
1.概述
BCI技术对于身体残疾的人们操作计算机非常重要。大脑的状态可以被测量并控制动作,例如从一个虚拟键盘选择一个字母或者移动一个机器手臂。BCI技术可以通过一系列的方法监控大脑活动,这些方法可以粗略地分为介入式和非介入式。大部分非介入式的脑机接口系统使用EEG信号,与电相关的大脑活动由位于头皮的电极记录下来。脑电信号的主要来源是成千上万个头皮神经元的同步活动。测量脑电信号是一种简单的非介入的监控大脑电信号活动的方式,但是它不能提供单个神经元(或者小的脑区)活动的详细信息。此外,它具有小信号振幅(几微伏)和噪声测量(尤其在不具有屏蔽的屋里记录时)的特征。
除了电活动,神经元活动也产生其他类型的信号,例如电磁和新陈代谢信号,这些可以在BCI中使用。电磁场可以被脑磁描记法记录,而新陈代谢活动——反映在血液流动的变化中——可以被正电子发射断层扫描、核磁共振成像和光学成像观察到,但是这些可选技术要求非常复杂的设备,这些设备只能在专业的研究室里操作。此外,测量血液流动的技术需要很长的反应时间,并且它们不太适合用于BCI技术。
在介入式的脑机接口系统中,单个神经元的活动(它们的峰值形成速率)由植入脑中的微电极记录。在一些对老鼠和猴子的试验中,研究人员监控到与运动执行和计划的相关皮层的不同区域——运动神经、运动前区和后顶叶皮层。从一个对神经元总体活动的实时分析中得出,测定动物的运动意图,预知猴子运动的轨迹,并且驱动一个计算机光标到预定位置是可能的。在人类患者中,迈向介入式方法的第一步已经完成。其中一个病人最终能够驱动光标并书写信息。
考虑到永久外科植入式BCI设备在大脑中产生的风险和相关的伦理关系,最好只采用非介入方式进行脑电信号的测量,尤其是由脑电图测量的大脑电信号。对于确定的刺激,例如闪过的图像和光,脑电图显示出一个明显的特征信号,也就是所谓的唤醒电位,它反映了大脑对这些外部刺激的即时响应。从理论上讲,唤醒电位容易被头部电极捕捉,而且已经在BCI技术中得到应用。然而研究外部刺激的必要性在很大程度上限制了唤醒电位的应用。对于BCI技术,一个更自然和合适的方法是分析与自发的“有意识的”精神活动相关的成分。因此,一些学者从头皮顶部测量不活跃脑皮层的电位,这种电位的振幅与一个特定皮层网络的整体的预备兴奋度有关。其他的团体则关注局部的EEG律动变化。一个独特且重要的EEG律动能从某些头皮的中心区域记录下来,这些头皮覆盖在想象身体运动时的感觉皮层之上。但是,除了与动机相关的律动,其他的精神认知活动也正在探测中。对于生物认知的研究可以采用多种方法,例如几何图形的旋转、算术运算和语言表达等模式。
目前基于EEG的BCI受到容量和速度的限制,在控制快速和复杂的活动序列时响应速度不够快。而且基于EEG的控制任务也只局限于一些简单的操作,例如移动鼠标指针到显示屏的边角处或打开手矫形器。本节给出的志愿者能够在短短的几天内学会操作能够识别三种精神状态的基于EEG的便携式BCI设备。两位志愿者仅靠意识成功地控制在几个区域之间走迷宫的机器人,而且大脑意识控制的效果与手动控制相差无几。在第二个大脑控制的互动演示中,描述了一个能使人们从一个虚拟键盘上选择字母和书写信息的通信工具。给出了三个志愿者使用虚拟键盘的报告,一个熟练的和两个初级的。其中一名熟练的用户已经可以连续使用虚拟键盘几个月,而初学者则在一天内就完成了训练。其中一位志愿者患有脊椎肌肉萎缩症。
2.BCI数据通信协议
目前基于EEG的大脑—计算机交互设备受到速度低的限制,大部分系统的数据传输速度都低于0.5bit/s。其中一个主要原因是它们采用的是同步数据通信协议。在这种协议下,对于每4~10s重复一次的整齐的外部刺激,EEG的周期是固定的,BCI的响应是这一时期的平均结果。从准确了解大脑活动状态和与背景EEG活动有关的差异来讲,这种同步数据通信协议有助于EEG的分析。但是由于速度太慢而且BCI系统从测量EEG的电信号中只能识别两种大脑活动状态,所以使用一种异步的数据通信协议来分析检测人们精神状态的EEG信号,可以在任何时候自由地改变而不用等待外部的刺激。这种快速的异步BCI技术,响应时间可以达到0.5s。处理速度在理论上能够达到1~1.5bit/s。
电极的放置是根据国际标准10-20系统。EEG系统需要从灰色表示的8个前部-中央-顶骨电极中获得大脑电信号。所有的信号都参照耳联参考值(从两个耳垂中测量的平均电位)记录下来。
EEG电位被记录在8个标准前部-中央-顶骨部位F3、F4、C3、Cz、C4、P3、Pz和P4,如图2-19所示。参与测试的志愿者们戴上装好电极(如图2-21中所示的小圆环)的帽子。采样率为128Hz。原始的EEG电位过于嘈杂而且易变,不易直接测量,因此第一步应该对它们进行预处理来增加它们的信噪比和提取相关的特征,使它更好地用于描述识别的大脑思维状态。原始的EEG电位首先要经过表层拉普拉斯(SL)算法变换。首先给第二种次序的球形键槽插值,然后计算第二个对局部化的电位活动的来源灵敏空间导数。它可从上述8个电极位置计算出来。通常,SL算法变换需要通过大量电极信号来进行计算,但是有人指出,对于BCI的操作,不论大量还是少量电极信号得出的SL波形在统计上都产生相似的分级结果。还有人比较了在使用很少电极信号时计算SL的不同方法。用于BCI操作的在原始电位上SL算法变换的优越性是明显的。
图2-19 大脑EEG测量的电极配置
从8个SL算法变换的电极信号所提取的特征是在时域傅里叶变换的基础上得到的。使用韦尔奇周期图算法来测定每一个信道的最终功率频谱。可以明确地将快速傅里叶变换(FFT)以0.5s平均分为3段(各段间有50%的重叠),得到了2Hz的频率分辨率。这个值在8~30Hz的频谱下根据在波段上总能量被标准化。因而,一个EEG样本有96个特征(8通道乘以12个组件)。EEG样本运算每62.5ms一次(每秒运算16次)。采用异步数据通信协议,可以更好地表现周期图特征。
图2-20所示为在位置C3和C4以及与它们相应周期图特征下测得的1s的原始EEG信号的两个例子。这两个例子都是间隔3s,而志愿者“B”是连续地执行“向左”的大脑命令。图2-20表明了以下两点:首先,除了原始EEG信号的易变性,它们的周期图特征相当稳定;其次,除了通道C3和C4被定位在大脑的左、右运动神经区外,它们各自的暂时动作与想象的单手动作非常相似(在这个事例中为左手)。这表明在这个任务中,EEG信号的空间立体解决方法是相当低水平的,因而EEG不同差别的能量与电极数量不成比例。
在大脑位置C3和C4测得的两个典型的原始EEG信号的例子如图2-20所示和图中所有波段的周期内的总结果(能量2Hz)是统计分类器的输入。这里,有五位志愿者作为被测试对象参加了研究,其中四位是健康的(志愿者A、B、C和D),而第五位患有脊骨肌肉萎缩症(志愿者E)。脊骨肌肉萎缩症是骨头和肌肉的发育受到损伤,他只能有限地控制他的右手。志愿者A和B用BCI控制走迷宫机器人,而志愿者C、D和E通过虚拟键盘进行交流。
图2-20 在大脑位置C3和C4测得的EEG信号与周期图
a)原始EEG信号 b)周期图
为了与被大脑控制的走迷宫机器人或虚拟键盘进行交互,志愿者经过了最初训练阶段,从几小时(志愿者D和E)到几天(志愿者A、B和C),在这里,他们学习控制所选的三个大脑智力任务。这些任务包括放松、想象肢臂的运动、想象一个旋转、执行一个固定数的减法运算(如64-3=61、61-3=58等)、用同样的字母构造单词。三个志愿者(C、D和E)闭上眼睛放松,而志愿者A和B(他们是控制智能走迷宫机器人的)睁着眼睛放松。所有其他任务都是睁着眼睛进行大脑控制。片刻评估之后,志愿者B选择做三个联系到一块的任务,即放松-向左-向右,而另四个志愿者选择放松-向左-空间的任务组合。然后将这些智力任务编为1号、2号和3号(也即,放松是1号,向左是2号,向右或空间是3号)。没有一个志愿者事先经过BCI或智力训练。
每天,志愿者参加四个连续的训练段(除了志愿者E做了7个训练段),每段为5s,间隔是5~10min。在每个训练中,志愿者每10~15s在三个任务中随机交换。志愿者通过计算机显示屏上的彩色按钮在线接收反馈信息。每个按钮连接一个可识别的智力任务。当一个EEG样本被归类到相应的智力任务时,一个按钮闪亮。每个训练后的统计分类数据被离线最优化。在初始训练后,志愿者学会用大脑意识控制走迷宫机器人(志愿者A、B)或者虚拟键盘(志愿者C、D和E)。在训练期间,他们两人一组彼此适应来准备实验。
3.统计分类器
采用一个高斯分类器把大脑智力任务(或类别)进行分类识别,对于上面讲到的1号,2号,3号或“不可知”的EEG样本,这种分类器胜过支持向量机和动态过程神经网络方法。
在这种分类统计中,每一个高斯单元代表了一个需要组织的分类的原型。它的输出是为一个EEG例子给出后面分类的可能分布的估计。算法的研究就是找出合适的中心和在高斯空间中各个分类的高斯单元的适用区间。
尽管混合高斯单元的方法大家都很熟悉,假设类的状态密度功能函数Ck是个关于Nk高斯原型的过电势元素。这些分类单元可能有相同的优先性。在这个例子中,所有的分类有相同数目的原型,共有四个。还有,假设所有的四个原型有相同的权重。然后,丢掉常量组,结果yk变量x的方程是
式中,Nc是分类的数量aik激活了Ck的第i个原型。
式中,μik相应了分类Ck第i个原型的中型;Σk是分类Ck的协方差矩阵;|Σk|是矩阵的值。这里,Σk对所有的分类原型来说都是斜三角矩阵。减少了变量的个数同时,增加了这些变量估计值的精度。
这种计算例子x的方法得到的结果是分类Ck通过最大可能的数据,这说明哪些数据要比给定可能的极限要大一些。或者说,结果是不太清楚的。这种拒绝判定保持较少数量的错误,因为从大量的错误中恢复会导致大量的费用。选择这个可能的极限是由前一段时间一个BCI研究小组提出的,他们对志愿者进行了初步训练,实际的数值是基于志愿者进行初期训练过程中的表现提出的。特别地有A和B可能的极限为0.85,C为0.9,D和E为0.75。
为开始设计原型中心和分类Ck的协方差矩阵,运行了一个叫Clustering Algorithm的软件来计算需要原型的数目和位置。然后,初始值的协方差矩阵是
式中,Sk表示Ck类测试例子的数量;i(n)是这种分类与例子xn最近的原型。
因为μki可以解释为原型的单元,在训练当中,把它移向了EEG例子中它们表现出来的心理工作。为了防止有其他因素影响原型单元,把EEG中其他的工作移走了。特别是为了使每个例子x都在训练项目中,所有分类的原型的更新原则是符合下列式子:
式中,a是学习效率;tk是目标段第k个组件;A是整个网络所有的活动。
在反复试验以后,使用式(2-3)重新估计了一下Σk的值。可以通过很多精确的方式估计协方差矩阵的值,包括通过梯度递减的方法,这样能够起到最小化错误的功能,但这里没有这样做。
人脑与计算机交互是每0.5s进行一次,开始这能够满足为每个类计算出分类状况的能力。然后把分类状况能力均分在8个连续的例子中,它能通过使用贝叶斯公式计算得到的平均分类状况能力来估计后期的能力。它能用得到的后期能力与可信的边界进行对比。在训练后期,错误和未知情况大约在5%~30%之间。下面是使用前期分类训练过的数据进行一次新网络上的测试的结果。理论上的频道接口容量大约在1bit/s左右。接口也可以运行在另外一种模式(模式Ⅱ)下,这种模式中,通过使用2个或3个连贯的0.5s的相应阶段发出相同的分类,可以使分类错误大大地降低。在模式Ⅱ中,错误或者未知情况在2%~40%之间,可信的是,理论的信道能力大约在1bit/s(2个连续的响应)或者0.6bit/s(3个连续的响应)。
4.大脑控制的走迷宫机器人
这项工作是驱动机器人走迷宫。走迷宫机器人是一个直径5.7cm双轮小车。机器人以每秒1/3直径的速度移动,这种速度差不多和一个轮椅在办公大楼里的移动速度相近。
在图2-21所示的一次实验中,一个志愿者通过意识操纵机器人穿过环境中的不同区域。
(1)设置和控制机器人 为了使机器人沿着预期的路线移动,需要确定电动机速度,以控制小车前进的每一步。显然,仅仅依靠三条大脑意识指令是不可能完成的。一个关键的控制策略是操纵者的大脑意识状态和高水平的指令相关联(例如,“在下一个地方右拐”),这样机器人通过依据传感器的信号执行相应的指令。另一个对机器人控制的想法是志愿者可以在任意时刻发出指令。这是因为对BCI的操作是异步的,和同步方式不同,它不要求等待外部指令,机器人能够自主执行一个高水平的指令,直到接收到了下一条指令。
图2-21 大脑控制走迷宫机器人实验
走迷宫机器人依靠一个基于BCI输出信号的控制器来执行指令,以保证避开障碍物和平滑转弯。在这种控制器中,需要经常读取传感器信号,并确定下一个要做的动作。志愿者的大脑意识状态(或者命令)到机器人动作的映射并不是简单的一一对应,为了达到对机器人更灵活的控制,对一个有6种动作状态的自动控制,大脑活动状态只是它的一个输入。动作之间的转换取决于3个大脑活动状态(1号、2号、3号)、6个关于环境的感知状态(机器人的感知信息:左墙、右墙、前方的墙或者障碍物、左方的障碍物、右方的障碍物,以及无遮挡空间)和一些内部存储器变量。图2-22给出了一个简化了的机器人控制的6种动作转换。正确地实现不同的动作需要存储变量。因此,如果机器人正在执行“向前”这个动作,并且感觉到左方的墙,它会自动切换到“沿左墙移动”这个动作。对“向前”这个动作的转换是必需的,例如,如果机器人接近了一个开着的门而志愿者不想让机器人进入该区域。另一方面,机器人一旦它感觉到前方有障碍物,以避免发生碰撞而需要“停止”(图中为了简化,并没有给出所有对“停止”这个动作的转换)。对大脑一个思维状态的解释取决于机器人的感知状态。因此,在一个空旷的地方,大脑思维状态2号代表“左转”,而如果在左边检测到有墙,这个相同的大脑思维状态会被解释为“沿左墙移动”。类似地,大脑思维状态3号代表“右转”或者“沿右墙移动”;大脑思维状态1号总是意味着“向前移动”。总而言之,志愿(操纵)者觉得这种控制策略简单并且使用起来很直观,因为每一个大脑思维状态与一类动作相关联(例如,种类“向左”),且感知状态决定子种类(例如,大脑指令“向左”有“左转”或者“沿左墙移动”)不同状态。
图2-22 机器人控制的6种动作转换
图2-22中的6个动作之间的转换取决于3个大脑思维状态(1号、2号、3号)、6个传感器感知状态(|o:左墙,o|:右墙,:前方有墙或者障碍物)和部分存储器变量。
走迷宫机器人是一个双轮车。在它的直径周围有8个红外线传感器用来检测障碍物。这些传感器的监测距离有限,这使得从未经加工的信息中识别不同状态有些困难。为了提高性能,采用多层感知器把8个红外线传感器的未经加工的信息映射到相应的感知状态。对这个神经系统的分类器,采用斜率的导数进行脱机训练来估计一个感知样本分配给6个感知状态表中每一个状态的概率。训练的样本(每一个感知状态有500个)通过在已知的环境中随机放置机器人定位产生。(www.daowen.com)
一个端元素是使用一个合适的反馈来显示当前被嵌入的分类器识别出来的大脑意识指令。这依靠机器人顶部的3个灯来完成,它们和训练阶段使用的按钮颜色相同。前面的灯是绿色的,并且当机器人接收到1号大脑意识指令时会亮。左边的灯是蓝色的,并且和2号大脑意识指令相关联,而右边的灯是红色的,并且和3号大脑意识指令相关联。
蓝色的左灯与2号大脑意识指令相联系,红色的右灯与3号大脑意识指令相联系。如果机器人沿着左边墙接近开着的门,蓝色的反馈灯会指示机器人将要向左转,以便于继续沿着左边墙走(这样一来,它将进入这个区域)。相反,绿色的反馈灯指示机器人将会沿着走廊一直走,当来到门口时不会进入区域。这种简单的反馈模式,可以让志愿者在发生错误时,及时改变机器人的前进路线。
(2)走迷宫机器人的试验结果 在操作界面模式1下,初始训练3天,志愿者A和B达到了令人满意的执行水平(正确识别率在65%以上,而错误率在7%以下——仍有一些“未知”反应)。志愿者参加了每天4次的试验训练。图2-23显示两个志愿者在相同训练次数下的特征曲线。一开始的训练倾向于收集初始EEG例子来训练统计分类器,所以志愿者此时得不到任何反馈。对于志愿者A,前两天的训练与剩余三天的训练间相隔了几个周期的时间。图2-23所示为在第一天(2~4次训练)、第三天(5~8次训练)、第五天(9~12次训练)志愿者A的操作行为精确度和操作错误率。图2-23表明4或5次训练后错误率显著下降。
图2-23显示了在三天内(每天4次)不同的训练表现。图a显示正确操作的精确度,图b所示为操作错误率。每次训练后的百分率相当于“未知”反应。在第一次训练时志愿者没有接收到反馈信息。
图2-23 志愿者A和B的操作行为精确度与错误率
a)精确度 b)错误率
除了这些观察资料,志愿者在操作行为精确度曲线中都展示了相同的趋势。第一天他们的操作行为有很明显的进步,在第二天时操作行为精确度降低但又恢复了。这说明由于人脑的自然多样性、EEG信号的限制和志愿者操作BCI的能力还不稳定,所以从第一天到第二天得出结论是很困难的。第三天志愿者的BCI操作技术趋向稳定,第一次训练时,BCI操作技能先降低随后又提高,在以前的试验中,其他的志愿者也表现出相似的趋势。对后来的志愿者进行几何学研究表明,在连续训练之间有许多相似之处。最初的两者在最后训练时技能提高有一定联系,说明志愿者的BCI操作技术正在趋于稳定。
图2-24显示第二次和最后一次训练时的两位志愿者每个大脑意识指令的不同。在各种情况下,可能性开始是0.85,每个分类器被以前练习的EEG例子训练。McNemar统计测试显示,4种原型分类器性能比其他数目原型分类器要好得多或水平相等。特别是,使用超过4个原型同常会导致在开始训练时不正常,这可能是由于EEG例子的多变量在训练结束时减少。
图2-24 参与者A和B的操作行为精确度和错误率
a)精确度 b)错误率
在图2-24中,他们在初始训练阶段的第二个和最后一个中,每个大脑意识指令使用不同数量的模式原型。图a显示正确操作的精确度,图b显示操作错误率。每次训练后的百分率相当于“未知”反应。
表2-4所示为两个志愿者在他们的第二个训练阶段根据反应率平均在0.5s以上的操作行为表现。此表现正确与否用精确度和错误率来衡量。剩余的百分比与“未知”反应相对应。在所有的情况下,概率阈值都取0.85。每一个分类器都由EEG的第一训练阶段的样本进行训练。
表2-4 平均响应数值表 (%)
从表2-4可以看出,根据志愿者A和B在他们的第二次训练过程中连续响应的数量均值超过1/2s。这意味着,如果把N个EEG样本的响应取平均值,每一个占据电源周期的1/(2N)s。此前在所有可能的情况下,概率阈值都取0.85,每一个分类器都用初次实验的EEG样本训练过。当这个均值略小于8时,就会产生相当大的误差。还可以观察到,当超过8时,结果不会有很大的改善。对于后面情况的原因是在连续EEG样本之间瞬间移动的很小,以至于样本非常相似。
经过初步训练之后,志愿者用两天的时间学习用大脑意识控制这个移动机器人,并运行于第二种模式的人机交互界面。在第二阶段的训练中,志愿者必须用大脑意识指令控制机器人从初始位置到第一个目标区域;一旦到达这里,第二个目标区域就被选中,以此类推,就可以用大脑意识指令控制机器人不断地前进。
图2-25 志愿者A大脑意识指令控制下的机器人路线轨迹
图2-25所示为一个由志愿者A在训练两天以后产生的路线轨迹。被控机器人走过了三个不同的区域,随机移动的,从“S”处出发。尽管这个数字没有显示在屋里的轨迹细节,但是机器人在它们中的每一个都做了小的探索。试验中,志愿者持续驱动机器人10min,每次他都把机器人带到指定的区域,但是有些情况下,这个机器人没有遵循最佳轨迹行进。这主要是因为大脑交互相对平常识别一个志愿者的意识状态需要更长的时间。例如在一种情况下,机器人错误地转了一个圈,因为大脑交互没有意识到合适的意识状态直到机器人已经通过一个指定区域的门道,因此志愿者需要用意识操纵机器人把它带回门口。在其他的情况下,机器人的感应器观察到一堵墙或一个角落非常近,因此使得机器人自动停止来避免撞击。在这些情况下,志愿者需要用意识控制来转动机器人远离障碍,并且重新回到轨道上。
在第一次的一系列试验中,机器人从左下角的区域离开,然后访问了其他的三个区域,定性地说,这个路线轨迹已经相当好地显示了机器人按照预订的命令访问了四个区域,被控机器人忠实地执行了人类大脑意识指令。但是为了评价脑控多个机器人方面的性能表现,志愿者A和B也在有略微差距的区域里作了第二次的一系列试验,这些区域在走廊的两边。
在一个规定的试验中,机器人必须从一个初始区域出发到一个指定的区域,同时也要求路经中间的区域。这个区域的顺序被任意指定。最初,志愿者通过意识控制机器人访问指定的区域,然后志愿者手动控制机器人沿着相同顺序访问。在这种情况下,志愿者用相同的控制模式描述上面的试验,不是发指令给机器人,他只是简单地按了三个键中的一个。这个模式可以比较大脑意识控制和手动控制方法的优劣。同时,手动轨迹需要相当接近当前志愿者设定的最佳路径。需要指出的是,为什么最初使用大脑意识控制,而后的试验都用手动控制呢,这样做是为了避免任何有助于意识控制的学习过程。
表2-5给出了对两个志愿者在三个不同的试验中不同的路线轨迹所用时间对照表,还给出了在每次试验中用大脑意识控制和手动控制的时间。大脑意识控制只比手动控制多了35%的时间。这个关系如果在机器人提高速度的情况下将会更糟,因为没有在正确的时刻传递正确的命令的可能性会增加。
表2-5 轨迹控制时间对照表 (单位:s)
5.脑控虚拟键盘
BCI技术还可以用来从计算机屏幕的虚拟键盘上选择字母和书写信息,如图2-26所示。
图2-26 脑控虚拟键盘
首先,整个键盘(26个字母加上它们之间的空隙,总共是一个有27个符号的3行×9列的矩阵)分为三块,每块对应着一项大脑意识任务,它们之间的联系在训练状态下通过颜色来关联。每块包括相同数目的符号,也就是9个(3行×3列)。然后,一旦统计分类器识别出来用户正在注意哪块时,这个块被分为三个小块,这样每块中只有3个符号(1行)。当第二层次块中的某一个被选中时,它又被分为三个部分。在第三层也是最后层中,每块只包含一个符号。为了选中要求得符号,用户应注意由符号颜色来暗示的意识任务。这个符号组成信息,整个进程又开始了。因此,写一个单独字母的过程需要三个决定性的步骤。
首先,整个键盘分为三块,每块对应着一项大脑意识任务。其次,当统计分类器识别到一项智能工作时,相应的块就被分为更小的块直到选定一个字母。这个字母进入信息(在屏幕下方),整个进程又开始了。在整个训练过程中,块和智能工作之间的联系由相同的颜色暗示。左边的块对应的是2号意识任务,中间的块对应的是1号意识任务,右边的块对应的是3号意识任务,如图2-27所示。
图2-27 虚拟键盘
为了增加正确功能的可靠性,一个块的实际选择还包含许多辅助的可靠性测量(除了统计拒绝标准外),尤其是在已经选定的各种公众实证(包括现场直播的电视节目)过程中。
更特别的是,仅仅当相应的意识任务在一行中被识别出来三次时,这部分键盘才被选定,并且如果选择错误,用户还可以通过立即注意他选择的其他工作而不去做它。因此,在完成每一个选择进入下一个层次时,系统会等待一段时间(3.5s)。如果用户没有最佳的表现,意识任务过去常常不被选中。
对于年老的志愿者C,选定一个字母平均需要22s,这个时间包括修正错误。尽管所有这些辅助检查都在实际选中块之前,和其他确定一个字母需要1min或2min的非主动性脑活动虚拟键盘相比较,这个时间段还是有优势的,它和1min写三个字母的主动性方式是相似的。在一些辅助检查要求不严格的实验中(两个连续的响应相同,等待时间省略,但是为放弃最后的选择增加了辅助标志),志愿者C写字母的平均速度可以达到7s。更不用说结合统计语言模型或其他用于单词联想的技术,如在微型电话中的T9,将最终加速写作速度。志愿者C在非正规的方式下运用虚拟键盘写短信(在1~5个字母之间)的所需时间几乎长到不可忍受的程度。有趣的是,一旦这个志愿者在他训练的开始阶段有了好的表现,就不必经常调整统计分类器,可以连续六个月用相同的分类器来操作虚拟键盘。在测试模式1的操作时,志愿者C的平均成绩是:精确度为70.5%,错误率为2.8%,停留在未知响应的百分率是26.7%。
表2-6所示为行为表现用精确度和错误率来表示。余下的百分率对应的是未响应的百分率。在第一个训练阶段,用户没有收到反馈。
表2-6 两个志愿者在一天的连续训练阶段的结果 (%)
除了年老的用户,其他的两个志愿者在一天内就学会了操作虚拟键盘。志愿者D是一位在展览领域做训练的女性。在完成模式1系统操作的最初4个训练阶段后,她已经能够在毫无错误的情况下编写短信。志愿者E是在他的家里训练的,他在模式1的系统操作下训练了4个阶段,然后也能成功地使用虚拟键盘。不过,没有测定这些志愿者的写字速度,他们明显低于志愿者C。表2-6显示了志愿者D和E在不同训练阶段的成绩。
6.讨论
本节讲述了有五个志愿者参加的使用便携式非介入大脑计算机接口控制走迷宫机器人和虚拟键盘的实验研究。这里的BCI技术主要是采用了对于不同志愿者EEG脑电特征的机器学习算法和用于EEG脑电信号在线分析的异步数据通信协议。这种BCI技术与先进机器人控制策略相结合,使得在室内环境中用大脑意识直接控制机器人(轮椅)成为可能。
在实验中,对于两种任务用限制阈值可以分为三类问题,随机分类方法最多可以实现33.3%的正确行为反应。在采用I类模型训练之后,所有志愿者在大约3000个样本训练当中表现出超过65%的正确分类行为。为了估定统计方法的正确性,把这个样本以每500个样品为一批分为6批。正确行为反应的准确率是70.5%±9.0%,显然高于随机分类方法(33.3%)。但是仅仅依靠偶然大脑意识操作这两种应用是不可能的。例如,为了选定一个给定的字母,接口必须做出3个选择。从而概率是(1/3)的3次方,每个字母和写一个5个字母的单词是(1/3)的15次方。相似地,由于志愿者要在一个通道内传输最小13个大脑指令,那么控制机器人的可能性也是很小的,从而发生一个正确信道的概率是(1/3)的13次方。
如果要把脑控机器人的控制系统扩展为能够完成更加复杂的任务则有两种方法:一个是仍然保持同样少数大脑意识状态和增加控制系统的复杂性,这可能导致只依靠直觉上不能实用的一种BCI技术;另一种是保持控制系统的复杂性和增加分类器可以识别的大脑意识状态数量,但是EEG处理的能力是有限的,这是一个挑战。此外试验时,许多大脑意识状态不能被EEG进行快速的可视化反馈识别。
BCI技术需要进一步研究,以获取更快的书写速度和满足残疾人对机器人轮椅的复杂操作。把这里的BCI技术用到机器人轮椅中还不成熟,一是因为残疾人坐在移动的运动平台上操作BCI交互的难度太大,使用者需要长时间的BCI使用训练。其次,当前有限的BCI指令只能控制几个简单的动作,不能满足实际应用的要求。不过,最近EEG分析技术的进展表明,许多大脑意识状态可以被识别用来控制机器人,可以使用一种更自然灵活的方式来加快与虚拟键盘的交互。将把有更多电极(32个、64个或更多)记录的微小电位转变成脑电图来获取在小范围大脑表面区域活动的细节信息。嵌入在BCI装置中的高斯分类器能够对这些脑电图的所选区域分析,而不对EEG特征产生影响。
一个重要的要求是,把BCI经常地与使用者进行交互。这是因为当使用者获得经验时,他们具有了新的能力和改变EEG脑电信号的模式。另外,大脑活动总是在自然地发生变化。这就是从一个样本(分类器通过其训练数据所得到)到下一个样本(分类器在此得以应用)的一种情况。当志愿者操作一个脑控设备时,面临的挑战是要适应在线分类器。初步的结果表明这种方法对于用户在最初训练时的好处,即一个重要的结果是来保持他们的动机和帮助他们快速到达稳定的执行状态。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。