理论教育 大脑皮层工作原理:全面解析

大脑皮层工作原理:全面解析

更新时间:2025-01-03 理论教育 版权反馈
【摘要】:第六章大脑皮层工作原理How the Cortex Works要弄清楚大脑是如何工作的,就好像是在玩一个巨大的拼板游戏。对大脑的深入理解利用“自下而上”的方法是行不通的。为了进行预测,大脑皮层必须能够记住并且存储关于事件序列的知识。要预测新的事件,大脑皮层必须形成恒定表征。在本章随后的几个部分里,我们将一步步深入地探讨大脑皮层的记忆-预测模型是如何工作的。

第六章 大脑皮层工作原理

How the Cortex Works

要弄清楚大脑是如何工作的,就好像是在玩一个巨大的拼板游戏。你可以采用以下任何一种方式来解决这个问题。一是使用“自上而下”的方法,即从最终拼好的形状着手,开始在那一堆拼图中决定如何取舍。另一种方法是“自下而上”,也就是说,集中关注每一块拼图自身,研究它们各自的特点,以寻求它们与其他拼图块的最佳匹配。如果你不知道拼出的图形是什么样子,那么“自下而上”法就是解决问题的唯一途径了。

像“了解、掌握大脑”这样的拼图游戏是尤其令人沮丧的。因为缺乏一个理解人类智能构成的成熟的理论框架科学家就只能采用“自下而上”的方法了。要解答“大脑是如何工作的”这样复杂的难题,如果说不是不可能的话,那工作量也是相当大的。设想一下一个由几千块拼板组成的拼图游戏,便可知其困难的程度了。其中许许多多的拼块有多种拼法,就好像是每一块拼图两面都有图案,而只有一面是正确的,而且所有的拼图形状都不太规则,你甚至无法确定两块之间能否进行拼接。还有许多拼图最终都是多余下来的,而你却不知道哪些用不着、到底有多少是会剩下来。制造拼图的厂家每个月都寄来一些新的拼块。这些新的拼块中有一些是用来替换旧的,就好像拼图制造商这样说:“我们知道你用这些旧的拼块拼了多年,但实际上它们是被弄错了。对不住。在没有接到进一步的通知之前,请用这些新的拼块。”不幸的是,你都不知道最后会拼出个什么东西;还有更糟糕的,你也许有了一些想法,但这些想法都是错的。

这个拼图的类比很好地描述了我们在建构关于大脑皮层和智能的新理论时所面临的困难。这些一块块的拼图便是科学家一百多年来收集的生物学和行为学研究的数据。每个月都有新的论文发表,从而又添加了新的拼块。有时某个科学家的研究数据会与另一个科学家的相冲突。因为可以用不同的方式对所获得的数据进行解释,所以科学家几乎凡事都存在分歧。没有一个“自上而下”的理论框架,对于要探寻什么、什么是首要的、怎样解释堆积如山且越来越多的信息等问题,就没有一个一致的意见。对大脑的深入理解利用“自下而上”的方法是行不通的。我们所需要的就是一个“自上而下”的理论框架。

“记忆一预测模型”可以扮演这个角色。它可以使我们知道如何着手将拼块拼合到一起。为了进行预测,大脑皮层必须能够记住并且存储关于事件序列的知识。要预测新的事件,大脑皮层必须形成恒定表征。大脑需要按照世界的本来面貌建立并存储一个世界的模型,这个模型与你在变化着的条件下看到它的样子无关。了解了大脑皮层该做些什么,可以引导我们理解它的结构,尤其是它的层级结构和分为6层的形状。

在此首次提出的新框架的时候,我们将就一些对某些读者来说具有挑战性的细节展开详细地讨论。读者将遇到许多陌生的概念,这些概念甚至对神经科学家来说都不太熟悉。但我相信,经过一些努力,任何人都可以领会这一新框架的基本要义。本书第七章、第八章的内容不会太专业,在那两章中我们将讨论本理论的更深广的蕴意。

我们玩拼图游戏的过程现在已经变成了寻找支持记忆-预测假设的生物学细节,这就像是我们可以把大多数拼块放到一边,因为我们知道剩余的为数不多的拼块将揭示最终的答案。一旦我们知道了要找寻什么,这一工作就具有可操作性了。

同时我想强调的一点是,这一新的理论框架仍然不是完整的,其中还有许多东西我自己也不甚了解。但是我对理论框架中的许多内容却已掌握,这些内容都是以演绎推理、许多在不同的实验室里进行过的实验以及已知的解剖学知识为基础的。在过去的5~10年间,神经科学内部许多子领域的研究人员也在探究某些观念,正好与我所提出的观念相类似,而且,虽然他们用的术语不一样,但据我所知,他们并没有尝试着把这些思想整合到一个完整的框架里。他们也讨论“自上而下”和“自下而上”的处理方式,也讨论模式是如何经由大脑的感觉区域进行传递的,他们还讨论恒定表征可能会是如何的重要。比如说,加州理工学院的两位神经科学家加布里埃尔·克里曼(Gabriel Kreiman)和克里斯托弗·科赫(Christof Koch)与神经外科医生一起发现,一个人不论何时看到比尔·克林顿的图像,他的某些脑细胞都会变得活跃起来。我的目标之一就是解释这些有关克林顿的细胞是如何形成的。当然,一切理论做出的预测都要能在实验室得到检验。我在附录中列举了许多这样的预测。既然我们已经知道了要寻找的目标,这个相当复杂的系统看上去也就不再那样复杂了。

在本章随后的几个部分里,我们将一步步深入地探讨大脑皮层的记忆-预测模型是如何工作的。我们从新大脑皮层的主要结构和主要功能开始,直到最终弄清楚那些细小的拼块的作用以及它们是如何置入整个大图画的。

恒定表征

在前面,我把脑皮层比作是一块餐巾大小、有6张名片厚度的由细胞组成的薄片,在这张薄片上,各个区域之间的连接构成了一个层级结构。现在我想为大脑皮层描绘出另一幅图像,以此来突显它的层次连通性。让我们想像一下,我们根据不同的功能将“餐巾”切成彼此独立的区域(大脑皮层的这些区域都专门负责某类任务),然后将这些分块像薄饼一样一层层叠起来。要提醒你的是,脑皮层看起来其实并不是这样,但这幅图像能帮你想像信息是如何传递的。我在图上标示出了4个脑皮层区,其中感觉输入经由底层,也就是最低的那个区进入,然后向上逐层传递。请注意,信息是双向传递的。

图1 识别物体时前四个视觉区域

图1表示了识别物体时涉及的前4个视觉区域——你是如何看到并辨识出一只猫、一座大教堂、你的母亲、中国的万里长城以及其他任何一个你能叫得上名字的事物的。生物学家把它们标记为V1区、V2区、V4区和IT区。在图1的底部,我们用箭头表示了源于双眼视网膜的视觉输入,这些输入被传递到V1区。我们可以把这些输入看作是由约100万个轴突(这些轴突束成视神经)所承载的不断变化着的模式。

前面我们讨论过空间及时间模式,在此还是有必要请你重新回忆一下,因为我们将要反复地提到它们。让我们来回忆一下,脑皮层是一大块细胞组织,其中包含有各司其职的功能区域,这些区域由大束轴突或纤维连接起来。信息就沿着这些轴突或纤维瞬时从一个区域传递到另一个区域。在任何一个时间点上,一些纤维会触发出叫作“动作电位”的电脉冲,而其他的纤维则保持静止不动。这样一束纤维上的集体活动就是我们所说的“模式”。

如前所述,人的眼睛每秒大约以3次扫视的视觉运动移过某一物体,并有1次注视的视觉停留。假若科学家给你安上一个跟踪记录眼球运动的装置,你会吃惊地发现扫视是多么地不平稳。因为之前你体验到的视觉是连续且稳定的。

图2(a)显示了人眼在看一张脸时是如何运动的。请注意:眼球在注视物体时并不是随机的。现在请想像一下,你能够看见从此人眼中发出并到达V1区的活动模式。眼球的每一次扫视都会完全改变。视觉皮层以每秒数次的频率看到一个崭新的模式。

你也许会想:“不错。但眼球所看到的仍然是同一张脸呀,只不过是有所移位而已。”这样想也是有些道理的,但实际情况不全是你所想的那样。视网膜上的光感应体并不是均匀分布的,中心部分分布密集,叫中央凹,四周逐渐稀疏。与此相反,脑皮层中的细胞则是均匀分布的。结果,传递到第一视区V1区的视网膜上的影像就被高度扭曲了。当你的眼睛注视某张脸上的鼻子而不是眼睛时,视觉输入是相当不同的,就好像是在前后急拉一个扭曲变形的超广角镜头并通过它进行观察一样。然而当你看那张脸时,它看上去并没有变形,也不跳来跳去。大多数时候,你根本就不知道视网膜的模式有所变化,更不用说那么显著的变化了。你看到的只不过是张“脸”。图2(b)显示了一幅此效果下的海滩风景。在此,我们只不过是再次说明了在第四章关于记忆时我们曾谈到的恒定表征的奥妙。你感觉到的并不是V1区看到的。你的大脑究竟是如何知道正在看的是同一张脸,而你又为何不知道输入有所变化而且变形了呢?

图2 (a)眼睛是如何扫视一张人脸的;(b)由视网膜上感应器分布不均引起的变形

如果将一根探针深入到V1区来看看单个细胞是如何响应的,我们就会发现任一细胞都只针对视网膜一极小部分的视觉输入做出反应,且活跃异常。这样的实验进行过多次,是视觉研究的主要成果。每个V1区神经元都有一个感应域,它只针对你整个视觉区域的很小一部分起作用。说得更精确些,这整个区域也就是你的视野范围。V1区的细胞似乎就不知道什么脸啊、汽车啊、书啊以及你时刻看到的任何其他有意义的物体,它们所“知道”的一切仅仅是视觉世界的一个针孔大小的部分。

V1区的每一个细胞也都只响应特定类型的输入模式。例如,在某个细胞的感应域范围内,当它“看”到倾斜成30度的一条直线或边缘时,这个细胞就会异常活跃。这条直线或边本身并没有什么意义,它可以是任何事物的一部分——地板、远处的棕榈树树干、字母M的边线,或任何能想到的其他可能的事物。随着每一次新的“注视”,细胞的感应域就会落在视觉空间的一个全然不同的、新的部分。在某些“注视”中,这个细胞就会活跃,而在另外一些“注视”中,它就不怎么活跃,或者甚至没有反应。因此,眼睛每扫视一次,V1区的许多细胞就可能要改变它们的活动。

然而,如果我们将探针深入图1中的顶端区域,也就是IT区的话,奇妙的事情就会发生。我们发现,当整个物体在视野的任何地方出现时,某些细胞会变得活跃起来,并一直保持活跃。例如,我们会发现,每当看到一张脸时,有一个细胞总会被激烈地触发,只要你的眼睛一直看着视野中任何一处的一张脸,这个细胞就会一直保持活跃,它不会像V1区细胞那样会随着每一次扫视而不断切换状态。这个IT区细胞的感应域覆盖了整个视觉空间,并且每当看到脸时就会被触发。

让我们再来看看这神秘之处。从视网膜到IT区在跨过脑皮层的4个阶段的过程中,细胞在改变着状态:从飞速变化的、具有空间特异性、能识别细微特征的细胞,转变成为不断被触发、空间非特异性、能识别目标的细胞。IT区的这个细胞告诉我们,在视野中我们看到了一张脸。这个细胞通常被叫做“脸细胞”。不管看到的脸是倾斜的、旋转的还是部分被遮挡了的,它都会活跃。它构成了“脸”的恒定表征的一部分。

如此描述使得它看似非常简单。也就是说,经历这么4个飞快的阶段,我们就识别了一张脸。任何计算机程序和数学公式都丝毫没能像人脑那样强有力地、高度概括地解决这个问题,而人脑只需几步就解决了这个问题。本章的主要目的之一就是要解释这样一个“脸细胞”——不管是关于克林顿还是其他任何人的——是如何出现的。

我们再来看一下图1,其中可以看到信息通过一个“反馈连接”的网络同时从较高的区域传递到较低的区域。这个网络是由许多束轴突组成的,它们连接着IT区这样的较高区域和V4区、V2区、V1区这样的较低区域。此外,在视觉皮层中,如果说这样的反馈连接不比前馈连接多的话,至少也是一样多。

许多年来,大多数科学家都忽视了这些反馈连接。如果我们对大脑的了解仅仅集中在脑皮层是如何接受所输入的信息、如何加工信息,然后如何对它做出反应的话,就不需要反馈,而仅仅是连接着感觉器官和脑皮层运动区的前馈连接。但是当我们开始认识到脑皮层的核心功能是做出预测时,就会不得不将反馈纳入我们的模型里来了。大脑要将信息送回最先接受输入的区域。预测就是在实际发生了什么和我们期待发生什么之间进行比较。信息向上流动,我们的期待向下流动。

在涉及所有感觉的皮层各区都存在着同样的前馈、反馈过程。图3所示为视觉“薄饼”与听觉和触觉“薄饼”并排堆叠。图中还画有几个较高层次的脑皮层区,这些叫做联合区的皮层区,接收诸如听觉、触觉和视觉等的输入,并将这些输入进行整合。图1是根据4个已知的脑皮层区域之间已知的连接而绘出的。但图3仅仅是一个示意图,并不是要描绘实际的皮层区域。在真正的人脑里,数十个皮层区域都是通过各种方式互相连接起来的。实际上,人类脑皮层的大部分是由联合区组成。这里的图示以及以后所见到的图解都是为了帮助读者理解,我不希望给读者造成任何的误解。

图3 形成触、听、视觉的恒定表征

这些关于视觉的从快速变化到缓慢变化、从空间特异到空间恒定的转化过程,在很多的文献中有所论述,虽然只有少量的证据能提供证明,但许多神经科学家都认为在脑皮层的全部感觉区域里都是同样的情形,而不仅仅在视觉区域里是这样。

下面我们来看看听觉。当有人对你说话时,声压的变化很快,进入基本听觉区域——A1区的模式也同样快速地变化。可是,如果将一根探针插入听觉的较高区域,我们会发现一些恒定不变的细胞对单词、有时甚至是短语做出反应。听觉皮层也许有一些细胞会在你听到“谢谢”时触发,而另一些细胞会在听到“早安”时触发。假定你识别了这个短语的话,这些细胞在整个句子所经历的时间内都会保持活跃。

第一个听觉区域接收到的模式可以有很大的变化,我们可以用不同的口音来说一个词,可以用不同的音高和不同的语速。但是在较高层次的脑皮层,这些低级特征将变得无关紧要,不管声学的细节多么不同,一个词就是一个词。音乐也是这样。《三只瞎老鼠》的曲子可以用钢琴弹出来,也可以用单簧管吹出来,或是孩子唱出来。在不同的条件下,A1区接收的模式是迥然不同的。但是插入较高的听觉区域的探针会让我们发现每当听到《三只瞎老鼠》时,有些细胞会不断地被触发,而不管是什么乐器演奏的,节奏如何,或是其他许多细节有什么不同。当然,这样的实验并没有做过,因为这样的实验在人身上施行未免太不人道了。但是,如果你承认有一个通用的脑皮层算法,那么你就应该能确定这些细胞是存在的。我们知道,听觉皮层有类似视觉系统的反馈、预测以及恒定记忆。

触觉也不外乎这样。即使我们能够利用高解析度脑部成像仪对猴子进行研究,此类的实验也并未做过。当我坐在这里写这本书时,我的手上有一枝钢笔,我触到了笔帽,手指摸着笔帽上的金属口袋夹,当我的手指移动时,从我皮肤上的触觉传感器传到脑皮层体觉区的模式在快速地变化,但我依然能感觉到那是同一枝笔。我可以一会儿用这几个手指、一会儿用另几个手指,甚至用嘴唇弄弯金属夹。这些输入彼此不同,它们到达脑皮层基本体觉区的不同位置。然而,我们的探针再一次发现距离最初输入几步之遥的皮层区域里,有些细胞稳定地对“钢笔”做出反应。只要我一直在拨弄着钢笔,它们就一直保持活跃,而并不在乎我是用哪个手指或身体的哪个部位接触到它的。

在听觉和触觉方面,你并不能通过瞬间的输入来识别物体,你耳朵或皮肤的触觉传感器传来的模式,在某个时间点上,并没有足够的信息来告诉你听到或是摸到了什么。当你要感知一系列诸如旋律、话语或是“砰”的关门声等听觉模式时,或者当你要感知一枝像钢笔那样的物体时,唯一的办法是通过有一定时间跨度的输入信息流。只听一个音符是无法识别一个旋律的。同样的道理,只轻轻接触一下,你也不可能识别出那是钢笔的触感。因此,相对于像话语等事物的心理感知的神经活动,必须比单个的输入模式历时要久。这与先前的结论是一样的,也就是说,在脑皮层区域中位置越高,能看到的变化就越少。

视觉也是基于时间的输入流,它与听觉和触觉的工作方式一样。但由于我们通过一次注视就能够识别单个物体,这就把整幅图画给弄乱了。的确,这个通过一次短暂的注视就能识别空间图形的能力,许多年来将那些研究机器和动物视觉的研究人员引入了歧途——他们通常忽视了时间的关键性。虽说在实验室的条件下人能被迫在不移动眼睛的条件下识别物体,但这并不是人们通常采用的方式。正常的视觉,比如你现在读这本书,就要求眼球不断地运动。

整合感觉

联合区又是怎样的呢?至此,我们已经看到了信息是如何在脑皮层的特定感觉区上下传递的。当向下传递的信息汇入到不断输入的信息时,就会对我们接下来要经历到什么进行预测。同样的过程也出现在不同感觉之间,也就是说,在视觉、听觉、触觉以及许多其他的感觉之间。例如,听到某种声音就会使我预感到要看到或触到什么。此刻我正在卧室写作,我家的猫“可儿”走动时,它的项圈会丁当作响。现在,我听到了这丁当声从走廊传过来,且越来越近。正是从这个听觉的输入我识别出了我的猫,于是我转过头去朝走廊看,“可儿”走了进来。我是根据“可儿”的声音而知道会看见它的。假设“可儿”并没有进来,或者是其它一个什么动物出现的话,我一定会感到吃惊。在这个例子中,首先是听觉的输入产生了对“可儿”的听觉识别。这个信息流经由听觉的体系到达联合区,正是这个联合区将视觉与听觉连接了起来。然后,这个表征回流到听觉和视觉的体系,从而产生听觉和视觉的预测。图4说明了这个例子。

此类多感觉的预测随时都在发生。我将钢笔的夹子向外扳,感觉到夹子脱离了手指时,我会预期听到夹子碰到笔帽而发出“劈啪”声。如果此时没有听到“劈啪”声的话,我会感到惊讶。我的大脑精确地预测了我何时将听到声音以及这个声音听起来是什么样子。为了做出这个预测,信息向上流到脑皮层的体觉区并同时回流到体觉区和听觉皮层,从而能预测到将听到并感觉到一个“劈啪”声。

图4 信息经感觉体系上下传递,形成预测并产生统一的感觉体验

再举一个例子:我每周有几天要骑自行车去工作。早上我走进车库,取了自行车,将它调转头来,驶上了马路。在整个过程中,我收到了许多视觉、触觉以及听觉的输入——自行车碰到了门框,链条咔哒作响,脚踏板碰了我的腿,车轮擦过地面旋转着。在将自行车从车库里拿出来的过程中,我的大脑收到了一连串视觉、听觉以及触觉的感觉,每一种感觉输入都以非常协调的方式为其他感觉做出预测。我看到的事物能准确地预测我将触摸到和听到什么。反之亦然。看到自行车撞上门框,我就会期待听到一种撞击的声音、感觉到自行车会向上跳起。当感到脚踏板碰到了腿时,我会迅速地向下看,预料到我会在期望见到它的地方见到它。这个预测是那么的准确,以至于我会觉察出这些输入有丝毫不协调或不寻常的地方。信息在感觉体系中同时向上和向下流动,从而产生包含有各种感觉预测的统一的感觉体验。

请尝试下面这个实验。放下手中的这本书,停止阅读,活动活动。活动一下身体并摆弄什么东西,比如说,走近洗手池,打开水龙头。好,当你这么做时,尽力注意每一点声音、每一个接触的感觉和每一个变化着的视觉输入。你必须集中注意力,每一个动作都与视觉、听觉以及触觉密切联系着。上提或旋开水龙头手柄时,你的大脑期待着感觉到皮肤上的压力和肌肉的阻力,你期待着看到且感觉到手柄的移动,同时也期待着看到水并听到水的声音。当水溅到水池里时,你期待着听到不同的声音,并且期待着看到和感觉到水的飞溅。

每走一步都会发出声音,不论是有意识还是无意识,你都会预期到这一点。就连手持这本书这样简单的动作也会引起许多感觉的预测。想像一下:如果你感觉到并听到书合上的声音,而你却看着它仍然打开着,你一定会惊讶万分,也会茫然不知所措。正如在第五章中改装门的那个思维实验里看到的那样,你会对世界做出各种感觉协调一致的恒常预测。当我专注于所有这些小小的感觉体验时,我真为我们的知觉预测是多么的整合一致而感到惊讶。虽然这些预测看起来很简单,也不起眼,但你要记住的是,它们是无处不在的,并且它们只有在大量的模式协调一致,上、下流经脑皮层的感觉体系时才可能出现。

一旦你理解了感觉是怎么互相连接在一起时,你就会得出这样的结论:整个新大脑皮层及所有的感觉和联合区域都行动如一。是的,我们有一个视觉皮层,但它是一个完整的感觉系统的一部分。这个感觉系统包括视觉、听觉、触觉以及更多的感觉结合在一起,所有这些都在一个单一的多分支的体系中同时向上、向下流动。

还有一点,所有的预测都是从经验中学习的。我们期待着钢笔夹现在和将来都会发出“劈啪”声,这是因为它们过去就是这样。自行车在车库碰撞而发出“砰砰”的声音,我们都是以可预测的方式看到、感觉到并且听到的。你不是生来就具有这些知识,这些都是通过学习而得来的,这得归功于你的脑皮层有令人难以置信的大容量,从而可以记住各种模式。如果传入大脑的输入中有一贯相同的模式,脑皮层就会将它们用来预测未来的事件。

虽然图3和图4并没有描绘皮层的运动区,但是你可以把它想像成另一个分层的薄饼沓,它就像感觉的薄饼沓一样通过联合区连接到感觉系统(也许与脑皮层的体觉区有着更密切的关系,以便实现身体的动作)。这样的话,脑皮层的运动区就与感觉区域以几乎同样的方式工作着。任何一个感觉区的输入都能上流到联合区,联合区再产生一个模式向下流到皮层运动区,最终引起动作。正如视觉输入能导致模式传到脑皮层的听觉和触觉区,视觉输入也可以导致模式传到脑皮层的运动区。在前一种情况下,我们把这些向下传递的模式叫做预测。而在皮层运动区,我们把它们叫做运动指令。正如蒙卡斯尔指出的那样,皮层运动区和皮层感觉区看起来是一样的。因此,脑皮层处理向下传导的感觉预测的方法,就与它处理向下传导的运动指令的方式类似。

很快我们便会看到脑皮层中并没有单纯的感觉区和单纯的运动区。感觉模式同时传入皮层的任何一处和所有各处,然后回流到这个体系的任何一个区域,引起预测或运动。虽然皮层运动区有某些特别属性,但我们仍然可以把它认为是一个更大的分级结构存储器——预测系统的一部分。它和其他的感觉几乎一样。视觉、听觉、触觉和动作紧密地纠缠在一起。

V1区新说

要解开脑皮层结构之谜,下一步需要从新的角度来审视脑皮层的各个区域。我们知道,脑皮层体系的较高区域形成了恒定表征,但是为什么这个重要的功能只出现在较高区域呢?根据蒙卡斯尔关于对称的概念,我开始着手研究脑皮层区域连接起来的各种不同方式。

图1描绘了视觉通路中的4个典型区域:V1区、V2区、V4区和IT区。其中V1区处于整个结构的最底层,往上依次是V2区、V4区和处于最顶层的IT区。按照传统的看法,每一个区域都被看成是单独的连续的区域,因此V1区的所有细胞虽说各自处理视野中的不同部分,但它们恐怕都在完成类似的任务。V2区的所有细胞也完成同样的任务,V4区的细胞也是一样。

首先,依照这个传统的观点,当一张脸的图像进入V1区时,那里的细胞建立起这张脸的一个草图,这个草图是由简单的线段和其他基本的细节所构成的。这幅草图被传到V2区,V2区也对图像进行处理,对五官特征稍作精密的分析,然后将它传到V4区,以此类推。只有当输入信息到达顶层的IT区时,才产生恒定表征以及对该物体的识别。

可惜的是,这个关于V1区、V2区和V4区等脑皮层区域的统一看法存在着某些问题。我们不禁再一次心存疑问:为什么恒定表征只出现在IT区?如果脑皮层的所有区域功能都一样,为什么IT却有所不同?

其次,脸可以出现在V1区的左侧,也可以出现在右侧,两种情况下你都能识别出来。但实验显示,V1区的不相邻各块却不是直接连接起来的,V1区的左侧并不直接知道右侧所看到的东西。请好好想想这一点。显然,V1区各部分功能相似,因为它们都参与到脸的识别过程,但同时它们在生理上又是相互独立的。V1区的各子区域生理上相互分离,但却在完成同样的任务。

最后,实验显示脑皮层中所有的较高区域都是从位于它们下面两个以上的感觉区域接收到整合输入的(图3)。在人脑里,数十个区域汇聚于联合区。但根据传统的看法,V1区、V2区和V4区这样的较低层的感觉区域似乎是以不同的方式连接起来的。每一区看起来好像只有一个输入源,即只有一个由底而上的箭头,而不是明显的来自不同区域的整合输入。V2区接受来自V1区的输入,仅此而已。那为什么脑皮层的某些区域接收整合输入而另外一些却不是呢?这显然与蒙卡斯尔关于脑皮层的通用算法的观点是相矛盾的。

由于上述的理由和一些其他的原因,我渐渐认为,V1区、V2区和V4区不应看成是单一的脑皮层区域。与此相反,我认为每一区都是由许多较小的子区域构成的。让我们回到先前的那个餐巾比方上——整个脑皮层的一个平化版本。比方说,我们要用笔在脑皮层“餐巾”上标记出所有的皮层功能区域的话,显然最大的区域是V1区,即基本的视觉区域。其次是V2区。相对于多数区域来它们是非常大的。实际上我要说的是,V1区应该被认为是由许多很小的区域组成的。在“餐巾”上原本指派给V1区的区域上,我们可以画出许多小的区域,而不是一整块大的区域。换言之,V1区是由许多彼此分离的小皮层区组成的,这些小的区域通过体系中较高的区域而与周边相邻的区域间接地相连。在所有的视区当中,V1区的子区域数量最多。V2区也是由许多子区域组成的,只不过这些子区域数目较少,面积较大。V4区也是如此。但顶层的IT区却是一个完整的单一区域,这一区域的细胞对整个视觉世界具有鸟瞰的视野。

图5 对脑皮层体系的新看法

这里有一个令人高兴的对称现象。请看一下图5。它与图3描绘了同样的体系,只不过其中的感觉区是以我刚才描述的样子描绘的。请注意,现在脑皮层看上去到处都是相似的了。任意挑一个区域来看,你都会发现其下方许多子区域提供整合的感觉输入。接收信息的区域将投影发送回到输入区,告诉它们接着将会看到什么模式。较高的联合区整合了来自诸如视觉和触觉等多个感觉区的信息,像V2区这样较低的区域整合来自V1区内部各子区域的信息。每个区域都不知道,也不可能知道这些输入都意味着什么。V2区的一个子区域不必知道它自己正在处理来自V1区几个部分的视觉输入,联合区也不必知道自己在处理来自视觉和听觉区的输入。相反,任何一个脑皮层区域的工作就是要弄清它的这些输入是如何关联的,然后记忆这些输入之间的关联序列,并用这个记忆来预测这些输入将有何种表现。脑皮层就是脑皮层,各处的工作都是一样的,这就是通用的脑皮层工作原理。

这样一个新的分层描述有助于我们理解建立恒定表征的过程。下面我们以视觉为例更深入地看看它是如何工作的。在第一个层面加工过程中,视觉空间的左侧与右侧是不同的,这个不同正如听觉不同于视觉一样。V1区的左右两侧能形成同样的表征,这是因为它们都曾接触过现实中相似的模式。正如听觉和视觉一样,它们可以被看成是彼此独立的感觉流,并在较高的层次上得到整合。

与此相似,V2区和V4区内的小区域都是视觉的联合区(子区域可能有重叠,但这不会从根本上改变这些区域工作的方式)。这样来解释视觉皮层并不会与我们已知的解剖学知识相冲突,也不会改变我们对它的解剖学构造的看法。信息顺着这个分级树状记忆结构的分枝上下流动。视觉区左侧的一个模式可以引起右侧的预测,这与猫的铃铛可以引起我做出的关于它会进入我卧室的视觉预测的道理是一样的。

关于脑皮层体系的这样一种新的描述带来的最重要的好处是,现在我们可以说脑皮层的每一个区域都形成恒定表征。按照老的思路,只有等输入到达顶层,也就是能看到整体视觉世界的IT区时,我们才形成彻底的恒定表征,比如说“脸”的表征。而现在我们可以说恒定表征是无所不在的。在脑皮层的每一个区域都形成有恒定表征。表征的恒定性并不是在较高的皮层区域——IT区才变戏法般地出现的。每一个区域都从位于自己下面的输入区获得并形成恒定表征。因此我们说,V4区、V2区和V1区的子区域都根据流入它们的信息产生恒定表征,它们只不过看到世界的很小一部分,它们涉及的感觉物体的符号也是非常基本的,但它们却和IT区一样完成相同的工作。同时,IT区上面的联合区从多种感觉中形成模块式的恒定表征。因此,脑皮层的所有区域都产生在体系中位于自己下方的那部分的恒定表征。这是一幅漂亮的图景。

我们的问题有了变化。我们不再追问恒定表征是如何在自下而上的4个层级中得以产生,然而我们却要追问恒定表征在每一个脑皮层的区域中是如何产生的。如果我们确信脑皮层有一个通用的工作原理,那么这样设问是完全有意义的。如果一个区域存储模式序列,那么每一个区域都存储序列;如果一个区域产生恒定表征,那么所有的区域都产生恒定表征。沿着图5中所示的线条重新审视脑皮层的体系,这种解释就会更容易被理解。

世界的模型

为什么新大脑皮层具有层级结构呢?你能够思考这个世界,也可以在世界中走动,还可以对未来做出预测。所有这些都是因为你的脑皮层构建了一个有关世界的模型。本书最重要的一个思想就是,脑皮层的层级结构存储着有关现实世界的一个层级结构模型,现实世界的嵌套结构在脑皮层的嵌套结构中得以反映。

嵌套结构或者层级结构又是什么意思呢?想想音乐吧!音符合在一起构成音程。音程合在一起构成旋律子句。旋律子句组合成旋律或歌曲。歌曲的集合就是歌曲集。再想想书面语吧。字母合在一起构成音节。音节合在一起构成单词。单词组合成子句和句子。下面把这个问题反过来看看。想想你的周围吧!你周围一定会有路、有学校和房子。房子里有房间。每个房间都有墙壁、天花板、地板、门以及一个或多个窗子。而这每一个物体都由较小的其他物体组成。窗子由玻璃、窗框、窗闩和纱窗组成。窗闩又由像螺钉等的更小的部分组成。

稍微花点时间抬起头看看你的周围。来自视网膜的模式进入到基本的视觉皮层,在这里,这些模式结合起来形成线条。线条又组合形成更复杂的形状。这些复杂的形状再组合形成事物,比如说鼻子。鼻子与眼睛和嘴一起构成了脸。脸又和其他的一些身体部分组合成比如说是坐在房间里你对面的一个人。

世界上的一切事物都是由同时出现的较小事物组成的。事物就是这样。当我们为一个事物命名时,我们之所以能够命名它是因为它有一组细节同时存在。脸之所以是脸,是因为两只眼睛、一个鼻子和一张嘴总是同时出现。眼睛之所以是眼睛,是因为瞳孔、虹膜、眼睑等等总是同时出现。椅子、汽车、树、公园和乡村莫不如此。最后,歌曲之所以成为歌曲是因为一系列音程总是依次连续出现。

如此,世界就像一首歌。世界上的每一个物体都是由许多较小的物体组成,而大多数物体都属于更大的物体。这也就是我所说的嵌套结构。一旦你了解了这一点,你就随处可见嵌套结构。与此极其相似,你对事物的记忆以及你的大脑表征事物的方式就存储在脑皮层的层级结构里。你对于自己家的记忆并不存在于脑皮层的某一区域里。它存储在脑皮层的整个层级结构里,而这又反映了你家的层级结构。大的关系存储在这个体系的最高层,而小的关系则存储在底部。

脑皮层的设计以及它自然的记忆方法展示了世界的层次关系。你生来并没有关于语言、房子或是音乐的知识。脑皮层有一个巧妙的学习算法,它能自然地发现存在着的任何层级结构并捕获它。当结构不复存在时,我们就陷入了一片混乱,甚至是混沌状态。

在任何一刻,你只能体验到世界的一个子集。在一个时间点上,你只能在你家里的一个房间里,看着一个方向。因为有了脑皮层的层级结构,你就能知道你是在家里,在起居室里,看着窗户,即使当时你的眼睛只注视在一个窗闩上。脑皮层的较高区域保持着你家的表征,较低的区域则表征房间,更低的区域则看着窗户。同样地,这个层级结构让你能知道是在听一首歌、一个歌曲集,即使在任何一刻你只听到一个音符,而这个音符本身几乎并没有意义。它也能让你知道你是和最要好的朋友在一起,即使在那一瞬间你的眼睛只注视着她的手。脑皮层的较高区域追踪着大的图像,而较低的区域则积极地处理快速变化着的小细节。

因为在任何时刻我们只能接触、听到和看到世界很小的一部分,传入大脑的信息自然就以一系列的模式到达大脑。脑皮层要记住这一再出现的序列。有时候,例如旋律,模式的序列是严格顺序的,比如说按音程的顺序。我们多数人都熟悉这种序列。但是我所用的序列一词则更加宽泛,比较接近数学上的“集合”的含义。一个序列是一组通常彼此伴随的模式,不一定总是有严格的顺序。重要的是一个序列中的模式在时间上是先后相继的,即使不一定按固定的顺序。

举几个例子可以使问题变得更清楚。当我看着你的脸时,我看到的输入模式的序列不是固定的,而是由我的扫视而决定的。某个时候我可能以“眼睛—眼睛—鼻子—嘴”的顺序来注视,而过了片刻我又是以“嘴—眼睛—鼻子—眼睛”的顺序注视的。组成脸的各部分就是一个序列。它们在统计上是关联的,并且总是几乎同时出现,虽然顺序有可能改变。如果你感觉到看到了一张“脸”,而此时你正注视着“鼻子”,那接下来的模式很可能就是“眼睛”或“嘴”,而不会是“钢笔”或“汽车”。

脑皮层的每个区域都看到一股这样的模式流。如果模式都是如此相互关联着,而皮层区域能够学会预测接下来将出现什么模式的话,我们就说脑皮层区域对这一序列形成了稳定的表征,或者叫记忆。产生真实世界中的物体的恒定表征的最基本要素就是要记住序列。

真实世界的物体可以是具体的,如蜥蜴、脸或门等,也可以是抽象的,如词或理论。大脑处理抽象和具体的事物的方式是一样的。这些事物不过是以可预测的方式在时间上同时出现的模式序列。一定的输入模式反复出现的事实使得脑皮层区域知道这样的体验是由世界上的实物所引起的。

现实的基本要义就是可预测性。如果脑皮层区域发现自己能够通过一系列的身体动作(例如眼睛的扫视或者手指的抚摸)可靠地且有预见性地在这些输入模式间切换,并且当它们不断明朗化时(例如声音能组成一首歌或一个词),能够对它们做出精确的预测,大脑就认为它们之间存在因果关系。纯粹由巧合引起的大量输入模式再三出现在同一关系中的几率几乎是微乎其微。一个可预测的模式序列一定是一个实实在在存在着的更大事物的一部分。因此可靠的预测性以铁定的方式说明了世界上不同的事件实际上是相互联系着的。每一张脸都有眼睛、耳朵、嘴和鼻子。如果大脑看到了一只眼睛,然后扫视到另一只眼睛,然后又扫视到嘴,它就可以确信自己看到的是一张脸。

如果脑皮层区域能够说话,它们也许会说:“我体验到了许多不同的模式。有时候我预测不到接下来会看到什么模式,但是这些模式的集合肯定是彼此联系着的。它们总是一同出现,我能够可靠地在它们之间跳来跳去。因此每当看到这些事件中的任何一个,我都会用同一个名字来指称它们。我传递给皮层中更高区域的就是这样的组名,而不是单个的模式。”

因此,我们说大脑存储着序列的序列。脑皮层的每一区域都记住序列,给它所知道的序列命上“名字”,然后将这些名字传递给脑皮层层级中下一个更高的区域。

序列的序列

信息从基本的感觉区域流到较高层级的过程中,我们可以看到变化是越来越少的。在V1这样的基本视觉区里,随着新的模式以每秒几次的频率落在视网膜上,兴奋的细胞组在不断变换。而在IT视觉区里,细胞的兴奋模式就相对稳定多了。这是怎么回事呢?脑皮层的每一区域都有一个已知序列的汇集,就好像歌曲汇集一样。皮层区域为任何事物都存储着诸如歌曲似的序列:海浪冲击海滩发出的声音、你母亲的面貌、从家到附近商店的路、怎样写“爆米花”这个词、怎样洗纸牌,等等。

歌曲都有自己的名字,类似地,每一个脑皮层区域都为已知的每一个序列命了名。这些“名字”就是一组细胞,它们的集体兴奋表示了序列中的这一组事物。(现在先不要关心哪组细胞是如何被挑选出来表征哪一序列的,我们在后面将会讲到。)只要这一序列仍在持续,这些细胞就会一直保持兴奋状态。传递给层级中更高区域的也就是这个“名字”。只要输入模式属于可预测的一个序列,该区域将会向下一更高层级的区域提供这个恒定的“名字”。

就好像这个区域在说:“这就是我所听到、看到、触摸到的序列的名字。你不必知道单个的音符、直线或纹理结构。一旦有新的或未曾预见的事物出现时,我就会通知你。”说得更准确些,也就是,我们能够想像处于视觉体系最高位的IT区向处于它之上的联合区传达到:“我看到了一张脸。眼睛的每一次扫视都注视在脸的不同部分,但我的确是见到了一张脸;我连续地看到脸的不同部分,但那就是同一张脸。一旦看到其他事物,我马上会通知你。”一个可预测的事件序列就以这种方式与一个“名字”——一个细胞兴奋的稳定模式——联系在一起了。如果我们沿着这个分层的金字塔一直向上观察的话,这种情形会反复出现。一个区域也许能识别一个由音素(组成词的声音)组成的声音序列,并将代表音素的模式传递到下一个区域。更高层级的区域识别出音素序列并生成单词,更高层级的区域识别出单词序列并生成短语,如此往下进行。要牢记于心的是,脑皮层最底层区域中的“序列”可能相当简单,例如平移过空间的一条可见线段。

在体系中的每一个区域里将可预测的序列变成“已命名的对象”。这样,在体系中层级越高,稳定性就越强。恒定表征就这样产生了。

当模式沿着体系往下传播时,就会出现相反的结果:稳定的模式“展开”成序列。我们现在假设,你在7年级时已背熟了葛底斯堡演讲,而你现在想将它再背出来。在处于脑皮层高层的语言区域里,存储着一个表征着林肯这一著名演说的模式。首先,这个模式展开成一个记忆中短语序列。在下面的一个区域中,每一短语又被展开成单词序列。而就在此刻,展开的模式分成两支,分别沿着脑皮层的听觉区和运动区向下传递。在运动区的那条路径中,每个词又被展开成音素序列。到了最后,也就是在最底层,每个音素被展开成肌肉指令序列以发出声音。这个体系中越是往下,模式变化得越快。处于运动区域最高层的那个稳定的模式最终产生了一个复杂而绵长的语音序列。

当信息在系统内部下行时,恒定性也在起作用。当你想将葛底斯堡演讲用打字机打出来而不是念出来时,在系统中的最高层级中是以相同的模式开始的。在下面的区域中该模式被展开成短语。在更下一层的区域中短语又被展开成单词。到目前为止,念出葛底斯堡演讲和打出葛底斯堡演讲之间并没有任何差异。但在随后的下一层级中,脑皮层运动区却走了另一条路径。这次,单词被展开成字母,字母又被展开成发给手指肌肉的打字指令。“Fourscore and seven years ago our fathers brought forth...”(87年前,我们先辈在这个大陆上创立了一个新国家……)这些单词的记忆被处理成恒定的表征;这与你是念出来,还是用打字机打出来,还是用手写出来没有关系。请注意,你不必将演讲存上两份,一次是为念的,一次是为写的。这个演讲的单份记忆就能产生多种行为。在任何一个区域里,恒定模式都能分为两支,分别沿着不同的路径向下传播。

系统中最底层的简单对象的表征能够被各种更高级的序列反复利用,这也可以说是比较有效的方式。例如,葛底斯堡演讲和小马丁·路德·金(Martin Luther King Jr.)的“我有一个梦想(I Have a Dream)”的演讲中的单个单词你不必记上两套,即使这两个演讲中包含了一些相同的用词。一个由嵌套序列构成的体系使得我们能共享、重复利用低级层级所存储的事物——单词、音素和字母,等等。这是一个非常有效的存储世界及其结构的方法,它与电脑的工作方式是决然不同的。

序列的这种展开方式也出现在感觉区,而不仅仅是出现在运动区,展开的过程也能让你从不同的方面去感觉并理解事物。如果你走近冰箱去取冰激凌,那么你的视觉皮层会在多个层级上变得兴奋起来。在比较高的层级上,你感觉到一个恒常稳定的“冰箱”。在较低的区域里,这个视觉上的预期分解成一系列更多的局部视觉输入。看到冰箱这一行为是由注视冰箱的门把手、造冰机、门上的磁吸、孩子画的画等组成的。就在你从冰箱的一个局部特征扫视到另一个特征的几毫秒的瞬间,对每一次扫视结果的预测也同时在视觉体系中向下传播。只要这些预测随着一次次的扫视得到确认,高层的视觉区域就确信你看到的就是个冰箱。请注意,在这一例子中,与葛底斯堡演讲中词的固定顺序有所不同的是,看着冰箱时所感知到的序列不是固定的——视觉输入流与提取的记忆模式流取决于你动作的顺序。因此在此例中,展开的模式不是严格次序的序列,但最终结果却是一样的:缓慢改变的高级模式展开成快速变化的低级模式。

当信息在脑皮层体系中上、下流动时你的记忆序列以及用名字表征它们的方式可能使你联想起军令的体系。司令官发令道:“调兵佛罗里达过冬。”随着命令在系统中向下传达,这一简单的高级命令被展开成一系列许多详细的指令。司令官的部下明白这一命令要分解成许多的步骤,比如说准备出发、将部队往佛罗里达转移以及准备到达等。这些步骤又被进一步分解成更小、更具体的步骤,由下一级来完成。到了最底层,上千士兵完成成千上万的动作,部队才得以行进,然后逐级形成命令实施的情况报告。随着这些报告向上呈报,它们被反复地汇总,直到到达顶层,最后司令官收到一份日志:“调兵佛罗里达完毕。”他不需要了解所有的细节。

但这一规律有一种例外情况。如果发生了事故,命令链上的下属无法处理,那么问题就会被逐级提交直到有人知道怎么处理为止。知道如何处理该问题的军官并不把它看作是例外。对部下来说,没有预测到的问题却是他规划中已预计到的下一个任务:军官向下属重新发出新的指令。新大脑皮层的工作方式就与此类似。我们很快就会看到,当没有预期到的事件(或模式)出现时,关于它们的信息就会在脑皮层系统中向上传递,直到有一个区域能够处理这些信息。如果脑皮层中较低的区域无法预测它们看到的是什么模式,它们就会认为这是一个错误并且将这一错误向上传递。这一步骤反复进行直到某一区域确能预测出这一模式。

****************************

无一例外地,脑皮层的每一区域都在努力存储并且提取序列。但这样来描绘大脑的工作原理仍然过于简单。我们要在这一模型中增加稍许的复杂性。

这些到达脑皮层某一区域的“自下而上”的输入是由成千上万以至上百万的轴突所承载的输入模式形成的。这些轴突来自不同的区域,且包含着各种模式。即使是在1000个轴突上可能的模式数量也比宇宙中的分子数还要多。在人的一生中,一个脑皮层区域只能看到这些模式中的极小一部分。

那么,问题就出来了:当一个区域存储序列时,这些序列又是关于什么的序列呢?问题的答案就是:这个区域先将输入分类,将它们归到有限的几种可能性中,然后再寻找能与之对应的序列。假设你就是一个脑皮层区域,任务是分拣彩色纸片。要将纸片分拣到10个桶中,每个桶上都贴有一张色标样片,其中一个桶装绿色纸片,一个装黄色,另一个装红色,等等。然后,把彩色纸片一张一张递给你,你必须将它们按颜色分类。递给你的每张纸片都稍有不同,因为世界上的颜色是无穷尽的,因此你不会拿到颜色完全相同的两张纸片。有时你会比较容易确定一张纸片该放进哪个桶中,而有时却会有些困难。一张纸片的颜色有可能介乎红色和橙色之间,但你必须做出选择,要么放进红色的桶,要么放进橙色的桶,哪怕判断可能是随机的。(举这样一个例子是要说明大脑必须将模式进行分类。脑皮层的各区域都要完成类似的工作,当然不是将模式放入桶里。)

然后,你的新任务是寻找序列。你发现“红—红—绿—紫—橙—绿”经常共现。请注意,如果纸片没有事先被分成不同的类别,那么要识别序列便是不可能的。在没有将每张纸片进行分类的前提下,你无法确定两个序列是否完全一样。

现在你就可以开始了。你将看到所有的输入模式——从低层的皮层区域传上来的彩色纸片——将它们归类,发现序列。将信息分类和序列化是产生恒定表征所必需的两个步骤,也是皮层中每个区域都要进行的两个步骤。

当一个输入有歧义时,比如一张纸片的颜色介乎红色和橙色之间,形成序列的这个过程就能派上用场了。即使你不能确定它到底是红色多一点还是橙色多一点,你也不得不为该纸片选一个桶来装。如果你知道与输入对应的最有可能的序列是什么的话,那就可以利用这个知识来决定如何将有歧义的输入进行分类。假如你因为刚刚见过两张红色的、一张绿色的和一张紫色的纸片,从而认为当前的序列是“红—红—绿—紫—橙—绿”,那么你就会预期下一张会是橙色的。但是,当下一张纸片到你手上时,你却发现它不是橙色的。它是介乎红色和橙色之间的一种颜色,看起来好像更接近红色。但你更熟悉“红—红—绿—紫—橙—绿”这样的序列,并也正期待着这样的序列。所以你会把这张纸片放进装橙色纸片的桶。这时你就是利用了已知序列的前后关系来消除歧义的。

在我们的日常体验中时刻都能遇到这样的现象。当人们说话时,脱离了具体上下文,他们所说的单个词语就可能让人听不懂。然而,当你听到一个句子中的某个模糊不清的词时,不会因为这个词而使整个理解过程受阻,你照样能理解这个句子。同样地,离开了上下文,手写的字也经常有认不出的时候,但是,如果将它放到一个完全手写的句子中,你就能认出来了。在多半情况下,你是意识不到自己在利用大脑中的序列记忆来填充模棱两可或不完全的信息的。你听到了你所期待听到的,看到了所期待看到的——至少当你所听到的和所看到的符合过去经验时是这样。

请注意,序列记忆不但能让你消除当前输入中的歧义,还能帮你预测接下来的输入会是什么。当你的大脑皮层在分拣颜色纸片时,你会对递给你纸片的人说:“嘿,万一你要是决定不了接下来要递给我什么,根据我的记忆,应该是橙色的了。”识别出一个模式序列后,大脑皮层区域就会预测接下来的输入模式会是什么,并告诉下面的区域该期待什么。

皮层区域不但识记熟悉的序列,还学习如何对其已有分类进行修改。比如说,你一开始有了一些贴有“绿”“黄”“红”“紫”和“橙”字样的桶,你准备要识别“红—红—绿—紫—橙—绿”序列或由这些颜色组成的其他组合,但如果某种颜色呈现出很大的不同,那又怎么办呢?如果每次你都能识别出“红—红—绿—紫—橙—绿”序列,而紫色总有些不太像紫色,那又会怎么样呢?这种不太像紫色的颜色更像是靛蓝。因此,你把“紫色”桶的标签改为“靛蓝”,这时,这些桶才更符合你所看到的,你也会减少产生歧义的可能性。可见,大脑皮层是灵活的。

在大脑皮层的各区域中,“自下而上”的分类和“自上而下”的序列化总是相互作用,它们在你的一生中总在变化。这就是学习的本质。实际上,皮层的所有区域都有“可塑性”——它们都可以因经验而改变。形成新的分类和新的序列就是你存储世界的方式。

最后,我们来看一下这些分类和预测是如何与更高层级的区域进行交互的。皮层工作的另一方面就是将你所看到的序列的名字传递给上一层区域,也就是说你将写有“红”“红”“绿”“紫”“橙”“绿”等字样的纸片传给上一层级,它们对上方的区域来说本身并没有多大意义,因为“名字”不过是一个模式,但它们将与其他经过分类的输入结合成更高层级的序列。与你刚才所做的一样,这个上方的区域也在跟踪所看到的序列。在某一刻,它可能会对你说:“嘿,万一你无法确定下面要传给我什么,根据我的记忆,我预测应该是‘黄—黄—红—绿—黄’序列了。”从基本上讲,这是指导你应该在自己的输入流中去寻找什么的指令。你将尽可能把所看到的内容解释成那个序列中的一部分。

既然许多人都听过人工智能和机器视觉研究领域中的一个术语——模式分类,那就让我们来看看模式分类这一过程与大脑皮层的处理有何不同。为了让机器能识别物体,研究人员一般都会建立一个模板,比如,杯子的图像或者杯子的原型,然后让机器学着将输入与杯子的原型进行匹配。如果两者在很大程度上匹配,计算机就会说它看到了一个杯子。但我们的大脑中并没有类似的模板,而且每个皮层区域作为输入所接受的模式也不是图像。你所记住的并不是视网膜所看到的事物的快照,也不是耳蜗或皮肤所接受的模式的快照。大脑皮层的层级结构保证了对事物的记忆分布于皮层的层级结构中,而并不集中存于一点。并且,因为在皮层体系中每一个区域都形成恒定的记忆,所以,典型的皮层区域所学得的就是恒定表征序列,这些序列本身也是恒定记忆的序列。人脑中是找不到杯子或其他物体的图像的。

与照相机的记忆所不同的是,你的大脑记住的是世界的本质,而不是它看上去的那个样子。当你对世界进行思考时,你是在提取那些对应于世界上物体的存在和表现方式的模式,而不是它们在某一刻通过你的任何感官所表现出来的样子。你用以体验世界万物的序列反映的就是世界的恒定结构。你体验世界各部分的顺序是由世界结构所决定的。比如,你是通过直接走下登机走廊,而不是从售票台登上飞机的。你赖以体验世界的序列就是世界的真正结构,也就是大脑皮层所要记忆的内容。

但不要忘了,大脑皮层里任一区域中的恒定表征,都能通过将模式沿皮层体系向下传播而被转化为你感官将要感知的样子的细节性预测。类似地,皮层运动区的恒定表征也能通过将模式沿运动体系向下传播而被转化为细节性的、情境特异的(situation-specific)运动指令。

大脑皮层区域会是什么样子呢?

让我们再来看看图5中的小方格所示的大脑皮层区域,现在,图6为我们提供了有关这些皮层区域的更多细节。我们将从描述皮层区域的结构开始,让你了解皮层区域中的细胞是如何学习并提取模式序列的,以及什么是形成恒定表征和进行预测的最必要的元素。大脑皮层的各区域大小差异显著,其中最大的要数基本感觉区。比如说V1区,从它在大脑后部所占的空间来说,大约有一个护照那样的大小,但是,正如我前面所讲过的,它是由许多只有像BB弹大小的微小区域所组成的。现在我们先假定典型的皮层区的大小为一枚硬币那么大。回想一下我在第三章说过的那6张名片,其中每一张都代表着皮层组织中的一个层级。我们为什么会说大脑皮层有层级呢?如果把硬币大小的皮层区放到显微镜下去观察,你就会发现从上到下细胞排列的密度和形状都不一样。我们正是根据这些差异来进行分层的。最顶层,是6层当中最清楚的一层,我们把它叫做第1层。这一层中的细胞很少,主要是由与皮层表面平行延展的轴突所组成。第2层和第3层看起来很相似,它们是由许多紧密排列的、被叫做“锥体细胞”的神经元组成,而这些神经元之所以得此名,是因为它们的细胞体很像一个小小的金字塔。在第4层中有一种星形的细胞。第5层中除了有正常大小的锥体细胞外,还有一类巨大的金字塔形状的细胞。在最底层,也就是第6层,也有几类独特的神经元。我们正是根据这些差异以及其他一些方面的不同进行分层的。

图6 层级和垂直柱

一般情况下,我们注意的是水平层,但科学家经常会谈及细胞垂直柱,这些细胞垂直柱是垂直贯穿各层的。可以把细胞垂直柱看作是由协同工作的细胞所组成的垂直单位。(“垂直柱”这一叫法在神经科学圈内有很大的争议。关于它们的大小、功能和重要性都存在不同见解。但是,就本书的目的而言,我们可以把它们看成是一种柱状的结构,这是大家都赞同的看法。)垂直柱内的各层是通过上下延展的轴突连接起来的。这样,形成了纵向的突触。这些垂直柱并不是界限分明、整齐的小柱子——大脑皮层不会这么简单——但有若干证据可以推断它们是存在的。

上述理由之一就是每个垂直柱中垂直排列的细胞对同一刺激通常会同时产生兴奋。如果我们近距离去观察V1区中的垂直柱,就会发现有些垂直柱会对朝一个方向倾斜的线段(/)产生反应,而另一些垂直柱则对朝另一个方向倾斜的线段(\)产生反应。每一垂直柱中的细胞彼此间都有很强的联系,这就是为什么整列的细胞会对同一刺激产生反应的原因。具体地说,第4层的一个被激活的细胞会使其上的第3层和第2层中的细胞兴奋起来,然后引起底下第5层和第6层中的细胞产生兴奋。兴奋状态就在细胞垂直柱中上下传播。

我们把细胞看成呈垂直柱状的另一个理由是基于大脑皮层的形成方式。在胚胎期,单个的前身细胞从内脑室移动到皮层最终成形的地方。这些细胞中的每一个都分裂形成大约100个神经元,我们把它叫做微型柱(microcolumn),与我刚才所描述的垂直柱连接起来。“垂直柱”一词经常被用来粗略地描述不同的现象,它可以用来指一般的垂直连通性,也可以指来自同一前身细胞的某一组细胞。根据第二种提法,我们可以说人类的大脑皮层大约有好几亿个微型柱。(www.daowen.com)

为了让你对这种柱状结构有个形象的了解,请设想一下单个微型柱的粗细和我们的头发一样。我们将上千根头发扎成一束,再切成小段,切的长度大概就是不带点的小写字母i那么长。然后将这小段头发排整齐,用胶将它们粘起来,这样看上去就像一支很浓密的刷子。然后,将长头发横向粘合成薄薄的一层,表示第1层的轴突,再将其粘到刚才那块短头发上面。这个刷子状的头发块就是硬币大小的皮层区的一个简单模型。信息是顺着头发的方向流动,在第1层中水平流动,在第2层到第5层中纵向流动。

关于这些垂直柱你还需要了解另外的一个细节,然后我们才能开始谈它们的作用。如果我们仔细观察的话就会发现,每一个垂直柱中,细胞上的突触有超过90%是与外部相连的,这些突触中有一些是来自邻近的垂直柱,其他的则来自半个大脑距离以外的地方。既然大脑皮层连接中有如此大面积的横向连接,那么为什么我们要强调垂直柱的重要性呢?

答案就在于记忆-预测模型。早在1979年,当蒙卡斯尔提出单一的皮层算法时,他就指出了皮层垂直柱是皮层中的基本计算单位。然而,那时他尚不知道垂直柱都起了些什么作用。我认为垂直柱是预测的基本单位。一个垂直柱要兴奋并能进行预测,就必须知道其他地方都发生了什么,因此,就有了从各处而来的突触。

我们很快就会涉及许多细节问题,这里仅仅需要说明一下我们的大脑中为什么需要这样的连接。要预言一首歌中下一个音符是什么,你必须知道这首歌的名字,现在演奏到了歌曲中的什么地方,上一个音符结束有多久了,以及上一个音符是什么。而将一个垂直柱中的细胞连接到大脑中其他地方的大量突触,能为每一个垂直柱提供它在许多不同情境下预测下一步兴奋状态必要的上下文信息。

****************************

接下来我们要考虑的是,这些硬币大小的皮层区域(以及它们内部的垂直柱)是如何沿着皮层体系上、下发送、接收信息的。我们先来看看向上的信息流,见图7所示。向上的信息流沿着一条直接的路径进行传递。设想一下,我们正在观察一个有着成千上万个垂直柱的皮层区域,将这个区域进行放大,由下面区域汇流而来的输入总是先到达第4层——主要输入层,顺带形成了第6层中的连接(我们后面会谈到为什么这样做很重要),然后第4层的细胞在各自的垂直柱内将信息向上投射到第2层和第3层中的细胞。当一个垂直柱向上投射信息时,第2层和第3层中的许多细胞会向更高层级区域的输入层伸展轴突,这样,信息就沿着体系中的一个个区域向上流动。

图7 在某个皮层区域中向上的信息流

相比之下,皮层体系中向下信息流的路径就没有那么直接了,这可以从图8中看出来。第6层中的细胞是皮层垂直柱中向下投射的输出细胞,它们向位于自己所属区域下方的区域的第1层投射信息。在第1层中,轴突在下面的皮层区域中延展很长的距离,因此在体系中,从一个垂直柱出发的向下信息流有激活下面区域中许多垂直柱的潜能。第1层中的细胞很少,但第2层、第3层和第5层的细胞都在第1层中有树突,所以,这些细胞能被流经第1层的反馈所激活。来自第2层和第3层细胞的轴突在离开皮层的过程中会在第5层中形成突触,从而人们认为它们能激活第5层和第6层的细胞。因此我们说,在皮层体系中,向下的信息流所流经的路径不是那么直接的。向下的信息流能通过第1层的传播,向许多不同的方向分流。反馈信息起源于较高层区域的第6层细胞,然后经由较低区域的第1层向四处传播。较低区域的第2层、第3层和第5层中的一些细胞被激活,这些细胞中有一些又激活第6层中的细胞,激活后的第6层细胞又投射到体系中较低区域的第1层,如此反复。(借助图8可以使整个过程更容易理解。)

图8 在某个皮层区域中向下的信息流

这里,我们先来看看为什么信息的传播会遍及第1层。将恒定表征转化为具体预测,需要有随时决定信息在传播过程中走哪条路径的能力。第1层提供了将恒定表征转化为更细节化的特定表征的途径。如果你既能用口语形式又能以书面形式来回忆葛底斯堡演讲,那么口头和书面两种形式就是在共用一个表征,只是在实际调用时沿两条路径传播。同样地,当我听一首曲子中的下一个音符时,我的大脑首先取一个通用的音程,比如一个五度音程,然后将它转换成正确的特定音符,比如C或G。遍及第1层水平流动的兴奋就提供了相应的机制。高级的恒定预测要沿皮层向下传播而成为具体预测,我们就是需要一种能允许模式流在各层级分流的机制,而第1层刚好能胜任这一任务。即使我们不知道这一机制到底存在与否,但我们还是可以预测出它的必要性。

最后是解剖学的发现:当轴突离开第6层到达其他地方时,它们都被包裹在一种叫做髓磷脂的白色脂肪物质里。这种所谓的白质就像房间里电线的绝缘层,它有助于信号间不致相互干扰,并能使信号传递得更快。信号是以大约每小时320千米的速度传播的。当轴突离开白质时,就进入了第6层中新的皮层垂直柱。

****************************

最后,皮层区域间还有另一种通信的间接方式。

描述细节之前,我们先回忆一下第二章中曾讨论过的自-联想记忆。你应该还记得自-联想记忆能用于存储模式序列吧?当一组人造神经元的输出反馈成为所有神经元的输入,并在反馈上还增加一点延迟时,模式就会一个接一个地形成序列。我认为,大脑皮层是运用了相同的机制来存储序列的,虽然可能还有一些其他的招数,但它不是由人造神经元形成自-联想记忆,而是由皮层垂直柱形成自-联想记忆的。所有序列的输出又反馈回第1层,这样一来,第1层就知道皮层区域中哪些垂直柱是兴奋的。

图9 运动行为中巨大的第5层细胞的作用

现在让我们再来看一些细节的问题,见图9所示。多年来,人们已知皮层运动区(M1区)中巨大的第5层细胞与肌肉和脊髓中的运动区有直接的联系,这些细胞直接驱动肌肉,使你能够运动。只要你在说话、打字或进行一些高级的行为,这些细胞就会高度协调地切换兴奋状态,使肌肉产生收缩。

近来,研究人员发现巨大的第5层细胞不仅在运动区,可能还在皮层的其他区域的行为中起着作用。比如,视觉皮层中大型的第5层细胞会将信息投射到大脑中负责移动眼球的区域,因此,皮层的视觉区,如V2区和V4区,不但加工视觉输入,还会协助控制眼球的运动,因而你就能看到想看的东西了。巨大的第5层细胞在新皮层的每一个区域都有分布,并在各种运动中扮演着广泛的角色。

这些大型的第5层细胞不但有运动行为方面的作用,它们的轴突还一分为二,其中一支延伸到大脑中叫做丘脑的那部分,即图9中的圆圈部分。人类丘脑的形状及大小就像两只小鸟蛋,它位于大脑的正中间,在古脑的上方,由白质和皮层包围。皮层的每一部分都有轴突延伸到丘脑,丘脑也有轴突延伸回那些部分。对于这些连接的许多细节我们都已知晓,但丘脑本身却是一个复杂的结构,对它的作用我们还丝毫都不清楚。但丘脑对于维持正常人的生活却是相当重要的——如果丘脑受损,就会导致永久的植物人状态。

丘脑与皮层连接的路径有几条,但现在我们只对其中的一条感兴趣。这条路径从巨大的第5层细胞开始,这些细胞将信息投射到丘脑中的那类被认为是非特定的细胞上,这些非特定的细胞又将信息通过轴突投射回许多皮层区域的第1层。比如,V2区和V4区内所有的第5层细胞都有轴突延伸到丘脑,丘脑又将信息回馈给V2区和V4区内所有的第1层细胞。皮层的其他部分也是如此:皮层中许多区域的第5层细胞都与丘脑相连,丘脑又将信息回馈到那些区域或与其相关的区域。我认为,这一回路酷似自-联想记忆模型中能学习序列的延迟反馈。

我们知道,第1层细胞有两种输入:皮层中较高区域将兴奋传播到下面区域的第1层,某一区域内兴奋的垂直柱也通过丘脑将兴奋传播给同一区域的第1层。我们可以把这些到达第1层的输入看成是歌曲的名字(由上面区域传来的输入)和歌曲当中的位置(同一区域中兴奋垂直柱传来的延迟反馈)。因此,第1层中承载着大量信息,我们需要用这些信息来预测一个垂直柱何时应该兴奋——序列的名字以及我们处于序列中的位置。利用第1层的这两种信息,任何大脑皮层区域都可以识记与调用许多不同的模式序列。

皮层区域的详细工作原理

有了这3种回路——沿皮层体系而上的汇聚模式、沿皮层体系而下的扩散模式、经由丘脑的延迟反馈,我们就可以开始讨论皮层区域是如何完成它所具有的功能了。这里,我们想了解如下几个问题:

1.皮层区域是如何将输入进行分类的(如前面的彩色纸片桶)?

2.皮层区域是如何识记模式序列的(如曲调中的音程和面孔识别中的“眼—鼻—眼”序列)?

3.皮层区域是如何形成稳定模式或序列的“名字”的?

4.皮层区域是如何做出具体预测的(什么时候接火车合适,或在一个曲调中预测特定的音符)?

我们先假设皮层区域中的垂直柱就像我们用以将彩色纸片分类的桶,每一个垂直柱就相当于一个桶上的标签。每一个垂直柱中的第4层细胞接受来自下面若干区域的输入纤维,如果这些输入的组合是正确的,它就会兴奋起来。这个第4层的细胞兴奋起来,就表明了输入与其标签相符。正如在纸片分类的比喻中输入有时可能会有歧义一样,针对同一输入可能会有多个垂直柱与之相符。这时,我们要求皮层区域做出唯一的解释:纸片要么是红色的,要么是橙色的,不能两者皆是。一个有着强输入的垂直柱应该能够抑制其他垂直柱的兴奋。

大脑中有起抑制作用的细胞,它们能完成这项工作。这些细胞能有效地抑制皮层某一区域附近的其他神经元,而只允许一个神经元兴奋,它也只能影响到垂直柱附近的范围。因此,即使有大量的抑制,一个区域中的许多垂直柱仍能同时兴奋起来。(在人脑里,没有任何事物是由单个神经元或单个垂直柱表征的。)为了容易理解起见,我们权且认为一个区域只有一个垂直柱胜出。但你要记住,实际上可以有许多垂直柱同时兴奋。皮层中一个区域将输入分类的实际过程以及它是如何学会这么做的,这个问题非常复杂,我们还无法完全了解。我不会试图让你绕开这些问题,相反,我认为皮层区域是将输入归成一组垂直柱的兴奋状态。

接下来,我们来集中谈谈序列的形成以及序列的命名吧。

皮层区域是如何存储这些分类模式序列的呢?这个问题实际上我已经回答过了,但现在我还想多谈谈有关的一些细节问题。假设你是一个细胞垂直柱,来自下面区域的输入使你的第4层细胞兴奋起来,对此你很满意,接着第4层细胞又激活了第2层、第3层细胞,然后是第5层、第6层细胞也被激活。整个垂直柱由下方驱动而变得兴奋起来。第2层、第3层和第5层的细胞都有成千上万的突触伸展到第1层,如果当第2层、第3层和第5层的细胞兴奋起来时,这些突触中有一些也跟着兴奋起来的话,这些突触就得到了加强。如果经常这样,这些第1层的突触就会变得很强,足以让第2层、第3层和第5层的细胞在第4层细胞没有产生兴奋的情况下也被激活——这意味着这个垂直柱的某些部分在没有从皮层中较低区域接受输入的情况下也能兴奋起来。这样,第2层、第3层、第5层的细胞便学会了根据第1层的模式来预期它们应该在何时产生兴奋。也就是说,在这种学习之前,这个垂直柱只有在第4层细胞的驱动下才会兴奋起来,而在学习以后,垂直柱能通过记忆产生部分的兴奋。当垂直柱通过第1层的突触而兴奋起来时,它在期待来自下面的驱动。这就是预测。如果垂直柱会说话,它就会说:“过去当我被激活时,第1层的某些特定的突触也是被激活的。因此,当我再次看到它们兴奋时,我就会因有所预期而兴奋。”记得我们说过,第1层中有一半的输入是来自皮层的邻近区域或垂直柱中的第5层细胞,这些信息代表着片刻前曾发生过的事件,代表着在你之前已经兴奋的垂直柱。它就是曲子中的前面那个音程,或者是最后看到的东西,或是最后感觉到的东西,或者是所听话语的最后一个音素。如果这些模式在时间上发生的顺序是稳定不变的,那么垂直柱就能学会这一顺序,它们就会以适当的序列接连兴奋起来。

第1层输入的另一半信息是来自体系中更高层级区域中的第6层,这些信息更稳定。如果你的垂直柱是音程的话,那么它就是曲子的名字;如果你的垂直柱是音素的话,那么它就是你听到的单词;如果你的垂直柱是口语单词的话,那么从上面传来的信号就是你正在说的话语。因此,第1层中的信息同时表征着序列的名字和序列中最后的那个项目。这样,一个特定的垂直柱由于能被许多不同的序列分享而不会产生混淆。垂直柱学会了在适当的上下文中以正确的顺序产生兴奋。

在继续往下讨论之前,有一点我要指出来,那就是第1层中的突触,它们不是仅有的会预感垂直柱何时兴奋的突触。正如我前面所讲过的,细胞从许多邻近的垂直柱那里接受输入,也向它们发送信息。前面我们曾说过,有超过90%的突触是来自垂直柱以外的细胞,而且这些突触中的大部分都不是来自第1层的。比如,第2层、第3层和第5层中的细胞在第1层中有成千上万的突触,同时在自己的这个层次中也有成千上万的突触。这里全部的思想就是细胞需要信息以帮助它们预测自己何时会被下面的区域驱动。通常情况下,邻近垂直柱中的兴奋有着很强关联性,因此,我们能看到有许多伸展到邻近垂直柱的直接连接。比如,如果一条直线移过你的视野,那么它就会激活一系列连续的垂直柱。但是,用以预测一个垂直柱是否需要激活的信息则常常是更全局性的,这也是第1层的突触所要起的作用。如果你是一个细胞或一个垂直柱,你并不知道这些突触意味着什么,你所知道的仅仅是它们能帮助你预测自己何时需要兴奋起来。

****************************

现在让我们来看看皮层区域是如何为一个已了解的序列命名的。我们再一次来假设你是皮层中的一个区域。你的兴奋垂直柱会随着每一个新的输入而有所变化。你已经成功地学得了垂直柱被激活的顺序,也就是说,你的垂直柱中有一些细胞会先于来自下级区域的输入到达之前而兴奋起来。那么你发送给皮层体系中更高区域的是什么信息呢?我们已经知道,你的第2层和第3层细胞会将轴突延伸到较高的区域,这些细胞的兴奋状态就是向更高区域发送的输入。但这样会有一个问题。为了让整个体系能正常运作,你不得不在学习序列期间传递一个恒定的模式。你得传递序列的“名字”,而不是它的细节。在学习序列之前,你可以传递细节,但在你了解了序列之后,当你能成功地预测哪些垂直柱会被激活时,你应该只传递恒定模式。然而,到目前为止,你还没有为序列命名。不论能否预测到变化着的模式,你都会将它们中的每一个进行传递。当一个垂直柱变得兴奋时,它的第2层和第3层细胞就会沿着体系向上发送一个新的信号。大脑皮层需要有一种机制,即在学习序列的过程中能让发送给下一区域的输入保持恒定。大脑皮层能使垂直柱在预测到自己要被激活时不让第2层和第3层的细胞有所输出,而当它预测不了时,仍让第2层和第3层的细胞保持兴奋。这是产生恒定模式的唯一方式。

现在我们还不甚了解大脑皮层,也无法说清楚它到底是如何做到这一点的。我认为有几种方法能让脑皮层做到这一点。我将介绍目前我认为最满意的观点——但请记住,比起谈到的具体方法来,更重要的是思想。产生恒定的“名字”模式是我们理论模型的要求。现在我所能说的只是这个命名过程存在着比较合理的机制。

现在我们来假设你是一个垂直柱,见图10所示的垂直柱。我们想知道,当你在能预测自己的兴奋状态时,是如何学会将恒定模式传递给较高的区域的,而当你不能预测自己兴奋状态时,又是如何将变化模式传递给较高区域的。我们先假定在第2层和第3层有若干不同类别的细胞。(除了几类抑制细胞以外,许多解剖学家还将其区分为第3层a型和第3层b型这样两种细胞,因此,这个假设并不是没有道理的。)

图10 预测中抑制细胞的作用

我们还假定有一类细胞,我们把它叫做第2层细胞,它们在学习序列的过程中是一直保持兴奋状态的。作为一个整体,这些细胞表征着序列的“名字”。只要我们的皮层区域能预测接下来哪些垂直柱会兴奋起来,它们就会向较高的区域传递恒定的模式。假如我们的皮层区域有一个由5种不同模式组成的序列,那么,那些表征这5种模式的垂直柱中的第2层细胞,就会在我们处于这一序列当中时一直保持兴奋。它们就是这一序列的“名字”。

下面,我们再假设还有一种细胞,即第3层b型细胞,它们在垂直柱成功预测出输入时不产生兴奋,而当垂直柱不能预测兴奋状态时却能兴奋起来。那么第3层b型细胞就是表征预料之外模式的。当一个垂直柱出乎意料地变得兴奋时,这种细胞就会兴奋;每当一个垂直柱在学习之前变得兴奋时,它也会兴奋。但当一个垂直柱学会了预测自己的兴奋状态时,第3层b型细胞就不会兴奋了。所以,第2层细胞和第3层b型细胞一起满足了我们的要求,学习之前,这两种细胞都会随垂直柱的状态而改变兴奋状态,但经过“训练”之后,第2层细胞就会恒定兴奋,而第3层b型细胞则一直保持安静。

这些细胞又是怎样学会这些的呢?首先,让我们来看看当垂直柱成功地预测到自己的兴奋状态时,第3层b型细胞是如何被抑制的。我们不妨认为,在第3层b型细胞的上方有另一类细胞,叫第3层a型细胞。这样的细胞也有树突延伸到第1层。它唯一的作用就是:当它在第1层中遇到合适的模式时,就会阻止第3层b型细胞产生兴奋;当第3层a型细胞在第1层中见到已学过的模式时,它就会迅速激活一种抑制细胞,以阻止第3层b型细胞的兴奋。这就是当垂直柱正确地预测了自己的兴奋状态时,它用以阻止第3层b型细胞兴奋的途径。

现在,我们再来看看更难的任务——在已知模式序列中使第2层细胞始终保持兴奋。这一任务更困难,其原因在于许多不同垂直柱中各类第2层细胞要同时保持兴奋,哪怕它们自己的垂直柱并没有被激活。我认为可以这样来解释这种现象:第2层细胞可以学会完全被更高层的区域所驱动,它们会优先与来自较高皮层区域的第6层细胞的轴突形成突触。这样,第2层细胞就表征着来自较高区域的恒定“名字”模式。当较高的皮层区域向下方区域的第1层发送一个模式时,下方区域的一组第2层细胞就会兴奋起来,它们代表着属于这一序列的所有垂直柱。因为这些第2层细胞也将信息投射回较高的皮层区域,所以这些细胞也就成了一组半稳定的状态。(这些细胞并不见得会恒定地保持兴奋,它们大概只是有节奏地兴奋。)这个过程就好像是较高区域向下方区域的第1层发送了一个曲调的名字,使一组第2层细胞兴奋,每一个第2层细胞都对应着听到曲调时会产生兴奋的垂直柱。

所有这些机制合起来,就能让大脑皮层学习序列、做出预测以及为序列形成恒定表征(或“命名”)。这些是形成恒定表征的基本操作。

****************************

那么,我们又是如何对从未见过的事件进行预测的呢?我们是如何在一个输入的众多解释中进行取舍的呢?皮层区域又是如何基于恒定记忆而做出具体预测的呢?关于这个问题,之前我举过几个例子。比如,当你的记忆仅仅调用了两个音符间的音程时,你能预测到曲调中的下一个音符;还有关于火车的例子和背诵葛底斯堡演讲的例子。在所举的这些例子当中,解决问题的唯一途径就是利用最后的特定信息将恒定预测转化为具体预测。换言之,从大脑皮层的角度来说,我们必须将前馈信息(实际的输入)与反馈信息(恒定形式的预测)相结合。

下面这个例子可以说明我对此是怎样认为的。比如说,你的皮层区域被告知要期待一个5度音程。区域中的垂直柱表征着所有可能的具体音程,比如C-G、D-A、C-E等,你必须决定需要激活哪个垂直柱。当上方区域告诉你要期待一个5度音程时,它就激活了所有表征5度音程(比如,C-G、D-A以及E-B等)的垂直柱中的第2层细胞,而表征其他音程的垂直柱中的第2层细胞将不被激活。现在,你必须在所有可能表征5度音程的垂直柱中选择出一个来。皮层区域的输入是具体的音符,如果你最后听到的音符是D,那么所有表征与D有关的音程的垂直柱,比如,D-E和D-B,就获得了部分的输入。因此,现在在第2层中的所有表征5度音程的垂直柱都兴奋起来了,而在第4层中,所有表征与D有关的音程的垂直柱也获得了部分信息。这两组垂直柱的交集就是我们的答案,也就是表征D-A5度音程的垂直柱(详见图11)。

图11

大脑皮层又是如何找到这个交集的呢?记得在前面我提到过,第2层和第3层的细胞在离开皮层时通常会在第5层形成突触,同样地,靠近第4层的来自下面区域的轴突在第6层会形成突触。这两种突触(一个自上而下,一个自下而上)正是我们需要的。接受了这两种兴奋输入的第6层细胞就会兴奋。第6层细胞表征着皮层区域认为正在发生的状况,也就是一个具体的预测。如果第6层细胞会说话,它就会说:“我属于一个表征某事物的垂直柱。现在的情形是,我所属的垂直柱表征着D-A音程,其他垂直柱则表征其他的事物。我代表着我的皮层区域。一旦我兴奋起来,就意味着我们认为D-A要么是已经出现,要么就是即将出现。我之所以兴奋是因为来自双耳的自下而上的输入使第4层细胞激活了整个垂直柱。或者我的兴奋状态可能意味着我们识别了一个曲子,并正在预测下一个具体的音程。不管是哪种情况,我的任务就是告诉下面的皮层区域我们认为发生了什么。我代表着我们对世界的解读,不管它是现实的还是想像的。”

我再用另一个心理图画来描绘这一机制。设想一下,我们有两张钻了许多小孔的纸片,其中一张纸片上的小孔代表着那些第2层或第3层兴奋的细胞垂直柱,也就是我们的恒定表征。另一张纸片上的小孔代表着来自下方区域的部分输入。如果将两张纸片重叠的话,你会发现,其中一些小孔能对齐,而另外一些则对不齐。对齐了的小孔就代表着我们认为需要激活的垂直柱。

这一机制不但能产生具体预测,还能消除来自感觉输入的歧义。有时候,一个皮层区域的输入可能是模棱两可的,就好像我们所提过的关于彩色纸片的例子,或者听到了一个模棱两可的单词。这种自下而上、自上而下的匹配机制,能让我们在两个或更多的解读中做出取舍。一旦做出了选择,你就会将你所选的解读传递给下面的区域。在你的一生中,只要你是清醒的,你的新皮层中每一个区域时时刻刻都在将由上方区域激活的一组期待垂直柱与由下方区域激活的一组实际观测垂直柱相比较。这两组的交集就是我们所感知的。如果我们的输入是完美的,且我们的预测也是完美的,那么,那组感知垂直柱就总会出现在那组预测垂直柱中。但并不会总是这么一致。这种结合部分预测与部分输入的方法能消除有歧义的输入,能填补缺失的信息,也能在不同的解读中做出选择。我们就是这样通过将一个期待的音高——恒定的音程与最后听到的音符相结合,来预测曲子中接下来将要听到的具体音符的;我们也是这样来判断一幅画是一个花瓶还是两张脸的;同样,我们也是用这种方法将运动指令流一分为二,分别写出或说出葛底斯堡演讲的。

最后,第6层细胞除了把信息投射到较低的皮层区域外,它们还将输出信息发送回自己所属垂直柱的第4层细胞,这样一来,我们的预测就成了输入。想入非非或思考问题时,我们就是这么做的,这能让我们知道自己预测的结果。每天我们都花费一些时间在做这样的事情——规划未来、排演讲话以及担心将要发生的事。斯蒂芬·格罗斯伯格,一位长期从事大脑皮层研究的科学家,把这种情况叫做“折叠反馈(folded feedback)”。而我更喜欢“想像(imagining)”这一提法。

在结束这一部分之前,我们再来看看最后一个问题。我曾有好几次都指出,我们所看到、听到和触摸到的结果往往取决于我们自己的行动。看什么,取决于我们的眼睛在扫视何处、我们的头又是如何转动的。触摸什么,取决于我们怎样移动自己的手臂和手指。会听到什么,有时取决于我们的所说和所做。

因此,要想预测自己下一步的感受,我们就得知晓自己目前采取的是什么样的行动。运动行为与感官知觉相互是高度依赖的。如果我们下一步的感觉每每取决于我们自己的行动,那么我们如何进行预测呢?所幸的是,对这一问题我有一个漂亮而又令人吃惊的答案,虽说其中有许多细节尚不清楚。

第一个让人感到吃惊的发现就是,知觉和行为几乎就是同一的。正如我前面说过的,大脑皮层中如果不是全部的话,也是大部分区域,甚至包括视觉区都参与了运动的产生过程。投射到丘脑和第1层的第5层细胞似乎也有运动功能,因为它们同时也将信息投射到古脑的运动区。这样,对于“刚刚发生了什么”——包括感觉和运动两方面的知识,第1层都能获知。

令人感到惊奇的第二点,同时也是第一点的结果,那就是,运动行为也必须由恒定表征体系来表征。通过以恒定方式来周详地考虑将要做的事,你就会产生完成特定活动所需的动作。运动指令在沿体系向下传播的过程中被转化为完成预期活动所需的复杂而细节化的序列,这在“运动”皮层区和“感觉”皮层区都有发生,从而模糊了彼此的差别。如果视觉皮层的IT区感知到了“鼻子”,在向“眼睛”的表征切换时,就产生了让预测(由看到“鼻子”而预测到能看到“眼睛”——译者注)变成现实所需的一次扫视。由看“鼻子”转换成看“眼睛”所需的特定扫视,会根据所看的面孔在何处而有所不同:较近的面孔需要较大幅度的扫视;面孔距离较远时,则只需要较小幅度的扫视就行。侧着的面孔与正面的面孔所需的扫视的角度也是不同的。随着看“眼睛”的预测向V1区流动,所需扫视的细节也随之确定下来。预测向下走得越低,扫视就变得越是具体,最后,经过扫视,你的视网膜凹正好落在要观察的对象上,或者很接近那个对象的地方。

我们再来看看另一个例子。我的身体要从起居室走到厨房,这时,大脑的任务就是要在心理上将起居室的恒定表征转换到厨房的恒定表征,这样的切换导致了序列展开的复杂过程。在从起居室走到厨房的过程中,产生了关于我将所看、所触和所听的预测序列,同时也产生了能使我从起居室走到厨房的运动指令,并导致在此过程中我眼睛的移动。模式在皮层体系中上下流动的过程中,预测和运动行为彼此很好地合作着。只要你的行为有所涉及,你的预测就不但要先于感觉,而且还会决定感觉。这听起来让人感到有点奇怪。对序列中下一模式的思考,会引起对你接下来将要体验到什么的预测,即所谓阶流式预测(cascading prediction)。随着阶流式预测的展开,就产生了完成预测所需的运动指令。思考、预测和行动都属于沿皮层体系下行序列的同一个展开过程。

通过思考而“行动”,以及知觉和运动行为的平行展开过程,是所谓面向目标的行为的核心内容。面向目标的行为是机器人研究的神圣目标,它被置入皮层的结构之中。

当然,我们可以关掉运动行为。我可以想像看到了某个事物而不必真正看见它,我也可以想像已走到厨房而不必真正那样去做。但是,“思考做某事”确实是我们完成这件事的开始。

上行与下行

让我们先来回想一下,信息是如何在皮层体系内上下流动的。当你在世界中走动时,变化着的输入涌进大脑皮层较低的区域。每一区域都会试图把输入流解读为属于已知模式序列的一部分。垂直柱试图预测自己的兴奋状态。如果垂直柱预测到了自己的兴奋状态,它们就向上方区域传递一个稳定的模式,或者序列的名字。就好像这个区域会说:“我听到了一首歌,这是歌的名字,我能处理有关它的细节。”

但如果一个预料外的模式到达了,比如,听到了一个预料外的音符,那又会怎样呢?或者说,假如我们看到的东西并不是面孔的一部分,那又会怎样呢?预料外的模式会被自动传递到较高的皮层区域。当不属于期待序列的第3层b型细胞兴奋时,这种情况自然而然就发生了。较高的区域也许能将这一新的模式解释成自己已知序列的下一部分。它也许会说:“噢,我看到了一个新的音符。也许这是歌曲集中下一首歌的第一个音符,好像就是这样。因此,我预测现在我们已经转到下一首歌了。喂,下方的区域,这就是下面这首歌的名字,我想你听的就是它了。”但是,如果连这样的识别过程都没有发生,这个预料外的模式就会一直沿着皮层体系往上传递,直到某个区域能把它解读成自己正常的事件序列。预料外模式传递得越高,就有越多的皮层区域参与到消除意外输入的处理过程中来。最后,当体系的上方有一个区域认为自己能解读这个预料外的事件时,它就会产生一个新的预测,这个新的预测就沿着体系尽可能地向下传播。如果这个新的预测还是不对,就会有错误被检测到,这样,这个预料外模式又将再一次沿体系往上传递,直到有某个区域能把它识别为自己兴奋序列的一部分。这样,我们看到观测模式沿体系向上传递,而预测则沿体系向下传播。在理想状态下,如果一个世界是已知的并且是可预测的,那么,大部分的上下模式流主要是快速地发生在皮层的较低区域。大脑迅速地尝试着找到自己世界模型中与预料外输入相一致的部分。只有在这个时候,大脑才能有理由知道接下来要期待什么。

假设我走进自己家的一间熟悉的房间,就不可能有任何错误会沿大脑皮层传播。关于我家的已熟练掌握的序列在视觉和运动体系的低级区域就能很好地被处理。我非常熟悉自己的房间,甚至可以在黑暗中摸索着四处走动。因为我对周围环境很熟悉,所以大脑皮层的大部分区域能得到有效的释放,可以用来完成其他的一些任务,比如思考关于大脑的问题和写书等等。然而,如果我是在一间不熟悉的房间,尤其是在一间与我以前所见过的很不一样的房间里,我不但要四处打量以确定自己的位置,而且预料外的模式会不断传到皮层体系中高层区域。感觉体验与已学序列之间越是不匹配,就会有越多的错误向上传递。在这样的新环境中,我不可能再思考有关大脑的问题,因为大部分皮层区域都在忙于处理漫步房间的事宜。这是那些步下飞机踏上异国土地的人们都曾有过的体验:即使异国的道路与你熟悉的道路大同小异,但汽车可能会奔驰于马路的另一边;货币也很陌生,语言也不通,找厕所也需要花费所有的大脑资源。初到异国他乡,走在路上,我们是无暇排演讲话的。

顿悟的感觉,“啊哈!”——突然明白后所发出的感叹,都能用这个模型来解释。想像一下,假设你正在看一幅模糊的图片。画面上满是墨水团和七零八散的线条,它好像什么都不是,丝毫没有意义。当大脑皮层没有找到与输入相匹配的记忆时,就产生了混乱。你的眼睛细细审视画面的每个角落,新的输入直接传到皮层体系的高层区域,高层的皮层区域尝试给出许多不同的假设,但每当这些预测沿体系向下传播的时候,它们都与输入发生了冲突,皮层不得不再次尝试新的假设。在整个混乱的过程中,你的大脑完全投入到了理解图画的任务之中。终于,你的高层皮层区域做出了正确的预测。这时候,这个预测从皮层体系的最高层出发,成功地通过了一个又一个的区域,最后到达了皮层的底层。在不到1秒钟的时间内,大脑皮层的每一区域都得到了与输入相匹配的序列,不再有错误传到高层。你知道自己已经看明白了这幅图画,看到了一只走在点线之间的斑点狗(见图12)。

图12 你看到了斑点狗吗

反馈真能完成这一任务吗?

几十年来,我们一直都认为皮层体系中的连接是相互的,如果区域A将信息投射到区域B,那么区域B也会把反馈信息投射回区域A。一般情况下,反馈轴突纤维比前馈轴突纤维要多。然而,即使这一看法被人们广泛接受,人们却普遍认为反馈在大脑中的作用很小,仅仅起“调节”的作用。那种认为反馈信号能及时且准确地引起第2层中多组细胞兴奋的看法,并没有得到广大神经科学家的认同。

为什么会这样呢?其中部分的原因在前面已有所提及,那就是,如果你不接受预测的关键作用,也就没有必要虑及反馈了。如果你认为信息直接流向运动体系,那为什么还需要反馈呢?不考虑反馈的另一个原因就是,反馈信号遍及第1层的广大区域。我们一般认为大面积分布的信号对许多神经元只能起到很小的作用,大脑中确实存在着一些这样的调节信号,它们不针对特定的神经元产生作用,而只是改变诸如警觉等的全局特征。

忽视反馈作用的最后一个原因在于,没有多少科学家认为单个神经元是独立工作的。典型的神经元有成千上万的突触,这些突触有些远离细胞体,另一些则离细胞体很近。靠近细胞体的突触对细胞的兴奋有很强的影响。细胞体附近如果有十多个兴奋的突触,那么它就可能释放电脉冲。这是大家都知道的。然而,绝大多数突触并不靠近细胞体,它们分布在有着大脑一样结构的细胞树突上的广大区域。正因为这些突触远离细胞体,所以科学家大多都认为,到达其中一个突触的电脉冲对其所在神经元所产生的作用很弱,甚至难以察觉。而对那些更远的突触,电脉冲可能在还没到达细胞体之前就已经消散了。

沿皮层体系向上传递的信息是通过靠近细胞体的突触来传递的,这被看作是一条基本原则。因此,我们可以更加肯定,沿体系向上传播的信息会流经一个个的区域,同时,沿体系向下传播的反馈信息是通过远离细胞体的突触而传递的,这也被看作是一条基本规则。第2层、第3层和第5层中的细胞都将树突伸展到第1层,并在第1层形成许多突触。第1层遍布着突触,但这些突触都远离位于第2层、第3层和第5层的细胞体。此外,第2层中任何一个特定的细胞与任一特定的反馈纤维只会形成几个突触(如果有的话)。因此,一些科学家对第1层的短暂模式会精确地引起第2层、第3层和第5层中的一组细胞兴奋这一看法是持反对意见的。但我所提理论恰恰要求这样。

解决这一难题,关键是要认识到神经元并不是以传统模型中的方式在工作。实际上,近年来有越来越多的科学家提出,远距离的纤细树突上的突触对细胞兴奋有着很积极和明确的作用。在这些模型里,这些远距离的突触与靠近细胞体的粗厚树突上的突触有着不同的表现。比如,如果纤细树突上有两个彼此很接近的突触,那么它们就会充当“共同探测器(coincidence detector)”的角色。也就是说,如果在一个很小的时间窗内,这两个突触都收到了一个尖脉冲输入,那么即使它们都远离了自己的细胞体,也会对所属细胞产生很大的影响——它们会使细胞体也产生一个尖脉冲。神经元的树突到底是如何工作的,这仍然是个谜,所以,在此我不会多谈。重要的是,大脑皮层的记忆-预测模型要求远离细胞体的突触能探测到特定的模式。

回头再看,认为一个神经元上成千上万的突触只起调节作用的想法似乎是很愚蠢的。大量的反馈信息和大量的突触之所以存在是自有道理的。根据这样的看法,我们可以说,当典型的神经元在纤细的树突上形成突触时,它们就能够学习反馈纤维上的上百个精确耦合。这意味着,从哪个反馈模式会使其激活这个角度来考虑,我们新皮层的每一个垂直柱都具有高度的灵活性。同时也意味着,任一特定的特征都能与成千上万个不同的对象和序列产生精确的联系。我的模型要求反馈要迅速且精确,即细胞必须在它们发现远离自己的树突上一旦有精确的耦合时就产生兴奋。这一点在那些新的神经元模型中已被考虑到了。

大脑皮层如何学习

皮层的所有层次中任何细胞都有突触,而且大部分突触都可以通过经验进行修改。我们不妨可以说,学习和记忆存在于所有的层次和所有的垂直柱中,以及所有的皮层区域中。

在本书的前面,我提到过以加拿大神经心理学家唐纳德·海布(Donald O.Hebb)的名字而命名的海布学习法则。其要点很简单:如果两个神经元同时兴奋的话,它们之间的突触就会得到加强。现在我们知道海布基本上是正确的。当然,世上万物都不会是这样简单的,人脑中的许多细节就更加复杂了。我们的神经系统有许多海布学习法则的变体,例如,一些突触会根据神经信号时长的微小变化而改变其强度,一些突触变化很短暂,而另一些则较长。但海布仅仅是为关于皮层学习的研究提供了一个框架而已,它不是一个最终的理论,但这一框架是相当有用的。

海布学习法可以解释我在本章中提到的大部分皮层行为。请记住,还是在20世纪70年代就已经证明了,利用经典海布学习算法的自-联想记忆系统就可以学习空间模式和模式的序列。它的主要问题在于,这样的记忆不能很好地应对变化。根据本书提出的理论,大脑皮层能突破这方面的限制,其途径部分是通过将自-联想记忆纳入皮层体系之中,部分是通过复杂的垂直柱结构。本章主要讨论的就是皮层体系及其工作原理,因为体系结构是大脑皮层之所以强大的原因。因此,我并不是要详细讨论每一个细胞是如何学这学那的,我只想论及一些皮层体系学习的基本原则。

在你出生之际,你的大脑皮层对世界基本上是一无所知。它不了解你的语言,你所处的文化,你的家,你的城市,歌谣以及将伴随你成长的人,总之是一无所知。所有这些关于世界结构的信息,都要通过学习来获得。学习的两个基本要素就是形成对模式的分类和建立序列,这两个相辅相成的记忆组件相互作用着。当一个皮层区域学习序列的时候,到达第4层细胞的输入就在变化。因此,这些第4层细胞就会学着进行新的分类,并改变投射回第1层的模式,进而对序列产生影响。

形成序列的基本过程就是将属于同一事物的模式归为一个组。有一种方法就是将时间上连续发生的模式归为一组。如果一个孩子手拿玩具并慢慢移动它,她的大脑会认定她的视网膜上对于该玩具的影像是不同时刻下同一物体的影像,因此,这一组变化着的模式可以联系到一起来。而在另一些场合下,你却需要借助外部指令来决定哪些模式是一个整体。要想了解苹果和香蕉是水果,而坚果和芹菜却不是,就需要老师指导你将前两者归为水果。不管是哪种方式,你的大脑都在慢慢建立起归为一组的模式序列。但是,当一个皮层区域在建立序列时,下一个区域的输入就在改变,输入从主要表征单个的模式变成了表征一组一组的模式,一个区域的输入就从音符变成了曲调,从字母变成了单词,从鼻子变成了面孔,等等。因为到达一个区域的自下而上的输入变得更加“面向对象”,所以皮层的较高区域现在可以学习这些更高层级对象的序列了。一个曾形成字母序列的区域,现在形成了单词序列。这一学习过程给人带来了意想不到的结果:在反复的学习过程中,对象的表征会沿着皮层体系向下移动。在你生命的前几年里,你对世界的记忆首先形成在皮层的较高区域,但随着你的进一步学习,这些记忆会在皮层体系的越来越低的区域中重新形成。这并不是说大脑将它们向下转移,而是指它不得不一次又一次地重新学习。(我并不是说,所有的记忆都是从皮层的顶层开始的。当然,记忆的实际形成过程更为复杂。我相信第4层的模式分类是先从底部开始,然后往上移动的。但在此过程中,我们开始形成序列,随后这些序列往下移动。我指的是对模式的记忆会在皮层的越来越低的区域中重新形成。)随着简单的表征往下移,位于皮层底部的区域就能学习更复杂、更细微的模式了。

你可以通过观察孩子的学习过程,来了解分层记忆是如何形成并向下移动的。想一想我们是怎样学习、阅读的吧。我们首先学会的是识别单个的印刷字母,这是一个缓慢而艰难的任务,它要求有意识地去努力。然后我们要识记简单的词汇,这一过程开始也是很困难且缓慢的,即使是学习最简单的词(三字母词)也是一样。孩子可以挨个念出每一个字母,但需要大量的练习才能把它们认作是一个完整的单词。学习了简单词汇以后,我们开始艰难地学习多音节单词。起先,我们会念出每一个音节,然后把它们连起来,就像我们学简单词汇时把字母连起来一样。经过多年的练习,我们才能读得很快。再往后我们会达到这样一种程度,不再看每一个单个的字母,而是一眼就能识别整个的单词或短语。这并不是因为我们读得快的缘故,实际上,这是因为我们把单词和短语当作一个整体来识别了。那么,当我们识别一个完整单词的时候,我们还能看到字母吗?答案既是肯定的,也是否定的。视网膜看到的是字母,因此V1区看到的也是字母。但识别字母只发生在皮层体系的较低层次,比如说V2区或V4区。当信号到达IT区时,表征的不再是字母了。当诸如字母等简单对象的记忆在体系中往下移动时,皮层的较高区域就能够学习单词和短语等更复杂的对象了。

另一个例子是学识乐谱。首先你得全神贯注于每一个音符。通过练习,你开始识别常见的音符序列,然后是整个乐句。经过大量练习以后,你就好像根本没有看见大部分的音符一样。活页乐谱放在那儿仅仅是帮你回忆乐曲的主要结构,细节性的序列已经储存在更低的层次中了。这类学习在运动和感觉区域都是存在的。

孩子的大脑在识别输入和做出预测方面都是比较慢的,这是因为服务于这些任务的记忆储存在皮层体系的较高层级中。为了消解冲突,信息不得不上下贯穿整个皮层,甚至还需要经多次的反复。神经信号要上下贯穿整个皮层体系是需要时间的。孩子大脑的顶部还没有形成复杂的序列,因此还不能识别和回放复杂模式,还理解不了世界的高级结构。与成人相比,孩子的语言、音乐以及社会关系都很简单。

如果你反复研究某一类事物,你的大脑皮层将在较低的层级中形成对它们的记忆表征,这就把皮层的较高层级给释放出来了,可以利用它来学习更细微、更复杂的关系。根据这一理论,专家就是这样被培养出来的。

在设计电脑的工作当中,我在看到产品时就能很快发现其设计上的瑕疵,很多人对此感到惊讶不已。经历了25年的电脑设计工作,在与移动计算设备有关的问题上,我形成了一个比普通人要强得多的模型。同样地,一位有经验的父母是很容易就能知道孩子为什么会不安的,但刚做父母的人处理这样的情形来则可能要费更多的周折。有经验的经理人能很容易发现团队中结构上的问题和优势,而对新手来说,他们则很难看到这些。他们都有着同样的输入,但新手的模型显然不够复杂,缺乏高级。在所有这些以及更多的事例当中,我们都是从学习最基本的结构和基础知识开始的。随着时间的推移,我们会将这些知识下移到皮层体系的下方层级中,这样,皮层的上方层级就有机会学习更高级的结构了。正是这些更高级的结构,使我们变得很有经验。专家和天才有着比普通人更能观察结构之结构、模式之模式的大脑。你也能通过练习而成为专家,但这其中当然也还包含遗传方面的因素。

海马:处于最高层

在新皮层下有相互能沟通的三大脑结构,它们是基底神经节、小脑和海马。这三大结构都先于新皮层而存在。粗略地说,基底神经节是原始的运动系统,小脑主要学习事件间精确的时间关系,海马则储存具体事件及与地点有关的记忆。从某种意义上讲,新皮层包含有它们原有的功能。比如,一个生来就小脑缺损的人在时间感觉方面会出问题,因此在行动的时候需要刻意地去注意,除此以外,在其他方面他都很正常。

我们知道,新皮层负责所有的运动序列,它能直接控制你四肢的活动。我们并不是说基底神经节就不重要了,我们只是说新皮层已接管了大部分的运动控制。因此,我是在没有提及基底神经节和小脑的情形下来描述新皮层的全部功能的。有些科学家可能不赞同这一假设,但我在本书中和实践中都是这样假定的。

然而,海马却与众不同。我们对大脑中这一区域的研究最为深入,因为它对形成新的记忆是至关重要的。如果你失去了左、右两半海马(像许多神经系统的组成部分一样,海马在大脑中也分为左、右两半),你就失去了形成新记忆的能力。没有了海马,你可以照常说话、走路、看东西和听东西,乍一看你几乎就是个正常人。但实际上,你受了很大的损伤:你记不住所有新的事物;你能记起失去海马前许多年认识的朋友,但你却记不住一个新遇见的人;即使在一年里,你每天去看你的私人医生5次,但你每次见到他时都会觉得是第一次见到他。你对失去海马以后发生的一切事情都无法记住。

多年来,我一直不愿意讨论海马,因为它对我来说没有任何意义。很显然,它对学习相当重要,但我们所掌握的大部分知识最后却不是储存在这里。而新皮层才是信息存放之处。人们对海马的传统认识是:新的记忆先在那里形成,然后,几天、几个星期或者几个月之后,这些新的记忆才被转移到新皮层中。我根本就不这么认为。我们知道,景物、声音、所触之物——一切感觉数据流,都直接流入皮层的感觉区,而不是先经过海马。在我看来,这些感觉信息应该是在皮层中自动形成新的记忆。那为什么大脑皮层学习的时候还需要海马呢?像海马这样一个独立的结构又是怎样干预或阻止皮层中的学习的呢?它又是怎样在若干时间之后再将信息转移回皮层的呢?

我决定先把海马放到一边,心想总有一天它的作用会明朗起来。这一天终于在2002年末出现了,那正是我着手写这本书的时候。布鲁诺·奥斯豪森(Bruno Olshausen),我在红杉神经科学研究中心的一名同事指出,海马与新皮层之间的连接表明海马是新皮层的最高区域,而不是一个独立的结构。这样看来,海马应该处于新皮层金字塔的顶端,也就是图5中的最上面的部分。从进化的角度来看,新皮层似乎是处于海马和其他大脑组织之间。显然,认为海马是皮层体系的最顶端的看法也有些时日了,对此我却不甚了解。我与几位研究海马的专家谈过,我要他们解释一下这个外形酷似海马的结构是如何将记忆转移到皮层的。他们谁都没法解释。并且他们中谁都没有指出海马是大脑皮层金字塔体系的顶点,大概这是因为在生理上,海马不仅位于皮层金字塔的顶端,而且还与许多大脑的较古老部分直接相连吧。

但是,我马上意识到,这一观点正是解决我当前困惑的关键。

想一想从眼睛、耳朵和皮肤传到新皮层的信息。新皮层的每一个区域都试图理解这些信息的意义,每个区域都试图将输入理解为自己已知的序列。如果确实理解了输入,它就会说:“这个我明白。它是我已经看到的事物的一部分。我不会传递细节的信息。”如果一个区域理解不了当前的输入,它就会把信息往上传递,直到有更高的区域能理解它。但是,一个完全崭新的模式会逐步沿着皮层体系上升到越来越高的地方。每一个更高层次的区域都会说:“我不知道这是什么。对此我没有预期,上面的伙计,你何不看看这是什么呢?”最后的结果是,当信息到达皮层体系顶部的时候,剩下的只是根据以前的经验所无法理解的信息了。现在你得到的就是崭新的、无法理解的那部分输入。

每天我们都会遇到许多新的事物,并且这些新事物都会直接到达皮层的顶端。比如说,报纸上的一条新闻,早上结识的那个人的名字,或者在回家路上看到的交通事故,等等。这些无法解释也没有预期到的事物的新记忆进入到海马,并储存在那里。但这些信息不会一直存在那里。这些信息要么被转移到皮层中,要么就永久地丢失了。

我注意到这样一种现象,随着年岁的增长,我感到要记住新事物越来越困难了。比如,我的孩子能记住去年看过的大部分电影中的细节,而我就想不起来。或许这是因为我所看过的多部影片对我而言毫无新鲜感,新电影的内容总是与看过的旧影片的记忆有雷同之处,因此,这些新的信息不会到达我的海马。而对我的孩子而言,每一部电影的内容都比在我看来要更新一些,所以这些信息就会传到海马。如果这是事实的话,我们就可以说,你知道得越多,你记住的就会越少。

与新皮层有所不同的是,海马是一个非均质的结构,它是由若干专门化的区域组成的。它所擅长的就是,快速记住它所看到的任何模式。海马处于皮层金字塔的顶端,这是一个最佳的位置,能记住新的事物。这一位置对于调用这些新的记忆来说也是最佳的,它能让这些记忆转存到皮层体系中。皮层体系存储记忆是一个稍许缓慢的过程,而在海马里,你能快速记住一件新事物。你必须再三体验同一件事物,不管你是在实际体验还是在想像,它才会永久地存于皮层中。

上溯体系的第二通路

大脑皮层中还有第二个主要通道能使信息在区域间传递,通过这一通道,信息还能在体系中向上传递。这条第二通路是从有轴突伸入丘脑(这部分丘脑不同于我们先前讨论过的那部分)的第5层细胞开始,然后经由丘脑一直延伸到皮层中紧接着的较高区域。每当皮层的两个区域上下彼此直接相连时,它们也通过丘脑间接地相连。第二通路只沿体系向上传递信息,而不向下传递信息。因此,当我们沿皮层体系上溯的话,就会有两条通路:一条是连接上、下两个区域的直接通路,另一条则是经由丘脑的间接通路。

第二通路存在由丘脑细胞控制的两种工作状态。在第一种状态下,通路基本上是关闭的,因此信息不能经过。在第二种状态下,信息在两个区域间精确地流动。有两位科学家描述过这第二条通路,并认为它可能与本章曾重点讨论过的直接通路一样重要(也许还更重要)。其中一位是纽约州立大学石溪分校的默里·舒曼(Murray Sherman),另一位是威斯康星大学医学院的雷·古勒雷(Ray Guillery)。

我对第二通路的作用是这样考虑的。

请读一下这个词:imagination。多数人只需瞥上一眼,凭一次注视就能认出这个词。现在再看一下单词中间的字母i。再看一下i上的那个点。你的眼睛可以只注视同一个地方,但第一次你看见的是整个单词,第二次看见的是字母i,而最后一次看到的是i上的点。请你注视着字母i,同时尝试着在单词、字母和点之间切换你的感知。如果这样做有困难的话,请你就在注视着点的时候反复念出“点”、“i”和“imagination”。在每一种情况下,都有同样的信息进入到V1区,但当它到达IT区等较高的区域时,你感知的是不同的对象,它们有着不同的细节信息。IT区知道如何去识别所有这三个对象。它能单独认出字母i上的点,也可以一眼就认出整个单词。但是,当你感知到整个单词的时候,V4区、V2区和V1区都在处理细节,IT区知道的仅仅是单词本身。在阅读的时候,你通常是感知不到单个字母的,你感知到的是整个的单词和短语。但如果你愿意的话,也可以感知到单个字母。我们时时刻刻都在做这样的注意力切换,只是在一般情况下我们没意识到而已。在听背景音乐时,我可以一点儿也注意不到它的旋律,但如果我尝试一下,就可以分离出歌手的声音和贝司、吉他的声音来。进入到我头脑中的都是同样的声音,但我可以把注意力集中到某一种感知上。每次挠脑袋时,手指的运动都会在脑袋里产生很大的声音,但通常你却感觉不到这个噪音。而如果你将注意力集中到它的上面,就可以清楚地听到声音了。这个例子又说明了感觉的输入通常是在皮层体系的较低区域被加工处理的,但如果你需要注意到它的话,它也可以被传送到高级区域。

我猜测,连接丘脑的第二通路就是我们去注意平时不会注意到的细节的机制。它绕过第2层对序列的分类,直接将原始信息送到皮层的较高区域。生物学家指出,第2条通路可以通过下面两种途径开启。其一是通过皮层中较高区域自己发出信号。这是当我要你注意你平常不会注意到的细节的时候你所采用的方法,比如要你看字母i上的点或者听挠头时候的声音。开启这条通路的第二种方法就是从下方传来的很强的预料外的信号。如果到达这条通路的输入足够强,它就会向较高区域发送一个唤醒信号,这样也可以开启通路。比如,如果我给你看一副面孔,然后问你它是什么,你会说“脸”。如果我还是给你看同一张脸,但这次鼻子上有一个奇怪的印记,你会先认出脸来,但很快视觉区的较低层次会注意到有什么不对劲的地方。这时,错误强制性地开启了这一通路。现在,细节信息可以取道第二通路,绕过正常情况下要进行的序列分类,你的注意力也就随之转移到了那个印记上。现在,你注意的将是那个印记而不是那副面孔。如果这个印记相当古怪,那么它将占据你全部的注意力。这样,不常见的事件能很快吸引你的注意力。这就是为什么我们无法避免将注意力集中到畸形事物和其他不常见模式上的原因。你的大脑会自动地完成这一切。然而,有时错误信息不够强,不足以开启第二通路。这就是为什么在阅读的时候一个单词拼错了而我们却注意不到的原因。

结束语

发现并建立一个崭新的科学理论框架,要求我们寻找最简单的原理。这个简单的原理必须能整合并解释大量看似毫无联系的事实。这一过程带来的必然后果就是:我们可能会将问题过于简单化。这样,很多重要的细节可能会被忽视,事实也可能会被曲解。如果这个理论框架有一定的道理,我们就肯定能发现其需要改进或修正的地方,比如或许我们走得太远了,或许走得还不够远,或许它根本就是错误的。

在这一章中,我提出了许多有关新皮层工作原理的设想,我很希望其中有一部分思想被证明是错误的,也许所有的想法都需要进行修订。我还有许多细节没有提到。大脑过于复杂,如果是神经科学家读这本书的话,他们就会觉得我在此仅仅是提供了有关人脑复杂性的一个很粗糙的描述。但我相信,这一框架整体上是站得住脚的。我希望,随着新的数据和理解的出现,细节的内容将会得到修正,但核心思想却能得以保留。

最后,你可能会觉得简单而庞大的记忆系统能产生所有人类行为这一思想难以接受。你我难道真是一个多级记忆系统吗?我们的生活、信念和雄心抱负都是储存在上万亿个细小的突触之上的吗?1984年,我开始专业从事编写计算机程序。以前我曾编过一些小型程序,而这一次却是我第一次编写一个带有图形用户界面的计算机程序,也是我第一次编写大型而复杂应用软件。我在为由Grid Sytems公司创建的操作系统编写软件。因为有了视窗,多种字体,还有菜单,Grid操作系统在当时算是相当进步的。

有一天,我对自己完成的看似不可能的事情而感到惊奇。作为程序员,我得一行一行地写程序代码,我会把多行代码合并为叫做子程序的程序块,把程序又进一步合并成为程序模块,再将模块组合起来形成应用软件。当时,我着手编写的电子表格软件(spreadsheet program)是由大量的子程序和模块组成的,一般人很难读明白其中所有的代码。程序实在是太复杂了,而每一行代码的作用却微乎其微。在显示器上显示一个像素需要多行代码,在整个屏幕上画上电子表格需要计算机执行散布于几百个子程序中的上百万条指令,子程序又反复、递归地调用其他的子程序。程序确实太复杂了,程序一旦运行起来我们几乎就不可能知道将会发生什么。程序运行起来的片刻间,它就画好了需要画的图形,这让我觉得真是难以置信。计算机画好了由数字、标签、文字和图表组成的表格。这个程序已经具备了电子表格的功能。我知道计算机内部到底是怎么回事,中央处理器每次只执行一个简单的指令,很难想像计算机能在迷宫般的程序模块和子程序中飞快地找到并执行所有的指令。如果不是我来写这个程序的话,我肯定会说它根本就无法运行。我想,当时如果某个人有了在有着图形用户界面的计算机上运行电子表格应用软件的主意,当他把程序写在纸上给我看的话,我肯定会拒绝这一想法,并说这肯定实现不了。我会说完成一件事需要很长的时间。实际上,这样的看法太过于保守了,因为程序确实能运行。就在那时,我才意识到对于微处理器运算速度和分级设计效能,我的直觉不太正确。

对于新皮层的问题来说,这是一个值得借鉴的教训。大脑的新皮层并不是由超高速的组件组成,其运作的规则也并不复杂,然而,它却确实有着一个分级结构,里面包含着上亿个神经元和上万亿的突触。如果我们觉得这么一个逻辑原理简单而数值上庞大的记忆系统能产生我们的意识、我们的语言、我们的文化、我们的艺术、还有这本书和科学技术是难以想像的话,我认为这其中的原因是,对于皮层容量以及它的分级结构的效能,我们的直觉不太正确。而新皮层就是这样工作的。它没有什么魔力。我们能理解它,正如我们能研制出计算机来一样,我们最终也能研制出与新皮层有着同样工作原理的智能机器来。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈