理论教育 智能理论新架构:优化思维方式

智能理论新架构:优化思维方式

时间:2023-06-27 理论教育 版权反馈
【摘要】:第五章智能理论新架构A New Framework of Intelligence1986年4月的一天,我正在思考“理解”的真正意义。它是用一种平行的方式连续不断地对我们所在环境的构架进行预测。这种下意识的预测无时无处不在,我们一时无法立刻意识到它,可能这正是其重要性长久以来被我们忽视的原因。人工智能的解决方法是不合情理的。正确的预测形成了理解——大门与平时无异。所有低级预测都是在各个感觉区连续不断地并行发生的。

智能理论新架构:优化思维方式

第五章 智能理论新架构

A New Framework of Intelligence

1986年4月的一天,我正在思考“理解”的真正意义。几个月来我为一些基础问题绞尽了脑汁。如果大脑没有触发行为,那它做了什么?当你被动地听演讲时,大脑做了什么?此时此刻,当你阅读这本书时,大脑做了什么?信息进入大脑却不会再出来,到底发生了什么?你现在的所作所为,如呼吸、眼睛的移动等,都是最基本的行为。大脑在清醒时所做的远比你在阅读和理解这些文字时所做的多得多。理解一定是神经活动的结果,那么神经元在理解时又做了什么?

那一天,我环视办公室,看到了椅子、海报、窗户植物、铅笔以及周围上百种熟悉的东西。扫视时,我的眼睛看到了它们,尽管这种“看”并没有促使我做出任何动作,没有促成任何行为,但我还是“明白了”这个房间以及里面的东西。我正在做塞尔的“中文屋”做不到的事情,不需要从小孔中送出任何东西,我就理解了,但没有任何动作为证。那么,“理解”到底是什么呢?

苦思冥想的我忽然茅塞顿开,那种感觉如此强烈,就像一团迷雾变得豁然开朗。当时我只问了一个问题:如果一个我从未见过的新出现的东西,比如一个蓝色的咖啡杯出现在房间里,将会发生什么?

答案很简单:我会意识到这个东西以前不属于这里,它会让我注意到它是新出现的,我不需要有意识地问自己这个咖啡杯是否是才冒出的,很明显它原本就不属于这儿。这个答案看似简单,其中却潜藏着一个非同寻常的构想:要注意到某个事物与众不同,我大脑中一些原本不活跃的神经元开始变得活跃起来。它是怎么知道蓝色咖啡杯是新的,而房间里其他上百件东西不是呢?这个问题的答案也让我大吃一惊,那就是:我们的大脑在利用记忆不断地对我们看到的、听到的和感觉到的东西进行预测。当我环视房间,我的大脑就利用记忆在我看到某个物体之前进行预测,而绝大部分的预测是在不自觉的状态下进行的,就像大脑的不同部位在说:“电脑摆放在桌子中央吗?是的。它是黑色的吗?是的。台灯在桌子的右上角吗?是的。字典还在我放的位置吗?是的。窗户是长方形的吗?是的。墙与地面垂直吗?是的。阳光是从这个时间的固定方向照进来的吗?是的。”当某种在大脑皮层中没有被储存的视觉模式输入时,这种预测就会被破坏,我的注意力就会被这个差错所吸引。

当然,大脑在预测时并不会自言自语,不会按照某种既定次序进行,也不会对咖啡杯这类确切的物体进行预测。它是用一种平行的方式连续不断地对我们所在环境的构架进行预测。它只会探测那些奇怪的结构,如变形的鼻子或异常的动作。这种下意识的预测无时无处不在,我们一时无法立刻意识到它,可能这正是其重要性长久以来被我们忽视的原因。它是那么自然而然,轻而易举,以至于我们无法透彻了解大脑中到底发生了什么;它是那么的普遍,因此知觉并不是意识(也就是世界显现在我们眼前的样子)的唯一来源。我们的意识是我们感觉到的一切与源于大脑记忆的预测之结合。

****************************

为了说明当时的想法,几分钟后我设计了一个思维实验,叫做“改变了的门”。它是这样的:

每天你回到家时,都会用几秒钟的时间穿过大门。你伸出手,转动门把手,走进去,然后关上门。这已成为固定的习惯,你经常做,而且很少注意它。假设在你外出时,我溜进你的家,对你家的大门做了一些手脚,比如把门把手向旁边移动几厘米,将球形把手换成指按门闩,或是将黄铜把手换成镀铬把手。我也可以扩大或缩小门框,改变它的颜色,在猫眼的位置安上一个门环,或是加上一个窗户……总之,我可以想出上千种你所不知道的变化。当你回到家,准备开门时,会很快觉察到有些异常。你可能需要几秒钟才能反应上来到底发生了什么,但你却能立刻意识到某种变化。伸出手转动把手时,你会意识到它不在原来的位置;看到门上新开的窗户时,你会觉得怪怪的;如果改变了门的重量,你会觉得使错了劲,感到很惊讶。总之,你会在极短的时间内注意到这上千种变化中的任何一种。

你是怎么做到的?你是怎么注意到这些变化的?要解决这个问题,人工智能和计算机工程师会列出有关门的所有特性并输入数据库,所有门的每一个特性和你家大门的具体特征都设有专门的信息组。当你靠近大门时,计算机就会向数据库询问有关大门的宽度、颜色、大小、门把手的位置、门的重量、声音等信息。从表面来看,这似乎和我环视办公室时大脑核对各种预测的过程很相似,但它们之间的差异是真实而深远的。人工智能的解决方法是不合情理的。首先,提前列出一个门的所有特性是不可能的,那样的话,它将是一份长得没有穷尽的清单;第二,我们还必须将一生中每一秒遇到的每一个物体列出清单;第三,在已掌握的有关大脑和神经元的知识中没有任何一点可以说明神经元是这样工作的;最后,神经元的反应速度太慢,无法执行计算机类型的数据库,如果是那样,你可能要花费两分钟而不是两秒钟才能注意到门的变化。

因此,只有一种办法可以解释你对改变了的门所做出的反应——你的大脑对于某个特定时刻将要看到、听到和感觉到的东西进行了低级感觉预测,而且是并行的,脑皮层各个区域都会自动地预测下一步的感觉。视觉区对边缘、形状、物体、位置和动作做出预测;听觉区对音调、声音的来源以及声音的模式做出预测;体觉区则对触摸、质地、轮廓以及温度进行预测。

这里所谓的“预测”,就是指参与感觉你家大门的神经元在确实收到感觉输入之前就变得活跃了起来,当感觉输入真正到达之后,再将它和预料的情况进行对比。当你走进大门时,大脑皮层会根据以往的经验形成大量预测;当你伸出手时,它会预测你的手指将会感觉到什么,什么时候你会接触到门;当真正接触到门时,你的关节会是什么角度;当你推开门时,脑皮层会预测门的阻力会有多大,门会发出什么样的响声。当所有的预测都与实际相符合时,你就会走进大门,根本意识不到这些核对预测的过程。对门的预测一旦被破坏,这个差异就会引起你的注意。正确的预测形成了理解——大门与平时无异。而不正确的预测则使人产生疑惑和警觉——门闩不在原来的位置,门太轻了,门不在中间的位置,门把手的材质不对劲,等等。所有低级预测都是在各个感觉区连续不断地并行发生的。

但这并不是全部。我要提出一个更有力的观点——预测不仅仅是你的大脑所做的事情,它还是大脑皮层的主要功能,也是智能的基础。脑皮层是一个预测器官,如果要解读什么是智能、什么是创造力、大脑是如何工作的以及如何建造智能机器,我们必须了解这些预测的本质,并搞清楚它们是如何形成的,甚至对作为预测副产品的行为都要透彻地了解。

我不知道是谁第一个提出了预测是了解智能的关键。在科学界和产业界没有人发明出任何全新的东西,人们看到的只是如何将已有的思想纳入新的框架。在被发现之前,新想法的组成成分通常只是在科学对话的背景里传播,而真正的创新是将这些成分组合成一个整体。同样,“脑皮层的主要功能是预测”这一看法也不是全新的,它已存在一段时间了,但在大脑理论和智能的定义方面它却一直没有取得应有的位置。

具有讽刺意味的是,一些人工智能的先驱却试图用计算机建立一个世界模型并进行预测,其中的例子就是D.M.麦凯(D.M.Mackay)。他在1956年曾提出,智能机器应该拥有一种“内部反应机制”与接收到的东西相匹配。他没有用“记忆”“预测”这样的名词,但思路是一样的。

20世纪90年代后期开始,像“推论”“生成模式”“预测”等名词悄然进入了科学术语表,它们都是指那些相关的想法。纽约大学医学院的鲁道夫·李纳斯(Rodolfo Llinas)在2001年出版的新书《旋涡中的我——从神经元到自我》(i of the vortex)中写道:“对未来事件的结果做出预测的能力对于成功至关重要,极有可能是大脑最根本也是最普通的功能。”另一些科学家,如布朗大学的大卫·曼福特(David Mumford)、华盛顿大学的罗杰西·拉奥(Rajesh Rao)以及波士顿大学的斯蒂芬·格罗斯伯格(Stephen Grossberg)都曾著书立说,用各种方式从理论上说明反馈和预测的作用。英国人托玛斯·贝叶斯(Thomas Bayes,生于1720年)是统计学的鼻祖,以他的名字命名的贝叶斯理论网络是数学领域的一个分支,专门利用概率理论进行预测。

目前,我们缺乏的是将这些毫不相干的点点滴滴组织起来,形成一个统一的理论框架。我认为,这是我们以前没能够做到的,也是我这本书要达到的目标。

****************************

在仔细探讨大脑皮层是如何进行预测的之前,让我们再看几个例子。你会发现,对此思考得越多,你就会越发感到,预测是无处不在的,它是你了解世界的基础。

今天早晨我煎了薄饼。在做饭的过程中,有一次我伸手到台面下打开橱柜的门,不用看,凭直觉就知道我会摸到什么——此时应该是橱柜的把手,也知道什么时候能摸到它。我拧装牛奶的瓶盖,预料到它会转动,然后很轻松地将其打开。我把煎锅放在炉子上,预料到开关会轻轻地按下,然后稍稍费力地转动,1秒钟以后就能听见火苗发出的“噗”的一声。在厨房的每一分钟,我都会做几十个甚至上百个动作,每一个动作又包含许多的预测。我之所以知道这些,是因为一旦这些普普通通的动作中哪怕有一个与预测的动作不一样,我都会很快意识到。

每一次你抬脚走路时,你的大脑就会预测到你的脚何时停止移动以及会给你踩到的东西多少“压力”。上下楼梯时如果一脚踩空,你会马上意识到这个错误;如果你抬脚过低,当你的脚“擦到”台阶的一霎间,你就会知道自己有麻烦了。实际上,你的脚感觉不到什么,是你的大脑在预测,而这些预测和实际的动作没有吻合,才会产生以上的情况。如果是一个电脑机器人,就会“毫无顾忌地”跌下来,根本意识不到出了什么问题。至于你,你的脚一旦超出大脑判断应该停止的位置哪怕是几厘米,你就会马上意识到。

当你听一首熟悉的旋律时,你的大脑会提前“听”到下一个音符是什么;当你听自己最喜欢的音乐专辑时,每一首歌开始之前你就能知道它的开头是什么。这是怎么回事?原来,大脑中听到下一个音符时应该激活的神经元,在真正听到它之前就提前激活了,于是你在大脑中“听”到了这首歌。神经元的激活是对记忆做出的反应,这种记忆存在的时间长得惊人。多年后当你再次听到这张专辑时,仍然可以在一首歌结束之后自然而然地“听”到下一首歌,这种现象并不少见。但是,如果你不按顺序随机地听你喜欢的一张CD中的歌曲,就会有一种因为疑惑而产生的愉悦感,因为你知道自己对下一首歌的预测是错误的。

听演讲时,你通常会提前知道他们要说什么——至少你认为自己知道!甚至有时你听到的不是演讲人实际说的话,而是你期望听到的。(在我小时候类似的事情经常发生,以至于妈妈曾两次带我去看医生,检查我的听力是否出了毛病。)之所以出现这种情况,部分原因是由于人们在谈话时总会使用一些很常见的词语和表达形式。如果听到我说:“白日依山_,黄河入海_。”你的大脑神经元就会被激活,在我将每一句说完整之前,就会浮现出“尽”“流”这两个字。(如果你熟悉这首中国唐代诗歌的话,你就会有这种感受。)当然,我们并不总是能够知道别人将要说什么,预测也并不总是准确的,然而,我们的大脑是通过预测可能发生的事情来进行工作的。有时我们可以准确地知道下一步会发生什么,而有时我们的预测又会产生多种可能性。例如,当我们坐在餐桌旁用餐时,如果我说:“请递给我——”不论下一个词是“盐”“胡椒”还是“芥末”,你的大脑都不会感到惊讶,因为从某个角度来说,它已经预测到所有可能发生的结果了。然而,如果我说:“请递给我人行道。”你马上就会意识到出问题了。

再让我们回到音乐,在这里,我们仍然可以看到对于可能性的预测。当你听一首以前从没听过的歌时,你仍然可以有相当强烈的预测。对于西方音乐来说,我会期望听到某个常规的节拍、某个重复的节奏,或是希望歌曲在主高音上结束。你可能不明白这些术语的意思,但是,假设你在听一种类似的音乐,你的大脑会自然而然地预测节拍、重复的节奏、乐句以及整首歌的结束。如果一首新曲子破坏了这些规律,你会立即意识到曲子有问题。而且当你听一首以前从未听过的曲子时,你的大脑经历的模式是以前从未经历过的,但你仍然可以做出预测,可以辨别出是否出了问题。这些下意识的预测是以存储在你大脑皮层中的记忆为基础的。你的大脑不能确切地说出下一步将会发生什么,但它能够预测出哪一种音符模式可能出现,哪一种不可能出现。

我们都有过这样的经历:当某些连续的背景声音,比如远处的风钻发出持续的噪音,或是在餐馆、商店、工厂等播放绵绵的背景音乐时,我们会毫不在意;然而一旦它们停下来,我们会马上注意到。你的听觉区域预测的是音乐的连续性,只要它不变化,你就不会留意,而一旦它停下来,就破坏了这种预测,于是就吸引了你的注意力。下面是一个真实的故事。纽约市刚刚停运高架火车时,经常有人半夜报警说他们被什么东西惊醒,而报警的时间往往是以前火车经过他们公寓的时间。

我们都喜欢说“眼见为实”,而我们看到的事物中有我们真正看到的,也有我们希望看到的。其中一个最有趣的例子和研究人员所说的“填补”有关。你可能早就注意到眼睛的视网膜上有一个小小的盲点,这个盲点上没有光感应器,因而你视觉区域中相应的点也是什么都看不见的。但我们为什么没有注意到它们呢?原因有两个,一个很普通,一个则具有启发性。那个普通的原因,就是两只眼睛的盲点不交叉,因此一只眼睛能补偿另一只眼睛。

但有趣的是,如果闭上一只眼睛,你仍然注意不到盲点,因为你的视觉系统“填补”了丢失的信息。当你用一只眼睛看着华丽的土耳其地毯或樱桃木桌面上波浪形的纹理时,你看不出任何缺陷——毯上的线结和木纹上的黑色结节被盲点覆盖时,视网膜就捕捉不到它们;然而你看到的却是天衣无缝的材质和颜色,因为你的脑视觉皮层利用了相似模式的记忆形成了连续的预测流,填补了丢失的输入信息。

“填补”发生在视觉影像的各个部分,而不仅仅在盲点上。如果我给你看一张海滩的照片,海滩的岩石上放着一些漂流木,木头和岩石之间的界限清晰可见。但是,如果我们放大图片,你就会发现岩石和木头接触点的材质和颜色非常相似。在放大了的部分上,木头的边缘很难和岩石分开,但从整个画面看,木头的界限很清楚。实际上这个清楚的界限是我们通过图像的其他部分推想出来的。看世界时,我们可以感到不同物体之间存在的线条和界限,但进入我们眼睛的原始数据经常是纷乱而模糊的,我们的大脑皮层会将它认为应该的内容填进那些失去或是混乱的部分,这样我们就看到了清晰的影像。

视觉预测也是眼睛移动方式的一种功能。在第三章中我曾提到眼扫视,也就是说每秒钟内有3次我们的眼睛会固定在一个点上,然后又突然跳到另一个点。通常你意识不到这种移动,你也不能有意识地控制它们。每一次眼睛变换注视点时,进入大脑的模式都会完全改变,即1秒钟内你的大脑会看到3次完全不同的东西。眼扫视并不完全是随机的。看到一张脸时,你首先注视的是脸上的一只眼睛,然后是另一只,并不停地打量,然后才会固定在鼻子、嘴、耳朵和其他器官上。你感觉到的是一张脸,而眼睛看到的却是眼睛——另一只眼睛——鼻子——嘴——眼睛,等等。我知道你的真实感觉并非如此,你感觉到的是周围环境的连续景象,但进入你大脑的原始数据却像一台抖动的便携式摄像机所拍下的图像一样不平稳。(www.daowen.com)

想像一下,如果你遇到一个人,他脸上原本是眼睛所在的地方长着一个鼻子。你的眼睛首先会注视一只眼睛,然后是另一只,但如果你看到的不是眼睛而是一个鼻子,这时你肯定知道出了问题。之所以会这样,是因为你的大脑对于将要看到的东西有预测。当你预测的是眼睛,而看到的却是鼻子,这个预测就被破坏了。因此随着每一次眼扫视,你的大脑在每秒钟都会对下一步将要发生的事情进行多次预测,如果哪个预测出现了错误,马上就会引起你的注意。这也解释了为什么遇见身体畸形的人我们总是忍不住多看几眼。如果看到一个长着两个鼻子的人,你很难做到眼睛不盯着看。当然,如果和这个人一起生活一段时间后,你就习惯了这两个鼻子,也就不会再把它当作什么不寻常的事情加以关注了。

现在,想想此时此刻的你在做什么预测。当你翻开书本,你会预测到页码会略微弯曲,并以某种可预测的方式翻动,这种方式与封面翻动的方式完全不同。如果你坐在椅子上,你会预测到身体感觉到的压力是持续不断的。但如果椅子突然湿了,或者开始向后滑动,或者是什么突然的变化,你的注意力就会从书本上移开,尽量要弄明白发生了什么事。如果你花些时间观察一下自己,就能明白你对世界的看法、对世界的理解同样也和预测紧紧联系在一起。你的大脑早已建立起了一个有关外部世界的模型,并不断地将这个模型和事实相比较,因为这个模型的有效性,你才会知道自己在哪里,自己正在做什么。

预测并不仅仅存在于“看和听”这一类低级的感觉信息模式上。到目前为止,我的讨论一直局限于这类事例,是因为这样的例子是介绍智能新框架的便捷方式。然而,根据蒙卡斯尔的理论,低级感觉区感知到的事实,对于脑皮层的所有区域来说,都是普遍存在的。人类的大脑之所以比其他动物的大脑聪明,是因为它能够对更加抽象的模式和更长的时间模式流做出判断。现在,我的妻子正盯着我,要想预测她要说什么,我必须知道她说过什么——今天是星期五;垃圾袋必须在周五的晚上放到马路边上;上个星期五我把这事忘了。现在她脸上是那样一种表情。当她张开嘴时,我有强烈的预感,知道她要说什么。在这种情况下,尽管不清楚她的具体措辞,但我确实知道她要提醒我把垃圾袋拿出去。我要说的是,高级智能并不是一种不同于感性智能的处理过程,它同样是以大脑皮层记忆和预测算法为基础的。

要知道,智力测试从本质上讲就是预测能力的测试。从幼儿园的游戏到门扎(Menza)测验,所有智商测试的基础都是做预测。给你一个序列数,下一个数字应该是什么?给你看一个复杂形状的物体的三个面,下面哪一个也是这个物体的面?以词语A和词语B的关系为前提,那么词语C和哪个词有类似的关系?

科学本身就是一种预测练习。我们进行一系列的假想和实验,从而不断改进我们对世界的看法。这本书也是对什么是智能以及大脑工作原理的预测。甚至连产品的设计也是一种基本的预测过程。不论是设计服装还是设计手机,工程师们都会猜测竞争对手的做法、消费者的需求、新产品的成本以及什么样的款式是市场需要的。

智能是通过记忆能力和对周围环境中模式的预测能力来衡量的,包括语言、数学、物体的物理特性以及社会环境。你的大脑是从外部世界获得信息并将它们储存起来,然后将它们以前的样子和正在发生的情况进行比较,并以此为基础进行预测的。

****************************

说到这儿,你可能会想:“即使躺在黑暗中什么都不做,我也是智能的。这个说法我可以接受。正如你所说的,我并不需要专门做什么来理解或获得智能。但这样的情况难道不是例外吗?你难道能说智能的理解与行为毫不相干吗?最终使我们具有智能的不正是行为本身而非预测吗?毕竟,行为是生存的最终决定者。”

这个问题提得很好。当然,对于动物的生存来说,行为是最重要的因素。预测和行为不是完全分离的,但它们之间的关系相当微妙。首先,在进化过程中,新大脑皮层是在动物具有复杂行为之后才出现的,因此理解脑皮层存在价值的基础是动物现有行为的不断改进。也就是说,先有行为,然后才有智能。第二,除了听,我们对世界的感知在很大程度上依赖于我们的运动方式,因此,预测和行为又有着紧密的联系。让我们看看下面的例子:

哺乳动物通过进化得到一个很大的新大脑皮层,并带来某种生存优势,而这种优势最终会根植于行为之中。然而在最初,脑皮层的作用只是如何更好地利用已经具有的行为,而不是创造出全新的行为。为了更清楚地解释这一点,我们需要回顾一下人类大脑的进化历程。

几亿年前,多细胞生物开始在地球的各个角落繁衍,不久以后,就出现了简单的神经系统。然而真正的智能是随着我们的爬行类祖先的出现开始的。随后,爬行动物很成功地征服了整个大陆,它的踪迹遍布各个大洲并分化出无数的物种。它们有着很敏锐的感觉和能够赋予它们复杂行为的、相当发达的大脑。它们的后裔——现在的爬行动物,也继承了它们老祖宗的这些能力,就像短吻鳄,它拥有和你我一样的复杂感觉,有发达的眼睛、耳朵、鼻子、嘴和皮肤,也具有很复杂的行为能力,如游泳、奔跑、隐藏、捕猎、伏击、晒太阳、筑巢和交配。

那么,人脑和爬行动物的大脑到底有什么差别?可以说它们的差别既显著也微小。说它微小,是因为粗略地看,爬行动物大脑中的东西人脑中都有。说它显著,是因为人脑中有某些爬行动物没有的真正重要的东西,那就是一个很大的新大脑皮层。有时候你会听到“古脑”或“原始脑”这类的说法,像爬行动物一样,每个人的大脑中都有这些较古老的结构,它们控制着人的血压、饥饿感、性欲、情感以及运动的各个方面。例如,当你站立、行走或尽力保持身体平衡时,你主要依靠的是古脑;如果你被声音吓了一跳,感到惊慌并开始奔跑,那也是你的古脑在起作用。要做这一类有趣而有用的事情,一个爬行动物的大脑就足以胜任。那么,如果不严格地要求它去看、去听或去运动,新大脑皮层又会做些什么?

哺乳动物有新大脑皮层,因此它们比爬行动物更聪明。(“新大脑皮层”源于拉丁语,意思是“新长出的树皮”或“新的外层硬皮”,因为它的确将古脑包裹了起来。)几千万年前,新大脑皮层首先出现在哺乳动物身上,几百万年前才得以显著发展,正是这一阶段的发展使得我们人类比其他哺乳动物更聪明。不要忘了,新大脑皮层的形成使用的是很普通的重复性元素,人类大脑皮层的厚度和结构都与我们的哺乳动物亲戚差不多。当大自然要快速地进化某个重要的东西时,例如人类大脑皮层,它就会复制某种已经存在的结构,并加入更多的有关普通脑皮层算法的元素,我们才得以获得聪明才智。人们有一种普遍的错误观念,认为人类大脑是几十亿年进化的顶峰。对于整个神经系统来说的确如此,然而,新大脑皮层本身也是一个相对较新的结构,并没有经历长时期的进化过程。

如何理解新大脑皮层?为什么记忆和预测是打开智能谜团的钥匙?下面就要谈到这些问题的核心。让我们从没有脑皮层的爬行动物的大脑开始吧。进化论发现,给原始脑的感觉途径增加一个记忆系统(也就是大脑皮层),动物就能够获得预测未来的能力。这样的话,让我们想像一下,当爬行动物的古脑在执行它原有功能的同时,现在的感觉模式就会自动传输到新大脑皮层,并在记忆系统中储存起来。将来的某个时间,当这个动物遇到相同或相似的情况后,记忆系统就会辨认出相似的输入并回忆起以前发生的事情。重新唤起的记忆和感觉输入信息流对比之后,大脑就可以“填补”目前的输入信息并对下一步将要看到的情况进行预测。通过对现实的感觉输入和唤起的记忆的对比,动物不但可以了解自己所在的位置,并且可以预见到未来。

假设大脑皮层不仅能记住已经看到的东西,而且能记忆处在相似情况下古脑所做出的行为,我们甚至不必去假设大脑皮层能够区别感知和行为,因为对大脑皮层来说,它们都是模式。当动物发现自己处在相同或相似的环境中时,它不但可以预测未来,而且能够回忆起什么样的行为可以产生什么样的结果。这样,记忆和预测使得动物可以更聪明地利用已经存在的(古脑的)行为。

举个例子。假设你是一只老鼠,第一次学走迷宫,因为你不知所措又饥饿难忍,你一定会利用古脑固有的技能在这个新环境中摸索——去听、去看、去嗅并顺着墙壁向前爬。所有这些感觉信息都是由古脑所控制,然后输入到你的新大脑皮层并储存起来。之后的某一天,当你身处相同的迷宫时,你的大脑皮层会辨别出当前的输入信息与以前看到的相同,于是就回忆起已存储的代表着过去发生情况的模式。从本质上看,正是它使你能够看到不远的未来。如果你是只会说话的老鼠,你一定会说:“哇,我认出了这个迷宫!我记得这个拐角!”当你的大脑皮层回忆起以前的情况时,你的眼前就浮现出上次在迷宫中看到奶酪并向它奔去的情景。“从这儿向右拐,我知道下面会发生什么。这条通道的尽头有一块奶酪,我已经能想像出它的样子了。”当你匆忙穿行于迷宫时,你所做的动作,诸如抬腿、理胡须等,都是依靠你的古脑皮层的原始结构来完成的。然而,你之所以能够记得曾到过的地方,并在将来的某个时候再次认出它,而且对将要发生的事情进行预测,这些都要归功于你的(相对较大的)新大脑皮层。蜥蜴没有大脑皮层,因此它对过去的记忆能力就差得多,每一次走迷宫时它都会一遍又一遍地搜寻。你(作为一只老鼠)之所以能了解世界并预知不远的将来,都是因为你有大脑皮层记忆系统。你能生动地回忆起每一次对于摆在前面的奖励和危险的判定,因而可以更为有效地行动。也就是说,你确实可以预见到未来。

但是请注意,你并没有做出任何特别复杂或从根本上看前所未有的全新行为,你并没有把自己变成一架滑翔机飞向通道尽头的奶酪。你的大脑皮层形成的感觉模式预测使你能够预见到未来,但你所有的一切行为并没有受到影响,你所有的能力,像乱窜、攀爬和摸索等,和一只蜥蜴没有差别。

大脑皮层进化得越来越大,能够记忆越来越多的东西,能够形成更多的记忆,进行更多的预测,而且这些记忆和预测的复杂性也越来越强。除此之外,在人类脑皮层上还发生了更加不可思议的变化,形成了人类所特有的智能行为能力。

人类的行为远远超出了诸如老鼠的技能之类原有的基本功能。人类大脑皮层的进化已达到了一个新的高度,因为只有人类创造了书写和口头的语言,只有人类能够蒸煮食物、制作服装、开飞机、建造摩天大楼。我们的运动和谋划能力也大大超过了与我们最亲近的动物亲戚。天生能进行感觉预测的脑皮层是如何创造出人类独有的极其复杂的行为呢?这种超级行为何以会如此突然地得到进化呢?对此我有两种答案:一是因为脑皮层算法极其强大灵活,只要线路进行一点点专属人类的变化,就能创造出全新的复杂行为。另一种回答是,行为和预测实际上是同一事物的两个方面,尽管大脑皮层能够预测未来,但它只有在对所发生的行为有所了解的条件下,才能做出准确的感觉预测。

在老鼠找奶酪的例子里,老鼠记得那个迷宫并且可以利用这个记忆预测到自己会在拐角处看到奶酪。它可以向左转也可以向右转,但只有同时记起奶酪和它所做的正确行为——在岔路口向右拐,才能使吃到奶酪的判断变成现实。虽然这个例子很简单,但它触及了感觉预测和行为之间紧密关系的精髓——所有的行为都能改变我们所看到、听到和感觉到的,而我们随时随地得到的大部分感觉又是由行为决定的。在你的面前动一动手臂,你的大脑皮层必须知道它发出了移动手臂的命令才能做出“看见手臂”的预测。如果大脑皮层没有发出相应的运动命令你却看见手臂在动,你一定会惊讶不已的。对此最简单的一种假设方法是:你的大脑首先命令手臂移动,然后才能预测到将要看到的景象。我认为这种解释是错误的。我的看法是脑皮层能预测到看见了胳膊,是这种预测引发了运动命令并使预测变为现实,也就是说,你首先想,然后促使自己去行动来实现这个想法。

现在,我们来看一看是什么样的变化使人类的能力得到如此大的发展。猴脑皮层和人脑皮层之间的物理差别可以解释人类拥有语言和其他复杂行为的原因吗?人类大脑的体积是大猩猩的3倍,但“越大越好”是远远不够的。人类行为的发展之所以有如此大的跨越,其答案在于脑皮层各个区域和古脑各个部分之间的线路连接,简单地说就是我们大脑的连接有所不同。

让我们再仔细地研究一下。大脑的左、右两个半球是每个人都熟悉的,但还有一个部位并不为人熟知,而这个部位正是人脑独特性之所在。所有的大脑,尤其是体积较大的,都将脑皮层分为前、后两个部分,中间有一条很大的裂纹,称作“中央回间沟”。科学家用“前部(anterior)”和“后部(posterior)”加以区别。从眼睛、耳朵和触觉传来的输入信息都进入脑皮层后部,这里是大部分感觉预测发生的地方。脑皮层前部的区域主要涉及高级策划和思维,也包括运动皮层以及负责运动肌肉和做出行为的大脑部位。

灵长目动物的脑皮层已进化得越来越大,其前部的发展更是超出了比例,尤其是人类脑皮层。和其他灵长类动物以及早期类人猿相比,我们人类有很大的额头以承载很大的前部脑皮层。但这种变化并不足以解释和其他生物相比我们在运动能力上的优势。人类之所以拥有可预测的复杂运动能力,原因在于我们的运动脑皮层和我们身体上的肌肉有更多的连接。在其他哺乳动物身上,脑皮层前部在运动行为方面发挥的直接作用并不是很大,它们主要依靠古脑的各个部位产生行为。相比之下,人类脑皮层在运动控制方面取代了大脑的其他部分。如果一只老鼠的运动皮层受到损伤,可能不会有明显的运动能力的损失;而一个人的运动皮层受到损伤后,他就会瘫痪。

人们经常问我,难道海豚有体积较大的大脑吗?答案是肯定的,而且海豚有一个很大的新大脑皮层。但和人类的相比,它们的脑皮层结构较简单(只有3层,人类的有6层),但用其他标准来衡量,它们的大脑是很大的。海豚可以记住和理解很多事情,可以认出自己的同类;它们对自己的生活有很好的记忆,带有一种自传的意味,它们甚至还记得曾经到过的海洋的每一个角落和裂缝。然而,尽管它们有一些很复杂的行为,但无法和我们人类相比。由此我们可以推测它们的脑皮层对它们的行为并没有决定性的影响,也就是说,它们的脑皮层的主要功能是提供对周围世界的记忆。如果一个动物拥有很大的脑皮层,它就可以和你我一样感知这个世界,但人类脑皮层在控制行为方面所起的作用是决定性的、极其超前的,这是人类所特有的,是我们能够使用复杂语言和制造精密工具的原因,也解释了我们为什么能够写小说、上网冲浪,为什么能向火星发射探测器,为什么能探索神秘能源的性质。

现在一幅完整的图画展现在我们眼前。大自然首先创造出一些动物,它们有复杂的感觉,相比之下其行为却相对僵化,诸如爬行动物之类。然后,只要给它们加入一个记忆系统并输入感觉信息流,这些动物就可以记住以前发生的事。当它们身处相同或相似的环境时,这些记忆就可以被唤起,引发对下一步的预测。这样,智能和理解首先从记忆系统开始,并将预测输入感觉信息流。这些预测就是理解的实质,因为知道某个事情就意味着你可以对它做出预测。

大脑皮层是从两个方面进化的:一是,在储存记忆的形式上向更大、更复杂的方向发展,使得它可以记住更多的东西,可以根据更复杂的关系做出判断。二是,脑皮层首先与古脑的运动系统相互作用。要预测将要看到、听到和感觉到的,大脑皮层必须要知道将采取的动作是什么。脑皮层控制了人类大多数运动行为,它不仅仅根据古脑的行为做出预测,而且还引导行为去迎合它的预测。

人类脑皮层很大,因而有相当巨大的记忆容量,它能够不断地预测你将要看到、听到和感觉到的东西,而且多数都是在你不自觉的情况下发生的。这些预测就是我们的思想,与感觉输入信息流结合之后就形成了我们的知觉。我认为对于大脑的这个认识,就是智能的记忆和预测框架。

如果塞尔的“中文屋”有一个相似的记忆系统,可以预测到下一个汉字是什么,故事下一步会发生什么,我们就可以肯定地说,这个房间懂汉语,可以理解这个故事。现在我们可以清楚地看到阿兰·图灵错在哪里——智能的证据是预测,而不是行为。

至此,我们已经做好了准备,进一步探讨这个记忆和预测框架的新想法。要对未来发生的事做出预测,你的大脑皮层必须储存一系列的模式;要唤醒相应的记忆,必须根据新旧模式之间的相似性检索这些模式(自-联想回忆);最后,这些记忆还必须以恒定的形式储存起来,这样对于过去事件的认识才能应用到与之相似但不完全相同的情景中去。我们的大脑是如何完成这些任务的?在下一章,我将回答这个问题,并对大脑皮层的层级结构进行全面的探讨。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈