理论教育 探寻人工智能研究的早期历程

探寻人工智能研究的早期历程

时间:2023-06-27 理论教育 版权反馈
【摘要】:第一章人工智能Artificial Intelligence当我1979年6月从康奈尔大学毕业时,我对自己的生活没有任何长远的打算。本人有信心承担该工作。于是我考虑申请麻省理工学院的研究生院,因为该学院以人工智能研究著称,而这将对我的研究提供很大的便利。这最后一项——弄清大脑工作的原理——在麻省理工学院人工智能实验室的科学家们看来是个问题。麻省理工学院是人工智能的航母,在我申请的同时,已有大批精英汇聚于此,意欲通过程序设计使电脑具有智能。

探寻人工智能研究的早期历程

第一章 人工智能

Artificial Intelligence

当我1979年6月从康奈尔大学毕业时,我对自己的生活没有任何长远的打算。获得电机工程学位后,我在位于俄勒冈州波特兰市新建的英特尔工业园找到了一份工程师的工作。当时,微型计算机工业方兴未艾,而英特尔是这一领域的核心。单片机是我们当时的主导产品(由于英特尔发明了微处理器,因此在那时,把整台计算机建立在单个电路板上的想法就已经成为了可能)。而我的工作就是分析并修复由其他工程师发现的单片机上的错误。那期间,我创办了一份业务通讯,并经常外出旅行,有机会见识各种客户。尽管很思念在辛辛那提工作的大学女友,但那时的我年轻,过得很快活。

几个月后,我遇到了一件改变我人生目标的大事。那是一本当年9月新出版的《科学美国人》(Scientific American)杂志,是有关大脑研究的专刊。它重又唤起了我自小就开始的对大脑的兴趣。这本杂志令人着迷。里面的文章涉及大脑的组织、发展和化学特征,专事视觉、运动及其他此类组织的神经机制,以及精神错乱的生理基础等内容。我认为它是《科学美国人》里最棒的一期。一些与我交往过的神经学家也表示,这期杂志在帮助他们做出职业选择的时候起到了重要作用。这一点和我一样。

这一期的最后一篇文章题为《有关大脑的思考》,作者是弗朗西斯·克瑞克(Francis Crick),他曾是DNA结构的发现人之一,并且他那时就已经将其天才思考投入到了对大脑的研究之中。克瑞克认为,尽管一直以来积累了大量有关大脑的详尽知识,但大脑的工作原理对于人们来说仍是一个难解的谜。一般来说,科学家不会写他们不知道的事情,但克瑞克就像那个指出皇帝没有穿衣服的小男孩一样,对此并不在意。他认为神经学只是一堆没有任何理论的数据。他说:“最明显的是在概念上缺乏一个总的框架。”这句话在我听来就像一位英国绅士在委婉地表示:“我们对大脑的工作原理一无所知。”而那时这是事实,并且现在也是如此。

克瑞克的话像是出发的号角声,唤醒了我长久以来梦想研究大脑、制造智能机器的愿望。尽管我已走出大学校园,但还是决定做出事业上的转变——我打算研究大脑,不仅仅是理解大脑是如何工作的,而且要以这些知识作为新技术的基础,制造出智能机器。但要把这一计划付诸实践尚需时日。

1980年春天,我调到了英特尔驻波士顿的公司,和我未来的妻子团聚了,她那时正在当地的学校攻读硕士学位。我的工作是给客户和员工们讲解如何设计微处理器系统,但我心中的抱负却在另一方面——我一直在寻找研究大脑理论的方法。所学的工程学知识使我意识到,一旦解开了大脑工作原理之谜,我们就可以复制整个过程,而且硅是制造人工大脑的天然材料。因为我就职的公司发明了硅记忆芯片和微处理器,因此我想,也许能说服英特尔,允许我把一部分时间用在智力研究和设计仿大脑的记忆芯片上。于是我给英特尔的主席戈登·摩尔(Gordon Moore)先生写了一封信,大意如下:

亲爱的摩尔先生:

兹建议成立一研究小组,专攻大脑工作原理的研究。该工作可从一个人,即本人开始,随后进一步拓展。本人有信心承担该工作。相信有一天它会给我们带来无限商机

杰夫·霍金斯

随后,摩尔把我介绍给英特尔的首席科学家特德·霍夫(Ted Hoff)。我飞到加利福尼亚与他会面并陈述了对大脑研究的建议。霍夫在两个方面成绩卓著:一个是他在第一台微处理器的设计工作中表现出色;另一个是进行了神经系统理论的早期研究。前者为我所熟知,而后者在当时我还不甚了了。霍夫曾做过人造神经元及其实际应用等方面的研究,而这些都是我所未曾想到的。听完我的建议后,他表示不相信人类能够在可预见的未来研究出大脑的工作原理,因此英特尔公司没有理由支持我的想法。他的看法是对的,因为在25年后的今天我们才刚刚开始在大脑的研究方面取得显著的进展。我很清楚,在商界时机就是金钱,不过当时我仍然感到很失望。

原本我想通过一条便捷的道路达到目的,而英特尔公司应该是进行大脑研究最便利的桥梁。但此路不通,我只得另辟蹊径。于是我考虑申请麻省理工学院的研究生院,因为该学院以人工智能研究著称,而这将对我的研究提供很大的便利。幸运的是,我似乎完全具备申请的条件:接受过计算机科学的专门训练——“合格”;立志建造智能机器——“合格”;以大脑研究作为突破口来认识其工作原理……“且慢,这是个问题。”这最后一项——弄清大脑工作的原理——在麻省理工学院人工智能实验室的科学家们看来是个问题。

而难题接踵而至。麻省理工学院是人工智能的航母,在我申请的同时,已有大批精英汇聚于此,意欲通过程序设计使电脑具有智能。在这些科学家看来,视觉、语言、机器人科学和数学都只是编写程序的问题。既然计算机可以做到人脑所做的一切,甚至更多,那为什么我们的思维还要大脑——这一天然计算机的生理混乱所限制呢?他们认为研究大脑会限制思维,更明智的做法应该是发掘计算方法的最大极限。而这一点已经被数字计算机发挥得淋漓尽致。他们所追求的就是编写出能与人脑相媲美并最终超越人脑的程序。他们对大脑如何工作毫无兴趣,采取“只求结果,不问手段”的方式开展研究。甚至有些人还为自己跳开了神经生物学这一阶段而沾沾自喜。

确切地说,我觉得这是一种错误的解决问题的办法。直觉上我感到这种人工智能的方法不仅不能设计出能与人脑相媲美的程序,甚至不能告诉我们智能到底是什么。计算机和大脑的工作原理完全不同:一个是设计出来的,一个具有自学能力;一个必须不断完善才能发挥作用,一个天生可以灵活地处理和宽容失误;一个有中央处理器,一个则没有中央控制……这样的差别举不胜举。我之所以认为计算机无法智能化,主要原因是,从晶体物理学的层面来看,我明白电脑是如何工作的,而恰恰是这一点使我意识到大脑与计算机在本质上完全不同。对此我无法证明,但直觉告诉我这是对的,就像人们对一些事情有直觉一样。最终我得出结论:用传统的方式研究出的人工智能可以生产出实用的产品,但绝不可能制造出真正的智能机器。

与此相对,我想廓清什么是真正的智能和知觉,探究大脑生理学和解剖学理论,挑战弗朗西斯·克瑞克提出的论断,为大脑的工作原理绘制出一个大的框架。我把精力集中在对新大脑皮层的研究上——它是近期哺乳动物大脑进化最快的一个部分,也是智能的中心。只有认识了新大脑皮层的工作原理之后,我们才能着手建造智能机器,而在此之前是不可能做到这一点的。

令人遗憾的是,我在麻省理工学院遇到的教授和学生无人对此感兴趣。他们直截了当地告诉我,要认识智力和建造智能机器,没有必要研究真正的大脑。1981年该大学拒绝了我的申请。

****************************

今天,许多人认为人工智能是一个既成的事物,只待计算机具有足够的能力后,即可实现其美好前景。只要计算机有足够的内存和处理能力,思维能力就会发展,人工智能的编程人员就可以造出智能机器。对此我不敢苟同。人工智能正面临着一个根本的错误,因为它无法圆满地解决什么是智能的问题,或者说“理解某个事物”到底意味着什么。回顾人工智能的发展史及其建立的原则,我们可以看到这一领域的发展偏离了正确的方向。

人工智能理论是随着数字计算机的出现应运而生的。早期人工智能研究的关键人物是英国数学家阿兰·图灵(Alan Turing)——多用途计算机这一想法的发明人之一。他最卓越的成就在于正式提出了“万能计算”这一概念,即:尽管建构的细节有所不同,但从根本上讲所有的计算机都是等效的。他还假想了一台机器来证明这一观点。这台虚构的机器包括三个主要部分:一个处理盒,一个纸带和一个能从来回移动的纸带上读取并记录信息的装置。纸带就像众所周知的计算机代码0和1一样,是用来存储信息的(当时没有发明记忆芯片和光盘驱动器,所以图灵想像用纸带来存储信息)。那个处理盒,现在被称为中央处理器(CPU),会遵循一定的规则读取和编辑纸带上的信息。图灵用数学的方法证明,如果CPU的规则选择正确,并且有足够长的纸带供其使用,这台机器就可以完成世界上任何一种计算。这就是被称为“图灵万能机器”的众多等效计算机中的一种。无论是计算平方根,还是弹道轨迹,是玩游戏、编辑照片,还是做银行交易核对,其基本的形式都是0和1,任何一台“图灵机”都可以处理。信息处理就是信息处理。从逻辑上讲,所有的数字计算机都是等效的。

图灵的结论有着无可辩驳的正确性,取得了惊人的成功,计算机及其所有产品都以之为基础。随后,图灵转而考虑如何建造智能机器。他感到电脑可以智能化,但他不愿卷入对其可能性的争论之中,并且认为自己无法给“智能”下一个定义。因此他在这一方面没有做任何尝试,而是提出了一个智能存在的证据,即著名的图灵实验:如果一台电脑可以诱使一个问询者相信它也是一个人,那么从定义上来讲这台机器就有智能。以这个实验为衡量尺度并以“图灵机”作为媒介,图灵开创了人工智能的研究领域,其核心是:大脑就是另一种形式的计算机,无论你如何设计它的人工智能系统,这台计算机都可以做出类似人类的行为。

人工智能的倡导者们看到了电脑与思维之间的相似之处。他们说:瞧,很显然,人类智力最伟大的功绩就在于对抽象符号的处理——而计算机也能做到。所谓听和说的过程,就是我们用恰当的语法规则对被称为“词”的概念符号的处理过程。下棋时会怎样?是在处理那些代表着不同棋子的属性和位置的概念符号。那么看东西呢?我们用概念符号代表物体以及物体的位置、名称及其他属性。当然,人们是借助大脑而不是计算机来做到这一切的,但图灵已经证明,如何实施和处理这些符号并不重要,你可以借助一个齿轮装置、一个电子系统或是大脑神经元网络等等,任何形式都可以做到,只要你的媒介可以实现和图灵万能机器相同的功能即可。

这一假想得到了一篇有影响的科学论文的支持。该论文发表于1943年,作者是神经生理学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮兹(Walter Pitts)。他们俩解释了神经元是如何数字化工作的——也就是说,大脑的神经元是如何能够对规范逻辑进行充满想像力地复制。他们认为,大脑神经元的工作原理和电脑工程师所说的逻辑门一样。而逻辑门可以处理简单的逻辑关系,如“并且”“否”和“或者”。计算机的芯片是由上百万个逻辑门构成,它们被合成精确而复杂的电路。一个CPU就是一个逻辑门的集合体。(www.daowen.com)

麦卡洛克和皮兹指出,用精确的方式可以将神经元连接起来,以实现逻辑功能。神经元可以收集并处理输入的信息,从而决定是否输出信息,因此可以将神经元想像成一种活的逻辑门。这样,我们可以大胆地设想,大脑是由“并且”“或者”等逻辑门及其他此类的逻辑节点构成的,和数字电路相类似。我们不清楚麦卡洛克和皮兹是否真的相信大脑是这样工作的,他们只是说这大有可能。而且从逻辑上讲这种看法是可能的,因为神经元在理论上可以实施数字功能。而后,再没有人专门针对神经元在大脑中的存在形式提出疑问。尽管缺乏生物学的根据,他们想以此作为证据来证明,大脑是另一种形式的计算机。

还有一点也是值得一提的:人工智能的基本原理得到了一个在20世纪上半叶占主导地位的心理学思潮的支持,人们称之为“行为主义”。行为学家认为,大脑内部的运转过程是不可知的,称之为“无法穿越的黑匣子”;但是,人们可以观察和测量动物所处的环境和行为,例如它们如何感知,行为如何等。他们承认大脑具有反射机制,可以利用奖惩的方式使动物学会新的行为。但除此之外,人们没有必要研究大脑,尤其是那些杂乱无章的主观情感,如饥饿、恐惧或什么是“理解”,等等。毋庸置疑的是,这种实验哲学在20世纪后半叶逐渐消亡了,而科学家对人工智能的兴趣却没有因此而消亡。

二战结束后,电子数字计算机的广泛应用已成为可能,于是人工智能的先锋们开始摩拳擦掌设计程序。语言和语言之间的翻译?简单!只是破译代码而已,只需将A系统中的每一个代码和B系统中的代码相匹配即可。图像呢?也很简单。已经了解了处理图像旋转、增减和移位所需的几何定理,只要将它们编成计算机代码即可。这样,工程就已完成了一半。人工智能专家曾骄傲地断言,计算机的智力将很快赶上并超过人类。

具有讽刺意味的是,有一种名为“Eliza”的电脑程序几乎可以达到图灵实验的要求,它能够改变你的措辞从而模仿精神分析师。例如,如果一个人输入“我和我的男朋友不再说话了”,Eliza就会说:“跟我说说你的男朋友。”或者“你和男朋友为什么不说话了?”这一程序设计平庸且不全面,初衷只是一个玩笑,但还是蒙骗了一些人。除此之外,还出现了一些严肃的程序,如“积木世界”。该程序模拟了一个房间,里面装有各种颜色和形状的积木。你可以提出各种问题,如“绿色金字塔形的积木是在红色大方块儿的上面吗?”或“请把蓝色的方块移到红色小方块儿上。”该程序就可以回答你的问题或是按照你的要求完成动作。这一切都是模拟的,虽然有效,但只能局限在这个完全人造的小小积木世界里。程序员不可能将其扩展到任何实际的用途中去。

与此同时,公众被这一连串表面上的成功以及有关人工智能技术的新闻消息深深吸引。最初只是引起人们兴奋的程序竟然可以解决数学定理的问题了。自柏拉图以来,多步骤演绎推理一直被认为是人类智慧的顶峰,因此,在最初看来,人工智能似乎有很大的经济潜力。但结果证明,就像“积木世界”一样,这个程序只是能够找到简单定理而已,而且这些定理早已为人所熟知。随后一个名为“专家系统”的程序引起了人们的巨大关注。它是一个包含细节事实的数据库,能够回答人提出的问题。比如“医学专家系统”就能根据列出的症状诊断出病症。但遗憾的是,这个系统再一次被证明作用有限,无法显示出与综合智力有关的任何东西。除此之外,计算机还可以具有大师级的象棋技艺,而且IBM的国际象棋机器人“深蓝”战胜了国际象棋世界冠军加里·卡斯帕罗夫(Gary Kasparov),曾经轰动一时。但这种胜利是毫无意义的,因为“深蓝”的取胜不是因为它比人聪明,只是在于它的速度是人脑速度的几百万倍。“深蓝”没有直觉,而一位象棋大师综观棋盘上的局势,立即就可以判断出比赛中哪个区域有利,哪个区域有危险。然而电脑对于重要的事情没有任何直觉的感应,它必须尝试更多的选择。此外,“深蓝”对于这种游戏的历史毫无了解,对自己的对手也一无所知。它就像一台计算器,能算算术但毫不理解什么是数学。“深蓝”只能下棋,并不真正了解象棋。

在任何情况下,无论多么成功的人工智能程序也只是擅长于那些经过专门设计的领域。它们不会总结归纳,缺乏灵活性;甚至它们的创造者也认为它们不会像人一样思考。当初被认为很简单的人工智能问题最终都无果而终,至今也没有一台计算机能够在语言理解方面超过3岁的儿童或是在视觉方面超过任何一只老鼠。

多年的努力带来的只是无法兑现的承诺和毫无说服力的成果。人工智能头上的光环开始慢慢退去,一些科学家转而进入其他领域的研究。刚刚成立的人工智能公司纷纷倒闭,资金来源越来越少。一时间,使计算机具备最基本的感知、语言和行为能力的程序设计似乎都变得不再可能。直到今天,这一境况都没有大的改变。正如我先前所说,尽管有人相信可以通过速度更快的计算机来解决人工智能的问题,但大多数科学家都认为以前所有的努力都是有缺陷的。

我们不应因此而责怪人工智能研究的先驱们,毕竟,阿兰·图灵是伟大的。这一切能够说明,图灵机将会改变世界——而且它已经改变了世界,但不是通过人工智能。

****************************

我申请麻省理工学院时就对人工智能的断言心怀疑虑。当时,加州大学伯克利分校的知名哲学教授约翰·塞尔(John Searle)就曾说,计算机没有,而且也不可能有智能。为了证明这一观点,他于1980年设计了一个思考实验,即“中文屋”实验。

假设一个说英语的人坐在一间墙上开有小孔的房间里,在他面前的桌上有一本指令手册和各种可能需要的铅笔和便签纸,翻开手册,他可以看到用英语写成的指令,其中介绍了汉字处理、分类及比较的方法。请注意:这些指令没有提及任何汉字的含义,只是描述如何对汉字进行复制、删除、重新排列和誊写等内容。

房间外的一个人从小孔中递进一张纸,上面用中文写着一个故事和与之有关的问题。屋内的人对中文一窍不通,但他在手册的指令下拿起笔开始工作——只是生搬硬套地按照指令去做。有时指令要求他在纸上写下一些汉字,有时又让他移动或删除另外的汉字。就这样写写画画直到指令告诉他工作已经完成。这时他已写出了一篇汉语文章,而他并不知道,这正是那些问题的答案。他按照指令将纸从小孔送出去,心中疑惑,这无聊的游戏到底是什么。

房间外一个懂汉语的人读过文章后说答案完全正确,而且很有见地。如果问她(懂汉语的人),这篇文章是否出自一个对故事透彻理解的聪明人之手,她一定会很肯定地回答“是”。她对吗?是谁看懂了故事?当然不是屋里的那个人——他根本不懂中文,因而对故事一无所知;也不是指令手册——它只是躺在桌上一堆纸张中间毫无生命的书。那么,理解从何而来?塞尔的回答是:根本不存在所谓的“理解”——存在的只是无意识的书页翻动和铅笔的涂鸦而已。这个“中文屋”与数字计算机非常相似,那个人就是CPU——只是无意识地执行指令;那本书就是向CPU传达指令的软件程序;而那些便签纸便是内存。因此,无论你多么巧妙地进行设计,试图让计算机通过模仿人类的行为而积累一定的智力,计算机都是不可能具有理解力和智能的。(塞尔曾明确表示他不清楚智能是什么,他的意思是说不论智能是什么,电脑都不具备。)

这个论点引发了哲学家和人工智能专家之间的激烈争论。他们发表了上百篇文章,字里行间夹杂着尖刻和愤怒。人工智能的捍卫者们提出了一些驳斥塞尔的论据,如:虽然房间中的任何部分都不懂中文,但房间作为一个整体是理解中文的;房间里的人是懂中文的,但他自己对此没有意识,等等。就我而言,我认为塞尔的解释是正确的。认真思考过“中文屋”实验的论据和计算机的工作原理之后,我没有看到任何地方有“理解”的发生,这使我坚信,我们首先需要弄清楚什么是“理解”,并为之下一个定义,这样才能清楚地知道何时一个系统是智能的,何时不是;何时它能懂中文,何时不能。单从它表面的行为是不能找到答案的。

一个人要看懂一个故事是不需要刻意去做任何事的。我可以静静地读着一个故事,表面上没有任何行为表明我是否清楚地理解了,至少对我而言是这样。而另一方面,你无法从我安静的行为上辨别出我是否读懂了故事,甚至无法辨别写成故事的语言我是否能懂。事后你可以提问,但我对故事的理解发生在阅读之时,而不是你问话之际。这本书的主题就是:理解是无法用外部行为测量的,它是对大脑如何记忆、如何利用这些记忆进行判断的内部度量——这些将在以后的章节中写到。在这一点上,“中文屋”“深蓝”和大部分的电脑程序一样没有任何类似之处,它们不能理解正在做的事情。而电脑的输出,即外部行为,成为我们判断它是否具有智能的唯一标准。

人工智能派为自己辩护的终极论据是:从理论上讲,计算机可以模拟整个大脑。一旦计算机模拟了所有的神经元和它们之间的连接点,就说明大脑的“智力”和计算机的模拟“智力”不再有任何区别。尽管这在实际上不能成立,但我同意这种看法。可惜的是,人工智能的研究者们并没有模拟大脑,因而他们设计的程序不会具有智能。在不了解大脑是什么的前提下来模拟大脑,是不可能的。

****************************

被英特尔和麻省理工学院拒绝后,我无所适从。如果你不知道下一步该干什么,最好的策略就是保持现状直到有转机出现。于是我继续从事电脑行业,心满意足地待在波士顿。直到1982年,我妻子想移居加州,于是我们举家前往(这是避免摩擦的一个办法)。我在硅谷找到了工作,是一家刚刚成立的小公司“Grid Systems”。Grid是便携式电脑的发明人。而便携式电脑是一台绝妙的机器,后来成为纽约现代艺术馆中第一个电脑藏品。我先后在市场部和工程技术部工作,后来发明了一种高级程序语言,命名为“Grid Task”。我和我的发明对于公司的成功变得越来越重要,同时我的事业蒸蒸日上。

然而此时,对于大脑和智能机器的好奇仍然在我脑海中挥之不去,我一心渴望研究大脑,于是参加了人体生理学的函授课程,开始自学(没有任何人会被函授学校拒绝的)。学习了一定的生物学知识后,我决定申请生物学研究项目的研究生,希望从生物科学的内部去研究智能。如果说计算机世界不需要大脑研究的理论家,那么生物学界可能会欢迎一位计算机工作者。那时还没有所谓的理论生物学,尤其是理论神经系统学,所以从我的兴趣来看,生物物理学是最好的选择。我努力学习,参加了入学考试,准备了简历,恳请公司写了推荐信……哇,最终我被接收为加州大学伯克利分校的生物物理学研究项目的全日制研究生。

我欣喜若狂。终于可以认真地研究大脑理论了,我这样想。我辞了Grid公司的工作,决心不再重回计算机产业任职。当然,这意味着无限期地放弃我的薪水。那时我妻子正盘算着买房子和生孩子,而我却心甘情愿地变成了一个不能挣钱养家的人。这可不是避免摩擦的好办法,但这是我最好的选择,而且我的妻子也支持我的决定。

在我离开公司之前,Grid的创始人约翰·艾伦比(John Allenby)把我拉进办公室,说:“我知道你不想再回Grid,也不想再涉足电脑业,但以后会发生什么谁也不知道。不要完全退出,就算休假吧。这样,一两年后如果你回来,还可以重领薪水,继续做你的职位,得到公司的股份。”这是一个友好的表示,我接受了,但心中仍然感觉这次我永远告别计算机产业了。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈