理论教育 从理想到现实:人工智能应用之路

从理想到现实:人工智能应用之路

时间:2023-06-09 理论教育 版权反馈
【摘要】:我们再次将目光投向历史,看看“人工智能”从诞生到现在走过了怎样一条路。在第1章第1.5节中曾经指出,在人工智能诞生之后,人工智能的发展有两个不同的方向。“人工智能”到底该如何定义似乎更加困难了。不过,从被归入人工智能类的方法中能够清晰地看出,被冠以“人工智能”的方法都是用来处理“复杂”问题的。

从理想到现实:人工智能应用之路

我们再次将目光投向历史,看看“人工智能”从诞生到现在走过了怎样一条路。

在第1章第1.5节中曾经指出,在人工智能诞生之后,人工智能的发展有两个不同的方向。一种是以联结主义/人工神经网络为代表的,依靠缺少内在神似的外在形式上的模仿来实现人工智能;另外一种则是采用某种机制去实现智能化的功能。由于第一种方法没有取得明显的效果,而退化为第二种方法中的一个组成部分,所以下面集中讨论人工智能的机制实现方法。

在用机制实现人工智能的过程中,还可以细分为两个不同的途径,一种就是遵循人类思维过程,然后在通用计算机上加以复现。在这种途径中,人类和机器在解决问题的时候采用的是同样的方法。我们把这种思路称之为“机制模仿”(Mechanism Imitation)方法;而另一种思路也是成功的人工智能应用大多采用的方式,就是用完全不同的机制(或者说我们不清楚它是否与人脑内部的机制相吻合),来完成某项人类的智能活动。我们把这种思路称之为“机制替代”(Mechanism Replacement)方法。

不论是采用机制模仿还是机制替代的方式实现智能,大都走了一条相似的路:试图用一些基本的逻辑推理规则构造出具有完整智能的机器,至少能够完整地解决一类问题。从科学史的角度来看,这就是我们在第1章第1.6节中讨论过的:“寻找精巧、简洁、普适性的数学方程或系统模型去解决问题,成为科学技术领域无须讨论的基本共识。”

在传统力学领域,不论是牛顿力学还是爱因斯坦相对论,只需要几条基本的定律就能解释几乎所有的(宏观)力学现象。所以,当初人们试图用一些基本的逻辑化推理机制就能实现复杂的智能活动是一种合乎情理的期待。

从对人的智能过程的理解角度来看,这种做法也无可厚非。在第8.1节中我们推断,人脑确实存在一些与领域无关的抽象的“基础核心智能”机制,使得我们可以以此为基础从零开始不断学习开拓。日本第五代计算机便是这种努力的典型代表。但是我们并不理解大脑的这些机制到底是什么。经过几十年的尝试,以日本第五代计算机的失败为标志,说明这种方法有着致命的缺陷。

这种方法不仅仅无法实现一般性的完整智能,即便在特定领域解决比较复杂的智能化问题,它也不能让人满意。这方面的一个典型例子就是机器翻译。人们在开始的时候,就是期望将语法规则完整地表达出来,然后加上对词汇和语义的理解,就能够造出一个良好运转的机器翻译系统。但是,现实无情地打破了这种期待。事实上,哪怕是在一个特定的领域内,我们所面对的智能问题也是相当“复杂”的。相比之下,以力学为代表的绝大多数“经典”科学所处理的问题,则显得相当“简单”。

人们经过多年的探索,终于发现在大多数的“智能”问题领域,普适的一般性逻辑化推理规则或机制,以及领域内少量的逻辑化推理规则或机制都不是解决问题的充分条件。我们必须把人在具体领域内积累的经验或知识融入进来,才有可能比较满意地解决复杂的问题。而经验和知识与一般性逻辑化推理规则或机制之间本质的区别就在于经验和知识是局限于某些特定的场合或具体领域的,而一般性逻辑化推理规则或机制具有跨领域的普适性,可以适用于广泛的不同领域。我们在第1章第1.1节最后引用的钟义信老师提出的“人类智能系统的基本模型”(图1-3),就反映了信息及知识在人类智能过程中所起的重要作用。

充分利用人的经验与知识来解决复杂性问题的典型做法就是在20世纪七八十年代蓬勃兴起的各种“专家系统”,见图8-5。这些专家系统都是针对特定领域中的一些特定问题的,融入了大量领域专家的知识和经验。在这种系统中,专家的知识与经验比普适的一般性逻辑化推理规则或机制更重要。在专家系统的发展历程中,一个标志性事件是1977年斯坦福大学的费根鲍姆在第五届国际人工智能大会上提出了“知识工程”的概念。它标志着AI研究从传统的以推理为中心进入以知识为中心的新阶段。

978-7-111-60062-6-Chapter08-5.jpg

图8-5 专家系统示意图

当人们意识到自己没有能力用一些普适的基本逻辑化推理规则或机制去有效地解决各种“智能问题”时,人工智能的研究便扎入各种具体的问题之中。针对不同类型的问题发展出花样繁多的解决方法,也取得了很大的进展。当然,受计算机形式化方法的影响,这其中也有很多形式大于内容的产物。

人工智能发展出来的这些方法所针对的问题包括问题求解、搜索、规划、机器学习、知识表示、模式识别自然语言处理、机器感知、数据挖掘等众多性质各异的主题。这些进展使得大量的计算机应用的智能化程度都今非昔比了。

也正因为如此,人工智能目前更多地被当成将一些具体的应用工具方法融入不同类型的应用之中,以自己具体的技术性名称出现,默默无闻地发挥着自己的作用。这些年关于人工智能的一本经典的教科书是《Artificial Intelligence:A Modern Approach》[1],它的副标题“A Modern Approach”就是指试图采用“智能体”(Agent)的概念将人工智能在各个不同领域中的方法整合到一个统一的框架之中。

在这个过程中,“人工智能”与“非人工智能”之间的界限也越来越模糊,比如用一些传统的统计方法对数据进行处理,也被纳入“智能”的范畴。其实这就反映出信息技术从一开始就是辅助与延伸人类智能的工具这一本质。“人工智能”到底该如何定义似乎更加困难了。当我们用信息技术去解决具体问题的时候,我们讲哪个技术是“人工智能”技术、哪个技术不是人工智能技术已经没有什么技术意义了。

不过,从被归入人工智能类的方法中能够清晰地看出,被冠以“人工智能”的方法都是用来处理“复杂”问题的。所谓“复杂”问题,并没有一个严格的定义,通常是指无法用一些“简单”“常规”方法来解决的问题。

时至今日,随着信息技术产业发展催生的大数据现象的到来,人们对人工智能追求的热望再次被点燃,以至于像物理学家S·W·霍金(1942—2018,物理学家,英国剑桥大学)这样的知名人士,都对人工智能的研究发出了警告,更有人预测机器智能很快会达到失控的程度,以至于出现了“奇点临近”这样耸人听闻的说法[2]。抛开这些对未来科幻式想象不谈,智能类的方法确实再次发生了变化,沿着固有的逻辑向前迈出了新的一步。

今天在被归入智能范畴的“大数据”应用中,人们不如人工智能开创时期那样关注对基本的普适智能机制的探索,也不像专家系统那样努力地从数据中去发现基于因果关系的领域知识来指导我们解决复杂的问题,而是利用各种现成的方法,在浩如烟海的“大数据”中去发现统计“相关性”,而在一定程度上解决不同的具体问题。“深度学习”在本质上也是基于大数据的统计方法。

“因果关系”与“相关性”不是处于同一个层面的事物之间的联系。因果关系更为本质,体现了事物之间的相互作用;而相关性仅仅是表层的现象,甚至可能是假象。通过数据统计可以发现相关性,但是却很难用简单的统计来发现因果关系。因果关系需要对事物之间的作用机制进行深入的分析才能确定。

“不问因果,只关注相关”,成为大数据应用的一个理直气壮的原则。站在传统的科学理念的高度,这是从探索内在规律向表象归纳的倒退,是由“深刻”向“肤浅”的退化。但从现实的角度来看,这种做法却也不无合理及有效之处。虽然大数据应用中并没有新的原理性机制或算法的发现,利用的都是已有的成果或它们的改进,但是由于获得了前所未有的数据,拥有了前所未有的“暴力计算”能力,因此这些成熟的、甚至是陈旧的、可以追溯到牛顿时代的算法,也产生了前所未有的效果,解决了人类从未能解决的问题。这就是大数据所采取只关注相关性的做法的合理性所在。但是,我们也不应该因此就无限地夸大这种做法的意义,而认为我们在追寻智能的本质上有了新的革命性突破。这也是有学者对“深度学习”提出质疑的原因。

所以,之所以能够用“大数据”的“方法”来解决以前无法解决的问题,并不是因为我们发明了前所未知的新的方法或机制,而是因为今天计算机的能力发展到了在绝大多数情况下不再成为应用瓶颈这个历史性转折点,从而使得我们有了现实可行的技术手段获取足够多的数据,拥有了足够强大的计算能力,来用早就知道的方法,甚至是一些“低级”与“简单”的方法,去解决以前无法解决的问题。今天使用的很多方法当初被认为并非有多么高深和有效,但是借助计算机充沛的处理能力以及获取的丰富数据,这些方法在今天可以产生更加有效的结果。这也是今天计算机应用水平普遍持续提高的一个最重要的因素,这背后的动力源泉就是计算机的处理能力,以及存储能力与通信能力的持续提高。

在某种意义上来讲,以计算机为代表的信息技术确实有一种强大的、不可思议的“化平庸为神奇”的力量。只要计算能力足够强大,无须原理上的突破,用那些看上去平淡无奇、甚至相当笨拙的方法就能够创造前所未有的奇迹。我们可以形象地将这种奇迹称之为“暴力计算”的成就。这就是信息技术产业蓬勃发展的最重要的真相之一。这同时也是今天在信息技术产业中时常会出现一些缺少科学常识、似是而非的说法的原因。

如在第1章第1.6节中讨论的,信息技术这种“化平庸为神奇”的本事,就是源于计算机生而固有的唯一能力——“数值计算”。只是在计算机获得“暴力计算”能力之前,我们没有意识到信息技术使用的“低级”“粗暴”的计算方法应用可以如此广泛、有效。毕达格拉斯在两千多年前认为这个世界的一切都是计算问题这一断言,今天看起来“几乎”是“绝对真理”了。

与此相对应的是,虽然计算机的能力空前强大,但我们依然没有能够借助它去解决智能的基本机制问题。当然,它或许确实就不是一个能够通过计算来解决的问题。

从主流上看,人工智能从当初对智能基本机制的探究以期一劳永逸地整体性解决智能问题,到利用人的知识与经验解决具体领域中的复杂问题的专家系统,再到今天在充沛的计算能力基础上,利用大量的数据及已有的各种成熟算法和工具及它们的改进,以人类的知识与经验为基础更多地依赖统计性分析去解决具体的问题。这是一个从理想不断回归现实的过程。在这条发展道路上,我们能够看到两条有趣的、站在“传统”科学的立场上看似矛盾的线索。(www.daowen.com)

一条线索,就是在对智能本质规律的探索上不断退化,从对基本智能机制的探究到对因果性领域知识的利用,再到对数据进行统计性相关分析,实现智能的方法一步步地在趋向“肤浅化”。在这个过程中,我们从对一般性机制的一往情深,逐步转向对知识、经验、数据等信息的日益依赖,不断地把更多的知识、经验、信息融入解决问题的方法中;另外一条线索,则是依赖于计算机日益强大的数值计算能力,“智能化”应用范围不断扩大,解决的问题不断增多,计算机因此看上去越来越“聪明”,越来越强大,对人的帮助也越来越大,见图8-6。

978-7-111-60062-6-Chapter08-6.jpg

图8-6 人工智能从理想到现实的演化

今天,人工智能的含义已经十分模糊,大量的当初不被认为是人工智能的技术与方法都被纳入这个概念之下,而大数据从一开始就是一个模糊的、非技术性的概念,这两者也已经难以分割。随着这些技术被广泛地使用,已经很难说哪个应用不含有人工智能的技术了。其实,从一般的智能意义上来讲,计算机最初实现的数值计算应用也应该属于“智能”应用,因为计算就是人所特有的智能的一种表现。而基于计算,利用人的意识产物所做的各种应用,就更应该属于“智能”应用了(见第4章第4.1节)。所以,计算机应用从一开始就是智能化的应用,只是随着技术的进步,智能化程度在不断地提高。正因为如此,我们在第1章第1.1节就指出,计算机的出现是人类工具的一次实质性跨越,人类从此拥有了辅助与延伸智能的工具。而且如前面所分析的,在实现一般性人的智能的路一直没有走通的情况下,迄今为止,它还没有能够摆脱这样的附属性命运。

在此需要追问的是:计算机这种变得越来越强大、越来越“聪明”的趋势,在本质上意味着什么?众多新的智能化应用功能的累加能否产生质变性突破,弥补在智能本质探索上的退化而达到最终全面实现一般智能的目标?还是它难逃宿命,始终只是作为人类一个越来越好用的辅助性工具而存在?

虽然这是一个最终需要用实践来检验的问题,但是理论分析对未来还是有一定的指导意义,也远比浪漫的想象更加可靠。

按照人工智能目前的发展趋势,我们可以设想不久就能够不断地将基于不同方法策略的各种智能化应用集成在一起,从而获得一台功能日益强大的智能化机器。我们可以预测,当集成的功能足够多,它的综合能力完全可能超过某些甚至是很多普通人。那么是否可以说我们已经造出了拥有与人一样智能水平的机器?

如前所述,计算机的各种智能应用都是借助了人在相应领域中的经验与知识加上相应的逻辑化机制而实现的。这些功能即使具有有限的“学习”能力,也无法在根本上超越人工植入的领域经验与知识的局限。所以,当我们能够把大量的智能化应用集成在一起时,系统固然可以覆盖更广泛的领域,在这些领域中的表现也完全可能远超一般的人、甚至是顶尖的人,就像“深蓝”与AlphaGo那样。但是它却依然不具有主动探索未知的能力,更不要说自我意识的自觉性了。而这种能力的缺失,在根本上是因为系统只是在相对表层集成了人在某些领域中的智能或智能的产物,而缺少人所具有的、在底层与领域无关的“基本核心智能”。

现在人工智能领域的一些学者认为他们已经可以不需要预制人的知识经验,依靠计算机的“强化自主学习”就能够从数据中“自我”学习积累从而完成复杂的任务。比如谷歌旗下开发出下围棋程序的DeepMind团队就在其2017年发表于著名杂志《Nature》的论文中声称,在新的AlphaGo Zero中,没预制先验知识,它是靠自己学会下围棋的。他们说:AlphaGo Zero说明“一种纯强化学习方法是可行的,即使在最具挑战性的领域,它也能训练到超过人类的水平,并且无须人类的案例和指导。除了基本规则外,没有任何领域的基础知识。”他们的说法是“starting tabula rasa”,即从一片空白开始。

但是针对这个说法,Gary Marcus(1970—,心理认知学家,纽约大学任职)指出:“我认为这些说法是夸大其词的……他们系统中的很多方面延续了之前在围棋程序上积累的研究,比如构建游戏程序中常用的蒙特卡洛树搜索。这种技术可以用来评估动作和对策,在树状结构上快速得到测试结果。问题来了,蒙特卡洛树这种结构不是通过强化学习从数据中学习的。相反,它在DeepMind的程序中是与生俱来的,根深蒂固地存在于每个迭代的AlphaStar(注:这个词是Marcus用来指DeepMind开发出来的AlphaGo系列下围棋程序)。……可以发现,DeepMind给出的卷积结构很精确,有很多下围棋的精确参数在里面,这不是通过纯碎的强化学习学到的。……并且,(人为预制的那些)固有算法和知识的整合的取样机制不在AlphaZero的下棋学习实验中,因为那样做可能会导致模型效果变差。……与其说AlphaGo是从白板开始学习,不如说它在构建的开始就站在了巨人的肩膀上。”[3]

DeepMind团队可能自己都没有意识到自己设计的程序算法中暗藏了多少人类在围棋方面的知识与经验。

没有类似于人所具有的“基本核心智能”作为支撑,智能化的机器恐怕就只能是被动地附属于人的辅助与延伸智能类工具,而不能成为独立的智能主体,哪怕它通过了著名的“图灵测试”,哪怕它在众多的领域比很多人都更“聪明”,更“优秀”。

当然,这种“基本核心智能”的来源可以有两个。一个就是将人脑研究清楚而“复制”人所具有的这个能力;另一个可能的来源就是抛开人脑,独立创造出一套这样的“基本核心智能”,然后从理论与实践上证明基于它能够构造出一个智能系统,达到人的智能水平——可以自我学习(starting tabula rasa)。显然,目前对于这两条路我们都还没有找到它们的起点在哪里。

在2005年,瑞士的洛桑联邦理工学院与IBM一起发起了由欧盟支持的“蓝脑计划”(The Blue Brain Project,见图8-7)。该计划由科学家亨利·马克拉姆领导,准备走一条与上述各种基于对应或相当于人脑的高层意识层面活动的计算机算法及知识、数据等来实现人工智能完全不同的路。他们利用海量的计算能力,基于计算机模拟技术,用对应于人脑的基础性物质层面活动的算法去模拟人脑内部的物理生化过程。该项目计划在2023年左右实现在分子水平上对人脑的完整模拟。其直接目的是研究阿尔茨海默氏症和帕金森氏症的发病机制及治疗方法。

978-7-111-60062-6-Chapter08-7.jpg

图8-7 蓝脑计划官方网站首页

在经过几十年艰苦努力依然无法破解人类智能本质的情况下,许多从事人工智能研究的学者对该计划抱有很大的希望。它采用的方法可以看作是一种比联结主义/人工神经网络更为彻底的对大脑在形式上的模拟。如果这种彻底的模拟成功了,就达到了神似的程度,而可以认为是一种对人脑的机制模拟了,只是其模拟的机制不是在高层意识层面的活动,而是基于底层物质层面的作用。如果成功,我们就可以在不了解人类智能本质的情况下用非生物的方法人工再现人类智能。

这种做法相当于在没有足够的空气动力学知识的情况下,完全依靠模仿鸟的各种动作而实现飞行。虽然在人类历史上鲜有类似的成功案例,但也不能认为这种做法全无成功可能,特别是在计算机获得了空前的处理能力的今天。比如,我们已经能够借助计算机强大的处理能力,结合先进的材料制造采用与鸟一样的方式飞行的机器了(见图8-8)。达·芬奇五百年前如鸟一样飞翔的梦想,今天借助强大的信息技术终于得以实现。当然,这个机器鸟的设计除了简单地模仿鸟类,还是基于空气动力学知识的。

978-7-111-60062-6-Chapter08-8.jpg

图8-8 德国Festo公司于2011年研制出的仿生人工机器鸟

当然,要通过对大脑底层物质过程的模拟实现全面的人工智能的目标,必须跨越两个巨大的障碍。一是对人脑内部的物理生化过程有完整的理解;二是能够将人的意识活动与大脑的物理生化过程完整地对应起来。虽然在这两个方面取得了许多进展,但是离完整的把握还有非常遥远的路程。对于一个非常简单的、只有302个神经元的低级生物秀丽隐杆线虫,在清楚这些神经元之间连接关系的情况下,还无法解释它最基本的生存行为(如进食等)是如何产生的[4],而人的大脑保守估计也要有150亿个神经元。所以从目前对大脑的认识水平来看,如果蓝脑计划是一条可行的、通向完整人工智能的道路的话,目标的实现很可能要用百年的尺度来计算。事实上,欧盟支持的这个蓝脑计划在2016年被发现有严重问题,项目负责人被撤换,并且实质性地改变了项目方向与目标。

自人工智能的研究于1956年正式开始之后,我们一直希望能够造出一台与人相当的智能化的机器,它有能力来解决各种复杂性的问题。时至今日,我们发现虽然取得了巨大的进步,但依然只是找到了越来越多处理复杂具体问题的方法。这些方法被用在不同的场合,而我们依然无法基于它们构建一个能够灵活应对不同复杂问题的、拥有完整意义智能的系统。

计算机“修炼成精”是尚未找到有效途径,还是遥遥无期的事,虽然它是很多人的梦想乃至信仰。对此,我们不必杞人忧天。

也许,我们原本的期望就有不合理之处。面对未来,我们更应该关注的不是不能做什么,而是能够做什么,也许应该换一个思路从更为现实的角度来重新审视一下:应该如何有效地利用各种具体的智能类方法构建更加强大的服务于人类的智能系统。为此,首先需要把各种智能类方法放到科学、技术与应用系统的整体框架中,分析它们实际的地位,从而把握它们的本质。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈