理论教育 智能应用初期:20世纪60-90年代的结构化数据应用时代

智能应用初期:20世纪60-90年代的结构化数据应用时代

时间:2023-06-09 理论教育 版权反馈
【摘要】:在这个阶段,计算机处理的数据以所谓的“结构化数据”为主。结构化数据是指一个基本的完整数据,是由多个有明确定义的数据段组合而成的。银行账户等也属于典型的结构化数据。也就是说,结构化数据是可以被一个有限维度语义空间来严格定义的。在这些过程的软件实现中,核心是对相应的结构化数据的处理,所谓的“增删改查”等。在应用过程中,特定的一整套数据始终与一个完整的应用彼此相配合,实现完整的业务过程。

智能应用初期:20世纪60-90年代的结构化数据应用时代

随着计算机计算能力的快速提高,计算机从辅助人类做在智能意义上看起来比较“简单”的数值计算领域里走了出来,逐步进入在智能意义上稍微“高级”一点的非数值计算的“信息”处理领域。这一步的跨越比起今天看到的那些令人瞠目的“智能”应用还是相当拘谨的。计算机进入的主要应用领域是与数值计算最接近的、普通人就能看出来具有严格逻辑规则的数据/信息处理类应用。计算机应用发展到这个阶段,开始从高傲的象牙塔似的纯科学技术领域逐步进入其他社会领域,开始了计算机对社会的一些重要领域产生比较普遍性影响的阶段。

之所以说这次跨越相当拘谨,是因为计算机的处理能力还相当有限,只能完成基于数据/信息的“自动化”类型的应用。“办公自动化”这个叫法就代表了人们对这个阶段的应用的典型看法。人们这时依然吝啬地不肯将“智能”这个闪光的字眼用在此时的计算机应用上。其实,这时计算机对人在智能上的辅助与延伸作用比起数值计算已经大大地进了一步。而且,此“自动化”与机械工具中的彼“自动化”还是有着本质不同的。此“自动化”是计算机基于人类意识所特有的数据/信息(详见第4章第4.1节)在人类创造的“虚拟空间”中实现的“自动化”过程。这已经实在地进入人类智能的领地了。所以,对于以计算机为代表的辅助与延伸人类智能的工具,这个阶段虽然与“人工智能”的宏伟理想相去甚远,但已经属于信息技术智能应用的初期了。信息技术对人类智能的辅助与延伸作用已经超越了简单的数值计算这个起点,而进入到多个不同的相对复杂的应用领域,让人类从更多的人类所特有的、逻辑性、规则性比较强的“智能”劳动中解放了出来。

信息(数据):计算机在这个阶段处理的数据与上一阶段不同,数据处理应用中的数据以社会实体(包括社会物质实体和抽象逻辑实体)的多重社会属性的数值化表达为主,而不是简单的物质自然属性的数值表达。这些对象的属性中那些原本不是数值化的属性,通常经过简单的编码映射规则即可以用数值来代表。这些数据有着明确无歧义的意义,能有效利用计算机的数值逻辑处理能力进行处理。在这个阶段,计算机处理的数据以所谓的“结构化数据”为主。结构化数据是指一个基本的完整数据,是由多个有明确定义的数据段组合而成的。比如一张电子机票是一个典型的完全结构化的数据,它由人名数据段、航班号数据段等构成。每个数据段都有明确无歧义的意义,整张机票也是明确无歧义的,而且所有机票都是一样的。银行账户等也属于典型的结构化数据。

从语义的角度来看,如果把以有限数量的、有单一且明确无歧义意义的、可以被赋予不同具体值的语义概念,如航班号、目的地、姓名等,作为一组基而构成的空间称为有限维度(离散)“语义空间”的话,结构化数据就是在一个有限维度语义空间中的点或点的集合。也就是说,结构化数据是可以被一个有限维度语义空间来严格定义的。

以电子机票为例,一张电子机票是由乘客姓名、航班号、登机时间、起飞地点、到达地点、座位号、舱位等级等几个语义概念维度构成的一个有限维度语义空间中的一个点。

显然,结构化数据的语义特征比数值计算中的数值数据的语义特征要复杂,但是依然可以用确定和有限维度的语义来完整描述。在第4章第4.4节中还将对此进行进一步的讨论。

由于结构化数据所具有的相对复杂的语义特征,因此在日常使用习惯上,它既可以被称为数据,也可以被称为信息。结构化数据由于承载了比反映对象局部单一特征的物理数值更为复杂广泛的内涵,因此可以称之为“中观数据”。

支撑应用的基础理论:这个阶段核心的基础理论是关系型数据库理论。基于关系型数据库理论设计出来的关系型数据库,构成了此类软件应用系统的核心基础,用于实现有限维度语义空间,并对语义空间及其定义的数据进行有效的管理和操作,以及支撑基于这些数据的应用。

应用软件的特点:这个阶段的应用都是针对现实中可以用数值逻辑算法(组合)表达的(或者说可以映射为数值逻辑算法或其组合的)过程(流程)的软件实现。在这些过程的软件实现中,核心是对相应的结构化数据的处理,所谓的“增删改查”等。这类应用软件的核心是由若干用数值逻辑算法实现的流程组合而成。软件的设计,首先要做业务分析,即将需要实现的功能分解映射为数值逻辑算法的组合。

这些应用软件不再像科学计算软件那样通常作为工具性软件被用于各种独立的一次性任务。它们基本都是作为特定工具,有固定明确的使用者,长期持续地支撑特定的主体进行某一种持续的活动。比如一个企业拥有的ERP软件支撑的是这个企业的持续经营活动,而不是一个在需要时才拿出来使用一下、去解决某个具体问题的工具。在这些软件的支撑下,这些持续的活动实施的效率、一致性与精确性得到了可靠的保证,尽管可能会牺牲一定的灵活性。

系统工程的角度来看,这些软件的复杂度逐步增加,系统级设计变得越来越重要。软件的整个设计生产过程需要规范的方法和精细的过程管理。“软件工程”这一学科正是在这个背景下出现并逐步发展起来的,用于指导复杂软件的设计开发的整个过程,以期达到产出高质量软件的目的。

在这个时期出现了专业化的软件工程师这个职业,来负责应用软件的开发。尽管他们通常也需要一些相应的领域知识,但是总体来讲,这类应用软件比数值计算应用的专业性弱。软件外包业务也主要是针对这类应用的。

信息(数据)的管理及其与应用软件之间的关系:这个时期的应用软件,是用来支撑不同主体持续的特定业务活动的。在应用中,信息(数据)模型结构是作为应用软件的一个有机组成部分一体化设计出来的。在应用过程中,特定的一整套数据始终与一个完整的应用彼此相配合,实现完整的业务过程。离开了特定的数据,业务就无法进行。因此特定数据与特定的业务应用在应用软件设计初始便相对应,数据因应用而获得自己存在的意义,应用也因数据才能产生自身的价值。所以在这些应用中,数据是按照业务过程来管理的。

比如,简单来说,一个企业OA系统的数据根本就无法直接放到其ERP系统中去,这些数据只有在自己对应的业务系统中才有价值。或者说,数据加上应用软件才形成了一个实际持续运行的、支撑主体特定的持续活动的应用系统。

在这里,特定的一整套数据与应用软件是共生的、紧耦合的关系,彼此不可分离。这与数值计算中的数据与应用之间相对独立的情况不同。这种数据与应用紧密结合的模式,也是现在计算机应用中普遍采用的方法。它是现有的基于结构化数据应用的产物。面对未来新的应用,特别是面对大量非结构化信息的时候,这种模式必然有其严重的局限性。目前大家抱怨的烟囱式的信息系统建设方式以及由此产生的“信息孤岛”都是这种建设模式的必然结果。

实际问题到数值问题的映射:这类应用软件处理的实际问题,在其原本的状态下通常并不是数值逻辑计算类问题。所以,用计算机来解决这些问题需要做人为的映射变换。映射变换的对象包括两大类别,一个是对实体属性的映射,将其映射为数值表达;另外一个就是对实际业务过程的变换,将其变换为数值逻辑算法。第二个变换的准确性与有效性,在根本上决定了计算机应用软件解决实际问题的准确性与有效性。随着信息技术应用实践的不断丰富与计算机处理能力的不断增强,人们发现越来越多的、看上去并非是逻辑计算问题的过程,可以想办法映射为数值逻辑算法过程,以便用计算机来解决。计算机应用的范围从这个阶段开始,就不断地突破人们过去的想象。

当后来互联网普及之后,许多基于结构化数据的应用通过互联网得到了极大的延伸,但应用的基本特征并没有变。由于社会中各个领域内基于结构化数据、可以流程化的应用数量巨大,计算机在信息处理领域里的应用在这个阶段得到了极大的发展。软件应用系统的日益复杂,也促进了计算机技术自身在各个方面的快速成长,以满足日益复杂的软件应用的需求。

特别需要指出的是,基于结构化数据的应用,并不是在科学计算基础上的自然深化与延展,而是计算机在人类社会中开辟了不同于数值计算的另外一个全新的基于结构化数据处理的、更为广阔的应用空间,极大地推进了计算机对人类社会的广泛渗透。

计算机所解决的问题本身的特点:从计算机所完成任务的实际作用来看,这些应用不同于前一个阶段中科学计算的“点”的作用,而是具有“线”的特征。它是完成了由许多“点”的活动连接而成的“线”的流程。人们普遍抱怨的“信息孤岛”“烟囱”式的信息技术系统建设方式,就是源于这种面向业务流程的应用设计开发方式。所以“信息孤岛”“烟囱”式的信息技术系统建设,是信息技术在特定发展时期的必然产物,有其历史的必然性与合理性。

信息技术应用的这个时期是信息技术产业的少年时代。在这个时期,信息技术产业在基础理论,特别是核心技术与产品等方面取得的主要进步有以下内容。

在这个时期,计算机由中小规模集成电路发展到了超大规模集成电路。计算机系统的运算速度从每秒几万次飙升到每秒上万亿次。(www.daowen.com)

Intel公司在1971年研制成功的第一个微处理器4004。它采用10µm工艺,集成了2250个晶体管(见图3-3)。虽然这在今天看来只是一个功能简单的、只能执行四位字长运算的处理器,但是这是信息技术历史上第一次将计算机的核心处理功能与控制功能全部集成在一个集成电路芯片上。因而它成为计算机发展史上的一个划时代的里程碑。

Intel公司的Gordon Moore(1929—,仙童半导体公司与Intel公司创始人之一)在1965年首次提出集成电路发展的“摩尔定律”。在随后的几年里几经修改后,该“定律”表述为:“当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。”迄今为止,该“定律”依然有效,但在硅技术上已经看到尽头了。

978-7-111-60062-6-Chapter03-3.jpg

图3-3 Intel公司1971年研制成功的第一个微处理器4004

在CPU领域,IBM自20世纪80年代开始发起了一场精简指令集(RISC)对复杂指令集(CISC)的大战。CISC的典型代表就是Intel的X86结构的CPU,十分壮观的RISC阵营则有IBM公司的PowerPC,HP公司的PA-RISCC,Sun Microsystems公司的SPARC,Motorola公司的MC88000,DEC公司的Alpha,以及MIPS和现在大名鼎鼎的ARM等。在20世纪90年代,从服务器到嵌入式系统,RISC体系大有一统天下的势头。

集成电路技术的飞速发展,导致计算机从高端专业设备领域中走出来并进入个人应用领域。苹果公司在1976年推出了第一台个人计算机Apple I。IBM则在1981年推出了IBM PC,并成为产业标准。IBMP C的出现有力地促进了互联网的发展,并成为信息技术进入下一个发展阶段的重要推动力。东芝公司在1992年推出了第一台笔记本电脑T1000,开创了移动计算时代。PC的出现,标志着计算机开始了从“贵族”到“平民”的转身。

进入20世纪60年代后,计算机逐步摆脱了非标准化生产的初级状态,开始了标准化进程。操作系统开始作为标准化的产品出现。第一个重要的操作系统是IBM在1964年推出的System/360。影响最广的UNIX操作系统由在AT&T贝尔实验室工作的Ken Thompson(1943—,计算机科学家,1983年获图灵奖,贝尔实验室/Google任职)和Dennis Ritchie(1941—2011,计算机科学家,1983年获图灵奖,贝尔实验室任职)于1969年开发出来。微软公司在1981年推出MS-DOS,在1985年推出Windows1.0。1991年,Linus Benedict Torvalds(1969—,软件工程师)在互联网上发布了第一个版本的Linux内核。这是信息技术历史上第一个采用开放源代码软件开放模式的软件协作计划。由此开始,开源软件的影响与日俱增。

曾经非常重要但是现在已经被遗忘的一个产品是软盘。它是IBM在1971年开发出来的。2000年以后,软盘逐渐被U盘所取代。

高级程序语言在这个时期也得到了大发展。BASIC(Beginner's All-purpose Symbolic Instruction Code)语言在1964年由John Kemeny(1926—1992,计算机科学家,达特茅斯学院第13任院长)和Thomas Kurtz(1928—,计算机科学家,达特茅斯学院任职)设计,由达特茅斯学院的学生在他们的指导下实现的。C语言则是伴随着UNIX在1971年被贝尔实验室的Ken Thompson和Dennis Ritchie开发出来的。在C语言基础上发展出来的面向对象的C++语言,是贝尔实验室的Bjarne Stroustrup(1950—,计算机科学家,贝尔实验室/德克萨斯A&M大学任职)于1983年推出的。Java和JavaScript的出现则是1995年的事情了。其他一些比较重要的高级程序设计语言还有LISP(1958,函数式编程设计语言)、Cobol(1959,面向商业与数据处理的程序设计语言)、ALGOL60(1960,算法程序设计语言)、Simula67(1967,第一个面向对象的程序设计语言)、Pascal(1970,第一个结构化程序设计语言)、Prolog(1972,面向人工智能的逻辑程序设计语言)、Ada(1983,美国军方主导的面向实时嵌入式应用的程序设计语言)等。

由于计算机开始从科学计算进入到数据处理应用,因此促进了数据库的产生与发展。1961年,通用电气公司(General Electric Co.)的Charles Bachman(1924—,计算机科学家,1973年获图灵奖,通用电器/巴赫曼信息系统公司任职)成功地开发出世界上第一个网状数据库管理系统——集成数据存储(Integrated Data Store,IDS),奠定了网状数据库的基础,并在当时得到了广泛的发行和应用。层次型数据库管理系统是紧随网络型数据库出现的,最著名、最典型的是IBM公司在1968年开发的IMS(Information Management System)。

今天被最广泛使用的关系型数据库,源于1970年6月IBM的研究员E.F.Codd博士(1923—2003,计算机科学家,1981年获图灵奖,IBM任职)在CommunicationoftheACM上发表的一篇名为A Relational Model of Data for Large Shared Data Banks论文。1974年,IBM的Raymond F.Boyce(1947—1974,计算机科学家,IBM任职)与Donald D.Chamberlin(1944—,计算机科学家,IBM任职)定义了用于关系数据库交互的SQL(Structured Query Language)语言。1976年,霍尼韦尔国际公司(Honeywell International)开发了第一个商用关系数据库系统MRDS(Multics Relational Data Store)。第一个比较完整实现SQL的商用关系型数据库是Oracle公司(当时叫Relational Software Inc.,RSI)于1979年推出的。IBM在1982年推出了基于SQL的商用数据库管理系统SQL/DS,并于次年推出了著名的DB2关系型数据库。

由于软件系统日趋复杂,1968年秋,北大西洋公约组织的科技委员会在联邦德国召集计算机科学家、软件设计师及企业巨头开会讨论应对“软件危机”的策略,并在这次会议上首次提出了“软件工程”(Software Engineering)的概念。随后,软件工程不断积累总结软件开发的过程管理方法与设计方法,以保证复杂软件系统的质量。在设计方法上,随着C++语言的出现,在20世纪80年代面向对象的方法成为主导;基于构件的方法则兴起于20世纪90年代。

互联网的雏形出现在20世纪60年代。当时美国国防部国防前沿研究项目署(ARPA)出于冷战考虑创建了远程分组交换的ARPA网。1973年,ARPA网扩展成互联网,第一批接入的有英国和挪威的计算机。1974年,ARPA的Robert Elliot Kahn(1938—,计算机科学家,2004年获图灵奖,贝尔实验室/麻省理工学院/ARPA任职,非盈利组织CNRI创始人)和斯坦福大学的Vinton Gray Cerf(1943—,计算机科学家,2004年获图灵奖,IBM/斯坦福大学/DARPA/CNRI/Google任职)提出TCP/IP。1983年1月1日,ARPA网将其网络核心协议由NCP改变为TCP/IP。1990年开始,互联网向公众全面开放。

互联网上基于超文本的万维网(World Wide Web)技术是Tim Berners-Lee(Timothy John Berners-Lee,1955—,计算机科学家,万维网的发明者,欧洲粒子物理实验室/麻省理工学院/南安普敦大学任职)在欧洲粒子物理实验室工作时于1989年第一次提出的,并于1991年8月6日在互联网上开通了世界第一个网站http://info.cern.ch/,由此开创了互联网应用的新纪元。

移动互联网源自移动蜂窝通信系统。第一部移动电话是摩托罗拉公司在1973年研制出来的DynaTAC 8000X。它重2磅,通话时间半小时,销售价格为3995美元。1978年,美国贝尔实验室开发了先进移动电话业务(AMPS)系统,这是第一种真正意义上的具有随时随地通信能力的大容量的蜂窝移动通信系统。目前移动通信中最核心的移动CDMA(码分多址)技术是高通公司(Qualcomm Inc.)在1989年推出的。

在局域网中,最著名的总线竞争的以太网施乐公司(Xerox Corp.)帕罗阿尔托研究中心的Bob Metcalfe(1946—,计算机网络专家,Xerox/3Com任职,3Com公司创始人)于1973年首次提出的。以太网标准正式出台于1980年。随后,以太网很快击败了同期出现的令牌环网等其他类型的局域网而成为局域网的标准形态。无线局域网的标准出现于1997年。

通信骨干网中,激光与光纤是两个核心技术。激光的理论源于爱因斯坦。爱因斯坦在1917年指出,物质存在受激相干辐射的机制。1960年5月15日,美国加利福尼亚州休斯实验室的科学家Theodore Harold Maiman(1927—2007,物理学家,休斯公司/TRW公司任职)宣布获得了波长为0.6943µm的激光。这是人类有史以来获得的第一束激光,Maiman因而也成为世界上第一个将激光引入实用领域的科学家。

1966年,在欧洲标准电信实验有限公司工作的高锟(1933—,物理学家,2009年获诺贝尔物理学奖)提出了光纤理论。1970年,美国康宁公司(Corning Inc.)的三名科研人员马瑞尔、卡普隆、凯克成功研制成低损耗石英光纤。

这个时期是信息技术产业的核心技术蓬勃发展完善的时期,孕育了今天使用的几乎所有的信息技术基础性核心技术和产品。信息技术应用从社会的核心重要领域开始,逐步渗透到社会的其他方面,包括个人生活领域,日益显示出信息技术对人类社会的历史性影响。继农业、工业社会之后,人类历史上第三个以技术来标志的社会形态——信息社会初现端倪。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈