徐谦(华中师范大学信息管理系情报学专业 湖北武汉 430079)
摘要 文章结合当前基于万维网的信息系统的一些不足之处,探讨了被称为第三代因特网的网格的出现将给当今的信息系统带来的影响和对其研究提出的新问题。
关键词 网格 信息系统 资源共享
1.引言
近年来计算机硬件的飞速发展和软件的进一步成熟,并伴随着Internet的流行和高性能计算机的利用以及低耗费高速网络的发展,使计算机网络成为单个统一强大的计算机资源的梦想正在逐步成为可能。所谓网格(Grid),是指将跨地域的多台高性能计算机、大型数据库、贵重科研设备、通信设备、可视化设备和各种传感器,甚至个人计算机等所有的计算资源、存储资源、通信资源、软件资源、信息资源、知识资源、专家资源等整合成一个巨大的超级计算机系统使用,从而能够方便快捷地解决各种复杂的问题。继Internet实现了计算机硬件的连通,WEB实现了网页的连通,Grid试图实现互联网上所有的资源全面连通,掀起第三次网络技术浪潮。因此,有人也称网格为第三代因特网。同时我们也注意到,当今基于万维网的信息系统虽然应用领域日益广泛,但与其他一些信息化技术如数据库技术、网络技术等相比,信息系统还并没有被真正充分广泛地运用到管理决策活动之中。应该承认,传统信息系统理论框架和技术平台中存在着一些不足。而网格的出现恰好给解决信息系统现存的一些问题提供了新的思路和技术。下面着重分析网格将给信息系统的理论和实践带来哪些影响并如何推进其发展。
2.基于万维网的信息系统存在的不足
回顾信息系统60多年的发展历史,我们可以看到它在理论研究、系统开发和实际应用等方面都取得了很大的进展。目前我们所处的信息爆炸时代,其特点就是信息已经与能源、物资一起,成为社会的三大要素之一。人们生产信息、获取信息、使用信息的手段和方式多种多样,信息系统的大量出现就是这个时代的标志。信息系统的主要功能是辅助解决人们在生产、获取和使用信息中遇到的问题。但是现在人们不断发现基于TCP/IP协议的万维网并不能很好地解决在信息共享和利用方面所出现的问题,信息系统的发展也严重滞后于网络技术发展的速度,其应用远没有达到人们预期的那样深入人们生活的方方面面。具体说来,主要存在以下几个方面的不足:
从使用角度上看,目前的信息系统使用的生命周期都是很短暂的,使用的效率也是很低下的。这主要是由于分布式数据环境中TCP/IP协议的点对点(Peer-to-peer)传输优点变成了缺点,使万维网上出现了大量的信息孤岛。基于万维网的信息系统,虽然实现了全球范围内信息资源的连接(网页和物理链路层的连接),但这些信息资源零散地分布在各个网络站点上,缺乏有效的组织和管理,发现和利用这些信息资源非常困难。而且大多数信息系统中共享的信息资源仅指模型、方法、知识和数据等,并不包括支持这些信息资源运行的软硬件支撑平台。这使得共享的信息资源的使用受到了很大的限制,信息资源的用户即使得到了这些信息,由于没有运行它们的软硬件环境,也很难使用它们。在最近几年中,这种现状激增了信息系统的应用分割,这种分割集中体现在3个孤岛上——信息孤岛、应用孤岛和用户孤岛。在大量企业或其他组织中,可能因为多项业务的原因同时存在多个信息系统,它们相互不能替代,又不能无缝地进行信息共享,从而导致各类组织的信息化建设和维护过程中巨大的成本浪费,而且受益不佳。大多数的信息系统没有充分发挥它的功能和性能,用户还没有真正体验到信息化所带来的直接利益。另外,随着时间的推移,业务的变化或管理体制和规划上的一些原因也导致信息需求的变化,从而又需要开发新的系统,其使用周期都很短暂。
从技术角度来看,目前的信息系统缺乏统一的标准,而且结构僵硬,不能适应环境和需求的变化。由于在用户界面、组成部件结构和信息交互等方面缺乏统一的标准,导致了各种信息系统用户接口千差万别,信息系统各组成部件集成非常困难。这给信息系统的建造、使用和推广带来了许多困难。另外,目前的大多数信息系统是针对具体的问题而构造的,没有充分考虑信息系统组成部件的独立性,没有提供对信息系统组成部件的灵活访问,在信息系统组成部件间没有提供灵活的映射和集成机制,没有实现插件形式的信息系统组成部件。这样的信息系统结构僵硬、可重用性差、生命周期短,不能随环境和用户需求变化,造成了人力物力的大量浪费。
上述问题的存在大大影响了信息系统的推广和应用。为了解决这些问题,需要改进现有的信息系统理论,引入更加先进的计算支撑平台。而网格技术的提出,给信息系统的发展带来许多新的机遇和挑战。
3.网格的应用蓝图及趋势
人们借鉴电力网的要领提出网格的发展前景,即让网格像电力网一样成为公共基础设施的一部分,使每位连入网格系统的用户都能够像日常生活中从电网中获取电能一样方便地获取高性能的计算能力和各类信息资源,而不用关心其地理位置和来源。网格将因特网中各站点上零散分布的信息资源,进行统一管理和使用。用户可以通过网格门户(portal),看到若干与自己相关的频道,而不必在无数个网站中大海捞针般地搜索信息。许多平台和资源都可以共享,这样可大大降低网站创建及提供服务的成本(估计只是现有网站的1/3到l/10)。人们建设网格就是为了实现信息的广泛共享、有效聚合、充分释放。所谓广泛共享,是指通过各种方法、计算和策略将网络上的各种资源提供给网络上众多用户共享和使用;所谓有效整合,是指将网络上的巨大资源通过协同工作连接集成起来,产生巨大的综合效能,联合完成应用任务;所谓充分释放,是指为用户提供良好的开发手段和使用环境,将网络上多种资源的聚合效能按照需求提供给用户,为用户提供个性化的信息服务、计算服务和决策支持服务。
信息的网格化意味着一个新的计算机发展阶段的出现,其特点是,计算机已经成为人们生产和生活的基本需要,用户已经看不见技术,也不需要知道技术,只需知道技术带来的好处。在这个阶段,计算机已经明显打上社会的烙印,人们更关心计算机产生的社会性效果和意义,对其本身的技术发展关心程度已经大大降低了。因此,网格已经从计算机领域研究和技术领域发展到人类社会领域,它代表的不再单纯是一种技术发展趋势,还代表着人类社会信息的发展必然阶段和人们生产与生活的基本需求。网格的发展是技术和社会发展相结合的必然产物。其实现在网格的相关技术已经在很多行业使用开来,只是尚未使用网格的名称。例如,在银行界叫“业务集中”,在航空、船舶、汽车等制造业叫网络化虚拟制造环境,资源环境领域叫“单一数据源”,电子商务和电子政务中叫“一站式服务”等。其技术思想其实都跟网格如出一辙。我们预计未来的网格应用将呈现如下趋势:
(1)以行业为先导。由于网格技术还不成熟,还没有统一的标准,而对网格技术的需求又十分强烈,因此目前的网格应用形态和用户使用模式是多种多样的,对用户的请求、资源的表示与管理、信息的集成等基本都是依据各行业特点构造相应的系统,并试图去解决问题。
(2)标准化。网格应用的行业化,对应用网格的构造提出了统一行业标准的需求。与目前关于网格软件标准化的要求类似,行业网格应用也提出了标准化的需求,一方面要求应用开发要遵循现有的一些开放标准与协议,另一方面又要依据行业特点,制定网格应用的一些行业标准。事实上,目前的一些应用网格实例也正试图这样做。
(3)技术融合。目前,基于XML(可扩展标记语言)的WEB services技术在各种异构平台之上构筑了一层通用的、与平台无关的信息和服务交换设施,将WEB services的规范加入OGSA(开放网格服务架构)之后,网格的一切对外功能都以网格服务(Grid Services)来体现,并借助一些现成的、与平台无关的技术来实现这些服务的描述、查找、访问、传输等功能。另一方面,网格的应用将涉及众多学科的交叉,需要众多学科的科研工作者相互交流合作,实现技术融合,只有这样,才能构造出易用、好用的网格应用系统。
(4)大型化。一方面,网格应用在资金上的投入越来越大,各国政府的投入逐年递增,公司也投巨资发展网格技术及应用;另一方面,依据网格的发展,从最初的企业网格、合作网格,到最终的公用基础设施,网格最终将作为国家公用设施去建设与运营,为科学研究、国民经济和国防建设提供服务。
4.网格对于信息系统的影响
人们开发信息系统的目的是为了对信息进行有效管理,实现资源共享,而网格的本质特征正是高性能的远程资源共享,网格提供的技术支持和信息系统的需求恰好吻合。毋庸置疑,网格的广泛应用必然会对当今的信息系统产生巨大的推动作用。本文从四个方面来具体分析:
4.1信息资源的共享和利用方面
首先,网格的出现使得机构能够充分利用闲置的计算资源和信息系统中的信息资源。网格将系统中的计算机、科研设备、数据库、通信设备等软硬件都整合起来,采用网格技术,机构能充分利用闲置的计算资源进行计算、数据备份和数据恢复,从而提高了计算资源的利用率,减少了基础设施的投资。网格技术还提供了资源动态共享和集成不同信息系统中应用程序的功能,将企业的各种应用系统加以集成、整合,使得它们连通在同一平台上,以使企业能够共享资源,从而消除企业信息化中存在的“信息孤岛”和“资源孤岛”。其次,应用网格技术,通过数据迁移和同步系统,能够实现异构数据库的统一查询和同步访问,可以在较短时间内把需要的数据从不同的信息系统中提取出来并综合在一起,大大提高了信息系统中信息资源的利用率。
再者,网格的宽带更宽,还可以给信息系统提供虚拟超级计算机的高性能计算能力,数据处理速度大幅度提高,为部分行业信息系统如银行信息系统中所涉及的计算加快计算速度和提高精确度,以及达成信息系统的高吞吐率、联合调度、资源预约等目标要求。
4.2系统用户方面
一方面,信息系统在网格环境下可以跨系统、跨平台获得所需资源,使用户可以在较短的时间内解决复杂的问题,提高用户的工作效率。如在公司的市场分析或财务分析中,采用信息系统进行数据挖掘、联机分析处理等时,往往涉及大量的数据和复杂的计算,利用网格技术提供的强大的计算能力和资源共享能力可加速数据的访问、提取,在较短的时间内,为用户提供所需的信息。
另一方面,信息系统将更加智能化,辅助用户进行决策支持的能力得到增强。网格不仅能够跨系统跨平台地提供用户所需信息,还可以从中提炼有用信息,并把用户最关心的内容经过智能的分析整理,以用户容易理解的方式,及时准确地送到用户手中,为其决策提供依据。
另外,网格环境下的信息系统还可以提高系统用户与其他组织协同解决问题的能力。如:一个汽车制造商在设计最终产品时,需要成千上万的零件供应商与之协作,而且,每个零件供应商可能使用不同的操作系统、应用程序和数据库。通过网格,制造商能将分散的异构的系统集成为一个统一的“虚拟组织”,组织中的各成员共享资源,大家可在全球不同的地点协同工作,最后完成产品的设计。(www.daowen.com)
4.3系统服务方面
由于人工智能技术,特别是分布式人工智能技术和Agent技术的大量使用,在网格环境下,信息系统使用起来更加方便,能为用户提供个性化服务和一站式服务。目前用户访问不同的信息必须进入不同的信息系统,增加了信息访问的复杂性和困难性,很不方便。基于网格的信息系统能够提供易于操作的单一入口,使用户透明地访问各种信息资源。不论用户身处何地,只要打开浏览器,登录一次就可以访问整个网格系统中的授权信息,而不需在信息的查询上花费太多的时间。这就是一站式服务。同时,信息系统提供更高层次的个性化和智能化服务,用户可以根据自己的喜好设置系统,用最少的操作准确获取想要的信息,并按照用户的喜好方式显示。
网格还可以为信息系统提供动态的信息服务。传统的信息系统是静态结构,一旦建成就很难修改。在网格环境下,信息系统的提供者将以个性化定制和点播的形式提供信息服务。用户可以根据自己的爱好和所从事的工作对信息进行定制和点播,形成自己独特的定制页面和信息资源,信息系统将根据用户的需要动态地组织信息,以适应环境和信息任务的变化。
4.4系统管理方面
网格环境下的信息系统标准统一,集成一体,它不需要程序员进行二次开发,只需要管理员做简单的配置,就可建立服务平台,系统管理的工作量大大减少。
在系统安全管理方面,由于网格环境由许多高性能计算机和高速通信网络组成,且增加提供了许多功能强大的安全服务和故障检测与修复服务,因此基于网格环境下的信息系统具有更高的性能,而且更加安全可靠。
我们预计将来网格环境下的信息系统将具有三大特点:高性能、全共享和零管理。高性能是基于网格强大的并行计算能力;全共享是指不仅共享信息系统管理的信息资源,还能共享信息系统本身,即信息系统本身也成为具有良好互操作性的网格资源;零管理也就是自主计算,信息系统将充分适应网格动态和自治的特点,做到像电力网一样24小时无需人工干预而安全可靠地运行。
5.网格给信息系统研究提出的新问题目前,网格的研究正在全世界范围内如火如荼地展开,对于网格环境下的信息系统的研究也成为国内外研究的焦点。网格的应用在给信息系统带来巨大影响的同时,也给信息系统提出了许多新的问题。我们认为有以下几个关键问题值得关注:
5.1信息资源方面,各类异构信息系统中信息如何表示的问题
基于网格的各类异构信息系统中有各种结构化、半结构化和非结构化的数据,要在网格环境下共享这些数据可能需要把这些数据映射成数据库或其他存储机制(比如文件系统)的数据实体,使得各种信息可以通过元素属性与值之间的关系对来表达,从而实现信息的单一性。如何映射这些数据则是网格信息系统要解决的首要问题。
5.2系统用户方面,知识发现和数据挖掘问题基于网格的信息系统提供强大的知识管理工具和信息挖掘工具,可对网格中的信息实现智能化的分析处理及元信息的自动关联。但是人们对于信息把握的准确性和全面性提出越来越高的要求,因此,对于信息系统的智能化研究也一直是信息系统发展研究的重点。
5.3系统服务方面,如何实现个性化和一站式服务平台问题将Internet上提供信息服务的站点从逻辑上连接在一起,在不考虑安全限制的前提下,从一个信息源可以到达连通的其他任何信息源,让所有用户都可以享受这些信息服务。虽然这些信息可能存储在不同位置,但对访问者来说,它们就像是存储在同一位置,访问者不必关心其实际存储位置,他们所看到的网格是一个统一整体,完成的是一个统一的功能。如何在网格信息系统中从信息存储到用户的浏览检索服务,纵向地为用户提供集成一体的方案,如何使界面达到一致、使用方便、用户输入和操作次数最少等,都是网格环境下信息系统建设应该考虑的问题。
5.4在管理方面,网格环境下信息系统集成的标准及自治条件下信息系统的协同性和安全保证问题。
有人认为网格就是一种标准,网格要整合很多异构的资源和不同的信息系统,就需要非常强调公共标准,进行系统建设时应该树立标准先行的观念,而且集成标准需要是开放的,不能被控制在某个企业或个人手中。虽然网格信息系统集成所涉及的问题并没完全解决,但目前已有一些实际可用的标准草案,根据它已经实现了网格环境下信息系统的集成,但是草案不一定会形成标准,对于标准制定的研究应该予以重视。
另外,由于网格环境下集成的信息系统通常属于不同的机构或组织,并且使用不同的安全机制,因此,既需要各个机构或组织对其拥有的资源有自主的管理能力,又需要它们共同参与解决资源共享和互操作的问题。整个网格是协同工作的,在一定的规则和管理下,很多网格结点可以共同处理一个项目。Internet环境下的信息系统正是缺乏与其他系统协同工作的能力及安全保障机制,尤其是缺乏与跨领域信息系统的协同工作能力和安全保障。因此,网格信息系统需要建立多个系统资源之间的关联共享,保持系统资源之间共享关系定义的灵活性和资源共享的高度可控性,从而提高系统的协同工作能力。
6.结语
从以上分析可以看出,现有的信息或信息系统是未来网格的物质基础,所利用的技术主要包括现有的网络基础设施、新的数据模型、协议规范、WEB和数据库技术等等,实现网格化的信息共享世界的道路看起来并不遥远。当WEB还处在实验室时,连它的发明者(Tim John Berners-Lee)也没预料到10多年后会取得如此巨大的成功。因此,我们有信心认为实现网格的目标指日可待。同时,我们也该认识到,目前对于网格的研发在全球仍处于起步阶段,如何实现网格在信息系统中的广泛应用还有很长的路要走,包括所需的理论基础和关键技术等还需要人们进行不断的探索。但是可以肯定的是,构建基于网格的信息系统将成为下一阶段信息系统发展的重点领域。计算机科学推进网格技术应用于信息系统领域,将对全面解决信息资源共享、IT公用事业化和信息安全等问题具有重大的指导意义和广阔的发展前景。
参考文献:
1.吕雪梅.憧憬网格时代.网际商务,2002(1)
2.李亮先.网格技术在数字图书馆的应用.情报科学,2004(6)
3.钱德沛.我国网格技术应用现状及发展探讨.信息化论坛,2004(5)
4.郑淑荣.网格的研发现状与发展趋势.现代通信,2004(4)
5.彭希君.网格阔步在后WWW时代.电子商务,2004(8)
(原载2005年第4期)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。