陈卫东 叶鹰
摘要 文章提出建立人文信息学的构想,对人文信息学的资源和方法进行了初步探讨,认为人文信息学是人文社科情报研究的未来发展方向之一。
关键词 人文信息学 信息资源管理 社科情报
世界已经进入信息时代,信息作为一类普遍的资源无处不在,因而必然对人文社会科学产生影响。随着网络人文信息资源的增加,人文社会科学情报研究在理论与方法上面临现代化转折①,人文信息学可望兴起。
本文对人文信息学的基本思想和方法进行初步探讨,以明确人文信息学的资源基础和逻辑结构。
1.人文信息学的基本思想
在当今网络信息资源和网络信息技术飞速发展的推动下,各种专科信息学层出不穷,如化学信息学②、生物信息学③、中医信息学④等均已出版专著,神经信息学、脑信息学等研究正在蓬勃展开 ⑤ 。将这些基于网络信息资源和网络信息技术发展信息学的思想方法平移到人文学科领域,就导致人文信息学设想的提起。
人文信息学的基本思想是以当今电子化、网络化信息资源作为主要研究对象,以电子信息技术、网络信息技术作为主要研究方法,以网络作为研究平台,从数字化人文信息中发掘规律和知识。由此,可以拓展人文社会科学情报研究。
2.人文信息学的资源基础
建构人文信息学的资源基础,主要是电子文献和网络资源。
2.1电子文献
随着文献信息资源的电子化,越来越多的经典文献已经数字化,中国大套古籍数字化工程基本完成,电子版《十三经》、《二十五史》、《四库全书》等已经商品化,这就为人文信息学提供了丰富的可以利用的资源。这些载体化的电子文献,为人文信息学研究提供了实实在在的物质基础。美国的一些东亚图书馆已经采购了上述资源 ⑥ ,国内已经以这些资源为基础建立了多媒体人文信息系统⑦。
2.2网络资源
除了以光盘、磁盘等载体形式存在的人文信息资源外,大量的人文信息已经上网,为建构人文信息学提供了更加丰富的资源,这些资源以专门网站或网页形式存在并动态更新,完全可以作为人文研究的资源平台。
常见的网上人文资源如:国学网站:http://www.guoxue.corn;中国文学网:http://www.1iterature.net.cn;中国诗歌网:http://www.poetry-cn.com;中国史学网:www.chinahis.con;中华文化信息网:http://www.ccnt.com.cn;中华人文网站:http://libweb.zju.edu.cn/ren-wen/;等等。
这些网络资源不仅是重要的人文信息,而且是重要的人文学术资源。电子文献和网络资源都是数字化信息资源,它们共同构成了人文信息学的资源基础。
3.人文信息学的研究方法
人文信息学的研究方法,主要是成熟的信息处理方法,具体包括:
3.1信息存储与检索技术
业已成熟的数字化信息存储与检索方法完全可以移植到人文信息学中,由此带来的优势有:(1)可以从根本上改善人文信息获取的技术水平;(2)可以促进人文信息研究方法的现代化。
3.2信息处理与分析技术(www.daowen.com)
在人文信息的处理与分析中,利用信息技术,尤其是智能信息处理技术可以从整体上提高人文信息研究的效率,将传统人文信息研究以手工低效操作为特征的方法推进到计算机辅助高效处理和智能化处理阶段,定能彻底改进人文研究的面貌。
3.3数据挖掘与知识发现技术
学术研究已经积累了海量文献和数据,如何超越常规的查询或检索操作而对储存于数据库中的极为丰富的数据进行有效的发掘和利用已引起数据库专家越来越浓厚的兴趣。KDD(Knowledge Discovery in Database,基于数据库的知识发现)在20世纪80年代末、90年代初应运而生。KDD是数据库和人工智能专家系统的结合,它利用前者存储的大量数据,在其上运用人工智能的知识生成规则,得出具有普遍性的知识。由此还可以作为专家知识输入专家系统以供系统决策,从而解决专家系统的知识获取瓶颈问题。
从1989年第一届KDD国际研讨会召开到现在,KDD已经引起了越来越多的专家学者的兴趣。对KDD技术讨论的热点主要集中在定量规则的发现,发现过程中知识的运用,集成的交互的知识发现系统,发现方法,依赖关系的发现与分析,知识发现的应用以及系统应用等方面。对KDD的研究已由最初的对某一种知识的研究转移到集多种知识发现能力和多种知识发现策略的交互式集成系统的开发上。目前,KDD理论研究取得了一定的成就 ⑧ ,美国GTE实验室的G.P. Shepiro等人的强规则发现理论、J. Ham等人的面向元组的知识发现等都在KDD理论上作了有益的探索。人文学科文献浩如烟海,建立人文学科的数据挖掘和知识发现系统是十分必要和有益的。
4.作为人文社科情报发展方向之一的人文信息学
多年来,人文社会科学情报研究在低水平徘徊,理论与方法均无较大突破。人文信息学概念的提出,可望打破这一相对封闭的局面,让人文社科情报研究发展出具有现代特色的分支,其意义和影响将极为深远。
作为人文社科情报研究的一个分支,人文信息学将独树一帜,用新理念、新方法改良人文学科研究,可望产生出具有学术价值的成果。其中明显可以预见的是能构造人文学术研究的网上协作环境,形成网上合作研究系统,构成网上合作研究中心之间的资料、软件等信息资源和科技成果的共享网络,建立起连接各研究网点的基于网络的协同研究工作平台,利用计算机协同工作的最新成果和先进工具构建成高效的人机交互系统,如视频会议系统、文献共享系统、协同编辑系统、网上研讨系统等。在此基础上,可以便捷地开展跨学科、国际化的人文科学领域前沿课题的研究。
5.小结
综上所述,广泛的数字化信息资源和普及的信息技术方法为建立人文信息学奠定了良好的资源基础和方法基础,使人文信息学获得可行性和必要性;网络信息资源和信息技术方法为人文信息学支撑起广阔的研究空间,发展前景无限美好。
注释:
①邓小昭.人文社科情报方法技术研究(1979—1999).情报资料工作,2001(2);李学英.试论人文社科情报研究现代化.社会科学动态,2000⑷
②邵学广,蔡文生编著.化学信息学.北京:科学出版社,200l
③张成岗,贺福初编著.生物信息学方法与实践.北京:科学出版社,2002
④任廷革主编.中医信息学.北京:科学出版社,2003
⑤唐一源.人类脑计划和神经信息学.http://pfc.3322.org/〜cnc/
links/meetings/02/2/0tyy/tyy.doc
⑥http://www,1ibrary.ucla.edu/libraries/eastasian/
⑦董慧,焦玉英.多媒体人文信息系统设计与实施研究.情报学报,1998,17(3)
⑧Fayyad.U.etal.AdvancesinKnowledgeDiscovery&DataMining.Cambridge,MA:TheAAAIPress/TheMITPress,1996
(原载2005年第1期)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。