唐晓波1,2 叶晨孟1 魏 巍1 朱 娟1
【摘 要】本文系统梳理了国内外知识融合相关研究,并从概念与内涵、方法与实现路径、系统研究、应用研究四个方面进行了总结与归纳。概念与内涵方面,将知识融合的功能概括为针对多源、结构复杂、层次不一的知识,采用转换、集成、提取与合并等方法,建立统一的知识模式并获取新知识,以提供高质量的知识服务。方法与实践路径方面,分为元知识集和本体库构建、融合算法、融合结果的控制与评价反馈三个方面。系统方面,主要介绍了KRAFT 模型及其他相关研究。应用方面,归纳为产品设计、决策支持、知识服务三个领域。最后,本文对目前的研究进行了述评。
【关键词】知识融合 方法与实现路径 系统研究 应用研究
A Review on Knowledge Fusion
Xiaobo Tang1,2 Chenmeng Ye1 Wei Wei1 Juan Zhu1
(1.Center for Studies of Information Resources,Wuhan University;2.School of Information Management,Wuhan University)
【Abstract】This paper summarized the research about knowledge fusion home and abroad.The summarization included 4parts,i.e.concepts and connotation,methods and implementation path,systematic study,application study.About concepts and connotation,the functionof knowledge fusion was defined as converting,integrating,exacting and combining multisource,baroque,multilevel knowledge into unique knowledge pattern so as to have new knowledge for high-quality knowledge services.About methods and implementation path,contained the building of meta knowledge base and ontology,fusion algorithm,the control and assessment of fusion results.About the system,this paper mainly introduced KRAFT model and other related models.About application,it covered product design,decision support and knowledge service.At last,this paper gave a short summary about the whole paper.
【Keywords】knowledge fusion methods and implementation path systematic study application study
知识在知识经济社会中是创造价值的重要源泉,但是随着知识总量的激增,如何从繁杂的知识库中科学高效地利用知识已经成为了一大难题。知识融合(knowledge fusion)提供了一个可行的解决方案。随着计算机网络技术、数据库技术的发展,知识融合愈来愈受到人们的重视。本文从四个方面归纳分析了知识融合的相关研究,即知识融合的概念与内涵、方法与实现路径、系统研究、应用研究四个方面。其中知识融合的概念与内涵厘清了知识融合与相关概念之间的关系;方法与实现路径是知识融合的核心,决定了知识融合的效果和效率;系统研究是知识融合的技术方法与实践的结合;应用研究是知识融合在生产实践中发挥效力的基础前提。
1 知识融合的概念与内涵
知识融合的概念于20世纪90年代在信息融合的基础上被提出,虽然现有的文献对于知识融合的定义尚未统一,但其功能都可以概括为:针对多源、结构复杂、层次不一的知识,采用转换、集成、提取与合并等方法,建立统一的知识模式并获取新知识,以提供高质量的知识服务(见图1)。
图1 知识融合研究思路
知识融合是知识科学与信息融合的交叉学科,其研究对象主要针对知识,而采用的基本思想和实现技术主要来源于信息融合。知识融合与信息融合在处理对象的结构和功能目标上完全一致,都是通过对来自多源的对象个体进行综合分析,得到新的可用性更强的同类对象。不同之处在于,信息融合的处理对象内容一般是数据化信息,例如传感器信号序列;而知识融合则针对知识对象实体,例如规则库等。此外,前者相对侧重结果的实时可用性,所以一般结果对象信息的规模较小;而后者相对强调知识的模糊性和服务质量,所以结果一般不是单一的对象个体,而是对象集合甚至空间。
知识融合又和知识科学中的知识集成、知识共享等模块有较为密切的关系,三者之间有部分重叠的内容,例如都要对知识进行组织,基本目的都是要实现知识共享和重用。因此在研究方法方面,知识融合可以与其他两个模块相互借鉴。知识融合与二者的最大区别在于,知识融合希望通过适合的算法模型产生基于现有知识的新知识,并能够通过应用反馈对新的知识进行合理评估,从而提高不同知识对象之间的协同工作能力。
2 知识融合的方法与实现路径
要实现理想的融合过程需要解决三个基本问题,即知识结构的差异性、知识更新的随机性和知识扩展的开放性。如果知识元素的表示结构存在差异,则很难直接进行处理,为了解决知识异构的问题,现阶段研究大多采用本体论的相关技术将知识库转化为本体库或知识元集合,将知识元素统一为对象化表示处理;知识更新的随机性[1]是指知识处理过程中,一个系统的知识应该向什么方向演变是无法预知的,所以很难给出具有特定趋势指导的融合算法,为此,在融合算法中,要尽可能构造各种随机改动的操作,根据应用结果的反馈来判断改动的成功与否;知识扩展的开放性是指知识元素的结合可能是两个对象之间,也可能是多个对象之间发生的,而融合的结果一般并不是唯一的[2],可能会是一个相当庞大的规模,所以在进行知识融合处理的同时,必须考虑如何对运算后的知识元素规模进行有效合理的控制[3]。本文将从元知识集和本体库构建、融合算法、融合结果的控制与评价反馈三个方面对知识融合方法的国内外研究现状进行梳理。
2.1 元知识集和本体的构建相关研究进展
在知识融合过程中,本体提供了知识表示的方法和便于领域知识描述的潜在关系,但如何发现知识融合所需的知识源并辨别它们的有用性,则是解决知识融合的首要问题[4]。元知识的概念尚未有统一的形式化定义,一般理解为“关于知识的知识”,即专门用来显性地描述知识库中知识元素特征的知识元素实体。元知识集中的元素对应知识对象的不同结构特征,这种表示方式可以描述不同层次知识元素的结构,更有利于进行知识对象的融合处理。采用元知识和本体库协同工作的数据机制,将知识元素统一为对象化表示处理,通过引入本体论和元知识的方法消除了知识对象表示上的差异,形成知识融合的数据基础,同时强调知识内涵的融合处理,而不是构成知识的结构化元素的简单组合[5]。
在研究进展方面,Eloi Bosse[6]提出了KNOWMES 模型,通过本体的构建,实现了信息融合的高层融合;Laskey[7]等用OWL 表示概率本体,设计了PR-OWL(概率本体描述语言)进行基于语义内容的知识表示,实现了多个噪声信息源的融合;左秀然[8]进行了以本体论为基础的本体映射研究,利用相似度计算来判断概念的相似性,再将相似度高的本体进行映射;朱玉屏等[9]建立了一种基于本体的产品设计知识模型,应用于制造行业产品设计中,帮助制造企业缩短产品设计周期和提高开发质量,同时也有利于产品设计知识的共享和重用;沈旺等[10]提出了基于本体的数字参考咨询知识融合方法,以解决参考咨询服务过程中由于异构数据源造成的知识正确性低、完整性差、冗余度高等问题;Erik Blasch 等[11]基于信息融合构建了动态图像开发的语义本体。
2.2 融合算法的相关研究进展
融合算法是实现知识融合的关键,直接影响融合效果[12]。融合算法的目标是通过某种可流程化实现的处理过程将已有的知识元素按照约定的规则进行比较、合并和协调等融合运算,从而产生出新的可用知识对象内容,并同时对原有的知识元素进行优化[5]。
根据融合过程的动因,可以将融合算法划分为两大类,即被动型和主动型[3][5]。所谓被动型,是指融合算法中的启发式规则和适应度都是针对具体应用求解问题的,这类融合算法本质上对应于在知识空间进行的搜索算法,即对知识对象演变的趋势有一个以问题求解为主的导向。被动型和具体应用结合比较紧密,融合算法的处理结果规模也相对较小,但是可能会忽略一些有潜在作用的新知识元素。而主动型融合算法,则主要是针对已有知识对象内涵之间潜在的联系,即直接在现有知识的基础上按照知识对象的概念化约束条件生成新知识,这一生成过程并不直接以具体应用求解为驱动,或者并不以此为主要目标,但其结果可能恰好满足某种需求(直接或间接)。从算法设计目标上来看,主动型融合是一种构造型算法,此类算法的运算规模要比被动型大,但是能够较好地兼顾知识的开放性和随机性。
目前,在研究进展方面,很多研究将信息融合处理技术移植到知识融合处理中,构造知识融合算法。基于Bayes 方法、D-S 理论、模糊集理论的3种知识融合方法是融合决策处理的流行方法,都是建立在以集合或体制框架为研究对象的数学理论基础上,它们都考虑了知识源获取的不确定性。通过融合处理,在一定程度上降低了知识的不确定性,提高了融合结果的可靠性和置信度[13]。国内外基于这三种理论的知识融合算法研究颇多:Eugene Santos Jr.等[14]提出了以贝叶斯知识库(BKBs)为基础的概率模型和贝叶斯知识融合算法,将来自不同渠道、不同时间和不同视角下的内外部知识融合为统一可靠的新知识库;韩立岩等[15]将信息熵的概念引入到基础概率分配的确定中,推导出基于D-S 证据组合理论的知识融合公式,该方法能有效降低企业失败预警方法的不确定性;胡蓓[16]采用信息融合的DSmT 技术,对集群内外部知识源的知识进行融合,DSmT 超越了Dempster-Shafer 理论的局限,提出了一种新的一般性融合规则,能很好地适应静态的和动态的融合问题,而且可以在任何结构(离散、连续)上应用。很多学者采用优化算法:缑锦[5]在知识融合的若干关键技术研究中提出基于遗传算法和蚁群算法的知识融合算法,扩展了知识规模,丰富了知识储备,并采用参数反馈检验机制,根据新知识的有效性,控制了无用知识的产生;Yu Tianbiao 等[17]将遗传算法引入知识融合,构建了协同技术服务模型;Martens D.等[18]综合知识融合过程中软性约束和硬性约束的特点,提出基于蚁群算法的知识分类技术。
也有很多学者进行基于融合规则的融合算法研究。基于融合规则的知识融合方法在融合处理对象的选择上强调“符合什么条件的知识对象可进行融合”,以此来降低完全不可用结果出现的概率。Gregoire 结合一些自定义逻辑运算规则,提出了特定约束下进行知识融合的逻辑规则的形式化模型并应用到一些实际知识背景,该类方法将知识库看作蕴含规则的有序集合,序关系按照指定的约束生成,合并和融合对应的逻辑运算需要满足若干约定前提;胡晓等[19]提出了消解术语冲突的逻辑树融合方法,消除谓词冲突的频率融合法以及用于消除语义冲突的句法融合法;Borhgoff U.M.等[20]利用融合规则的方式,给出知识融合的相关理论,将多条多粒度异构的知识进行融合,形成综合考虑多个学科背景知识的新知识。
2.3 融合结果的控制与评价反馈
由于知识融合的结果往往是一个规模庞大的知识集,而其中有些知识是无用的,甚至是不符合逻辑的,所以在融合规则指导下的知识融合,其产生的新知识的有效性还需进一步通过评价机制予以提高。知识结构的合理性是通过应用效果反馈得到的,所以在知识融合基本步骤完成之后,还要根据应用中与实际问题匹配的结果进行评估与参数校正,以达到系统自适应的目的[21]。
对知识融合效果的评价也是国内学者研究的一个热点,徐赐军等[4]针对知识融合产生的新知识规模庞大的问题,提出了一个基于本体的融合知识测度指标,并运用基于信息扩散原理的评价机制提高融合知识的准确性;周元珂[22]在现有的可有效评估成对约束形式的实例层知识的指标基础上,提出可有效评估属性排序形式的属性层知识的指标;李进等[23]研究了决策级数据融合的可靠性验证方法;王海栋等[24]使用反馈自适应机制自动校正置信度因子,避免初始置信度设置的主观性。
3 知识融合体系框架模型的相关研究
3.1 知识融合体系框架模型国外相关研究
KRAFT 系统是首个从设计理论、设计方法到实证应用的知识融合系统。KRAFT 系统是由英国工程与自然科学研究委员会和英国电信共同赞助的项目。该项目的研究目的是能使异构数据库和知识系统的信息得到共享和重用,KRAFT 系统认为数据融合系统由外部组件和内部组件两部分构成,外部组件包括服务对象和服务资源,内部组件是融合系统的核心,由接口、路由和融合三部分构成,分别用W、F、M 表示。W 是服务对象和服务资源之间的接口,F 负责系统内部的消息路由,而M 则是知识融合的核心功能对象,主要功能包括异构数据源的集成、根据语义对知识进行转换、知识一致性的检查和处理、基于本体的知识等价转换等。这种体系结构支持的知识融合过程的关键就在于将抽取的知识转化为统一的知识模式,从而为具体的应用服务,融合过程的本质是知识模式的不断集成和转换。
Dominik Fisch[25]认为知识融合有三个层次,分为数据层知识融合、模型层知识融合以及参数层知识融合,并且构建了模型层的知识融合框架。Alexander Smirnov[26]从知识的自动获取、知识的表示和存储以及知识融合处理流程三个角度着手来构建基于上下文的知识融合模型,并认为知识融合有七个层次:简单融合、扩展融合、实例融合、参数融合、适应性融合、分面融合和历史融合。Lauro Snidaro[27]认为在海事监测中,异常事件是重要的影响因素,于是将异常事件融入数据融合模型JDL 模型(A.N.Steinberg,J.Llinas),并利用马尔科夫逻辑网络(Markov Logic Networks,MLNs)对不确定性知识进行编码来推断证据可靠性。Marco Fontani[28]构建了一个基于背景知识的多线索知识融合框架,在不提高成本的前提下提高了融合效率。Kun Yue[29]主要考虑融合效率和实时性,采用定性概率网络(QPN)、定性抽象的贝叶斯网络以及时间序列构建了不确定知识的融合框架。Jihong Liu[30]为了实现集团内部知识共享,在知识组织模型的基础上,通过本体映射和融合,提出了一种面向知识融合服务的体系结构,在这一结构中知识被打包为云制造服务平台,用户可以各取所需,获得优质的知识服务。
3.2 知识融合体系框架模型国内相关研究
国内关于知识融合体系框架模型的研究大多数是基于KRAFT模型演变而来,具有代表性的有缑锦[5],他认为知识融合系统主要包括四个功能模块:本体库和元知识集的构建、融合算法的设计和实现、解知识空间的生成和演化以及基于应用反馈的评估和参数校正。从功能模块的过程化处理角度来看,首先对分布的知识源进行处理,结合知识融合系统的特点构造各领域知识或分布式知识库对应的元知识集合本体;当本体管理完成本体映射目录和全局本体库之后,融合模块采用融合算法对规范化表示的元知识集进行融合处理,结合本体库和背景知识产生的约束集构建解知识空间;解知识空间中的知识元素按照一定的规律进行演化,结合实际应用问题在解知识空间中进行搜索,得到需要的新知识对象;最后通过知识应用的反馈结构对融合系统的相关参数进行优化调整。
Nengfu Xie[31]提出了知识融合与同步的信息共享框架(Knowledge Fusion & Synchronization Framework,KFSF)。KFSF 在逻辑上分为四个部分,分别是信息源、初级融合、知识融合和知识同步。其中,信息源是整个框架的信息来源,初级融合模块是整个系统的基础,为各个领域的信息源建立相应的本体以及在该领域下存在的逻辑规则和语义词典,其中全局和局部概念空间采用RDF表示,并且完成了异构信息源的集成;知识融合模块是整个框架的主要功能,主要完成信息集成结果的综合处理;知识同步模块为知识体与信息源信息保持同步提供变化检测,确保变化信息能够及时地传递给用户。
徐赐军[4]针对知识融合过程中融合知识语义的合理性及其有效性,提出了一个利用融合知识测度提高新知识语义内涵和控制融合结果规模,并运用基于信息扩散原理的评价机制提高融合知识准确性的知识融合框架。在这一框架中,包括元知识集的构建、知识测度指标的确定、知识融合算法的设计和融合知识的后处理4个核心功能。数据类型包括分布式知识源的本体库、知识库、元知识集、指导融合算法过程的融合规则库、知识构成的约束集以及存储融合知识后处理结果的解知识空间和衍生知识库。若知识融合是主动型的,则用户只需通过接口输入融合算法的参数;若知识融合是被动型的,则由专业人员根据领域本体对用户的问题进行规范化定义,并设置相关参数。知识融合系统首先根据输入的问题提取分布式知识库中的相关知识源,并根据各领域本体构建元知识集;然后根据元知识集中的知识元素来分析知识测度指标的参数;知识融合模块根据测度指标的分析启动相应的融合算法,并在相关融合规则指导下构建解知识空间;最后结合实际应用问题,通过融合知识后处理模块中的知识约束集得到理想的知识对象,并通过新知识的应用反馈评估进一步优化融合知识。
在知识管理领域,知识源是供体,知识源具有多样性、多层次性和无限扩展性。鉴于知识源的这些特性,周芳[12]提出了多层次的知识融合框架,将知识融合体系分为知识层融合、方法层融合和思想层融合。基本知识层融合是对不同的观察获得的知识进行融合,原始数据是该层知识融合的主体,如对数据、报表所记载的内容进行相关特征提取、属性判断、滤波优化等;方法层融合是指用不同方式对同一知识源进行观察、理解和提取,将从不同视角下获得的知识进行融合,得到基于多种方法集成后的融合知识;思想层融合是将人的个性化理念、视点直接作用于待处理的客体中,并与其他处理方法或思想进行融合,以充分发掘和运用人的智慧的潜能,提高融合质量和效果。实现知识分层融合可以适应不同应用场合的融合需求。
沈旺[10]认为基于本体的数字参考咨询知识融合可分为三个步骤:首先是问题分析,在领域本体映射基础上分析问题中包含的知识点,构建问题空间,表达为统一的描述;其次是知识抽取、清理和匹配,从异构数据库中获取大量的与问题相关的知识,但是这些知识是庞杂无序的,可能存在各种矛盾的事实、数据和观点,同时还包含着未被直接表达的潜在知识;最后是知识的融合,对获得的海量知识进行知识融合处理,构建解空间,完全或部分解决用户的问题,从而为用户提供完整、正确、及时的知识需求。
4 知识融合的应用
知识融合技术最初应用于军事领域,随后逐渐应用到其他非军事领域,目前知识融合技术被广泛应用于产品设计、决策支持和知识服务等领域。
4.1 在产品设计领域的应用
在快速变化的市场环境下,产品升级换代的速度愈来愈快。如何从知识管理的角度提高对设计知识的积累和重用,进而提高企业产品开发的效率和质量,已经成为了关系企业竞争力和发展前景的重要问题。目前,产品设计从经验设计转变为基于网络的计算机分析、知识融合的优化设计,产品设计应用的知识已不再是单一的学科知识,而是交叉的多学科综合知识。在此背景之下,知识融合技术越来越多地应用到产品设计领域中去。
缑锦[5]将知识融合应用于个性化产品的协同定制。基于知识的个性化产品协同定制能够实现客户与设计、材料、物流等主体间的间接交流和共享,在保证定制产品数据一致性的前提下,提高系统的灵活性,特别是各主体群信息按照领域对应到知识库之后,其内部之间可以协同工作,也能够满足复杂性较高的客户需求。顾邦军等[32]开发了一个以高速贴标机为实例的基于JSP 和JAVA 的Web 系统的以实现知识融合的应用。Wang Yishou[33]将知识融合技术应用于卫星舱的布局设计。在传统的技术手段下,卫星舱的布局设计一直都是个难题,一个成功的卫星舱布局设计依赖于工程师们丰富的经验和智慧、过去的经验以及先进的信息技术的支持。该文通过知识融合技术,将在线的人类知识、先验知识和计算机知识进行融合,设计出了一种可行的方法来解决卫星舱布局设计问题。朱玉屏等[9]将知识融合应用于机械产品的设计。此研究建立了一种基于本体的产品设计知识模型,并将该知识模型应用于制造行业产品——数控机床的设计中,帮助制造企业缩短产品设计周期和提高开发质量,同时也有利于产品设计知识的共享和重用。
4.2 在决策支持领域的应用
决策支持系统能够为企业提供各种决策信息以及问题的解决方案,从而提高了企业决策面对动态的内外部环境的应对能力,提高企业决策的质量与效率。目前,决策支持系统逐步结合人工智能技术向智能决策支持系统转变。在此背景下,知识融合技术在决策支持系统的智能化过程中发挥了重要的作用。
夏荣菲等[34]将知识融合应用于船舶能耗决策支持系统的研究。以船舶能耗为对象,应用系统辨识理论,建立重点设备能耗模型库;以方法、经验和案例为基础,建立船舶能耗知识库;融合模型库、知识库、关系数据库等多源知识,建立船舶能耗评价与决策支持系统。实现了船舶航运管理、船舶操纵控制、航线设计以及船舶设计等各个过程的决策支持。Alexander Smirnov,Tatiana Levashova,Nikolay Shilov[26]将知识融合技术应用于火警监控决策支持系统。陈超[35]将融合技术应用于网络安全态势评估领域,在基于规则的网络安全态势评估架构的基础上引入规则评价和规则融合,设计了基于知识获取和规则融合的态势评估架构,给出了态势评估总体结构;针对网络环境中数据的不确定性,分析了粗糙集理论在处理不确定性问题上的优势,给出评估架构中基于粗糙集的知识获取结构;针对规则匹配中出现的多匹配规则,分析了D-S 证据理论在多源信息融合方面的优势,给出评估架构中基于D-S 证据理论的规则融合结构。徐晓等[36]将知识融合应用于制造决策领域。此研究将知识融入到粗糙集模型中,在传统粗糙集(ORSM)以不可分辨关系处理数据的基础上,对知识进行建模,将知识映射为函数关系,建立一个基于不可分辨函数关系的综合分析信息和知识的新型粗糙集模型,即知识融合粗糙集模型(KBRSM)。张景强[37]以知识管理的知识融合为指导思想,进行了技术服务知识融合理论的研究与分析,以面向对象的知识表示方法构建了制造技术知识元和知识库;进行了遗传融合算法的设计以实现技术服务知识融合,并对知识融合实验结果进行了概念分析。应用JSP 技术开发了一个具有知识融合特点的协同技术服务系统,实现了技术服务中文档、图纸、模型、资料等制造技术知识服务功能。知识管理规划中所包含的制造技术知识涉及制造对象知识、制造方法知识、制造决策知识、制造过程知识以及制造理论知识等。
4.3 在知识服务领域的应用
在知识经济背景下,知识在社会的发展、技术的进步、企业的竞争中发挥出了极其重要的作用。与此同时,信息服务逐渐向知识服务转变。知识融合为知识服务的实践与发展奠定了技术基础,目前主要应用于数字参考咨询、科研团队知识管理、自动问答系统、文本分类等方面。
沈旺等[10]提出了一个数字参考咨询知识融合框架。利用知识融合技术,解决异构数据的结构异构性、语义矛盾性等问题,在知识层面上进行新的知识发现和知识挖掘,就能有效提高对数字参考咨询知识管理的效率,改善数字参考咨询的服务效果。赵丽梅[38]将知识融合理论应用于高校科研团队内部知识整合问题,丰富和完善面向知识创新的高校科研团队内部知识整合研究的理论和方法,为高校科研团队知识整合的顺利进行提供决策依据。李良富[39]等设计实现了基于知识融合的金融领域汉语自动问答系统FAQAS,该系统实现了基于多领域本体驱动的知识融合,通过对用户的问句进行句法分析、语义块分析、规则推理和实例推理等处理,最终在本体层面中直接提取满意的答案。针对FAQAS 系统在用户问句约束和处理效率方面的不足,缑锦[5]应用知识融合技术完成了新的自动应答服务系统(KFAA)的设计和实现。代六玲等[40]将知识融合应用于在线文本分类。对于某一特定类别,使用一定数量的语义中心代表该类的训练文本集,并在此基础上训练语义SVM;通过动态调整语义中心达到分类知识的积累;在SMO 算法的基础上实现减量和增量学习,并以此实现语义SVM 的快速在线学习,解决了将SVM 用于在线文本分类时的存储和效率问题。
5 结 语
从既有的研究来看,知识融合的研究已经取得了初步的进展。但是在以下方面,知识融合的研究仍然具有进步的空间:
(1)缺乏适应大数据环境的主动型知识融合算法研究。
相对信息融合技术,知识融合从理论到实践尚不成熟,是一项需要深入探讨的新技术。目前的许多研究是将信息融合处理技术移植到知识融合处理中构造或改进知识融合算法;融合算法大多是针对某个应用领域的需求驱动的被动型融合,而主动型的融合过程支持知识对象之间的自发融合,一方面便于为潜在的需求提供服务,另一方面也可以不断优化知识对象本身的结构与内涵。适应大数据环境特点,合理高效的主动型知识融合算法研究有待进一步深入开展。
(2)缺乏获得广泛认可的知识融合体系。
知识融合是一项跨学科的研究领域,吸引了计算机科学、管理学、图书情报学、医学、工程科学等众多学科的关注。在广泛的研究当中,不同学科背景的学者都试图提出知识融合体系,但目前尚未出现获得广泛认可的统一的知识融合模型。因此,如何提出一个统一的知识融合体系仍然值得探讨。
(3)知识融合应用研究领域广泛,但不够深入。
知识融合技术的应用领域主要涵盖了产品设计、决策支持和知识服务。产品设计和决策支持基本上是基于某一具体领域,针对的用户对象是某些专业领域的人员。知识服务主要是基于网络,对象是不具备专业能力的普通用户,关于这方面的研究还相对较少,尤其是随着大数据时代的到来,对于知识服务有需求的人越来越多,对于知识服务质量的需求越来越高,如何将技术理论与需求完美地结合,这是知识融合应用研究亟待解决的问题。
[1]Russell S,Norvig P.Artificial intelligence [M].Beijing: Posts& Telecom Press,2010.
[2]Gregoire E.Fusing Legal Knowledge [A].In: Proc.of the 14th IEEE int.Conf.on Information Reuse and Integration [C].Les Vegas,2004: 522-529.
[3]郭强,关欣,曹昕莹,张政超,何友.知识融合理论研究发展与展望[J].中国电子科学研究院学报,2012(6):252-257.
[4]徐赐军,李爱平.基于本体的融合知识测度分析[J].控制与决策,2014(9):1649-1654.
[5]缑锦.知识融合中若干关键技术研究[D].杭州:浙江大学,2005.
[6]Bosse E,Valin P,Boury-Brisset A,Grenier D.Exploitation of a priori knowledge for information fusion [J].Information Fusion 2006,7(2): 161-175.
[7]Laskey K B,Costa P C G,Janssen T.Probabilistic ontologies for knowledge fusion [C]/ /Proceedings of the 11th International Conference on Information Fusion,Cologne,2008: 1-8.
[8]左秀然.基于概念相似度的本体映射系统研究[D].武汉:武汉理工大学,2008.
[9]朱玉屏,刘丽兰.基于知识融合技术的产品设计知识模型研究[J].计算机应用研究,2009(9):3235-3238.
[10]沈旺,李亚峰,侯昊辰.数字参考咨询知识融合框架研究[J].图书情报工作,2013(10):139-143.
[11]Blasch E,Salerno J,Kadar I,Hintz K,Biermann J,Chong C,Das S.Resource management coordination with level 2/3fusion issues and challenges [J].Aerospace & Electronic System Magazine IEEE,2008,23(3): 32-45.
[12]周芳,刘玉战,韩立岩.基于模糊集理论的知识融合方法研究[J].北京理工大学学报,2013(6):67-72.
[13]周芳,王鹏波,韩立岩.多源知识融合处理算法[J].北京航空航天大学学报,2013(1):109-114.
[14]Jr E S,Wilkinson J T,Santos E E.Bayesian knowledge fusion[C].Proceedings of Twenty-Second International FLAIRS Conference,2009.
[15]韩立岩.基于D-S 证据理论的知识融合及其应用[J].北京航空航天大学学报,2006(1):65-73.
[16]胡蓓,王聪颖.基于信息融合的发展中国家高技术产业集群知识融合与创新模型研究[J].图书情报工作,2009(7):38-41,73.
[17]Yu T B,Ding J M,Song Y H,Wang N,Wang W S.Research on model of cooperative technology service based on genetic fusion algorithm [C].2012International Conference on Management Science & Engineering (19th ) September 20-22,2012Dallas,USA: 1673-1679.
[18]Martens D,De Backer M,Haesen R,Baesens B,Mues C,Vanthienen J.Ant-Based approach to the knowledge fusion [M].Heideibery: Springer,2006.
[19]胡晓,胡洁,彭颖红,李晟,曹兆敏.语义级知识融合中的冲突消解方法[J].上海交通大学学报,2009(11):1730-1733.
[20]Borkar V,Carey M J,Li C.Inside big data management:Ogres,onions,or parfaits [C]/ /Proceedings of the 15th International Conference on Extending Database Technology.ACM,2012: 3-14.
[21]缑锦.基于元信息和本体论的知识融合算法[J].计算机辅助设计与图形学学报,2006(6):819-823.
[22]周元珂,邵峰晶,吴舜尧.评估属性层知识和实例层知识融合效果的有效指标[J].青岛大学学报,2014(2):29-38.
[23]李进,赵宇,黄敏.基于决策级数据融合的可靠性综合验证方法[J].北京航空航天大学学报,2010(5):275-279.
[24]王海栋,郑骁庆,张红俊.基于置信度理论的网络知识融合系统和应用[J].计算机系统应用,2011(20):1-6.
[25]Fisch D,Kalkowski E,Sick B.Knowledge fusion for probabilistic generative classifiers with data mining applications[J].IEEE Transactions on Knowledge and Data Engineering,2014(3): 652-666.
[26]Smirnov A,Levashova T,Shilov N.Patterns for context-based knowledge fusion in decision support systems [J].Information Fusion,2015(21): 114-129.
[27]Snidaro L,Visentini I,Bryan K.Fusion uncertain knowledge and evidence for maritime situational awareness via Markov Logic Networks [J].Information Fusion,2015(21): 159-172.
[28]Fontani M,Argones-Rua E,Troncoso C,Barni M.The watchful forensic analyst: Multi-clue information fusion with background knowledge [C].IEEE International Workshop on Information Forensics & Security 2013: 120-125.
[29]Kun Y,Qian W H,Fu X D,Li J,Liu W Y.Qualitative probabilistic network-based fusion of time-series uncertain knowledge [J].Soft Comput,2014(3): 152-159.
[30]Liu J H,Bo L.An ontology-based architecture for serviceorientated design knowledge fusion in group corporation cloud manufacturing [ C].Proceedings of the 2012IEEE 16th International Conference on Computer Supported Cooperative Work in Design,2012: 811-816.
[31]Xie N F,Cao C G,Guo H Y.A knowledge fusion model for web information [C].Proceedings of the 2005IEEE/WIC/ACM International Conference on Web Intelligence (WI'05) 0-7695-2415-X/05$20.002005IEEE: 67-72.
[32]顾邦军.网络环境下虚拟产品设计的知识融合技术研究[D].衡阳:南华大学,2007.
[33]Wang Y S,Teng H F.Knowledge fusion design method: Satellite module layout [J].Chinese Journal of Aeronautics,2009,22(1): 32-42.
[34]夏荣菲,万隆君.基于知识融合的船舶能耗决策支持系统[J].船舶工程,2014(S1):166-169.
[35]陈超.基于知识获取与规则融合的网络安全态势评估技术研究[D].解放军信息工程大学,2013.
[36]徐晓,翟敬梅,刘海涛.制造决策的知识融合粗糙集模型[J].华南理工大学学报(自然科学版),2011(08):36-41.
[37]张景强.基于知识融合的协同技术服务研究[D].沈阳:东北大学,2009.
[38]赵丽梅.面向知识创新的高校科研团队内部知识整合研究[D].哈尔滨:哈尔滨工业大学,2013.
[39]李良富,樊孝忠,李宏乔,顾益军.知识是如何驱动Q/A 系统的[J].计算机工程与应用,2004(20):70-73,98.
[40]代六玲,李雪梅,黄河燕.基于知识融合的在线文本分类算法——语义SVM [J].华南理工大学学报(自然科学版),2004(S1):67-72.
【作者简介】
图1 知识融合研究思路
知识融合是知识科学与信息融合的交叉学科,其研究对象主要针对知识,而采用的基本思想和实现技术主要来源于信息融合。知识融合与信息融合在处理对象的结构和功能目标上完全一致,都是通过对来自多源的对象个体进行综合分析,得到新的可用性更强的同类对象。不同之处在于,信息融合的处理对象内容一般是数据化信息,例如传感器信号序列;而知识融合则针对知识对象实体,例如规则库等。此外,前者相对侧重结果的实时可用性,所以一般结果对象信息的规模较小;而后者相对强调知识的模糊性和服务质量,所以结果一般不是单一的对象个体,而是对象集合甚至空间。
知识融合又和知识科学中的知识集成、知识共享等模块有较为密切的关系,三者之间有部分重叠的内容,例如都要对知识进行组织,基本目的都是要实现知识共享和重用。因此在研究方法方面,知识融合可以与其他两个模块相互借鉴。知识融合与二者的最大区别在于,知识融合希望通过适合的算法模型产生基于现有知识的新知识,并能够通过应用反馈对新的知识进行合理评估,从而提高不同知识对象之间的协同工作能力。
2 知识融合的方法与实现路径
要实现理想的融合过程需要解决三个基本问题,即知识结构的差异性、知识更新的随机性和知识扩展的开放性。如果知识元素的表示结构存在差异,则很难直接进行处理,为了解决知识异构的问题,现阶段研究大多采用本体论的相关技术将知识库转化为本体库或知识元集合,将知识元素统一为对象化表示处理;知识更新的随机性[1]是指知识处理过程中,一个系统的知识应该向什么方向演变是无法预知的,所以很难给出具有特定趋势指导的融合算法,为此,在融合算法中,要尽可能构造各种随机改动的操作,根据应用结果的反馈来判断改动的成功与否;知识扩展的开放性是指知识元素的结合可能是两个对象之间,也可能是多个对象之间发生的,而融合的结果一般并不是唯一的[2],可能会是一个相当庞大的规模,所以在进行知识融合处理的同时,必须考虑如何对运算后的知识元素规模进行有效合理的控制[3]。本文将从元知识集和本体库构建、融合算法、融合结果的控制与评价反馈三个方面对知识融合方法的国内外研究现状进行梳理。
2.1 元知识集和本体的构建相关研究进展
在知识融合过程中,本体提供了知识表示的方法和便于领域知识描述的潜在关系,但如何发现知识融合所需的知识源并辨别它们的有用性,则是解决知识融合的首要问题[4]。元知识的概念尚未有统一的形式化定义,一般理解为“关于知识的知识”,即专门用来显性地描述知识库中知识元素特征的知识元素实体。元知识集中的元素对应知识对象的不同结构特征,这种表示方式可以描述不同层次知识元素的结构,更有利于进行知识对象的融合处理。采用元知识和本体库协同工作的数据机制,将知识元素统一为对象化表示处理,通过引入本体论和元知识的方法消除了知识对象表示上的差异,形成知识融合的数据基础,同时强调知识内涵的融合处理,而不是构成知识的结构化元素的简单组合[5]。
在研究进展方面,Eloi Bosse[6]提出了KNOWMES 模型,通过本体的构建,实现了信息融合的高层融合;Laskey[7]等用OWL 表示概率本体,设计了PR-OWL(概率本体描述语言)进行基于语义内容的知识表示,实现了多个噪声信息源的融合;左秀然[8]进行了以本体论为基础的本体映射研究,利用相似度计算来判断概念的相似性,再将相似度高的本体进行映射;朱玉屏等[9]建立了一种基于本体的产品设计知识模型,应用于制造行业产品设计中,帮助制造企业缩短产品设计周期和提高开发质量,同时也有利于产品设计知识的共享和重用;沈旺等[10]提出了基于本体的数字参考咨询知识融合方法,以解决参考咨询服务过程中由于异构数据源造成的知识正确性低、完整性差、冗余度高等问题;Erik Blasch 等[11]基于信息融合构建了动态图像开发的语义本体。
2.2 融合算法的相关研究进展
融合算法是实现知识融合的关键,直接影响融合效果[12]。融合算法的目标是通过某种可流程化实现的处理过程将已有的知识元素按照约定的规则进行比较、合并和协调等融合运算,从而产生出新的可用知识对象内容,并同时对原有的知识元素进行优化[5]。
根据融合过程的动因,可以将融合算法划分为两大类,即被动型和主动型[3][5]。所谓被动型,是指融合算法中的启发式规则和适应度都是针对具体应用求解问题的,这类融合算法本质上对应于在知识空间进行的搜索算法,即对知识对象演变的趋势有一个以问题求解为主的导向。被动型和具体应用结合比较紧密,融合算法的处理结果规模也相对较小,但是可能会忽略一些有潜在作用的新知识元素。而主动型融合算法,则主要是针对已有知识对象内涵之间潜在的联系,即直接在现有知识的基础上按照知识对象的概念化约束条件生成新知识,这一生成过程并不直接以具体应用求解为驱动,或者并不以此为主要目标,但其结果可能恰好满足某种需求(直接或间接)。从算法设计目标上来看,主动型融合是一种构造型算法,此类算法的运算规模要比被动型大,但是能够较好地兼顾知识的开放性和随机性。
目前,在研究进展方面,很多研究将信息融合处理技术移植到知识融合处理中,构造知识融合算法。基于Bayes 方法、D-S 理论、模糊集理论的3种知识融合方法是融合决策处理的流行方法,都是建立在以集合或体制框架为研究对象的数学理论基础上,它们都考虑了知识源获取的不确定性。通过融合处理,在一定程度上降低了知识的不确定性,提高了融合结果的可靠性和置信度[13]。国内外基于这三种理论的知识融合算法研究颇多:Eugene Santos Jr.等[14]提出了以贝叶斯知识库(BKBs)为基础的概率模型和贝叶斯知识融合算法,将来自不同渠道、不同时间和不同视角下的内外部知识融合为统一可靠的新知识库;韩立岩等[15]将信息熵的概念引入到基础概率分配的确定中,推导出基于D-S 证据组合理论的知识融合公式,该方法能有效降低企业失败预警方法的不确定性;胡蓓[16]采用信息融合的DSmT 技术,对集群内外部知识源的知识进行融合,DSmT 超越了Dempster-Shafer 理论的局限,提出了一种新的一般性融合规则,能很好地适应静态的和动态的融合问题,而且可以在任何结构(离散、连续)上应用。很多学者采用优化算法:缑锦[5]在知识融合的若干关键技术研究中提出基于遗传算法和蚁群算法的知识融合算法,扩展了知识规模,丰富了知识储备,并采用参数反馈检验机制,根据新知识的有效性,控制了无用知识的产生;Yu Tianbiao 等[17]将遗传算法引入知识融合,构建了协同技术服务模型;Martens D.等[18]综合知识融合过程中软性约束和硬性约束的特点,提出基于蚁群算法的知识分类技术。
也有很多学者进行基于融合规则的融合算法研究。基于融合规则的知识融合方法在融合处理对象的选择上强调“符合什么条件的知识对象可进行融合”,以此来降低完全不可用结果出现的概率。Gregoire 结合一些自定义逻辑运算规则,提出了特定约束下进行知识融合的逻辑规则的形式化模型并应用到一些实际知识背景,该类方法将知识库看作蕴含规则的有序集合,序关系按照指定的约束生成,合并和融合对应的逻辑运算需要满足若干约定前提;胡晓等[19]提出了消解术语冲突的逻辑树融合方法,消除谓词冲突的频率融合法以及用于消除语义冲突的句法融合法;Borhgoff U.M.等[20]利用融合规则的方式,给出知识融合的相关理论,将多条多粒度异构的知识进行融合,形成综合考虑多个学科背景知识的新知识。
2.3 融合结果的控制与评价反馈
由于知识融合的结果往往是一个规模庞大的知识集,而其中有些知识是无用的,甚至是不符合逻辑的,所以在融合规则指导下的知识融合,其产生的新知识的有效性还需进一步通过评价机制予以提高。知识结构的合理性是通过应用效果反馈得到的,所以在知识融合基本步骤完成之后,还要根据应用中与实际问题匹配的结果进行评估与参数校正,以达到系统自适应的目的[21]。
对知识融合效果的评价也是国内学者研究的一个热点,徐赐军等[4]针对知识融合产生的新知识规模庞大的问题,提出了一个基于本体的融合知识测度指标,并运用基于信息扩散原理的评价机制提高融合知识的准确性;周元珂[22]在现有的可有效评估成对约束形式的实例层知识的指标基础上,提出可有效评估属性排序形式的属性层知识的指标;李进等[23]研究了决策级数据融合的可靠性验证方法;王海栋等[24]使用反馈自适应机制自动校正置信度因子,避免初始置信度设置的主观性。
3 知识融合体系框架模型的相关研究
3.1 知识融合体系框架模型国外相关研究
KRAFT 系统是首个从设计理论、设计方法到实证应用的知识融合系统。KRAFT 系统是由英国工程与自然科学研究委员会和英国电信共同赞助的项目。该项目的研究目的是能使异构数据库和知识系统的信息得到共享和重用,KRAFT 系统认为数据融合系统由外部组件和内部组件两部分构成,外部组件包括服务对象和服务资源,内部组件是融合系统的核心,由接口、路由和融合三部分构成,分别用W、F、M 表示。W 是服务对象和服务资源之间的接口,F 负责系统内部的消息路由,而M 则是知识融合的核心功能对象,主要功能包括异构数据源的集成、根据语义对知识进行转换、知识一致性的检查和处理、基于本体的知识等价转换等。这种体系结构支持的知识融合过程的关键就在于将抽取的知识转化为统一的知识模式,从而为具体的应用服务,融合过程的本质是知识模式的不断集成和转换。
Dominik Fisch[25]认为知识融合有三个层次,分为数据层知识融合、模型层知识融合以及参数层知识融合,并且构建了模型层的知识融合框架。Alexander Smirnov[26]从知识的自动获取、知识的表示和存储以及知识融合处理流程三个角度着手来构建基于上下文的知识融合模型,并认为知识融合有七个层次:简单融合、扩展融合、实例融合、参数融合、适应性融合、分面融合和历史融合。Lauro Snidaro[27]认为在海事监测中,异常事件是重要的影响因素,于是将异常事件融入数据融合模型JDL 模型(A.N.Steinberg,J.Llinas),并利用马尔科夫逻辑网络(Markov Logic Networks,MLNs)对不确定性知识进行编码来推断证据可靠性。Marco Fontani[28]构建了一个基于背景知识的多线索知识融合框架,在不提高成本的前提下提高了融合效率。Kun Yue[29]主要考虑融合效率和实时性,采用定性概率网络(QPN)、定性抽象的贝叶斯网络以及时间序列构建了不确定知识的融合框架。Jihong Liu[30]为了实现集团内部知识共享,在知识组织模型的基础上,通过本体映射和融合,提出了一种面向知识融合服务的体系结构,在这一结构中知识被打包为云制造服务平台,用户可以各取所需,获得优质的知识服务。
3.2 知识融合体系框架模型国内相关研究
国内关于知识融合体系框架模型的研究大多数是基于KRAFT模型演变而来,具有代表性的有缑锦[5],他认为知识融合系统主要包括四个功能模块:本体库和元知识集的构建、融合算法的设计和实现、解知识空间的生成和演化以及基于应用反馈的评估和参数校正。从功能模块的过程化处理角度来看,首先对分布的知识源进行处理,结合知识融合系统的特点构造各领域知识或分布式知识库对应的元知识集合本体;当本体管理完成本体映射目录和全局本体库之后,融合模块采用融合算法对规范化表示的元知识集进行融合处理,结合本体库和背景知识产生的约束集构建解知识空间;解知识空间中的知识元素按照一定的规律进行演化,结合实际应用问题在解知识空间中进行搜索,得到需要的新知识对象;最后通过知识应用的反馈结构对融合系统的相关参数进行优化调整。
Nengfu Xie[31]提出了知识融合与同步的信息共享框架(Knowledge Fusion & Synchronization Framework,KFSF)。KFSF 在逻辑上分为四个部分,分别是信息源、初级融合、知识融合和知识同步。其中,信息源是整个框架的信息来源,初级融合模块是整个系统的基础,为各个领域的信息源建立相应的本体以及在该领域下存在的逻辑规则和语义词典,其中全局和局部概念空间采用RDF表示,并且完成了异构信息源的集成;知识融合模块是整个框架的主要功能,主要完成信息集成结果的综合处理;知识同步模块为知识体与信息源信息保持同步提供变化检测,确保变化信息能够及时地传递给用户。
徐赐军[4]针对知识融合过程中融合知识语义的合理性及其有效性,提出了一个利用融合知识测度提高新知识语义内涵和控制融合结果规模,并运用基于信息扩散原理的评价机制提高融合知识准确性的知识融合框架。在这一框架中,包括元知识集的构建、知识测度指标的确定、知识融合算法的设计和融合知识的后处理4个核心功能。数据类型包括分布式知识源的本体库、知识库、元知识集、指导融合算法过程的融合规则库、知识构成的约束集以及存储融合知识后处理结果的解知识空间和衍生知识库。若知识融合是主动型的,则用户只需通过接口输入融合算法的参数;若知识融合是被动型的,则由专业人员根据领域本体对用户的问题进行规范化定义,并设置相关参数。知识融合系统首先根据输入的问题提取分布式知识库中的相关知识源,并根据各领域本体构建元知识集;然后根据元知识集中的知识元素来分析知识测度指标的参数;知识融合模块根据测度指标的分析启动相应的融合算法,并在相关融合规则指导下构建解知识空间;最后结合实际应用问题,通过融合知识后处理模块中的知识约束集得到理想的知识对象,并通过新知识的应用反馈评估进一步优化融合知识。
在知识管理领域,知识源是供体,知识源具有多样性、多层次性和无限扩展性。鉴于知识源的这些特性,周芳[12]提出了多层次的知识融合框架,将知识融合体系分为知识层融合、方法层融合和思想层融合。基本知识层融合是对不同的观察获得的知识进行融合,原始数据是该层知识融合的主体,如对数据、报表所记载的内容进行相关特征提取、属性判断、滤波优化等;方法层融合是指用不同方式对同一知识源进行观察、理解和提取,将从不同视角下获得的知识进行融合,得到基于多种方法集成后的融合知识;思想层融合是将人的个性化理念、视点直接作用于待处理的客体中,并与其他处理方法或思想进行融合,以充分发掘和运用人的智慧的潜能,提高融合质量和效果。实现知识分层融合可以适应不同应用场合的融合需求。
沈旺[10]认为基于本体的数字参考咨询知识融合可分为三个步骤:首先是问题分析,在领域本体映射基础上分析问题中包含的知识点,构建问题空间,表达为统一的描述;其次是知识抽取、清理和匹配,从异构数据库中获取大量的与问题相关的知识,但是这些知识是庞杂无序的,可能存在各种矛盾的事实、数据和观点,同时还包含着未被直接表达的潜在知识;最后是知识的融合,对获得的海量知识进行知识融合处理,构建解空间,完全或部分解决用户的问题,从而为用户提供完整、正确、及时的知识需求。
4 知识融合的应用
知识融合技术最初应用于军事领域,随后逐渐应用到其他非军事领域,目前知识融合技术被广泛应用于产品设计、决策支持和知识服务等领域。
4.1 在产品设计领域的应用
在快速变化的市场环境下,产品升级换代的速度愈来愈快。如何从知识管理的角度提高对设计知识的积累和重用,进而提高企业产品开发的效率和质量,已经成为了关系企业竞争力和发展前景的重要问题。目前,产品设计从经验设计转变为基于网络的计算机分析、知识融合的优化设计,产品设计应用的知识已不再是单一的学科知识,而是交叉的多学科综合知识。在此背景之下,知识融合技术越来越多地应用到产品设计领域中去。
缑锦[5]将知识融合应用于个性化产品的协同定制。基于知识的个性化产品协同定制能够实现客户与设计、材料、物流等主体间的间接交流和共享,在保证定制产品数据一致性的前提下,提高系统的灵活性,特别是各主体群信息按照领域对应到知识库之后,其内部之间可以协同工作,也能够满足复杂性较高的客户需求。顾邦军等[32]开发了一个以高速贴标机为实例的基于JSP 和JAVA 的Web 系统的以实现知识融合的应用。Wang Yishou[33]将知识融合技术应用于卫星舱的布局设计。在传统的技术手段下,卫星舱的布局设计一直都是个难题,一个成功的卫星舱布局设计依赖于工程师们丰富的经验和智慧、过去的经验以及先进的信息技术的支持。该文通过知识融合技术,将在线的人类知识、先验知识和计算机知识进行融合,设计出了一种可行的方法来解决卫星舱布局设计问题。朱玉屏等[9]将知识融合应用于机械产品的设计。此研究建立了一种基于本体的产品设计知识模型,并将该知识模型应用于制造行业产品——数控机床的设计中,帮助制造企业缩短产品设计周期和提高开发质量,同时也有利于产品设计知识的共享和重用。
4.2 在决策支持领域的应用
决策支持系统能够为企业提供各种决策信息以及问题的解决方案,从而提高了企业决策面对动态的内外部环境的应对能力,提高企业决策的质量与效率。目前,决策支持系统逐步结合人工智能技术向智能决策支持系统转变。在此背景下,知识融合技术在决策支持系统的智能化过程中发挥了重要的作用。
夏荣菲等[34]将知识融合应用于船舶能耗决策支持系统的研究。以船舶能耗为对象,应用系统辨识理论,建立重点设备能耗模型库;以方法、经验和案例为基础,建立船舶能耗知识库;融合模型库、知识库、关系数据库等多源知识,建立船舶能耗评价与决策支持系统。实现了船舶航运管理、船舶操纵控制、航线设计以及船舶设计等各个过程的决策支持。Alexander Smirnov,Tatiana Levashova,Nikolay Shilov[26]将知识融合技术应用于火警监控决策支持系统。陈超[35]将融合技术应用于网络安全态势评估领域,在基于规则的网络安全态势评估架构的基础上引入规则评价和规则融合,设计了基于知识获取和规则融合的态势评估架构,给出了态势评估总体结构;针对网络环境中数据的不确定性,分析了粗糙集理论在处理不确定性问题上的优势,给出评估架构中基于粗糙集的知识获取结构;针对规则匹配中出现的多匹配规则,分析了D-S 证据理论在多源信息融合方面的优势,给出评估架构中基于D-S 证据理论的规则融合结构。徐晓等[36]将知识融合应用于制造决策领域。此研究将知识融入到粗糙集模型中,在传统粗糙集(ORSM)以不可分辨关系处理数据的基础上,对知识进行建模,将知识映射为函数关系,建立一个基于不可分辨函数关系的综合分析信息和知识的新型粗糙集模型,即知识融合粗糙集模型(KBRSM)。张景强[37]以知识管理的知识融合为指导思想,进行了技术服务知识融合理论的研究与分析,以面向对象的知识表示方法构建了制造技术知识元和知识库;进行了遗传融合算法的设计以实现技术服务知识融合,并对知识融合实验结果进行了概念分析。应用JSP 技术开发了一个具有知识融合特点的协同技术服务系统,实现了技术服务中文档、图纸、模型、资料等制造技术知识服务功能。知识管理规划中所包含的制造技术知识涉及制造对象知识、制造方法知识、制造决策知识、制造过程知识以及制造理论知识等。
4.3 在知识服务领域的应用
在知识经济背景下,知识在社会的发展、技术的进步、企业的竞争中发挥出了极其重要的作用。与此同时,信息服务逐渐向知识服务转变。知识融合为知识服务的实践与发展奠定了技术基础,目前主要应用于数字参考咨询、科研团队知识管理、自动问答系统、文本分类等方面。
沈旺等[10]提出了一个数字参考咨询知识融合框架。利用知识融合技术,解决异构数据的结构异构性、语义矛盾性等问题,在知识层面上进行新的知识发现和知识挖掘,就能有效提高对数字参考咨询知识管理的效率,改善数字参考咨询的服务效果。赵丽梅[38]将知识融合理论应用于高校科研团队内部知识整合问题,丰富和完善面向知识创新的高校科研团队内部知识整合研究的理论和方法,为高校科研团队知识整合的顺利进行提供决策依据。李良富[39]等设计实现了基于知识融合的金融领域汉语自动问答系统FAQAS,该系统实现了基于多领域本体驱动的知识融合,通过对用户的问句进行句法分析、语义块分析、规则推理和实例推理等处理,最终在本体层面中直接提取满意的答案。针对FAQAS 系统在用户问句约束和处理效率方面的不足,缑锦[5]应用知识融合技术完成了新的自动应答服务系统(KFAA)的设计和实现。代六玲等[40]将知识融合应用于在线文本分类。对于某一特定类别,使用一定数量的语义中心代表该类的训练文本集,并在此基础上训练语义SVM;通过动态调整语义中心达到分类知识的积累;在SMO 算法的基础上实现减量和增量学习,并以此实现语义SVM 的快速在线学习,解决了将SVM 用于在线文本分类时的存储和效率问题。
5 结 语
从既有的研究来看,知识融合的研究已经取得了初步的进展。但是在以下方面,知识融合的研究仍然具有进步的空间:
(1)缺乏适应大数据环境的主动型知识融合算法研究。
相对信息融合技术,知识融合从理论到实践尚不成熟,是一项需要深入探讨的新技术。目前的许多研究是将信息融合处理技术移植到知识融合处理中构造或改进知识融合算法;融合算法大多是针对某个应用领域的需求驱动的被动型融合,而主动型的融合过程支持知识对象之间的自发融合,一方面便于为潜在的需求提供服务,另一方面也可以不断优化知识对象本身的结构与内涵。适应大数据环境特点,合理高效的主动型知识融合算法研究有待进一步深入开展。
(2)缺乏获得广泛认可的知识融合体系。
知识融合是一项跨学科的研究领域,吸引了计算机科学、管理学、图书情报学、医学、工程科学等众多学科的关注。在广泛的研究当中,不同学科背景的学者都试图提出知识融合体系,但目前尚未出现获得广泛认可的统一的知识融合模型。因此,如何提出一个统一的知识融合体系仍然值得探讨。
(3)知识融合应用研究领域广泛,但不够深入。(www.daowen.com)
知识融合技术的应用领域主要涵盖了产品设计、决策支持和知识服务。产品设计和决策支持基本上是基于某一具体领域,针对的用户对象是某些专业领域的人员。知识服务主要是基于网络,对象是不具备专业能力的普通用户,关于这方面的研究还相对较少,尤其是随着大数据时代的到来,对于知识服务有需求的人越来越多,对于知识服务质量的需求越来越高,如何将技术理论与需求完美地结合,这是知识融合应用研究亟待解决的问题。
参考文献
[1]Russell S,Norvig P.Artificial intelligence [M].Beijing: Posts& Telecom Press,2010.
[2]Gregoire E.Fusing Legal Knowledge [A].In: Proc.of the 14th IEEE int.Conf.on Information Reuse and Integration [C].Les Vegas,2004: 522-529.
[3]郭强,关欣,曹昕莹,张政超,何友.知识融合理论研究发展与展望[J].中国电子科学研究院学报,2012(6):252-257.
[4]徐赐军,李爱平.基于本体的融合知识测度分析[J].控制与决策,2014(9):1649-1654.
[5]缑锦.知识融合中若干关键技术研究[D].杭州:浙江大学,2005.
[6]Bosse E,Valin P,Boury-Brisset A,Grenier D.Exploitation of a priori knowledge for information fusion [J].Information Fusion 2006,7(2): 161-175.
[7]Laskey K B,Costa P C G,Janssen T.Probabilistic ontologies for knowledge fusion [C]/ /Proceedings of the 11th International Conference on Information Fusion,Cologne,2008: 1-8.
[8]左秀然.基于概念相似度的本体映射系统研究[D].武汉:武汉理工大学,2008.
[9]朱玉屏,刘丽兰.基于知识融合技术的产品设计知识模型研究[J].计算机应用研究,2009(9):3235-3238.
[10]沈旺,李亚峰,侯昊辰.数字参考咨询知识融合框架研究[J].图书情报工作,2013(10):139-143.
[11]Blasch E,Salerno J,Kadar I,Hintz K,Biermann J,Chong C,Das S.Resource management coordination with level 2/3fusion issues and challenges [J].Aerospace & Electronic System Magazine IEEE,2008,23(3): 32-45.
[12]周芳,刘玉战,韩立岩.基于模糊集理论的知识融合方法研究[J].北京理工大学学报,2013(6):67-72.
[13]周芳,王鹏波,韩立岩.多源知识融合处理算法[J].北京航空航天大学学报,2013(1):109-114.
[14]Jr E S,Wilkinson J T,Santos E E.Bayesian knowledge fusion[C].Proceedings of Twenty-Second International FLAIRS Conference,2009.
[15]韩立岩.基于D-S 证据理论的知识融合及其应用[J].北京航空航天大学学报,2006(1):65-73.
[16]胡蓓,王聪颖.基于信息融合的发展中国家高技术产业集群知识融合与创新模型研究[J].图书情报工作,2009(7):38-41,73.
[17]Yu T B,Ding J M,Song Y H,Wang N,Wang W S.Research on model of cooperative technology service based on genetic fusion algorithm [C].2012International Conference on Management Science & Engineering (19th ) September 20-22,2012Dallas,USA: 1673-1679.
[18]Martens D,De Backer M,Haesen R,Baesens B,Mues C,Vanthienen J.Ant-Based approach to the knowledge fusion [M].Heideibery: Springer,2006.
[19]胡晓,胡洁,彭颖红,李晟,曹兆敏.语义级知识融合中的冲突消解方法[J].上海交通大学学报,2009(11):1730-1733.
[20]Borkar V,Carey M J,Li C.Inside big data management:Ogres,onions,or parfaits [C]/ /Proceedings of the 15th International Conference on Extending Database Technology.ACM,2012: 3-14.
[21]缑锦.基于元信息和本体论的知识融合算法[J].计算机辅助设计与图形学学报,2006(6):819-823.
[22]周元珂,邵峰晶,吴舜尧.评估属性层知识和实例层知识融合效果的有效指标[J].青岛大学学报,2014(2):29-38.
[23]李进,赵宇,黄敏.基于决策级数据融合的可靠性综合验证方法[J].北京航空航天大学学报,2010(5):275-279.
[24]王海栋,郑骁庆,张红俊.基于置信度理论的网络知识融合系统和应用[J].计算机系统应用,2011(20):1-6.
[25]Fisch D,Kalkowski E,Sick B.Knowledge fusion for probabilistic generative classifiers with data mining applications[J].IEEE Transactions on Knowledge and Data Engineering,2014(3): 652-666.
[26]Smirnov A,Levashova T,Shilov N.Patterns for context-based knowledge fusion in decision support systems [J].Information Fusion,2015(21): 114-129.
[27]Snidaro L,Visentini I,Bryan K.Fusion uncertain knowledge and evidence for maritime situational awareness via Markov Logic Networks [J].Information Fusion,2015(21): 159-172.
[28]Fontani M,Argones-Rua E,Troncoso C,Barni M.The watchful forensic analyst: Multi-clue information fusion with background knowledge [C].IEEE International Workshop on Information Forensics & Security 2013: 120-125.
[29]Kun Y,Qian W H,Fu X D,Li J,Liu W Y.Qualitative probabilistic network-based fusion of time-series uncertain knowledge [J].Soft Comput,2014(3): 152-159.
[30]Liu J H,Bo L.An ontology-based architecture for serviceorientated design knowledge fusion in group corporation cloud manufacturing [ C].Proceedings of the 2012IEEE 16th International Conference on Computer Supported Cooperative Work in Design,2012: 811-816.
[31]Xie N F,Cao C G,Guo H Y.A knowledge fusion model for web information [C].Proceedings of the 2005IEEE/WIC/ACM International Conference on Web Intelligence (WI'05) 0-7695-2415-X/05$20.002005IEEE: 67-72.
[32]顾邦军.网络环境下虚拟产品设计的知识融合技术研究[D].衡阳:南华大学,2007.
[33]Wang Y S,Teng H F.Knowledge fusion design method: Satellite module layout [J].Chinese Journal of Aeronautics,2009,22(1): 32-42.
[34]夏荣菲,万隆君.基于知识融合的船舶能耗决策支持系统[J].船舶工程,2014(S1):166-169.
[35]陈超.基于知识获取与规则融合的网络安全态势评估技术研究[D].解放军信息工程大学,2013.
[36]徐晓,翟敬梅,刘海涛.制造决策的知识融合粗糙集模型[J].华南理工大学学报(自然科学版),2011(08):36-41.
[37]张景强.基于知识融合的协同技术服务研究[D].沈阳:东北大学,2009.
[38]赵丽梅.面向知识创新的高校科研团队内部知识整合研究[D].哈尔滨:哈尔滨工业大学,2013.
[39]李良富,樊孝忠,李宏乔,顾益军.知识是如何驱动Q/A 系统的[J].计算机工程与应用,2004(20):70-73,98.
[40]代六玲,李雪梅,黄河燕.基于知识融合的在线文本分类算法——语义SVM [J].华南理工大学学报(自然科学版),2004(S1):67-72.
【作者简介】
图1 知识融合研究思路
知识融合是知识科学与信息融合的交叉学科,其研究对象主要针对知识,而采用的基本思想和实现技术主要来源于信息融合。知识融合与信息融合在处理对象的结构和功能目标上完全一致,都是通过对来自多源的对象个体进行综合分析,得到新的可用性更强的同类对象。不同之处在于,信息融合的处理对象内容一般是数据化信息,例如传感器信号序列;而知识融合则针对知识对象实体,例如规则库等。此外,前者相对侧重结果的实时可用性,所以一般结果对象信息的规模较小;而后者相对强调知识的模糊性和服务质量,所以结果一般不是单一的对象个体,而是对象集合甚至空间。
知识融合又和知识科学中的知识集成、知识共享等模块有较为密切的关系,三者之间有部分重叠的内容,例如都要对知识进行组织,基本目的都是要实现知识共享和重用。因此在研究方法方面,知识融合可以与其他两个模块相互借鉴。知识融合与二者的最大区别在于,知识融合希望通过适合的算法模型产生基于现有知识的新知识,并能够通过应用反馈对新的知识进行合理评估,从而提高不同知识对象之间的协同工作能力。
2 知识融合的方法与实现路径
要实现理想的融合过程需要解决三个基本问题,即知识结构的差异性、知识更新的随机性和知识扩展的开放性。如果知识元素的表示结构存在差异,则很难直接进行处理,为了解决知识异构的问题,现阶段研究大多采用本体论的相关技术将知识库转化为本体库或知识元集合,将知识元素统一为对象化表示处理;知识更新的随机性[1]是指知识处理过程中,一个系统的知识应该向什么方向演变是无法预知的,所以很难给出具有特定趋势指导的融合算法,为此,在融合算法中,要尽可能构造各种随机改动的操作,根据应用结果的反馈来判断改动的成功与否;知识扩展的开放性是指知识元素的结合可能是两个对象之间,也可能是多个对象之间发生的,而融合的结果一般并不是唯一的[2],可能会是一个相当庞大的规模,所以在进行知识融合处理的同时,必须考虑如何对运算后的知识元素规模进行有效合理的控制[3]。本文将从元知识集和本体库构建、融合算法、融合结果的控制与评价反馈三个方面对知识融合方法的国内外研究现状进行梳理。
2.1 元知识集和本体的构建相关研究进展
在知识融合过程中,本体提供了知识表示的方法和便于领域知识描述的潜在关系,但如何发现知识融合所需的知识源并辨别它们的有用性,则是解决知识融合的首要问题[4]。元知识的概念尚未有统一的形式化定义,一般理解为“关于知识的知识”,即专门用来显性地描述知识库中知识元素特征的知识元素实体。元知识集中的元素对应知识对象的不同结构特征,这种表示方式可以描述不同层次知识元素的结构,更有利于进行知识对象的融合处理。采用元知识和本体库协同工作的数据机制,将知识元素统一为对象化表示处理,通过引入本体论和元知识的方法消除了知识对象表示上的差异,形成知识融合的数据基础,同时强调知识内涵的融合处理,而不是构成知识的结构化元素的简单组合[5]。
在研究进展方面,Eloi Bosse[6]提出了KNOWMES 模型,通过本体的构建,实现了信息融合的高层融合;Laskey[7]等用OWL 表示概率本体,设计了PR-OWL(概率本体描述语言)进行基于语义内容的知识表示,实现了多个噪声信息源的融合;左秀然[8]进行了以本体论为基础的本体映射研究,利用相似度计算来判断概念的相似性,再将相似度高的本体进行映射;朱玉屏等[9]建立了一种基于本体的产品设计知识模型,应用于制造行业产品设计中,帮助制造企业缩短产品设计周期和提高开发质量,同时也有利于产品设计知识的共享和重用;沈旺等[10]提出了基于本体的数字参考咨询知识融合方法,以解决参考咨询服务过程中由于异构数据源造成的知识正确性低、完整性差、冗余度高等问题;Erik Blasch 等[11]基于信息融合构建了动态图像开发的语义本体。
2.2 融合算法的相关研究进展
融合算法是实现知识融合的关键,直接影响融合效果[12]。融合算法的目标是通过某种可流程化实现的处理过程将已有的知识元素按照约定的规则进行比较、合并和协调等融合运算,从而产生出新的可用知识对象内容,并同时对原有的知识元素进行优化[5]。
根据融合过程的动因,可以将融合算法划分为两大类,即被动型和主动型[3][5]。所谓被动型,是指融合算法中的启发式规则和适应度都是针对具体应用求解问题的,这类融合算法本质上对应于在知识空间进行的搜索算法,即对知识对象演变的趋势有一个以问题求解为主的导向。被动型和具体应用结合比较紧密,融合算法的处理结果规模也相对较小,但是可能会忽略一些有潜在作用的新知识元素。而主动型融合算法,则主要是针对已有知识对象内涵之间潜在的联系,即直接在现有知识的基础上按照知识对象的概念化约束条件生成新知识,这一生成过程并不直接以具体应用求解为驱动,或者并不以此为主要目标,但其结果可能恰好满足某种需求(直接或间接)。从算法设计目标上来看,主动型融合是一种构造型算法,此类算法的运算规模要比被动型大,但是能够较好地兼顾知识的开放性和随机性。
目前,在研究进展方面,很多研究将信息融合处理技术移植到知识融合处理中,构造知识融合算法。基于Bayes 方法、D-S 理论、模糊集理论的3种知识融合方法是融合决策处理的流行方法,都是建立在以集合或体制框架为研究对象的数学理论基础上,它们都考虑了知识源获取的不确定性。通过融合处理,在一定程度上降低了知识的不确定性,提高了融合结果的可靠性和置信度[13]。国内外基于这三种理论的知识融合算法研究颇多:Eugene Santos Jr.等[14]提出了以贝叶斯知识库(BKBs)为基础的概率模型和贝叶斯知识融合算法,将来自不同渠道、不同时间和不同视角下的内外部知识融合为统一可靠的新知识库;韩立岩等[15]将信息熵的概念引入到基础概率分配的确定中,推导出基于D-S 证据组合理论的知识融合公式,该方法能有效降低企业失败预警方法的不确定性;胡蓓[16]采用信息融合的DSmT 技术,对集群内外部知识源的知识进行融合,DSmT 超越了Dempster-Shafer 理论的局限,提出了一种新的一般性融合规则,能很好地适应静态的和动态的融合问题,而且可以在任何结构(离散、连续)上应用。很多学者采用优化算法:缑锦[5]在知识融合的若干关键技术研究中提出基于遗传算法和蚁群算法的知识融合算法,扩展了知识规模,丰富了知识储备,并采用参数反馈检验机制,根据新知识的有效性,控制了无用知识的产生;Yu Tianbiao 等[17]将遗传算法引入知识融合,构建了协同技术服务模型;Martens D.等[18]综合知识融合过程中软性约束和硬性约束的特点,提出基于蚁群算法的知识分类技术。
也有很多学者进行基于融合规则的融合算法研究。基于融合规则的知识融合方法在融合处理对象的选择上强调“符合什么条件的知识对象可进行融合”,以此来降低完全不可用结果出现的概率。Gregoire 结合一些自定义逻辑运算规则,提出了特定约束下进行知识融合的逻辑规则的形式化模型并应用到一些实际知识背景,该类方法将知识库看作蕴含规则的有序集合,序关系按照指定的约束生成,合并和融合对应的逻辑运算需要满足若干约定前提;胡晓等[19]提出了消解术语冲突的逻辑树融合方法,消除谓词冲突的频率融合法以及用于消除语义冲突的句法融合法;Borhgoff U.M.等[20]利用融合规则的方式,给出知识融合的相关理论,将多条多粒度异构的知识进行融合,形成综合考虑多个学科背景知识的新知识。
2.3 融合结果的控制与评价反馈
由于知识融合的结果往往是一个规模庞大的知识集,而其中有些知识是无用的,甚至是不符合逻辑的,所以在融合规则指导下的知识融合,其产生的新知识的有效性还需进一步通过评价机制予以提高。知识结构的合理性是通过应用效果反馈得到的,所以在知识融合基本步骤完成之后,还要根据应用中与实际问题匹配的结果进行评估与参数校正,以达到系统自适应的目的[21]。
对知识融合效果的评价也是国内学者研究的一个热点,徐赐军等[4]针对知识融合产生的新知识规模庞大的问题,提出了一个基于本体的融合知识测度指标,并运用基于信息扩散原理的评价机制提高融合知识的准确性;周元珂[22]在现有的可有效评估成对约束形式的实例层知识的指标基础上,提出可有效评估属性排序形式的属性层知识的指标;李进等[23]研究了决策级数据融合的可靠性验证方法;王海栋等[24]使用反馈自适应机制自动校正置信度因子,避免初始置信度设置的主观性。
3 知识融合体系框架模型的相关研究
3.1 知识融合体系框架模型国外相关研究
KRAFT 系统是首个从设计理论、设计方法到实证应用的知识融合系统。KRAFT 系统是由英国工程与自然科学研究委员会和英国电信共同赞助的项目。该项目的研究目的是能使异构数据库和知识系统的信息得到共享和重用,KRAFT 系统认为数据融合系统由外部组件和内部组件两部分构成,外部组件包括服务对象和服务资源,内部组件是融合系统的核心,由接口、路由和融合三部分构成,分别用W、F、M 表示。W 是服务对象和服务资源之间的接口,F 负责系统内部的消息路由,而M 则是知识融合的核心功能对象,主要功能包括异构数据源的集成、根据语义对知识进行转换、知识一致性的检查和处理、基于本体的知识等价转换等。这种体系结构支持的知识融合过程的关键就在于将抽取的知识转化为统一的知识模式,从而为具体的应用服务,融合过程的本质是知识模式的不断集成和转换。
Dominik Fisch[25]认为知识融合有三个层次,分为数据层知识融合、模型层知识融合以及参数层知识融合,并且构建了模型层的知识融合框架。Alexander Smirnov[26]从知识的自动获取、知识的表示和存储以及知识融合处理流程三个角度着手来构建基于上下文的知识融合模型,并认为知识融合有七个层次:简单融合、扩展融合、实例融合、参数融合、适应性融合、分面融合和历史融合。Lauro Snidaro[27]认为在海事监测中,异常事件是重要的影响因素,于是将异常事件融入数据融合模型JDL 模型(A.N.Steinberg,J.Llinas),并利用马尔科夫逻辑网络(Markov Logic Networks,MLNs)对不确定性知识进行编码来推断证据可靠性。Marco Fontani[28]构建了一个基于背景知识的多线索知识融合框架,在不提高成本的前提下提高了融合效率。Kun Yue[29]主要考虑融合效率和实时性,采用定性概率网络(QPN)、定性抽象的贝叶斯网络以及时间序列构建了不确定知识的融合框架。Jihong Liu[30]为了实现集团内部知识共享,在知识组织模型的基础上,通过本体映射和融合,提出了一种面向知识融合服务的体系结构,在这一结构中知识被打包为云制造服务平台,用户可以各取所需,获得优质的知识服务。
3.2 知识融合体系框架模型国内相关研究
国内关于知识融合体系框架模型的研究大多数是基于KRAFT模型演变而来,具有代表性的有缑锦[5],他认为知识融合系统主要包括四个功能模块:本体库和元知识集的构建、融合算法的设计和实现、解知识空间的生成和演化以及基于应用反馈的评估和参数校正。从功能模块的过程化处理角度来看,首先对分布的知识源进行处理,结合知识融合系统的特点构造各领域知识或分布式知识库对应的元知识集合本体;当本体管理完成本体映射目录和全局本体库之后,融合模块采用融合算法对规范化表示的元知识集进行融合处理,结合本体库和背景知识产生的约束集构建解知识空间;解知识空间中的知识元素按照一定的规律进行演化,结合实际应用问题在解知识空间中进行搜索,得到需要的新知识对象;最后通过知识应用的反馈结构对融合系统的相关参数进行优化调整。
Nengfu Xie[31]提出了知识融合与同步的信息共享框架(Knowledge Fusion & Synchronization Framework,KFSF)。KFSF 在逻辑上分为四个部分,分别是信息源、初级融合、知识融合和知识同步。其中,信息源是整个框架的信息来源,初级融合模块是整个系统的基础,为各个领域的信息源建立相应的本体以及在该领域下存在的逻辑规则和语义词典,其中全局和局部概念空间采用RDF表示,并且完成了异构信息源的集成;知识融合模块是整个框架的主要功能,主要完成信息集成结果的综合处理;知识同步模块为知识体与信息源信息保持同步提供变化检测,确保变化信息能够及时地传递给用户。
徐赐军[4]针对知识融合过程中融合知识语义的合理性及其有效性,提出了一个利用融合知识测度提高新知识语义内涵和控制融合结果规模,并运用基于信息扩散原理的评价机制提高融合知识准确性的知识融合框架。在这一框架中,包括元知识集的构建、知识测度指标的确定、知识融合算法的设计和融合知识的后处理4个核心功能。数据类型包括分布式知识源的本体库、知识库、元知识集、指导融合算法过程的融合规则库、知识构成的约束集以及存储融合知识后处理结果的解知识空间和衍生知识库。若知识融合是主动型的,则用户只需通过接口输入融合算法的参数;若知识融合是被动型的,则由专业人员根据领域本体对用户的问题进行规范化定义,并设置相关参数。知识融合系统首先根据输入的问题提取分布式知识库中的相关知识源,并根据各领域本体构建元知识集;然后根据元知识集中的知识元素来分析知识测度指标的参数;知识融合模块根据测度指标的分析启动相应的融合算法,并在相关融合规则指导下构建解知识空间;最后结合实际应用问题,通过融合知识后处理模块中的知识约束集得到理想的知识对象,并通过新知识的应用反馈评估进一步优化融合知识。
在知识管理领域,知识源是供体,知识源具有多样性、多层次性和无限扩展性。鉴于知识源的这些特性,周芳[12]提出了多层次的知识融合框架,将知识融合体系分为知识层融合、方法层融合和思想层融合。基本知识层融合是对不同的观察获得的知识进行融合,原始数据是该层知识融合的主体,如对数据、报表所记载的内容进行相关特征提取、属性判断、滤波优化等;方法层融合是指用不同方式对同一知识源进行观察、理解和提取,将从不同视角下获得的知识进行融合,得到基于多种方法集成后的融合知识;思想层融合是将人的个性化理念、视点直接作用于待处理的客体中,并与其他处理方法或思想进行融合,以充分发掘和运用人的智慧的潜能,提高融合质量和效果。实现知识分层融合可以适应不同应用场合的融合需求。
沈旺[10]认为基于本体的数字参考咨询知识融合可分为三个步骤:首先是问题分析,在领域本体映射基础上分析问题中包含的知识点,构建问题空间,表达为统一的描述;其次是知识抽取、清理和匹配,从异构数据库中获取大量的与问题相关的知识,但是这些知识是庞杂无序的,可能存在各种矛盾的事实、数据和观点,同时还包含着未被直接表达的潜在知识;最后是知识的融合,对获得的海量知识进行知识融合处理,构建解空间,完全或部分解决用户的问题,从而为用户提供完整、正确、及时的知识需求。
4 知识融合的应用
知识融合技术最初应用于军事领域,随后逐渐应用到其他非军事领域,目前知识融合技术被广泛应用于产品设计、决策支持和知识服务等领域。
4.1 在产品设计领域的应用
在快速变化的市场环境下,产品升级换代的速度愈来愈快。如何从知识管理的角度提高对设计知识的积累和重用,进而提高企业产品开发的效率和质量,已经成为了关系企业竞争力和发展前景的重要问题。目前,产品设计从经验设计转变为基于网络的计算机分析、知识融合的优化设计,产品设计应用的知识已不再是单一的学科知识,而是交叉的多学科综合知识。在此背景之下,知识融合技术越来越多地应用到产品设计领域中去。
缑锦[5]将知识融合应用于个性化产品的协同定制。基于知识的个性化产品协同定制能够实现客户与设计、材料、物流等主体间的间接交流和共享,在保证定制产品数据一致性的前提下,提高系统的灵活性,特别是各主体群信息按照领域对应到知识库之后,其内部之间可以协同工作,也能够满足复杂性较高的客户需求。顾邦军等[32]开发了一个以高速贴标机为实例的基于JSP 和JAVA 的Web 系统的以实现知识融合的应用。Wang Yishou[33]将知识融合技术应用于卫星舱的布局设计。在传统的技术手段下,卫星舱的布局设计一直都是个难题,一个成功的卫星舱布局设计依赖于工程师们丰富的经验和智慧、过去的经验以及先进的信息技术的支持。该文通过知识融合技术,将在线的人类知识、先验知识和计算机知识进行融合,设计出了一种可行的方法来解决卫星舱布局设计问题。朱玉屏等[9]将知识融合应用于机械产品的设计。此研究建立了一种基于本体的产品设计知识模型,并将该知识模型应用于制造行业产品——数控机床的设计中,帮助制造企业缩短产品设计周期和提高开发质量,同时也有利于产品设计知识的共享和重用。
4.2 在决策支持领域的应用
决策支持系统能够为企业提供各种决策信息以及问题的解决方案,从而提高了企业决策面对动态的内外部环境的应对能力,提高企业决策的质量与效率。目前,决策支持系统逐步结合人工智能技术向智能决策支持系统转变。在此背景下,知识融合技术在决策支持系统的智能化过程中发挥了重要的作用。
夏荣菲等[34]将知识融合应用于船舶能耗决策支持系统的研究。以船舶能耗为对象,应用系统辨识理论,建立重点设备能耗模型库;以方法、经验和案例为基础,建立船舶能耗知识库;融合模型库、知识库、关系数据库等多源知识,建立船舶能耗评价与决策支持系统。实现了船舶航运管理、船舶操纵控制、航线设计以及船舶设计等各个过程的决策支持。Alexander Smirnov,Tatiana Levashova,Nikolay Shilov[26]将知识融合技术应用于火警监控决策支持系统。陈超[35]将融合技术应用于网络安全态势评估领域,在基于规则的网络安全态势评估架构的基础上引入规则评价和规则融合,设计了基于知识获取和规则融合的态势评估架构,给出了态势评估总体结构;针对网络环境中数据的不确定性,分析了粗糙集理论在处理不确定性问题上的优势,给出评估架构中基于粗糙集的知识获取结构;针对规则匹配中出现的多匹配规则,分析了D-S 证据理论在多源信息融合方面的优势,给出评估架构中基于D-S 证据理论的规则融合结构。徐晓等[36]将知识融合应用于制造决策领域。此研究将知识融入到粗糙集模型中,在传统粗糙集(ORSM)以不可分辨关系处理数据的基础上,对知识进行建模,将知识映射为函数关系,建立一个基于不可分辨函数关系的综合分析信息和知识的新型粗糙集模型,即知识融合粗糙集模型(KBRSM)。张景强[37]以知识管理的知识融合为指导思想,进行了技术服务知识融合理论的研究与分析,以面向对象的知识表示方法构建了制造技术知识元和知识库;进行了遗传融合算法的设计以实现技术服务知识融合,并对知识融合实验结果进行了概念分析。应用JSP 技术开发了一个具有知识融合特点的协同技术服务系统,实现了技术服务中文档、图纸、模型、资料等制造技术知识服务功能。知识管理规划中所包含的制造技术知识涉及制造对象知识、制造方法知识、制造决策知识、制造过程知识以及制造理论知识等。
4.3 在知识服务领域的应用
在知识经济背景下,知识在社会的发展、技术的进步、企业的竞争中发挥出了极其重要的作用。与此同时,信息服务逐渐向知识服务转变。知识融合为知识服务的实践与发展奠定了技术基础,目前主要应用于数字参考咨询、科研团队知识管理、自动问答系统、文本分类等方面。
沈旺等[10]提出了一个数字参考咨询知识融合框架。利用知识融合技术,解决异构数据的结构异构性、语义矛盾性等问题,在知识层面上进行新的知识发现和知识挖掘,就能有效提高对数字参考咨询知识管理的效率,改善数字参考咨询的服务效果。赵丽梅[38]将知识融合理论应用于高校科研团队内部知识整合问题,丰富和完善面向知识创新的高校科研团队内部知识整合研究的理论和方法,为高校科研团队知识整合的顺利进行提供决策依据。李良富[39]等设计实现了基于知识融合的金融领域汉语自动问答系统FAQAS,该系统实现了基于多领域本体驱动的知识融合,通过对用户的问句进行句法分析、语义块分析、规则推理和实例推理等处理,最终在本体层面中直接提取满意的答案。针对FAQAS 系统在用户问句约束和处理效率方面的不足,缑锦[5]应用知识融合技术完成了新的自动应答服务系统(KFAA)的设计和实现。代六玲等[40]将知识融合应用于在线文本分类。对于某一特定类别,使用一定数量的语义中心代表该类的训练文本集,并在此基础上训练语义SVM;通过动态调整语义中心达到分类知识的积累;在SMO 算法的基础上实现减量和增量学习,并以此实现语义SVM 的快速在线学习,解决了将SVM 用于在线文本分类时的存储和效率问题。
5 结 语
从既有的研究来看,知识融合的研究已经取得了初步的进展。但是在以下方面,知识融合的研究仍然具有进步的空间:
(1)缺乏适应大数据环境的主动型知识融合算法研究。
相对信息融合技术,知识融合从理论到实践尚不成熟,是一项需要深入探讨的新技术。目前的许多研究是将信息融合处理技术移植到知识融合处理中构造或改进知识融合算法;融合算法大多是针对某个应用领域的需求驱动的被动型融合,而主动型的融合过程支持知识对象之间的自发融合,一方面便于为潜在的需求提供服务,另一方面也可以不断优化知识对象本身的结构与内涵。适应大数据环境特点,合理高效的主动型知识融合算法研究有待进一步深入开展。
(2)缺乏获得广泛认可的知识融合体系。
知识融合是一项跨学科的研究领域,吸引了计算机科学、管理学、图书情报学、医学、工程科学等众多学科的关注。在广泛的研究当中,不同学科背景的学者都试图提出知识融合体系,但目前尚未出现获得广泛认可的统一的知识融合模型。因此,如何提出一个统一的知识融合体系仍然值得探讨。
(3)知识融合应用研究领域广泛,但不够深入。
知识融合技术的应用领域主要涵盖了产品设计、决策支持和知识服务。产品设计和决策支持基本上是基于某一具体领域,针对的用户对象是某些专业领域的人员。知识服务主要是基于网络,对象是不具备专业能力的普通用户,关于这方面的研究还相对较少,尤其是随着大数据时代的到来,对于知识服务有需求的人越来越多,对于知识服务质量的需求越来越高,如何将技术理论与需求完美地结合,这是知识融合应用研究亟待解决的问题。
参考文献
[1]Russell S,Norvig P.Artificial intelligence [M].Beijing: Posts& Telecom Press,2010.
[2]Gregoire E.Fusing Legal Knowledge [A].In: Proc.of the 14th IEEE int.Conf.on Information Reuse and Integration [C].Les Vegas,2004: 522-529.
[3]郭强,关欣,曹昕莹,张政超,何友.知识融合理论研究发展与展望[J].中国电子科学研究院学报,2012(6):252-257.
[4]徐赐军,李爱平.基于本体的融合知识测度分析[J].控制与决策,2014(9):1649-1654.
[5]缑锦.知识融合中若干关键技术研究[D].杭州:浙江大学,2005.
[6]Bosse E,Valin P,Boury-Brisset A,Grenier D.Exploitation of a priori knowledge for information fusion [J].Information Fusion 2006,7(2): 161-175.
[7]Laskey K B,Costa P C G,Janssen T.Probabilistic ontologies for knowledge fusion [C]/ /Proceedings of the 11th International Conference on Information Fusion,Cologne,2008: 1-8.
[8]左秀然.基于概念相似度的本体映射系统研究[D].武汉:武汉理工大学,2008.
[9]朱玉屏,刘丽兰.基于知识融合技术的产品设计知识模型研究[J].计算机应用研究,2009(9):3235-3238.
[10]沈旺,李亚峰,侯昊辰.数字参考咨询知识融合框架研究[J].图书情报工作,2013(10):139-143.
[11]Blasch E,Salerno J,Kadar I,Hintz K,Biermann J,Chong C,Das S.Resource management coordination with level 2/3fusion issues and challenges [J].Aerospace & Electronic System Magazine IEEE,2008,23(3): 32-45.
[12]周芳,刘玉战,韩立岩.基于模糊集理论的知识融合方法研究[J].北京理工大学学报,2013(6):67-72.
[13]周芳,王鹏波,韩立岩.多源知识融合处理算法[J].北京航空航天大学学报,2013(1):109-114.
[14]Jr E S,Wilkinson J T,Santos E E.Bayesian knowledge fusion[C].Proceedings of Twenty-Second International FLAIRS Conference,2009.
[15]韩立岩.基于D-S 证据理论的知识融合及其应用[J].北京航空航天大学学报,2006(1):65-73.
[16]胡蓓,王聪颖.基于信息融合的发展中国家高技术产业集群知识融合与创新模型研究[J].图书情报工作,2009(7):38-41,73.
[17]Yu T B,Ding J M,Song Y H,Wang N,Wang W S.Research on model of cooperative technology service based on genetic fusion algorithm [C].2012International Conference on Management Science & Engineering (19th ) September 20-22,2012Dallas,USA: 1673-1679.
[18]Martens D,De Backer M,Haesen R,Baesens B,Mues C,Vanthienen J.Ant-Based approach to the knowledge fusion [M].Heideibery: Springer,2006.
[19]胡晓,胡洁,彭颖红,李晟,曹兆敏.语义级知识融合中的冲突消解方法[J].上海交通大学学报,2009(11):1730-1733.
[20]Borkar V,Carey M J,Li C.Inside big data management:Ogres,onions,or parfaits [C]/ /Proceedings of the 15th International Conference on Extending Database Technology.ACM,2012: 3-14.
[21]缑锦.基于元信息和本体论的知识融合算法[J].计算机辅助设计与图形学学报,2006(6):819-823.
[22]周元珂,邵峰晶,吴舜尧.评估属性层知识和实例层知识融合效果的有效指标[J].青岛大学学报,2014(2):29-38.
[23]李进,赵宇,黄敏.基于决策级数据融合的可靠性综合验证方法[J].北京航空航天大学学报,2010(5):275-279.
[24]王海栋,郑骁庆,张红俊.基于置信度理论的网络知识融合系统和应用[J].计算机系统应用,2011(20):1-6.
[25]Fisch D,Kalkowski E,Sick B.Knowledge fusion for probabilistic generative classifiers with data mining applications[J].IEEE Transactions on Knowledge and Data Engineering,2014(3): 652-666.
[26]Smirnov A,Levashova T,Shilov N.Patterns for context-based knowledge fusion in decision support systems [J].Information Fusion,2015(21): 114-129.
[27]Snidaro L,Visentini I,Bryan K.Fusion uncertain knowledge and evidence for maritime situational awareness via Markov Logic Networks [J].Information Fusion,2015(21): 159-172.
[28]Fontani M,Argones-Rua E,Troncoso C,Barni M.The watchful forensic analyst: Multi-clue information fusion with background knowledge [C].IEEE International Workshop on Information Forensics & Security 2013: 120-125.
[29]Kun Y,Qian W H,Fu X D,Li J,Liu W Y.Qualitative probabilistic network-based fusion of time-series uncertain knowledge [J].Soft Comput,2014(3): 152-159.
[30]Liu J H,Bo L.An ontology-based architecture for serviceorientated design knowledge fusion in group corporation cloud manufacturing [ C].Proceedings of the 2012IEEE 16th International Conference on Computer Supported Cooperative Work in Design,2012: 811-816.
[31]Xie N F,Cao C G,Guo H Y.A knowledge fusion model for web information [C].Proceedings of the 2005IEEE/WIC/ACM International Conference on Web Intelligence (WI'05) 0-7695-2415-X/05$20.002005IEEE: 67-72.
[32]顾邦军.网络环境下虚拟产品设计的知识融合技术研究[D].衡阳:南华大学,2007.
[33]Wang Y S,Teng H F.Knowledge fusion design method: Satellite module layout [J].Chinese Journal of Aeronautics,2009,22(1): 32-42.
[34]夏荣菲,万隆君.基于知识融合的船舶能耗决策支持系统[J].船舶工程,2014(S1):166-169.
[35]陈超.基于知识获取与规则融合的网络安全态势评估技术研究[D].解放军信息工程大学,2013.
[36]徐晓,翟敬梅,刘海涛.制造决策的知识融合粗糙集模型[J].华南理工大学学报(自然科学版),2011(08):36-41.
[37]张景强.基于知识融合的协同技术服务研究[D].沈阳:东北大学,2009.
[38]赵丽梅.面向知识创新的高校科研团队内部知识整合研究[D].哈尔滨:哈尔滨工业大学,2013.
[39]李良富,樊孝忠,李宏乔,顾益军.知识是如何驱动Q/A 系统的[J].计算机工程与应用,2004(20):70-73,98.
[40]代六玲,李雪梅,黄河燕.基于知识融合的在线文本分类算法——语义SVM [J].华南理工大学学报(自然科学版),2004(S1):67-72.
【作者简介】
唐晓波,教授,博士生导师。曾任武汉大学信息管理学院信息管理科学系主任。现任武汉大学信息系统研究中心主任、国际信息系统协会中国分会理事、湖北省信息学会常务理事、武汉市系统工程学会理事。近年来,发表学术论文80余篇,出版著作4部。主持国家自然科学基金面上项目、教育部人文社会科学重点基地重大项目、教育部人文社会科学规划项目以及横向项目近20项,参加国家自然科学基金重点项目、教育部重大攻关项目。主要研究方向:商务智能、管理信息系统、知识组织、情报研究。
叶晨孟,武汉大学信息管理学院硕士研究生,研究方向:知识组织与情报研究。
魏巍,武汉大学信息管理学院博士研究生,研究方向:知识组织与情报研究。
朱娟,武汉大学信息管理学院博士研究生,研究方向:知识组织与情报研究。
唐晓波,教授,博士生导师。曾任武汉大学信息管理学院信息管理科学系主任。现任武汉大学信息系统研究中心主任、国际信息系统协会中国分会理事、湖北省信息学会常务理事、武汉市系统工程学会理事。近年来,发表学术论文80余篇,出版著作4部。主持国家自然科学基金面上项目、教育部人文社会科学重点基地重大项目、教育部人文社会科学规划项目以及横向项目近20项,参加国家自然科学基金重点项目、教育部重大攻关项目。主要研究方向:商务智能、管理信息系统、知识组织、情报研究。
叶晨孟,武汉大学信息管理学院硕士研究生,研究方向:知识组织与情报研究。
魏巍,武汉大学信息管理学院博士研究生,研究方向:知识组织与情报研究。
朱娟,武汉大学信息管理学院博士研究生,研究方向:知识组织与情报研究。
唐晓波,教授,博士生导师。曾任武汉大学信息管理学院信息管理科学系主任。现任武汉大学信息系统研究中心主任、国际信息系统协会中国分会理事、湖北省信息学会常务理事、武汉市系统工程学会理事。近年来,发表学术论文80余篇,出版著作4部。主持国家自然科学基金面上项目、教育部人文社会科学重点基地重大项目、教育部人文社会科学规划项目以及横向项目近20项,参加国家自然科学基金重点项目、教育部重大攻关项目。主要研究方向:商务智能、管理信息系统、知识组织、情报研究。
叶晨孟,武汉大学信息管理学院硕士研究生,研究方向:知识组织与情报研究。
魏巍,武汉大学信息管理学院博士研究生,研究方向:知识组织与情报研究。
朱娟,武汉大学信息管理学院博士研究生,研究方向:知识组织与情报研究。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。