语境知识库由语境词典构建完成。它是实现话语意图理解的重要知识库,依据定义2,词语语境Ω=(C,L,B,δ),其中上下文语境是由除目标词外的上下文词语构成,从词类角度分析,这些候选语境词主要是实词。动态语境词典的构建包括上下文语境和背景语境,背景语境由语义框架激活,具体过程如图23所示。
图23 动态上下文&背景语境词典的构建
除上下文语境和背景语境之外,还应构建现场语境,由交际过程中感知到的环境因素所构成的集合组成,如视觉、听觉、嗅觉等信息。这些信息的获取可以通过计算机视觉和数字语音处理等技术达成,同时也给话语意图的推断提供了依据。然而这只是理想状况下我们对现场语境的处理,目前的研究成果和技术水平很难将这些信息整合到一个话语理解系统里。图24为话语现场语境示意图的构建。
图24 现场语境知识词典的构建(刘根辉,2017)(www.daowen.com)
依据定义4,背景语境是交际过程中,由上下文语境和现场语境之外的不能直接感知的语言外的世界构成的环境因素集合,它是交际双方对世界的认知。因为交际个体认知结构的不同,所以背景知识也不尽相同。而参与话语意图的理解和生成的仅是与话语话题相关的部分知识。现有的研究很大部分将焦点放在挖掘话语内部的语义信息,对话语外的背景知识关注的较少。认知心理学中的联想主义理论提出联想是人脑中信息和信息之间相互关联的方式,确切地说,个体所具有的全部知识都可借助于其他联想模型来确定。背景知识对话语意义的贡献不可忽视。
现阶段话语分析的研究都以挖掘话语内部语义关系为主,对以何种方式表述背景知识以及如何自动提取筛选背景知识的研究尚未成熟。因此,基于联想主义理论的观点,我们需要建立相关背景知识联想机制,以便话语自动提取背景知识候选条目,且从中筛选出与待分析文本具有最佳关联的选项。在建立背景知识联想模型的基础上,我们赋予计算机获取相关知识的能力。同时,由于背景知识增强了话语语义连贯性分析的能力,基于此,我们引入了语义框架,用它来激活背景知识。一方面,语义框架摒弃了传统利用实体匹配为核心的方法,这样更利于背景知识的精确获取;另一方面,语义框架也加强了话语语义连贯性分析的能力。例如,“苹果-乔布斯”这类语义相互关联的实体,由于语义上不相匹配导致语义连贯性的失衡,然而二者之间存在密切的语义关系。我们只要通过“手机”框架便可以激活这类相关信息,从而使语义信息连贯,这有助于计算机理解话语的含义。
综合以上分析,目前,对于框架语义知识库的构建,已有山西大学的刘开瑛、李茹等开发的汉语框架语义知识库(Chinese Frame Net,CFN)(You L,Liu T,Liu K.,2007),其中包括语义知识库内容的编写、辅助软件的开发和应用研究等,汉语框架语义知识库目前为止对1770个词元(一个义项下的一个词)构建了130个框架,标注的句子总数为8200个,覆盖认知、科普以及法律等领域的词语。(HAO X y,Liu W,Li R,et al.,2007)汉语框架语义知识库目前可作为话语语义分析的背景语义知识库来提升计算机对话语的理解。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。