Bunt和Black(2000)认为,要构建话语意义的计算模型,需要综合考虑以下三个方面的因素:第一,话语的语言学方面的语义信息,按照单位由小到大的顺序为词和短语、句法组合及其他与句子意义相关的语义信息;第二,话语的物理信息,包括由构成话语的语音特征及视觉信息;第三,话语语境方面的信息,指交际双方依据话题所能提取的背景知识及其想要表达的话语意图,交际的话语环境自身所具有的时间和空间特征。
设计一个语言系统的过程中,如何将知识有机地进行组合,需要怎样的语义处理方法计算组合过程中句子的意义?如果欲计算一个句子(sentence)中的话语u(utterance),条件是只有将u置于一个相对独立的阶段处理其语言学的信息时,计算S的句子意义过程才能等同于计算u的话语意义的过程。如果将话语的物理信息和语境信息视为两类无关信息分开处理,则处理过程为:第一,依据话语u的语言学方面的信息计算所有能够覆盖S的意义;第二,通过话语的物理信息筛掉S中的无效知识;第三,通过语境信息对筛选后的信息进行约束,选择S的最佳表达意义。
在对句子进行处理时,需要处理大量的意义问题,如果脱离语境难免会产生歧义。(Bunt H,2000)因此,这种处理方法在计算话语意义时是很低效的。此时,如果想要降低句子产生的歧义,就要加入动态语境的知识,利用话题领域的知识,通过穷尽词项在该话题领域的各种可能的意义,以便降低词汇层面的歧义。减少短语歧义的解决的方法即以领域知识为基础,构建该领域各种可能的词义组合规则,从而控制生成句子意义的数量。即便如此,还会有很大的意义集产生,还需要通过添加语境信息等方法筛选排除。(www.daowen.com)
发掘话语的潜在意义即推断话语意图过程中,主要从话语上下文一致性,相关性的角度进行考量,而不是寻找语义上的所有可能性。基于此Bunt和Black(Bunt H,Black W.,2000)指出了两种解决路径:第一,通过语境的信息交叉存储语言学知识,在意义处理的初始阶段控制大量的句子意义的生产;第二,约束意义的条件,从而限制生成话语意义的数量。鉴于语境信息推理的复杂度,在应用过程中只有部分信息为有效信息,这无疑增加了方案一的实践难度。因此难以实现对于语言学信息的交叉存取。方案二已经应用于计算语义学的研究中,作为一种句子语义信息的表达方法,称为“待指定的语义表达”(underspecified semantic representation,USR)。(Alshawi H.,1992)此方法把语言学知识不能处理的问题暂且搁置,而单独处理话语意义的计算。根据上下文语义信息将待说明的各种表达进行描述,然后依据语境信息解释话语意图。此方法将计算语义学和计算语用学有机地联系起来,对话语意义计算的处理起着至关重要的作用。
话语的语用推理作为话语理解的有效手段,受到了语言理解系统的关注,语言理解系统尝试对其进行部分形式化处理。关联理论的发展为溯因推理在话语语义的计算方向上提供了思路,然而对于自然语言理解系统而言,现阶段只能算作一种理论上的可行方案,离模型化和算法化的实现还有一定距离。信任推理已经应用于人工智能领域,基于信任空间进行计算的语言理解系统还在不断优化。语境的处理是话语意图计算的关键,其处理结果会涉及语言理解系统的性能,而动态语境知识库的建立可以为话语意义的计算提供可能性。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。