词汇链理论(Lexical Chain Theory)由Morris和Hirst(1991)提出,他们把共同主题下意义相关联的词所组成的词序列称为“词汇链”。对于词汇链的算法也相对容易理解,即在语义层面上,如果特定的主体被多个词语进行描述,那么这些词语相互间的语义相互关联,从而形成一条相关词汇的链条,即词汇链。可以通过词汇链来观察任意语言片段中主题的指示。对于文章的结构的分析,就可以通过多条词汇链在文章中的分布情况获知。从话语连贯的研究方法来看,这属于静态的研究。
应用词汇链理论最典型的代表是文本分割。同时,这也印证了Morris和Hirst提出该理论的初衷。分析方法如下:首先,确定词汇分布链条,通过文本片段中对同一主题或相同事件的描述进行判断。其次,推断主题结构,可根据上一词汇链条的分布情况推断出文本的主题结构。例如,“比分”“投篮”“抢断”“盖帽”“赢得”等,这些词聚集在体育新闻报道的文章中,因为它们都是有关体育运动场景的词汇。词汇链的构建方法在自然语言处理领域有很多应用,如文本检索、信息抽取等。
中心理论(Centering Theory),由Grosz在1995年提出,用于研究话语结构中关于焦点、指代表达式选择,以及话语一致性的问题,通过观察句子的“中心”转变理解文章的意义。当前句子与其他句子围绕中心实体互相关联,具备中心实体的句子一定不是独立存在的,它与上下文之间必然有某种关联,进而保持文章的连贯性。“句子(Sentence)”与“语句(Utterance)”被Grosz等人用来指代与上下文相关联的中心实体,他们用中心来承担组成话语的基础成分。
中心理论提出,任何句子都是由三个中心组合而成:用来指示上文的表述语义承接的前中心,用来指示上文的描述中心,以及当前句中,用来表示语义转移的后中心。
中心理论的特点是预测,通过相邻句子前后中心的改变可以预测其后句子焦点的模型,它的提出并非是要解决某一具体问题,而是通过焦点的变化更加快速地理解句子的含义,也有助于对段落结构的掌握。句子通过中心延续、中心回复、中心转移可以解决指代消解问题。此外,中心理论还可应用于上下文的连贯性分析。中心理论也有局限性,由于其重点关注句子间的中心改变,因而缺少对话语宏观整体的考虑。(www.daowen.com)
篇章连贯性理论(Discourse Coherence Evaluation)也是以研究篇章语义分析为核心,并一直是学术界关注的重要理论。篇章连贯性理论起初受到Grosz等人(1995)提出的“中心定理”的启发。因为中心理论的研究重心是句子焦点的变化,从而体现了篇章的连贯性。目前有关篇章连贯性分析的研究发展迅速,相对于中心理论具有更强的操作性。
综上所述,基于词汇的话语意义计算的研究主要根据词汇间的语义关系体现话语的意义。不同的理论从不同的层面研究话语的意义。通过语义相互关联的词汇或实体在文章中的分布信息,呈现话语的结构信息以及句子间的语义关系。如上文中词汇链理论(Lexical Cohesion),它通过分析名词、形容词等语义信息,使之形成一条主题词汇链,再通过这些词汇间的分布和转移方式解读话语意义。中心理论(Centering Theory)和连贯性分析主要分析实体,通过共指实体和相关实体的分布和重现分析话语信息。
以上理论的研究比较完善,而且有很强的操作性。以词汇为研究对象分析话语的意义的缺陷为其表现力相对较弱,以关联为核心刻画语义关系,导致对语义类型的分类不细致,如详述关系、递进关系等没有更具体的区分。另外,对于话语结构复杂的篇章而言,仅凭词汇衔接判断话语结构不够精确和全面。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。