理论教育 基于树状图的语义表征方法:话语意义的可计算性研究

基于树状图的语义表征方法:话语意义的可计算性研究

时间:2023-10-30 理论教育 版权反馈
【摘要】:基于树状图的语义表征方法,其横向表明小句间的语义关系,纵向表示小句间的语义关系的操作过程,小句间如何组织合并成更大的语义单位直至形成整个篇章修辞树,树状图的语义表征方法表现了语篇各部分的主要话题与整个语篇的主题之间的语义关系。关于树状图语义表征的理论很多,如van Dijk提出的宏观结构理论,这种树状图语义表征方法相对简单。基于修辞结构理论的语篇语义结构的表征方法能更明确地表示语段之间的关系。

基于树状图的语义表征方法:话语意义的可计算性研究

基于树状图的语义表征方法,其横向表明小句间的语义关系,纵向表示小句间的语义关系的操作过程,小句间如何组织合并成更大的语义单位直至形成整个篇章修辞树,树状图的语义表征方法表现了语篇各部分的主要话题与整个语篇的主题之间的语义关系。利用树状图的语义表征手段,可以清楚地标示出语篇各个话语单元之间的语义关系,从而呈现整个语篇的语义是如何构建的。

关于树状图语义表征的理论很多,如van Dijk(1980)提出的宏观结构理论,这种树状图语义表征方法相对简单。Van Dijk的模型将语义的宏观结构用树状图表征,其中小句是语篇意义的最小单位,是语篇的基本命题。基本命题间通过删除、合并、概括等宏观操作原则得出宏观命题,它是基本命题的上层语义单位。宏观命题还可以按照宏观操作原则继续向上层推进,由此逐步得到整个语篇的宏观命题。以上过程从语篇的基本命题开始,经过组合、分类、分级等操作,最后得到语篇宏观结构,这个过程可以利用一个倒置的树形图(图14)来表示。(van Dijk,1980:43)

图14 语篇宏观结构示意图

(van Dijk,1980:43)

图14中M用来表示宏观命题,M右上角的数字用来表示级别。语篇宏观结构示意图展示了从下层的微观命题到最高命题Mn的多层次命题结构,这里包括n=0的情况,即微观结构和宏观结构重合,显然,此时组成语篇的句子数量很少有可能只有一个句子。

语篇宏观结构树状图所表征的语义关系只标示了不同层次的语义项之间的关系,对于各个语义项之间的关系无从标示。相比而言,修辞结构理论的树状图表征方法弥补了宏观结构树状图的不足,它能反映出小句之间的关系以及自下而上的建构过程。

基于修辞结构理论的语篇语义结构的表征方法能更明确地表示语段之间的关系。小句是语篇的基本单位,在树状图中是树叶。根据核心性的级别,每个跨句形成的语段分为核心(nucleus)和卫星(satellite),核心语段表达中心信息,卫星语段表达背景或者辅助性的信息。级别不同,其标注方法也有区别,直线表示核心句,弧线表示卫星句。语篇关系(discourse relations)用来连接临近语篇的跨句。以上文的例句为例,我们用修辞结构理论进行标注后的结果如图15所示。

1)[John has a lovely evening]约翰度过了一个愉快的夜晚

2)[He had a great meal]他吃了大餐

3)[He ate salmon]吃了三文鱼

4)[He devoured cheese]吃了奶酪

5)[He won a dance competition]赢得了舞蹈比赛

图15 示例中修辞结构树

Rhetorical Structure Theory(RST)

图15中S2—S5是对S1的详述,S2—S4与S5之间的关系是并列,S3—S4是对S2的详述,S3与S4之间是并列关系。从修辞结构树状图更容易观察出两个语段之间的语义关系或意图。

通过树状图进行语义表征的还有宾州篇章树库(PDTB),它以词法为基础,通过谓词-论元的形式标注篇章结构,以连接词驱动论元,将语义关系分成显式和隐式两类,从而形成具有语义类别的关系。PDTB体系进一步完善了RST理论,对于隐式关系的识别,首先通过人工添加连接词作为语义关系识别的标记。PDTB中最小的语篇单元是从句而非短语,这提高了系统的实用性。

作为篇章连贯性识别的资源建设,PDTB共标注了四类篇章关系分别为:显式/隐式连接关系(Explicit/Implicit Relation)、基于实体的关系(Entity-based Relation)、替代词(Alternative Lexicalization)以及无连接关系(No Relation)。对于显/隐式关系类型识别的具体分析过程,见如下实例:

例1:(www.daowen.com)

Arg1:This car needs to be repaired.这辆车需要修理。

Arg2:But there's no auto parts matched it.但是没有合适的匹配零件。

Relation:Comparison.Contrast.Juxtaposition.

例2:

Arg1:And they were friends.作为好朋友。

Arg2:[Implicit=at the time]This friendship was the best experience of his life.这种友谊关系伴随他一生。

Relation:Temporal.Synchrony.

例1表示的是PDTB中的显示关系,but作为连接词,连接Arg1和Arg2两个论元,表示二者的语义关系为对比(Comparison)关系。例2表示的是PDTB中的隐式关系,由于两个论元间缺少连接词的连接,因此通过人工添加连接词“Implicit=at the time”判断论元对之间的语义关系为“时序(Temporal)”关系。

综上分析可知,PDTB对篇章的语义关系进行了严格的区分,且显/隐式关系的具体类型层次界定明确,进而为话语语义关系识别的语言资源建设提供了一定的基础。我们看下面这个例子:

1)[John has a lovely evening]约翰度过了一个愉快的夜晚

2)[He had a great meal]他吃了大餐

3)[He ate salmon]吃了三文鱼

4)[He devoured cheese]吃了奶酪

5)[He won a dance competition]赢得了舞蹈比赛

这五个句子在PDTB中的表征关联如图16所示。

图16 示例中宾州篇章树库(PDTB)

通过上面的宾州篇章树图可以观察出,S2—S5是S1的实例,表示为总分关系。S3和S4之间是并列的连接关系。S3—S4是S2的实例,形成总分关系。S4与S5两句没有形成任何关系。PDTB不排斥交叉和语义关系的跨越,使语篇的结构分析更具有表现力和实用性,其通过修辞结构和语义关系的判定,便可以得到一定程度的话语语义信息。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈