理论教育 构建事件链的方法与步骤

构建事件链的方法与步骤

时间:2023-10-30 理论教育 版权反馈
【摘要】:可见,事件链的构建机制包含两个必要的组成部分:事件和顺序。这里问题出现了,也就是当一个事件含有多个论元时,论元的选择范围成为一个问题,即是否要做全部的事件选择参与事件链的构建。以上问题均关涉到事件链机制的规定。由此可见,事件的论元不一定是词汇链中的词语,这些词语可能以论元的修饰语的成分形式呈现。因此,我们称为超强事件链。事件链的数量不定,可以是一条,也可为多条。

构建事件链的方法与步骤

句子是组成话语的单位,句子链是由句子组成,句子是由相应实体构成,实体链是由构成句子的实体之间互相连接组成。具体而言,韩礼德(Halliday)和哈桑(Hason)提出的词汇链就是实体链的代表。基于上一节词汇链存在的局限性,我们引入事件链这一概念。因为事件的出现,导致句子在篇章中贡献度不同。因为并非所有的句子都含有至少一个事件。上文提及的实体链包含在事件链之中,事件链可以依据实体链的呈现而生成。由此,篇章的连贯关系可以通过超强事件链来分析,同时,事件链也可以分析篇章的连贯模式。与词汇链相比,事件链的构建不需要分别计算实体,事件或者句子相对于整篇文章是否存在连贯性,超强事件链自身即可判断,鉴于此,通过事件链判断篇章的连贯性简化了单由实体链计算的过程。

通常情况下,对于给定的文本,和词汇链的构建方式类似,构建事件链的过程即将文本中句子呈现的事件按照文本顺序逐步生成。可见,事件链的构建机制包含两个必要的组成部分:事件和顺序。一般地,事件的表示方式为:谓词+论元,其中论元的表示方法比较灵活,可以是体词性的,同时可以用其他事件充当。例如,各地群众纷纷预祝党的十九大圆满成功。(来源:新华社2017/10/17)其中,“预祝”和“成功”都属于事件的表示,同时“成功”还作为“预祝”的论元。这里问题出现了,也就是当一个事件含有多个论元时,论元的选择范围成为一个问题,即是否要做全部的事件选择参与事件链的构建。如上例中“成功”事件的所有论元表示为:成功(党,十九大),是一个完整事件,而如果是:成功(十九大),只包含一个论元,则是部分事件。

对于语篇来讲,首先应设定如何确定语篇的事件链模型,包括事件链的数量,事件链的跨越范围。因为对于篇章中的一个句子可能包括不只一个事件,这样就导致了多条事件链的生成,而事件链所跨越句子的范围也不是统一设定的,可以是同一句子中的事件链,也可能是通过多个句子形成的事件链。以上问题均关涉到事件链机制的规定。同时描写机制的不同会影响计算机对于事件链计算的难易度。我们看下面这则关于NBA的新闻报道

新浪体育2017/12/11)

以上一则新闻文本中,共计6个句子。依据文本中我们所做的标识可以分析以上语篇体词性词汇链为两条,分别为:“凯尔特人-凯尔特人-他们-凯尔特人-凯尔特人-凯尔特人”链以及“他们-活塞-活塞”。与此同时,谓词性词汇链由“优势-中-领先-投中-得-领先”组成。通常情况下,对于体词性词汇链的识别可依据实体命名或指代消解的方式解决。相对而言,谓词性词汇链的识别要复杂很多。我们先不予以考虑,仅从体词性词汇链的层面进行识别,识别过程中有如下特点:首先,词汇链的数量对于一个连贯的语篇而言可以是一条,也可为多条;其次,词汇链的范围可以存在于同一个句子,同时也可以跨越句子存在,如“活塞”链跨越句子(2)、(4)和(6);最后,词汇链之间不存在排他性,不是独立存在的,其构成元素可以相互交叉。

通过构建词汇链,我们发现以上新闻事例中的词语所关涉的事件之间都是通过语义依存关系联系在一起的。举例说明:句(1)中,“凯尔特人”如果从句法的角度讲,它依存于“扩大”,然而如果从语义的角度讲却依存于“优势”。通常情况下,事件所关涉的语义依存关系可以是单级,同时也可以存在多级的情况,我们举例说明,句(4)中的“斯玛特”在句法上依存于“凯尔特人”,而“凯尔特人”在句法上又依存于“得”。由此,我们可以看出以下特点:首先,在一个句子中可存在一个或多个事件,例如在句(1)中可根据两个体词“凯尔特人”和“活塞”分析出“凯尔特人-优势”和“活塞-未得分”这样两个事件。其次,通过句(4)中“凯尔特人的斯玛特”可以发现“凯尔特人”本属于词汇链中的元素,但却以论元“斯玛特”的修饰语的成分呈现。由此可见,事件的论元不一定是词汇链中的词语,这些词语可能以论元的修饰语的成分形式呈现。最后,事件不一定要遵守句法依存原则,例如句(3)后半句中“他们”指代上句中的“凯尔特人”,如果按照句法依存的原则应该依存于“保持”,然而事件链的形成过程中,基于语义上的依存关系,却依赖于“领先”,与句法依存不一致。

下面还以这个文本为例我们从语义的角度分析依存关系,得到语篇连贯中的事件:

根据上面的分析结果,我们按照构建事件链的两大原则,即事件和顺序。依照文本的顺承关系依次标明了以上6句的事件链。这些事件由谓词和论元构成,我可以用依存树的方式表示上述6句的事件链,如图7所示。

图7 语篇连贯中的事件链(www.daowen.com)

观察上图中的事件链可知,以两条词汇链为线索构成,两条词汇链的范围跨越了6个句子,依次可以通过这条事件链判断以上新闻语篇的连贯性,具体表述为:对于给定的文本,在形式上假定事件(event)用e表示,如果事件链中存在n个事件,表示为事件集合{e1,e2,…,en},那么对于句子x则对应的事件为ex,集合中事件的论元和谓词又体现在词汇链上——体词性词汇链和谓词性词汇链,因此,事件链一方面反映篇章主题内容的同时,另一方面也体现了篇章的连贯性。

以上分析可知,一篇文章是否连贯,可依据通过构成这篇文章的事件链观察得知,事件链中事件的连贯性侧面体现了由事件链构成的语篇的连贯特征。由于句子是事件的主要载体,事件之间又有主次之分,由主要事件聚合而成的事件形成主要事件链。因此,我们称为超强事件链。此时,可以根据超强事件链来判断篇章的连贯性。换言之,判断一篇文章或一段话语是否连贯的标准可以通过寻找篇章内是否含有事件链来确定。事件链的数量不定,可以是一条,也可为多条。一旦发现事件链,则可判断篇章是连贯的,否则篇章可能不连贯。这里只是做一个假设,因为判断篇章连贯的标准有很多,如果不排除语境的干扰,仅凭事件链来判断过于武断。

上面我们分析了如何根据事件链判断语篇的连贯性,然而语篇的连贯性是一个逐渐逼近某一程度的问题,不是非此即彼的二元划分。将之分成连贯和间断,如果假设“X”值是判断一个语篇是否连贯的标准,那么对于语篇连贯的程度只能用正趋向和负趋向来表示,当语篇的连贯性无限逼近“X”值时,对于连贯的语篇的连贯范围我们表示为(x,+∞);当语篇连贯性较弱时,其连贯性无限远离“X”值时,此时对于语篇连贯性的范围我们表示为(-∞,x),那么对于连贯性取值中逐渐趋近的过程如何判断?换言之,如何确保连贯度的问题?

我们是通过词汇链来判断事件,从而进一步来判断事件链。那么依据这个顺序,首先需要通过词汇链的强弱程度分析其所含事件之间的语义关系。语义关系紧密的事件所构成的事件链连贯性也较强,反之亦然。上文我们以“X”值作为判断语篇连贯的标准,那么居于“X”值右侧的范围属于连贯的范畴。我们分为三个程度,越接近“X”值视为篇章的连贯性越强,即高度连贯、连贯、部分连贯,而“X”值左侧视为不连贯。我们用数轴表示,如图8所示。

图8 篇章连贯关系强弱度

事件链是篇章连贯的必要条件。事件链由事件和论元构成,二者互相关联构成篇章的核心部分。词汇链和事件链有怎样的关系?如何通过词汇链入手分析篇章的连贯关系?前面我们讲到词汇链有强词汇链和弱词汇链之分,那么可以得出存在于词汇链中的事件也一定有主次之分。同理,如果词汇链越强,则构成词汇链的事件对于篇章连贯的贡献就越大。在同一事件链上,包含核心事件和非核心事件,他们的关系即他们与篇章连贯性的关系为:(1)篇章中的核心事件链只有一条,由核心事件组成,体现篇章核心思想;(2)非核心事件链的数量不限,事件之间也相互关联从而形成局部事件链,分散在各段落中。也可理解为局部核心思想;(3)核心事件链与非核心事件链以及局部事件链之间的关系为:非核心事件链构成局部事件链,二者皆支撑核心事件链,同时,核心事件链对其进行控制,是二者的上位概念;(4)对于篇章连贯性的贡献,核心事件链大于局部事件链;(5)词汇链和关系链构成事件链之间的串联形式。

对于上文定义的文章的连贯强度,可以做如下理解:(1)高度连贯即核心词汇链+核心事件链;(2)连贯即核心词汇链+非核心事件链;(3)部分连贯:非核心词汇链+非核心事件链;(4)不连贯:只含有词汇链,不含事件链。可以看出事件链是语篇连贯的前提和必要条件。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈