理论教育 话语意义的可计算性研究:线状图语义表征方法

话语意义的可计算性研究:线状图语义表征方法

时间:2023-10-30 理论教育 版权反馈
【摘要】:语篇线状图的表示形式是一个依据原文的顺序,通过话题内容将话语中的语段逐一列举的过程,对于话题的标签不予限制,因此这种表示也是最直接和简单的方法。由于通过线状图表征的语义信息是依据话语内容的顺序所做出的话题再现,因此,从宏观的角度其所展示的内容与原话语最接近。图13依存关系图Dependency Tree以上的五个句子间的语义关系是基于依存分析的表示方法。

话语意义的可计算性研究:线状图语义表征方法

语篇线状图的表示形式是一个依据原文的顺序,通过话题内容将话语中的语段(span)逐一列举的过程,对于话题的标签不予限制,因此这种表示也是最直接和简单的方法。

由于通过线状图表征的语义信息是依据话语内容的顺序所做出的话题再现,因此,从宏观的角度其所展示的内容与原话语最接近。我们可以通过概括性的命题标示话语内容的各部分情节内容,按照话语中信息出现的顺序进行表征,表征结果呈现的是一条表示话语主要话题的命题所组成的线。例如:

一个描述利用互联网订火车票的文本,其具体的订票过程的描写很烦琐,然而通过对每个步骤的命题进行提取可以以线状图的形式表示为:

登录→车票查询→车票预订→订单确认→网上银行选择→网银支付→支付成功

实际上,这样的描述就是文本的线状语义表征。这种语篇语义的表征手段是语篇理解的最基本的工作。虽然通过线状的表征可以标示出语篇的语义核心结构(core structure)信息,但是对于这些信息的形成过程却没有明确的说明,仅仅给出了语义结构的表征结果。

话语单元间的依存关系的表征也是呈线形排列的。1959年,Tesniere提出了stemma结构。目前,人们都认为他是依存文法在语言学上研究的第一人。Tesniere提出,句子中的词以及词和词之间的关系构成了句子的内在结构,句子中结构性的联系通过词之间的依存关系建立起来,即通过支配词(governer)和从属词(dependent)将句子联系起来。

自然语言处理过程中,适切的句法分析是必要的。而利用依存句法进行句法分析是自然语言理解的有效手段。这种分析以描述语言结构框架为目标,通过句子中词和词之间的依存关系理解句子结构,又称从属关系语法。它与成分句法差异巨大,认为结构没有非终结点,词和词之间构成依存关系,进而形成一个依存对。其中一个是由动词承当的支配词,其不受其他任何成分的支配,另一个是从属词。从属词和支配词是多对一的关系。换言之,一个从属词只能依附一个支配词,而一个支配词可以支配多个从属词。从属词也可以作为支配词被其他词依赖。同理,支配词也可作为从属词依赖于其他支配词。这种词和词之间支配和从属的关系即为依存关系,这种关系是有方向的,但并不对等。这样,依存句法结构就可以看作一棵依存句法树。

通常情况下,一个句子只包含一个谓词,这个谓词可以由动词、名词或形谓词充任,称为核心词。核心词对主语加以陈述,用来解释主语“做什么”“怎么样”或者“是什么”。依存树以核心词为根节点,依存关系的类型由依存对中两个相互依存的词决定。

计算语言学家J.Robinson(1970)提出四条公理用于分析句子依存关系:

(1)一个句子所包含的独立成分是唯一的;

(2)句子的其他成分都受某一成分支配;

(3)任何一个成分都至多依存于一个成分;(www.daowen.com)

(4)如果成分A和B是从属关系,A和B之间假设加入成分C,此时对于C的支配成分可能有三个:A或B或介于A和B之间的其他成分。

我们看下面的例子:

1)[John has a lovely evening]约翰度过了一个愉快的夜晚

2)[He had a great meal]他吃了大餐

3)[He ate salmon]吃了三文鱼

4)[He devoured cheese]吃了奶酪

5)[He won a dance competition]赢得了舞蹈比赛

这五个句子之间的依存关系如图13所示。

图13 依存关系图Dependency Tree

以上的五个句子间的语义关系是基于依存分析的表示方法。S1是总述句,它与S2—S5之间是详述关系,S2与S3和S4之间也是详述关系,S3与S4之间是并列关系,S2与S5之间也是并列关系。这种话语单元间的依存关系呈线形排列的表征形式,可以很容易地判断出话语单元简单语义关系,更有助于计算机对自然语言的识别理解。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈