在本书撰写之前,我们有必要对书中经常用到的一些基本术语进行界定。
话语意义,指面向计算的话语意义,主要针对话语的理解过程,不涉及话语生成的部分。
可计算性,指根据话语计算的内容和条件,抽象出可形式化表征的结果,通过算法实现形式模型,达到计算机对话语意义的理解。
语法性词汇标记,指语法意义上的标记成分,属于连接性标记成分。例如,连词、连接副词和介词词组等。
语义性词汇标记,指词汇意义上的标记成分,属于非连接性标记成分。主要由实义词或实义短语充当。(梁国杰,2015)
话语连贯关系,指构成话语的句子形式上前后连贯,语义上互相关联,意在实现话语生成者的交际意图。话语中各个句子或语段之间的语义关系是话语连贯性的主要体现,这些语义关系又称为话语的连贯关系(coherence relations)。
显式连贯关系,主要由语法性词汇标记来识别,其集合的封闭性为计算机自动识别语义关系提供了依据。(www.daowen.com)
隐式连贯关系,指缺少语法性词汇的标记的小句之间的关系。
论文中出现的语篇、篇章和话语不做具体区分,均表示待分析文本。
强不适定问题(strongly ill-posed problem),指在自然语言处理过程中,通过形式模型建立的算法无法满足全部的问题求解要求,这种情况下,需要加入适当的约束条件(constraint conditions),将部分问题转化为“适定问题(well-posed problem)”进行求解。
话语标记语,指用来提示连贯关系的一种语言手段,也可称为话语联系语(discourse connectives)、连接词(conjunctives)等,汉语语言学界通常将这类不直接表达命题内容的词或短语称为关联词语,它们标记话语的连贯关系,却与被论及事物的本身无关。(李佐文,2003)
共同心智状态,指“共享知识(shared knowledge)”“相互知识(mutual knowledge)”“共同背景(common ground)”“共同知识(common knowledge)”“共享内容(shared content)”“相互信念(mutual belief)”“共享信念(shared belief)”这些具有共享信息的概念。
语境,指言语交际的环境,分为三类:一是上下文语境,即以目标词所在句为中心,其前后范围内的句子;二是现场语境,即言语交际的时间、空间环境,包括具体的物质环境及其性质特征;三是背景语境,包括个人和社会文化背景。(孙维张,1991:84-85)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。