自然语言理解中至少有三个主要问题。第一,需要具备大程序量的人类知识。语言动作描述的是复杂世界中的关系,关于这些关系的知识必须是理解系统的一部分。第二,语言是基于模式的:音素构成单词,单词组成短语和句子。音素、单词和句子的顺序不是随机的,没有对这些元素的规范使用,就不可能达成交流。最后,语言动作是主体(agent)的产物,主体或者是人或者是计算机。主体处在个体层面和社会层面的复杂环境中,语言动作都是有其目的的。
从微观上讲,自然语言理解是指从自然语言到机器内部的映射;从宏观上看,自然语言是指机器能够执行人类所期望的某些语言功能。这些功能主要包括如下几方面。
①回答问题:计算机能正确地回答用自然语言输入的有关问题。
②文摘生成:机器能产生输入文本的摘要。
③释义:机器能用不同的词语和句型来复述输入的自然语言信息。
④翻译:机器能把一种语言翻译成另外一种语言。
许多语言学家将自然语言理解分为五个层次:语音分析、词法分析、句法分析、语义分析和语用分析。
(1)语音分析
语音分析就是根据音位规则,从语音流中区分出一个个独立的音素,再根据音位形态规则找出一个个音节及其对应的词素或词。(www.daowen.com)
(2)词法分析
词法指词位的构成和变化的规则,主要研究词自身的结构与性质。词法分析的主要目的是找出词汇的各个词素,从中获得语言学信息。
(3)句法分析
句法是指组词成句的规则,描述句子的结构,词之间的依赖关系。句法是语言在长期发展过程中形成的,全体成员必须共同遵守的规则。句法分析是对句子和短语的结构进行分析,找出词、短语等的相互关系及各自在句子中的作用等,并以一种层次结构加以表达。层次结构可以是反映从属关系、直接成分关系,也可以是语法功能关系。自动句法分析的方法主要有短语结构文法、格文法、扩充转移网络、功能文法等。
(4)语义分析
语义分析就是通过分析找出词义、结构意义及其结合意义,从而确定语言所表达的真正含义或概念。
(5)语用分析
语用就是研究语言所存在的外界环境对语言使用所产生的影响。它描述语言的环境知识,语言与语言使用者在某个给定语言环境中的关系。关注语用信息的自然语言处理系统更侧重于讲话者/听话者模型的设定,而不是处理嵌入到给定话语中的结构信息。学者们提出了多钟语言环境的计算模型,描述讲话者和他的通信目的,听话者和他对说话者信息的重组方式。构建这些模型的难点在于如何把自然语言处理的不同方面以及各种不确定的生理、心理、社会及文化等背景因素集中到一个完整连贯的模型中。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。