理论教育 现有研究存在的缺陷及优化建议

现有研究存在的缺陷及优化建议

时间:2023-06-01 理论教育 版权反馈
【摘要】:现有研究的不足具体表现在以下两个方面:基于统计自然语言处理的方法仅仅根据特征词和观点词在语料中出现的位置或者共现性衡量二者的搭配关系,导致配对的准确性不高。此外,该方法只针对语料中出现的词语进行统计分析,无法有效地识别隐式特征词。基于语义分析的方法受到人工干预较大,领域可移植性不强。此外,语法规则库需要人工定义和扩展,具有一定的局限性,无法很好地覆盖所有可能的实例。

现有研究存在的缺陷及优化建议

在第3章的基础上,本章对已经识别的特征词与观点词进行配对,从而生成特征观点对。根据第2章文献综述,现有特征词与观点词配对的研究大致可以分为两类:基于统计自然语言处理的方法和基于语义分析的方法。这两类研究方法主要是根据语料中词语的位置、共现性或者语法规则等,匹配特征词与观点词。这种方法的不足是只考虑了特征词与观点词在语料中表现的表面关系,却忽略了它们之间的潜在语义关系。现有研究的不足具体表现在以下两个方面:

(1)基于统计自然语言处理的方法仅仅根据特征词和观点词在语料中出现的位置或者共现性衡量二者的搭配关系,导致配对的准确性不高。此外,该方法只针对语料中出现的词语进行统计分析,无法有效地识别隐式特征词。

(2)基于语义分析的方法受到人工干预较大,领域可移植性不强。该方法依赖于大量规范标注的语料,但是在中文情感分析领域中,还没有规范标注的、用来进行特征词和观点词配对的语料库。此外,语法规则库需要人工定义和扩展,具有一定的局限性,无法很好地覆盖所有可能的实例。(www.daowen.com)

由于领域本体定义了特定领域中相关概念,以及概念之间的抽象关系,所以能够较好地描述特征词与观点词之间潜在的语义关系。因此,本章通过自动构建面向产品评论的领域本体,进行特征词与观点词的配对。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈