【摘要】:总体而言,现有情感强度计算与极性分类研究的不足主要是未能考虑上下文语境对观点词情感的影响,尤其是特征词、否定词、双重否定词和程度副词对观点词情感强度与极性的限制与调节作用。此外,虽然采用更加复杂的句法分析能够在一定程度上提高情感分析的准确率,却受到依存句法分析器精度的影响,使得情感强度计算与极性分类的性能提高受到限制。
总体而言,现有情感强度计算与极性分类研究的不足主要是未能考虑上下文语境对观点词情感的影响,尤其是特征词、否定词、双重否定词和程度副词对观点词情感强度与极性的限制与调节作用。
基于语料的方法仅仅考虑了连接词等简单的语法要素,并不足以体现上下文语境在观点词情感分析中的作用,还需要分析观点词的评价对象以及观点修饰词对其情感强度与极性的影响。此外,虽然采用更加复杂的句法分析能够在一定程度上提高情感分析的准确率,却受到依存句法分析器精度的影响,使得情感强度计算与极性分类的性能提高受到限制。同时,对于口语化严重和语法不规范的中文产品评论,句法分析方法需要对语料进行复杂的计算,运行速度较慢,效率较低。
基于情感词典的方法只根据观点词在词典中的定义计算情感强度,以及判断情感极性,却未将观点词放到语料中,分析其情感强度与极性随上下文语境的不同而发生的动态变化。这类研究方法的不足主要表现在以下几个方面。
(1)极大程度地依赖于通用的情感词典,或者人工构建的、面向特定领域的词典,使得情感强度计算与极性分类的性能受到词典定义准确性的影响。(www.daowen.com)
(2)词典可能面临一词多义的问题,特别是当上下文语境不同时,词语表达的情感也随之发生变化,所以情感词典通常包含歧义词语,从而不利于情感强度的计算与极性的判断。
(3)无法计算与判断产品评论中一些口语化词语和流行新词的情感强度与极性,例如“处理器很垃圾”里的“垃圾”是评论常用的观点词。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。