【摘要】:在评价产品价格的褒义观点词中,虽然都是表达正面的情感,但是它们表达的情感强度却不相同。也就是说,观点词情感强度的模糊性和不确定性在两个词表中达到了21.3%。综合上述,观点词的情感强度具有模糊性。因此,在细粒度情感分析中,量化观点词的情感强度,将有助于全面和真实地反映特征观点对的情感,使分析结果更加接近实际情况。
在产品评论中,用户观点实际上是观点词本身及其修饰词组合而成的复合短语。其中,观点词是情感表达的基础词,观点修饰词是情感的调节器,起到调整观点词情感强度和情感极性的作用。例如,在“好”的前面加上程度副词“很”,使得“很好”表达的积极情感程度增强。
观点词的情感强度表现出模糊性。在评价产品价格的褒义观点词中,虽然都是表达正面的情感,但是它们表达的情感强度却不相同。从观点词的语义上看,“廉价”比“便宜”所描述的价格更低,其表达的肯定态度更强,但是增强的程度却是一个模糊值。
在情感强度模糊性的研究中,大部分学者通过人工标注语料库,对词语的情感强度进行量化。在语料库标注时,受人为的主观因素影响,不同语料库之间乃至不同标注者之间都很难达成一致。这种不一致主要表现在以下两个方面:
(1)多个语料库之间的不一致。Andreevskaia等[87]对GI-H4[173]和HM[78]两个观点词词表进行了一致性研究,两个词表的一致性仅达到78.7%。也就是说,观点词情感强度的模糊性和不确定性在两个词表中达到了21.3%。(www.daowen.com)
(2)不同的标注者之间的不一致。Wilson等人[174-175]在MPQA语料库中,将观点词标注为4个级别:中立、低、中、高。在标注过程中,标注者之间由于理解的不同很难在标注结果上达成一致。最终在整个语料库中达成一致的标注仅占61%。
综合上述,观点词的情感强度具有模糊性。因此,在细粒度情感分析中,量化观点词的情感强度,将有助于全面和真实地反映特征观点对的情感,使分析结果更加接近实际情况。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。