1.基线方法
在特征词与观点词识别的对比实验中,分别从统计自然语言处理和语义分析这两类研究中选取具有代表性的算法作为基线方法,与本书提出基于LDA主题模型的算法进行对比。
(1)基于关联规则与邻近匹配原则的算法:基线方法1重现Hu和Liu提出的方法[6]。首先对产品评论进行分词与词性标注,提取句中的名词和名词短语作为候选特征词,并且利用关联规则提取频繁项作为特征词;然后将离特征词最近的形容词当作观点词;最后用观点词查找未被提取的低频名词或词组以识别更多的特征词。
(2)基于语法规则与How Net词典的算法:基线方法2中重现Popescu和Etzioni等人提出的方法[7,23]。首先,对评论句进行分词与词性标注,提取句中的名词和名词短语作为候选特征词;然后,按照产品特征的分类(属性、部件、部件属性、相关概念、相关概念的属性),利用点互信息值(PMI)对提取的词语进行贝叶斯分类,从而识别特征词;接着,以特征词为中心,通过预先定义的10条规则来查找潜在的观点词;最后,通过How Net计算潜在观点词的情感强度,将情感强度较高的候选词识别为观点词。
2.实验结果比较与评价
为了便于分析与比较,本书分别对特征词识别与观点词识别进行了对比实验,结果如表3-10和表3-11所列。实验结果表明,基于SA-LDA主题模型的算法具有较好的特征词与观点词识别能力。
表3-10 特征词识别的对比实验结果
表3-11 观点词识别的对比实验结果
通过综合分析表3-10和表3-11中的结果,可得出以下结论:(www.daowen.com)
(1)总的来说,在三类产品的测试语料上,不论是特征词识别还是观点词识别,基于SA-LDA主题模型的算法的调和评价值都显著高于两个基线方法,充分说明了本书对于特征词与观点词识别方法的改进与提高。其原因在于,SA-LDA主题模型能够很好地挖掘词语在评论片段中的共现模式,聚类效果明显优于关联规则与语法规则。需要说明的是,虽然基于语法规则与How Net词典的特征词识别准确率略高于本方法,但是其综合表现(即调和评价值)却显著低于本方法,这也反映了本方法的优越性。
(2)基于关联规则与邻近匹配原则的算法和基于语法规则与How Net词典的算法都只把名词或名词短语当作特征词。然而,在中文产品评论中,特征词还包括描述产品使用行为的动词,如“操作”和“使用”等。
(3)两个基线方法都仅将形容词作为观点词。然而,根据《统计自然语言处理》对情感词词性的统计[155],其中形容词约占53.4%,名词约占18%,动词约占27.1%,副词约占1.5%。因此,本书认为观点词还应包括名词、动词和副词,如“垃圾”、“还行”、“问题”、“给力”等。
(4)在三类产品的测试语料上,不论是特征词识别还是观点词识别,基于关联规则与邻近匹配原则的算法在准确率、召回率和调和评价值上都比较低。这反映了该方法在特征词与观点词识别上具有以下两点不足:
①该方法利用关联规则中的频繁项集提取高频特征词,它们有可能是评论中用于介绍背景或连接上下文的非特征词(例如“送货速度”),从而影响特征词识别的准确率。
②该方法获取观点词的过程具有经验性,用邻近匹配原则衡量特征词与观点词的关系过于简单和粗糙,使得观点词识别的准确率较低。
(5)相比之下,基线方法2在三类产品的测试语料上的实验效果都优于基线方法1。这间接地反映了挖掘词语的共现模式要比单纯考虑它们在评论句中出现的频率与位置更有价值。然而,该算法的特征词识别准确率虽然较高,但其召回率却明显不足,使得其调和评价值显著低于本书提出的算法。这反映了该方法在特征词与观点词识别上具有以下三点不足:
①该方法利用语法规则与词典识别特征词与观点词,针对性较强,但是却不一定适用于口语化严重和语法不规范的中文产品评论,其识别的性能受到既定规则的影响较大。
②该方法制定的语法规则过于简单,无法完全涵盖所有可能的词语共现实例,所以在特征词识别上虽然具有较高的准确率,但是其召回率却较低。
③词典通常包含歧义词语,面临一词多义的问题,特别是当上下文语境发生改变时,同一个词语可能表达不同的含义,从而不利于观点词的识别。
(6)根据特征词与观点词识别的平均调和评价值,基于SA-LDA主题模型的算法和两个基线方法在不同产品语料上的变化都不大。尤其是本书提出的算法在特征词识别与观点词识别上都取得了大于85%的调和评价值,说明其具有良好且稳定的领域可移植性。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。