基于SA-LDA主题模型的特征词与观点词识别算法主要依靠“情感-属性对”在词语表上的分布矩阵,判断词语是否为观点词或者特征词。因此,为了构建有效而稳定的SA-LDA模型,以保证词语的聚类效果,需要认真考虑模型的初始化问题,尤其是模型中关键参数的初始值设置。
需要初始化的模型参数包括:α,β,迭代次数I,产品属性数量A和情感类型数量S。根据LDA主题模型构建的相关研究[129-137],这些模型参数对SALDA主题模型的影响主要表现在以下几个方面:
(1)参数α反映了产品评论中各“情感-属性对”之间的相对强弱,所以α<1;并且α越小,SA-LDA主题模型倾向于为每个评论片段分配的“情感-属性对”越少,其中分配数量为1是最理想的输出结果。
(2)参数β反映了常见的共现词语通过聚类形成的类别大小,以及词语对“情感-属性对”的识别和解释能力,影响着词语在不同“情感-属性对”下的概率分布。
(3)迭代次数主要影响SA-LDA主题模型的运算效率。
(4)产品属性的数量则影响“情感-属性对”的提取,以及不同“情感-属性对”之间的区分度。产品属性数量越大,SA-LDA主题模型提取的潜在“情感-属性对”表达的含义越具体,词语的聚类效果越好。然而,数量过大导致SA-LDAGibbs抽样运算的时间复杂度过高,运行效率低下。
在以上参数中,模型的超参数α和产品属性的数量对特征词与观点词识别性能的影响最为显著。
此外,该算法还根据“情感-属性对”在词语表上的概率分布,选择概率最高的前N个词语,生成候选特征词和候选观点词集合。因此,SA-LDA主题模型对特征词与观点词的识别性能还受到候选词集规模的影响。
本书以训练语料为基础,设计对比实验,确定最佳的模型超参数α、产品属性的数量A和每个“情感-属性对”的候选词数量N。其中,训练语料包括手机、数码相机和笔记本电脑三类产品的评论各1 000条。
在特征词与观点词识别算法中(详见3.3.2节),通过预先设定阈值,区分观点词和候选特征词。这表明观点词和特征词识别的性能为互补关系,此消彼长。为了得到较好的、均衡的效果,本书综合考虑特征词和观点词识别结果,对二者的准确率、召回率和调和评价值均取算数平均值,以此作为特征词与观点词识别性能的对比基础。
图3-8至图3-16展示了超参数α的取值,产品属性的数量以及候选词集的规模对特征词和观点词识别性能的影响。
根据图3-8至图3-16的实验结果,综合地考虑模型运算的效率(即时间复杂度)和性能(主要以调和评价值衡量),为模型的参数进行初始值设置。在三类产品的训练语料上,当超参数α=0.1,产品属性数量A=70,候选词数量N=50时,特征词和观点词识别算法获得相对较高的调和评价值。
图3-8 α取值对特征词与观点词识别的影响(手机评论)
图3-9 α取值对特征词与观点词识别的影响(数码相机评论)(www.daowen.com)
图3-10 α取值对特征词与观点词识别的影响(笔记本电脑评论)
图3-11 产品属性的数量A对特征词与观点词识别的影响(手机评论)
图3-12 产品属性的数量A对特征词与观点词识别的影响(数码相机评论)
图3-13 产品属性的数量A对特征词与观点词识别的影响(笔记本电脑评论)
图3-14 候选词数量N对特征词与观点词识别的影响(手机评论)
此外,结合已有文献提供的经验数据[15-18],其他参数的最佳初始值为:情感类型数量S=2,迭代次数设定为1 000次,影响特征词分布的βdomain=0.1,影 响其他词语分布的βc=0.001。此外,对于“正面-属性”,设置影响正面情感分布的βp=0.1,设置影响负面情感词分布的βn=0;对于“负面-属性”,则设置βn=0.1和βp=0。
图3-15 候选词数量N对特征词与观点词识别的影响(数码相机评论)
图3-16 候选词数量N对特征词与观点词识别的影响(笔记本电脑评论)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。