基于情感词典的方法主要是计算评论中的词语和词典中的词语之间的语义倾向相似度,以此识别观点词。如果语义倾向相似度高,则认为该词语具有明显的情感极性,可以被判定为观点词。常用的情感词典包括英文的Word Net和中文的How Net。
Esuli和Sebastiani[34-35]首先人工定义观点种子词,然后依据Word Net中种子词语的释义,计算候选观点词与种子词的语义倾向相似度,以此识别观点词,并且建立情感词典SentiWord Net。
Su和Markert[36]首先基于Word Net区分主观词语和客观词语,然后在此基础上构建以主观词和客观词为顶点的无向图,最后利用最小切分法来切割无向图,将与主观词语属于同一切分中的词语识别为观点词。
Wu等[55]认为产品评论中的评价观点不适合用简单的情感极性词来描述。他们提出用图的方法表示文本的情感信息,图中的顶点是观点的发起者、评价对象和评价中心词等实体词,而图的边则是实体词之间的关系。(www.daowen.com)
李纯等[38]基于How Net判断词语的语义倾向性,从而识别观点词。首先选择具有明显情感倾向的词语作为观点种子词,然后结合上下文语境因素的影响,计算候选观点词与种子词之间的语义倾向相似度,以此判断候选词的褒贬倾向。
朱嫣岚等人[39]以How Net为基础,提出了两种语义倾向性计算的方法:一种是基于How Net同义词集的方法,另一种是基于语义分析相关场的方法。实验表明,在同一测试集上,基于How Net语义相似度的方法比基于语义分析相关场的方法在观点词识别上的准确率高,能达到80%以上。
杜伟夫等[40]提出了一个可扩展的情感极性计算框架,将词语的情感极性计算问题转化为优化问题。首先利用多种语义相似度计算方法构建词语的无向图,然后利用最小切分法对该图进行划分,最后模拟退火算法求解目标函数的最优值。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。