基于LDA主题模型和领域本体的中文产品评论细粒度情感分析

现有研究存在的缺陷及优化建议

现有研究的不足具体表现在以下两个方面:基于统计自然语言处理的方法仅仅根据特征词和观点词在语料中出现的位置或者共现性衡量二者的搭配关系,导致配对的准确性不高。此外,该方法只针对语料中出现的词语进行统计分析,无法有效地识别隐式特征词。基于语义分析的方法受到人工干预较大,领域可移植性不强。此外,语法规则库需要人工定义和扩展,具有一定的局限性,无法很好地覆盖所有可能的实例。
理论教育 2023-06-01

情感强度计算:特征观点对

根据5.3.1节的分析,当观点词与不同的特征词搭配时,观点词的情感极性和情感强度都可能发生变化。因此,将特征词当作观点词的情感修正器,以观点词的情感强度为基础,特征词对观点词的修正作用为系数,共同计算特征观点对的情感强度。最后,将特征词对观点词的情感影响系数,以及程度副词的作用强度,代入观点词的情感强度计算公式中,得到整个特征观点对的情感强度值,如式(5-5)所示。
理论教育 2023-06-01

产品对比评测:基于特征观点对情感分析的实验研究

通过对产品评论中的特征观点对进行识别与情感分析,能够为消费者提供详细的用户评价与反馈信息。表5-11手机评论中的特征观点对及其情感极性与情感强度续表在此基础上,对产品各个特征的正面和负面评价进行统计,为消费者提供产品对比评测所需的信息。对于Nokia1050,同样从特征观点对的正面情感与负面情感的累积数值上看,用户对价格、电池和操作等特征给予了相对较高的积极评价,而对屏幕却持有相对较强烈的消极态度。
理论教育 2023-06-01

SA-LDA主题模型构建方法详解

相对于标准的LDA三层模型,SA-LDA主题模型新增了“评论片段”层,并且为模型的“产品属性”添加了“情感”的约束。图3-4SA-LDA主题模型的贝叶斯网络图解互联网上产品评论的附加信息反映了用户对产品的积极或者消极态度,所以将评论的整体情感当作可观测的随机变量λr。表3-2SA-LDA主题模型的贝叶斯网络图解中符号的含义续表综合上述,基于SA-LDA主题模型的评论生成过程如下。
理论教育 2023-06-01

设置SA-LDA主题模型参数初始值的实验

迭代次数主要影响SA-LDA主题模型的运算效率。产品属性数量越大,SA-LDA主题模型提取的潜在“情感-属性对”表达的含义越具体,词语的聚类效果越好。然而,数量过大导致SA-LDAGibbs抽样运算的时间复杂度过高,运行效率低下。因此,SA-LDA主题模型对特征词与观点词的识别性能还受到候选词集规模的影响。
理论教育 2023-06-01

实验语料的处理方法与技巧

表5-3实验语料的统计结果从表5-3可以看出,数码相机的正面评论包含的特征观点对总数小于其正面特征观点对的数量,而笔记本电脑的负面评论包含的特征观点对总数小于其负面特征观点对的数量。
理论教育 2023-06-01

产品评论对口碑的影响

德勤咨询的调查显示,有67%的网民会浏览产品评论,其中82%认为产品评论影响了他们的购买决策。CIC在2009年6月的一项研究中发现,81.2%的网络用户在过去一年实际购买商品时,都查询过相关的产品评论[186]。CIC调查的结果还表明,89.8%的被访者表示对产品评论会持续地关注;48.7%的被访者会关注自己喜爱的品牌;40.8%的被访者对特定的产品会保持关注。产品评论的口碑效应还能在一定程度上影响甚至转变消费者对商家的态度。
理论教育 2023-06-01

基于多属性离散选择的产品销量预测模型

由于为发表评论的用户对产品j属性k的正、负面评价,并非阅读评论的消费者对产品j属性k的价值感知。其中,A表示产品属性集合,表示产品属性k及其评价向量与权重向量的内积。根据式可以得出以下结论:消费者对不同产品属性的评价Evaluation(k,s)与消费者的期望(μk)的差值影响产品销量。
理论教育 2023-06-01

领域本体的初始化的分析介绍

本章采用本体学习技术自动构建领域本体。本体学习是半自动或者自动构建本体的一系列技术及方法,用于解决手工建立本体容易导致知识获取的瓶颈等问题。常用的方法包括基于字典的本体学习方法,基于文本的本体学习方法,基于半结构化数据的本体学习方法,以及基于知识库的本体学习方法[161-164]。根据本体的定义,概念具有规范化的表达形式,是领域内共同认可的词语。
理论教育 2023-06-01

面向“特征观点对”的情感分析基本流程

图5-1面向“特征观点对”的情感分析基本流程在细粒度情感分析中,情感词典作为基础词典为情感分析提供支持。然而,这种方法却丢失了特征观点对自身表达的情感强弱程度的差异,忽略了语言的本质。本章的基本思路:先计算特征观点对的情感强度,再确定情感强度的临界值,用于情感极性分类。以设计科学研究方法论为指导,分为模型设计、模型实现和模型评价三个阶段。
理论教育 2023-06-01

影响消费者购买决策的在线产品评论

产品评论引发的电子口碑已不容小觑。德勤咨询的调查显示,有67%的网民会浏览产品评论,其中82%认为产品评论影响了他们的购买决策。另据CNNIC《2013年中国网络购物市场研究报告》,对于所有年龄段的消费者而言,在购买陌生产品时主要考虑的所有因素中,用户评价都是最为显著的购买决策影响因素。其中,用户评价对于80后和90后消费者的影响尤为明显。
理论教育 2023-06-01

构建多属性离散选择模型的方法在不确定条件下的应用

因此,消费者在不确定条件下选择产品的效用函数如式(6-2)所示。其中,表示消费者对产品属性k的认知强度。根据6.2.3节的贝叶斯学习,消费者通过浏览产品评论,不断改变其对产品各个属性的认识。此外,假设随机误差εij与产品属性无关,并且服从标准Ⅰ型极值分布。
理论教育 2023-06-01

多元回归模型参数估计与显著性检验

同时,多元回归模型中目标解释变量的系数还与时间序列相关。在产品销量的多元回归模型中,产品价格Pricejt可能与随机误差项εjt相关,即E≠0。因此,对该假设进行显著性检验。
理论教育 2023-06-01

产品评论数值信息对销量的影响

但是在引入产品评论的文本信息后,星级评分对数码相机销量的影响却变为不显著。与之类似,在不包含产品评论文本信息的回归模型中,产品评论数量对数码相机和笔记本电脑销量的影响在1%水平上显著,也与其他相关研究得出的结论基本相符[109-112]。这些结果都说明,在手机、数码相机和笔记本电脑等电子产品市场上,口碑对产品销量的影响主要来自产品评论的文本信息,而非数值信息。
理论教育 2023-06-01

多元回归模型的显著性分析

根据表6-6的数据显示,在不包含产品评论文本信息的回归模型中,星级评分对数码相机销量的积极影响在1%的水平上显著。
理论教育 2023-06-01

构建领域本体模型实验二:优化方案

本实验采用OWL的自语言OWL Lite,描述面向产品评论的领域本体。图4-5面向手机评论的领域本体图4-6面向数码相机评论的领域本体图4-7面向笔记本电脑评论的领域本体实验2采用Protégé软件构建面向产品评论的领域本体。
理论教育 2023-06-01
-已经加载完成-