理论教育 特征词与观点词到领域本体的映射

特征词与观点词到领域本体的映射

时间:2023-06-01 理论教育 版权反馈
【摘要】:如果关联度大于该特征词的相关术语集合中的最小值,则确定该观点词为特征词对应概念的相关术语,并且将其映射到领域本体的相应位置。此外,由于特征词与观点词之间的关联度取值在单位区间[0,1],因此需将原值进行线性缩减。

特征词与观点词到领域本体的映射

1.特征词到领域本体的映射

根据本书对基本概念的定义(详见第一章1.4.1),特征词为描述产品组成、功能及其属性的词语,与领域概念之间存在关联关系、隶属关系和同义关系(图4-2)。因此,本书利用特征词与领域概念之间的语义关系,将特征词映射到领域本体的概念空间。具体的映射方式如下:

(1)判断特征词是否为领域概念的相关术语。通过关联度算法(式(3-39)),计算特征词与概念的关联关系,如果关联度大于该概念的相关术语集的最小值(ass(c,t)min),则确定该特征词为概念的相关术语,并且将特征词映射到领域本体中的相应位置。

(2)判断特征词是否为概念的子类。通过隶属度算法(式(4-1)),计算特征词与概念的隶属关系,将高于阈值T1(根据已有的研究,T1=0.025[167])的特征词判定为概念的子类,并且映射到领域本体中的相应位置。

(3)判断特征词是否为概念的实例。通过对中文产品评论的语言进行分析,发现概念的实例具有相似的表现形式(例如“价格”的实例“价钱”和“价位”都包含字符“价”)。所以先将特征词分解为字符组合,再根据这些字符查询领域本体的概念空间。如果领域本体中存在含有相同字符的概念或概念实例,则利用相似度算法(式(4-2)),计算该特征词与概念的同义关系,并且将高于阈值T2(根据已有研究,T2=0.3[168])的特征词判定为该概念的实例,映射到领域本体中的相应位置。(www.daowen.com)

在将特征词映射到领域本体的概念空间后,还可以利用本体的分层结构对特征词进行汇总,以便于对评论挖掘的结果进行统计分析。领域本体的下一级概念为上一级概念的组成部分、属性或属性值,相当于上一级概念在抽象层次上的分解与细化。所以除根节点外,领域本体第一层的概念是对其所在分支的高度概括。在确定特征词在领域本体中的位置后,可以沿着其所在的分支,层层向上追溯,最终将其映射到位于该分支根节点上的概念。

2.观点词到领域本体的映射

根据本书对基本概念的定义(详见第1章1.4.1),观点词是表达用户情感的、用于评价特征词的词语,与其修饰的特征词之间存在着关联关系。类似于特征词的映射方法,本书利用关联度算法(式(3-39))计算观点词与特征词的关联关系。如果关联度大于该特征词的相关术语集合中的最小值,则确定该观点词为特征词对应概念的相关术语,并且将其映射到领域本体的相应位置。

其中,Pr(f)=nf/N为特征词f出现在窗口(大小为8个字符)中的概率(nf为包含特征词f的窗口数量,N为语料中的窗口数量)。同理,Pr(o)为观点词o出现在窗口中的概率,分别为特征词f与观点词o未出现在窗口中的概率,Pr(f,o)为特征词f与观点词o同时出现在窗口中的联合概率,为特征词f与观点词o均未出现在窗口中的联合概率。此外,由于特征词与观点词之间的关联度取值在单位区间[0,1],因此需将原值进行线性缩减

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈