【摘要】:实验1是在三类产品的测试语料上进行对比实验,通过比较算法自动识别的隐式特征词与人工标注结果,衡量在不同阈值下得到的特征指示观点词用于识别隐式特征词的精度,从而确定阈值T3。当达到一定阈值后,隐式特征词识别的准确率反而开始下降,说明阈值T3过小可能会导致将一些通用观点词误认为特征指示观点词,使得隐式特征词的识别过程产生杂音,从而影响最终的识别精度。
由于隐式特征词的识别依赖于特征指示观点词,所以其识别性能直接受到特征指示观点词识别精度的影响。本实验并未对特征指示观点词进行标记,而是通过隐式特征词识别的对比实验,确定特征指示观点词识别时的阈值,以保证隐式特征词识别具有较高的准确率。
实验1是在三类产品的测试语料上进行对比实验,通过比较算法自动识别的隐式特征词与人工标注结果,衡量在不同阈值下得到的特征指示观点词用于识别隐式特征词的精度,从而确定阈值T3。实验结果如表4-3—表4-5所列。
表4-3 不同阈值下的隐式特征词识别比较结果(手机评论)
表4-4 不同阈值下的隐式特征词识别比较结果(数码相机评论)(www.daowen.com)
表4-5 不同阈值下的隐式特征词识别比较结果(笔记本电脑评论)
通过分析表4-3—4-5中的结果,在三类产品的测试语料上,特征指示观点词识别的阈值T3越小,隐式特征词识别的准确率越高。但是其增长幅度却越来越小,说明算法渐趋于稳定。当达到一定阈值后,隐式特征词识别的准确率反而开始下降,说明阈值T3过小可能会导致将一些通用观点词误认为特征指示观点词,使得隐式特征词的识别过程产生杂音,从而影响最终的识别精度。因此,令手机评论挖掘时的阈值T3=0.45,数码相机评论挖掘时的阈值T3=0.2,以及笔记本电脑评论挖掘时的阈值T3=0.1。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。