实验2采用RDF模式(Resource Description Framework Schema)和OWL语言(Web Ontology Language)构建面向产品评论的领域本体。其中,RDF模式(RDFS)是在RDF数据模型的基础上发展起来的,它不仅能定义概念的属性词语,还能定义其描述的概念类型及其取值范围。从功能上讲,RDFS本身并没有定义与领域相关的词语,它仅仅提供了一组核心概念和一套机制,并且支持进一步的领域建模。
OWL语言是W3C开发的一种网络本体语言,用于对本体进行语义描述。作为RDFS的扩展,OWL的目的是提供更多的建模原语以支持更加丰富的语义表达,并且保证描述逻辑(Description Logic,DL)的可判定推理。
本实验采用OWL的自语言OWL Lite,描述面向产品评论的领域本体。表4-6列出了领域本体的主要构造子,包括类、属性和实例等。
表4-6 面向产品评论的领域本体构造子
在实验2中,以手机、数码相机和笔记本电脑的评论为对象,依据产品参数说明以及已经识别的特征词与观点词,提取领域概念与领域术语,并且采用语义计算方法量化概念间的语义关系,从而构建面向产品评论的领域本体。手机、数码相机和笔记本电脑评论的领域本体的图形化表示结果如图4-5—4-7所示。
根据领域概念之间的语义关系,制定相应的本体推理规则,并且基于此进行特征词与观点词的配对。
具体的Jena Rule推理规则如下所示。
图4-5 面向手机评论的领域本体(部分示例)
(www.daowen.com)
图4-6 面向数码相机评论的领域本体(部分示例)
图4-7 面向笔记本电脑评论的领域本体(部分示例)
实验2采用Protégé软件构建面向产品评论的领域本体。该软件由斯坦福大学利用Java语言开发,是一个开放式架构的知识建模工具,可用于创建、编辑、可视化和操纵各种表现形式的本体,以获取相关知识。它不仅具有良好的可扩展性和简单灵活的用户定制界面,还具有其他一些特性,例如图形化本体编辑模式、支持多种数据库的存储模式、支持多种逻辑检测功能的推理机等。
作为面向产品评论的领域本体中最核心的模块,Jena推理机的加载过程如下:
(1)读取Protégé构建好的初始本体,创建Onto Model对象,将本体库中所有的数据以五元组的形式保存;(2)读取规则文件,解析并创建Rule对象,再通过Jena创建Reasoner对象;(3)通过前面得到的Onto Model对象和Reasoner对象调用Jena的ModelFactory工厂类,并且创建Inf Model对象。
当用户提交查询并且从OWL领域本体获取数据时,不仅能得到领域本体自身存放的数据,还可以得到由推理机产生的、蕴涵知识的数据。推理机模块的核心代码如下所示。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。