通过对网络舆情信息聚合要素的具体分析归纳,选定七个大类作为网络舆情事件本体的主要属性,并对其进行层次化分析,找出各自的子类,形成层次结构。从希望达到描述网络舆情事件到何种程度的视角,对其属性进行定义和必要的约束限制,以有效反映类间关系。根据前述网络舆情信息聚合概念框架,本书拟建立的是一个通用的网络舆情事件本体,其主要模块如图6-2所示。
图6-2 网络舆情事件本体
考虑重用性、可维护性及其演变的可能性,大型本体通常采用模块化的方式来构建。本书的主要设计目标是创建一个高度模块化的本体,通过合并已经建立的本体规范来表达更通用的元数据概念,以达到聚合网络舆情应对决策中所需要的信息和知识的目的。本体模型中,“人物”可以重用FOAF[21]中对人物及人物关系的描述规范,“时间”可以重用DC元数据规范等。从舆情应对全过程的角度,为满足决策需求,信息资源的来源考虑更广泛,包括网络意见、专家意见、案例、政府文件、威胁测评报告等,构建起原始数据及其利用之间的联系。这些不同来源的信息都具备7个核心类:来源、人物、机构、时间、环境、关键词和主题描述。接下来,本书将详细分析这7个核心类。
(1)来源
由于细粒度信息聚合是对源资源的信息抽取和利用,“来源”类可以建立起源资源与网络舆情信息分析所使用知识之间的关系。例如信息检索时记录了知识的来源包括某博客网站URL、专家系统、政府文件系统,说明为了满足该决策者的需求,需要从以上三种途径获取知识。
表6-2 核心类“来源”定义
(2)人物
人物是聚合网络舆情事件信息的核心类,可以划分为评论者、被评论者、决策者和资源创建者四类,既包括个体,也包括群体。“人物”类是实现来自科研领域、社会实践领域和政府决策领域三个主体的信息聚合的重要途径。例如,在聚合模型层级二,决策者可以根据人物类信息聚合发现意见领袖、焦点人群,也可以发现拥有某类型知识的专家,还可以跟踪特定个体或人群的网络形象变化。
表6-3 核心类“人物”定义
(3)机构
机构是聚合网络舆情事件信息的核心类,可以划分为意见持有机构(评论机构)、意见指向机构(被评论机构)、资源创建机构三类。“机构”类是实现来自科研领域、社会实践领域和政府决策领域三个主体的信息聚合的重要途径。例如,在聚合模型层级二,决策者可以根据机构类信息聚合发现机构间关系变化,也可以发现拥有某类型知识的机构,还可以跟踪特定机构的网络形象变化。
表6-4 核心类“机构”定义
续表
(4)时间(www.daowen.com)
时间是聚合网络舆情事件信息的核心类,可以划分为网络舆情事件发生时间、资源创建时间、信息发布时间、评论时间、转载时间等五类。“时间”类是实现多维度信息聚合的重要途径。例如,在聚合模型层级一,可以进行基于时间轴的信息聚合,呈现网络舆情信息传播的关键节点。在聚合模型层级二,可以基于时间轴的信息聚合,呈现舆情事件的核心人物、核心机构、核心主题随时间变化的状态。
表6-5 核心类“时间”定义
(5)地点
地点是聚合网络舆情事件信息的核心类,可以划分为网络舆情事件发生地所属的行政区划、网民位置(IP地址)、空间区域等三类。“地点”类是实现多维度信息聚合的重要途径,基于地点共现的聚合,可以在聚合层级一分析网络舆情事件传播范围,也可以在聚合层级二呈现参与舆情事件的网民的地理分布,还可以在聚合层级三实现科研知识与风险测评的聚合。
表6-6 核心类“地点”定义
(6)关键词
关键词是信息主题特征的表达,可以使用受控语言,也可以使用非受控语言来进行表达。从类型上看可以划分为内容关键词、图标关键词两类。基于关键词的聚合,是决策过程中为决策者提供专家知识供给的重要途径。
表6-7 核心类“关键词”定义
续表
(7)主题描述
语义概念的使用可以让信息资源的主题更为清晰,根据特定的主题或话题可以实现信息资源的聚合,同时,语义概念的层次结构,可以使主题的扩大或缩小变得更容易。
表6-8 核心类“主题描述”定义
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。