理论教育 网络舆情信息聚合研究:核心类提取及定义

网络舆情信息聚合研究:核心类提取及定义

时间:2023-10-29 理论教育 版权反馈
【摘要】:接下来,本书将详细分析这7个核心类。表6-3核心类“人物”定义机构机构是聚合网络舆情事件信息的核心类,可以划分为意见持有机构、意见指向机构、资源创建机构三类。表6-6核心类“地点”定义关键词关键词是信息主题特征的表达,可以使用受控语言,也可以使用非受控语言来进行表达。表6-8核心类“主题描述”定义

网络舆情信息聚合研究:核心类提取及定义

通过对网络舆情信息聚合要素的具体分析归纳,选定七个大类作为网络舆情事件本体的主要属性,并对其进行层次化分析,找出各自的子类,形成层次结构。从希望达到描述网络舆情事件到何种程度的视角,对其属性进行定义和必要的约束限制,以有效反映类间关系。根据前述网络舆情信息聚合概念框架,本书拟建立的是一个通用的网络舆情事件本体,其主要模块如图6-2所示。

图6-2 网络舆情事件本体

考虑重用性、可维护性及其演变的可能性,大型本体通常采用模块化的方式来构建。本书的主要设计目标是创建一个高度模块化的本体,通过合并已经建立的本体规范来表达更通用的元数据概念,以达到聚合网络舆情应对决策中所需要的信息和知识的目的。本体模型中,“人物”可以重用FOAF[21]中对人物及人物关系的描述规范,“时间”可以重用DC元数据规范等。从舆情应对全过程的角度,为满足决策需求,信息资源的来源考虑更广泛,包括网络意见、专家意见、案例、政府文件、威胁测评报告等,构建起原始数据及其利用之间的联系。这些不同来源的信息都具备7个核心类:来源、人物、机构、时间、环境关键词和主题描述。接下来,本书将详细分析这7个核心类。

(1)来源

由于细粒度信息聚合是对源资源的信息抽取和利用,“来源”类可以建立起源资源与网络舆情信息分析所使用知识之间的关系。例如信息检索时记录了知识的来源包括某博客网站URL、专家系统、政府文件系统,说明为了满足该决策者的需求,需要从以上三种途径获取知识。

表6-2 核心类“来源”定义

(2)人物

人物是聚合网络舆情事件信息的核心类,可以划分为评论者、被评论者、决策者和资源创建者四类,既包括个体,也包括群体。“人物”类是实现来自科研领域社会实践领域和政府决策领域三个主体的信息聚合的重要途径。例如,在聚合模型层级二,决策者可以根据人物类信息聚合发现意见领袖、焦点人群,也可以发现拥有某类型知识的专家,还可以跟踪特定个体或人群的网络形象变化。

表6-3 核心类“人物”定义

(3)机构

机构是聚合网络舆情事件信息的核心类,可以划分为意见持有机构(评论机构)、意见指向机构(被评论机构)、资源创建机构三类。“机构”类是实现来自科研领域、社会实践领域和政府决策领域三个主体的信息聚合的重要途径。例如,在聚合模型层级二,决策者可以根据机构类信息聚合发现机构间关系变化,也可以发现拥有某类型知识的机构,还可以跟踪特定机构的网络形象变化。

表6-4 核心类“机构”定义

续表

(4)时间(www.daowen.com)

时间是聚合网络舆情事件信息的核心类,可以划分为网络舆情事件发生时间、资源创建时间、信息发布时间、评论时间、转载时间等五类。“时间”类是实现多维度信息聚合的重要途径。例如,在聚合模型层级一,可以进行基于时间轴的信息聚合,呈现网络舆情信息传播的关键节点。在聚合模型层级二,可以基于时间轴的信息聚合,呈现舆情事件的核心人物、核心机构、核心主题随时间变化的状态。

表6-5 核心类“时间”定义

(5)地点

地点是聚合网络舆情事件信息的核心类,可以划分为网络舆情事件发生地所属的行政区划、网民位置(IP地址)、空间区域等三类。“地点”类是实现多维度信息聚合的重要途径,基于地点共现的聚合,可以在聚合层级一分析网络舆情事件传播范围,也可以在聚合层级二呈现参与舆情事件的网民的地理分布,还可以在聚合层级三实现科研知识与风险测评的聚合。

表6-6 核心类“地点”定义

(6)关键词

关键词是信息主题特征的表达,可以使用受控语言,也可以使用非受控语言来进行表达。从类型上看可以划分为内容关键词、图标关键词两类。基于关键词的聚合,是决策过程中为决策者提供专家知识供给的重要途径。

表6-7 核心类“关键词”定义

续表

(7)主题描述

语义概念的使用可以让信息资源的主题更为清晰,根据特定的主题或话题可以实现信息资源的聚合,同时,语义概念的层次结构,可以使主题的扩大或缩小变得更容易。

表6-8 核心类“主题描述”定义

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈