【摘要】:网络舆情信息聚合单元抽取系统的数据库所用到的表及详细设计如下:项目表:项目表是用于存储每次单独分析内容的表,用于区分不同的分析过程,其中包括项目编号、项目名、项目描述详情和项目创建时间。表7-4实体关系表实体属性关联表:实体属性关联表存储的是根据实体以及实体属性关系表,用于反映该实体可用表中所示的属性来进行描述,形成网络舆情分析中的具体情境。
网络舆情信息聚合单元抽取系统的数据库所用到的表及详细设计如下:
项目表:项目表是用于存储每次单独分析内容的表,用于区分不同的分析过程,其中包括项目编号、项目名、项目描述详情和项目创建时间(见表7-1)。
表7-1 项目表
资源原文内容表:原文内容表是用于存储从网上抓取到的文本经过预处理的信息和文本自身原本的信息,其中包括文本编号、项目编号、文本标题、文本来源(IP地址)、文本发表时间、文本赞同数、文本内容、信息发布者(见表7-2)。
表7-2 资源原文内容表
词语切分表:词语切分表用于存储对预处理后以及切割之后的单句文本进行分词,过滤掉无意义的词语之后,剩下的能够反映原文观点词语。其中包括的字段为:词组编号、项目编号、原文编号、名词库(包括人物名词库、机构名词库、地理名词库,不能划入以上三类的则归入其他名词库)、动词库、形容词库、时间(见表7-3)。
表7-3 词语切分表
(www.daowen.com)
续表
实体关系表:实体关系表存储的是根据实体以及关系识别模式识别出来的人物与人物之间的关系、人物与机构之间的关系、机构与机构之间的关系列表。用以形成网络舆情分析中的具体情境。其中包括的字段如表7-4所示。
表7-4 实体关系表
实体属性关联表:实体属性关联表存储的是根据实体以及实体属性关系表,用于反映该实体可用表中所示的属性来进行描述,形成网络舆情分析中的具体情境。其中包括的字段有:属性配对编号、项目编号、名词、名词频率、动词库、形容词库(见表7-5)。
表7-5 实体属性关联表
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关面向应对决策的网络舆情信息聚合研究的文章