在这一节中,本书将提出一个将信息聚合和DIKW框架综合应用的网络舆情信息分析框架。首先介绍JDL提出的一个最受欢迎的信息聚合模型[14],该聚合模型是为了解决不同层级的文本抽取和问题空间复杂性所带来的联合影响而设计的,分为5个层级,在每一个层级中都可以进行聚合。
层级0-数据定义:数据聚合阶段,采用数据定义层级,利用过滤数据和校正数据处理最低抽取层级的数据。根据决策问题识别需求,数据源可能来自互联网、传感器、组织内部文件系统、科研数据库、词典、案例库、知识库、上级指示或专家判断等。这一聚合层级在数据获取步骤中,将不同来源的数据进行聚合时使用。而且,根据Dasarathy的模型[15],这一步骤和“数据输入—数据输出聚合”聚合类似,提供给这一层级的数据作为输入,所接受到的数据作为输出。
层级1-对象定义:在这一层级,数据必须被排列到一个共有参考框架或者数据结构中。在完成了聚合,校正和原始数据过滤后,需要将这些数据进行关联以便连带地对它们进行处理。对象定义层级是对数据定义层级的逻辑继承。在文本环境中,这一步骤与通过POS标签,以及在数据加工步骤的词形还原而从原始文本中获取特征是一致的。这一步骤在Dasarathy的模型中被称为“数据输入—特征输出聚合”[16]。例如,如果想将一则新闻消息、一则专家评论和一篇综述整合组织成一个一般表述,就需要根据它们所表现出来的文本特征来描述其文本类型,例如句子类型、与它们自身主题一致的POS标签。通常,这一步骤包含特征抽取过程,即将一个特征集中的数据进行转换,从而能够让不同文本都能够在同一个参考框架中的同一个向量空间中得到表示。
层级2-环境定义:这一层级往往是在介于数据和知识之间的、更高文本抽取层级中进行的。其处理对象是一个共有参考模型中的特征集,再根据这些特征集相应的行为或者其他高层级的属性对其进行评估。这一步骤在Dasarathy的模型中被称为“特征输入—特征输出聚合”[17]。抽取出来的所有文本特征集会被提供给算法,算法返回其他一些特征,如一个给定文本包含的实体的某个目标方面及其对应的情感倾向等。
层级3-威胁评测:环境知识被用来分析对象并聚合对象组,通常是为了透过数据的表面对当前状态进行评测,并建议或识别未来的外部状态。在Dasarathy的模型中,因为这一过程需要精炼的数据,并且在更高的抽取层级中,其结果输出既与专家系统的决策一致也与人类的决策一致,所以这一类的聚合被称为“特征输入—决策输出聚合”[18]。例如,决策者可以使用一份总结性的意见挖掘报告来作出更加明智的决定,一个专家系统则能够发现一个明确的公众情感的消极趋势并警示决策者适当处理这种情境。
层级4-知识管理:这是最后一个层级,负责对之前的各个层级进行定义更新和维护,使系统处于最新的状态,便于下一阶段可以利用当前环境信息以及开展更加深入的分析。
接下来,本书会把这五个层级与DIKW框架进行对接。在决策流程的不同阶段,可以将使用网络舆情信息分析流程与DIKW框架相互映射(见表5-2)。
表5-2 网络舆情信息分析流程与DIKW框架的映射
目前的网络舆情应对决策,主要是基于网络舆情监测系统或预警系统中的硬数据,即从网络新闻媒体、论坛、博客、贴吧、微信、微博等平台监测或抓取的数据,主要来自社会实践领域。数据是用来为决策者提供舆情事件描述信息的,它从网络舆情分析者或监测预警系统流向决策者或其他利益相关者,决策者或其他利益相关者因此得到舆情事件业已发生的提醒。分析者或系统可以根据监测结果发出预警信号,但是不能揭示该舆情为何爆发的原因,有无可以参照的预案或案例,决策需要提供哪些方面的知识支持等。也就是说,无法使网络舆情社会实践数据升华成知识或智慧。
从舆情应对决策者的角度,知识表现在:制定、选择、评估应对方案需要对网络舆情事件、利益相关者利益诉求、事件潜在的威胁或危机、潜在影响、分析者如何判断事件发展趋势等各方面有全面的理解,需要理解网络舆情事件风险评估结果、可以选择的应对方案及其缺陷。决策者固然受益于舆情预警信息中关于事件的描述,但是接受信息后,他们首先需要将描述信息置于他们自己的参照系统中,经过认知同化而形成知识。对网络舆情事件描述信息的理解程度实际上取决于知识转化的程度。例如决策者对一个危机事件如何引发一系列负面影响的理解,实际上就是关于该危机事件已经积累的科学研究知识、社会实践知识和相似案例等方面的知识的转化。
决策者的智慧体现在:在舆情应对决策情境下,正确使用分析结果的能力。这种能力既在充分理解网络舆情事件的基础上,也需要更多关于社会文化、价值观、伦理观、社会心态、政策法规或风俗人情等方面的知识支持,决策者才能更好地做出舆情应对方案的评估、选择和应用。
从网络舆情分析者的角度,知识需求体现在:知道如何分析评估舆情事件风险,以及知道如何理解所有输入的或输出的数据,即根据数据构建威胁评测模型进行风险评估或预测舆情应对方案的成功概率。例如当专家或决策者输入一组主观判断或评价指标时,分析者必须要理解它们,识别关键特征,同时通过建模或仿真方法,判断其可行性及其局限性。
分析者的智慧则体现在:在特定情境中制定出与之相应的应对方案,指出该方案的局限性,以及备选方案可能产生的结果,并能将分析结果以恰当的方式呈现给决策者或其他利益相关者。分析者的智慧与决策者的智慧密切相关,因为他们时常要问:舆情分析结果的正确呈现方式应该是什么?这是不是可以让决策者信任并作出正确决策的方式?要回答这个问题,除了双方实时充分沟通外,分析者还需要更多知识支持,例如可视化技术等。
表5-3 网络舆情应对决策者与分析者的信息需求
决策者与分析者之间的联系,说明网络舆情信息分析需要充分整合双方对数据、信息、知识和智慧的需求,如表5-3所示,通过DIKW框架可以建立起两者需求之间的匹配,并且明确双方对知识和智慧的含义的理解,判断每种引入的数据或模型的可用性、适用性,以及各种备选方案的效果及其局限或不确定性,以此作为辅助决策的参考。在智慧层面上,因时因地制宜恰当实施决策方案的能力是因人而异的,然而在DIKW情境内,我们发现,加大从数据到信息再到知识的转化力度,也就是使杂乱无章的舆情数据变成有序的、可理解的信息或者知识,可以弥补现阶段舆情应对决策知识缺乏或信息匮乏之不足。
图5-2 面向应对决策的网络舆情信息聚合模型
建立起映射之后,网络舆情应对决策的决策者和分析者对知识的需求更加明确,结合前述信息聚合模型,本书认为,决策者和分析者的需求整合可以用一个信息聚合概念框架来实现,如图5-2所示。
(1)网络舆情应对决策经历的首个阶段是问题识别
这个阶段发现“与我相关”的网络舆情事件,根据舆情信息分析的需求,对应的则是相关数据的输入阶段,层级0可以用来聚合不同的数据源,形成已定义的数据集合。社会管理领域中的网络舆情事件需要聚合的数据源既有硬数据也有软数据,可能存在数据不完善、不兼容、多种采集渠道等主要难题,数据不完善指不同来源数据集会存在不确定性、粒度差异、含糊不清、模棱两可、不完备等问题,不兼容主要体现在数据之间的冲突、异常数据或虚假数据,物联网环境下还存在多种采集渠道获取数据,实现数据结构的统一规范是层级0的主要任务。例如突发公共安全事件时,可能需要结合安全监测摄像头采集的数据和社交网络采集的数据来描述事件信息,这两种数据源之间的结构性差异较大,需要在环境定义层级实现两者的聚合。该层级的技术研究主要集中在数据聚合领域,详细的技术进展可见文献[19]。由于研究精力所限,本书假设社会管理领域的网络舆情信息资源已经采集、筛选完成并已实现统一规范以结构化的方式存储于数据库中,不对资源的形式化预处理进行研究,重点研究资源的聚合过程中的本体构建。
网络舆情信息分析需要本体库作为资源描述和聚合处理的主要数据规范体系。对于网络舆情信息资源的聚合来说,网络舆情事件本体的构建和更新维护均来源于网络舆情信息资源,本体的主要概念、概念间的关系也是从资源内外部的共现、耦合、句法等关系中识别建立,无论何种数据源,均需要经过数据定义,生成网络舆情事件本体所需的数据结构并存储。网络舆情事件本体的构建和维护是本书研究的重点。
(2)网络舆情应对决策经历的第二个阶段是问题定义阶段
这个阶段分析“与我相关”的网络舆情事件的发展态势,对于网络舆情信息分析来说,与之对应的是进入信息分析阶段,即根据决策者要构建问题空间和任务机构表征的需求,把多源异构的数据集合进行结构化处理。
层级1能够从已定义的数据集合中获取特征并将其在同一个参考框架中进行定位,抽取生成文本特征并输出。层级1还可以用来聚合不同的情感词典、实体名称词典等,抽取生成词汇特征并输出。这个层级的相关技术研究主要集中在自然语言处理领域,目前已经发表了超过7000篇论文,其中研究成果中相关的文本挖掘研究进展在第2章做了详细综述。本书主要依托网络环境中两种实体词典的构建,包括机构名词词典、人物名词词典两种,将网络舆情信息分析落实到实体层面。(www.daowen.com)
文本特征和词汇特征同时输出,经过层级2的环境定义,可以得到多维度的网络舆情事件信息的描述,决策问题定义阶段结束。环境定义通常是在语义层面上进行的,即将文本特征和词汇特征放置于相应的情境中,使之具有实际意义。例如,从媒体报道和网民评论数据中,经过层级1的分析可以输出意见倾向信息,但是经过层级2的环境定义,则可以赋予媒体和网民观点以上下文,将其置于特定的语境或背景中,经过多维度的聚合,立体化揭示观点在语义层面的含义。本书主要研究实体间关系的抽取,作为环境定义的主要依据。结合层级1,主要研究网络舆情信息资源内部提取出来的机构与机构之间的关系、人物与人物之间的关系、机构与人物之间的关系,形成资源语义空间描述。同时,还需要结合当前网络舆情事件的主题,聚合来自政府政策文件、科研成果、相似舆情事件案例库的信息资源,使相关知识得以获取、使用和转化。
(3)网络舆情应对决策经历的第三个阶段是决策方案制定阶段
这一阶段在分析“与我相关”的网络舆情事件的发展态势基础上制定应对方案供决策者选择,根据舆情信息分析的需求,与之对应的是理解与评估阶段。层级3可以聚合风险或威胁的评测,决策者和分析者理解该描述,同时分析者理解如何评估该舆情事件的风险,决策方案的风险评估和舆情应对方案是本阶段的输出。决策流程进入问题解决声明阶段,决策者准确运用分析结果的能力和分析者准确呈现分析结果的能力同时得到提升,形成决策者智慧和分析者智慧。例如,网络舆情风险评估报告需要将文本挖掘系统所产生的输出和风险评估模型(例如贝叶斯参数模型)所产生的输出进行聚合,这一聚合是在层级3进行的。从知识库建设角度看,本层级还可以实现过往相似网络舆情事件案例的风险评估报告、应对效果评估报告等的知识积累,在此基础上实现具有经验知识的信息聚合。舆情事件风险评估是个复杂的过程,本书未对动态、实时评估展开研究,仅使用过往网络舆情应对案例、专家学术论文资源为本阶段的输入。
(4)网络舆情应对决策经历的第四个阶段是问题解决与声明阶段
这一阶段单个网络舆情事件应对已经结束,问题得到了解决。对于网络舆情分析者来说,与之相应的就进入了信息分析中的呈现与应用阶段,即使网络舆情信息分析结果以决策者能理解的方式呈现,并使分析结果得以应用。当前网络舆情事件的全部分析成果旋即成为舆情事件案例。层级4可以聚合当前情境以及相关知识,并对层级0、层级1、层级2和层级3的定义加以更新或维护,例如新增数据来源的数据定义、更新情感词典、更新特征变量、更新环境变量、增加成功应对案例、更新网络舆情事件风险评测指标或修改指标权重等,实现网络舆情事件知识库的及时更新和维护。
【注释】
[1]熊美淋.面向危机决策的政府知识供给模式及其保障机制研究[D].中南大学,2013:67-80.
[2]陈福集,介静涛.网络舆情管理中政府隐性知识共享因素分析[J].情报杂志,2014(5):148-152.
[3]师容,李兆友.论政府决策知识的配置[J].广东行政学院学报,2015,27(3):16-20.
[4]徐国东,邹艳.产学研共建实体下的知识共享障碍因素研究[J].情报理论与实践,2008,31(6).
[5]陈洪澜.论知识分类的十大方式[J].科学学研究,2007,25(1):26-31.
[6]郭睦庚.知识的分类及其管理[J].管理科学,2001,14(2):11-14.
[7]卡尔·波普尔.客观的知识[M].杭州:中国美术学院出版社,2003:109,111-112.
[8]佚名.以知识为基础的经济——经济合作与发展组织1996年年度报告[J].中国工商管理研究,1998(7):59-63.
[9]布卢姆.教育目标分类学[M].上海:华东师范大学出版社,1986:60-73.
[10]庄彩云,陈福集.基于霍尔三维结构的政府网络舆情知识需求分析[J].图书馆学研究,2015(6):21-30.
[11]Moser S C,Ekstrom J A.A framework to diagnose barriers to climate change adaptation[J].Proceedings of the NationalAcademy of Sciences,2010,107(51):26-31.
[12]Dilling L,Lemos M C.Creating usable science:Opportunities and constraints for climate knowledge use and their implications for science policy[J].Global Environmental Change,2011,21(2):680-689.
[13]Ronald R B,Doel E,Roger A,Pielke Jr.The honest broker:Making sense of science in policy and politics[J].Policy Sciences,2010,43(1):95-98.
[14]White F E.Data fusion lexicon[J].Data Fusion Lexicon,1991.
[15]Dasarathy B V.Sensor fusion potential exploitation—Innovative architectures and illustrative applications[J].Proceedings of the IEEE,1997,85(1):24-38.
[16]Dasarathy B V.Sensor fusion potential exploitation—Innovative architectures and illustrative applications[J].Proceedings of the IEEE,1997,85(1):24-38.
[17]Dasarathy B V.Sensor fusion potential exploitation—Innovative architectures and illustrative applications[J].Proceedings of the IEEE,1997,85(1):24-38.
[18]Dasarathy B V.Sensor fusion potential exploitation—Innovative architectures and illustrative applications[J].Proceedings of the IEEE,1997,85(1):24-38.
[19]Khaleghi B,Khamis A,Karray F O,et al.Multisensor data fusion:A review of the state-of-the-art[J].Information Fusion,2013,14(1):28-44.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。