理论教育 网络舆情分析方法的现状及不足

网络舆情分析方法的现状及不足

时间:2023-10-29 理论教育 版权反馈
【摘要】:从前述三大方面的研究回顾可以发现,国内网络舆情研究以理论研究为主,对网络舆情分析方法和技术的探讨成果较少。然而,目前,国内外网络舆情信息文本处理的研究对象以产品评论居多,对产品评论文本进行特征级的信息抽取和聚合研究成果较多,社会管理领域的网络舆情文本处理以情感倾向值的分析为主,对观点内容本身的分析处于空白状态。

网络舆情分析方法的现状及不足

从前述三大方面的研究回顾可以发现,国内网络舆情研究以理论研究为主,对网络舆情分析方法和技术的探讨成果较少。网络舆情分析以基于内容挖掘的主题监测技术为目前的主要方向,中文信息处理技术有了深入发展,研究成果包括断句、分词、截词、词元化、停用词删除、词性标注等预处理方法,文本表示与主题发现方法,文本挖掘与观点分析则从文档层级、句子层级逐渐向实体和方面层级的挖掘为主。信息聚合研究从军事领域的硬数据聚合发展到软数据与硬数据结合的聚合,聚合单元向概念级发展。通过比对研究内容,本书发现,网络舆情文本挖掘与观点分析中的信息识别、抽取、聚类或聚合,与信息聚合研究中的聚合单元识别、抽取与聚类在方法和技术上是可以相互对应的。网络舆情信息传播理论研究、中文信息处理技术研究和信息聚合方法研究的相关成果为本书提供了坚实的理论、技术和方法基础。

然而,目前,国内外网络舆情信息文本处理的研究对象以产品评论居多,对产品评论文本进行特征级的信息抽取和聚合研究成果较多,社会管理领域的网络舆情文本处理以情感倾向值的分析为主,对观点内容本身的分析处于空白状态。从信息聚合的研究成果看,研究对象以馆藏资源居多,概念级的网络舆情信息聚合研究也处于空白状态。这两个空白使社会管理领域的网络舆情分析仍然停留在浅层次分析水平,信息聚合研究也仍然处于较粗粒度和较浅层次的信息整合阶段。

对于社会管理领域的网络舆情应对决策来说,观点内容的缺失导致决策者所需知识无法得到满足,亟须一种可以深化网络舆情分析深度的解决方案,全方位呈现网络舆情事件的相关情境,满足应对决策的需求。

【注释】

[1]许鑫,章成志,李雯静.国内网络舆情研究的回顾与展望[J].情报理论与实践,2009,32(3):115-120.

[2]王程韡.“大数据”是“大趋势”吗?基于关键词共现方法的反事实分析[J].科学学与科学技术管理,2015,36(1):3-11.

[3]王娟.突发事件中网络舆论的治理[J].长春理工大学学报(高教版),2007(4):71-75.

[4]冯希莹,王来华.舆情概念辨析[J].社会工作,2011(5):83-87.

[5]王来华,林竹,毕宏音.对舆情、民意和舆论三概念异同的初步辨析[J].新视野,2004(5):64-66.

[6]张元龙.关于“舆情”及相关概念的界定与辨析[J].浙江学刊,2009(3):182-184.

[7]刘毅.略论网络舆情的概念、特点、表达与传播[J].理论界,2007,2007(1):11-12.

[8]孙玲芳,周加波,徐会,等.网络舆情危机的概念辨析及指标设定[J].现代情报,2014,34(11):25-28.

[9]邢梦婷,王曰芬.国内外社会舆情研究的回顾与展望[J].情报理论与实践,2015,38(11):139-144.

[10]张克生.舆情机制是国家决策的根本机制[J].理论与现代化,2004(4):71-73.

[11]李昌祖.论社会舆情的汇集与干预机制[J].社会科学,2007(9):75-82.

[12]刘毅.网络舆情信息理论体系的构建研究[D].天津外国语学院,2007:33-40.

[13]姜胜洪.网络舆情的内涵及主要特点[J].理论界,2010(3):151-152.

[14]黄晓斌,赵超.文本挖掘在网络舆情信息分析中的应用[J].情报科学,2009,27(1):94-99.

[15]廖卫民.突发公共事件中网络舆论传播特征[J].新闻前哨,2010(11):19-22.

[16]Dwyer P.An approach to measuring influence and cognitive similarity in computer mediated communication[J].Computers in Human Behavior,2012(28):540-551.

[17]谢金林.网络舆论生态系统内在机理及其治理研究——以网络政治舆论为分析视角[J].上海行政学院学报,2013,14(4):90-101.

[18]Noelle-Neumann E.The spiral of silence:Public opinion—Our social skin[J].Social Forces,1986,64(3):110-122.

[19]韩运荣,喻国明.关于舆论领袖的“素描”[J].新闻知识,2005(6):9-12.

[20]扎勒.公共舆论[M].北京:中国人民大学出版社,2013:7.

[21]Toscani G.Kinetic models of opinion formation[J].Communications in Mathematical Sciences,2006,4(3):481-496.

[22]程慧.网络舆情的形成机制研究[D].江西师范大学,2011:64-70.

[23]柳军,蔡淑琴.微内容的网络舆情传播特征分析[J].情报杂志,2013(1):1-4.

[24]谢金林.网络舆论生态系统内在机理及其治理研究——以网络政治舆论为分析视角[J].上海行政学院学报,2013,14(4):90-101.

[25]邢梦婷,王曰芬.国内外社会舆情研究的回顾与展望[J].情报理论与实践,2015,38(11):139-144.

[26]方薇,何留进,宋良图.因特网舆情传播的协同元胞自动机模型[J].计算机应用,2012,32(2):399-402.

[27]朱恒民,李青.面向话题衍生性的微博网络舆情传播模型研究[J].现代图书情报技术,2012(5):60-64.

[28]姜鑫,田志伟.微博社区内信息传播的“小世界”现象及实证研究——以腾讯微博为例[J].情报科学,2012(8):1139-1142.

[29]刘继,李磊.基于微博用户转发行为的舆情信息传播模式分析[J].情报杂志,2013(7):74-77.

[30]陈福集,胡改丽.网络舆情热点话题传播模式研究[J].情报杂志,2014(1):97-101.

[31]杨永军,张彩霞.社会舆情的传播效应探析[J].现代传播(中国传媒大学学报),2012,34(1):137-138.

[32]陈潭,黄金.群体性事件的网络舆情及其传播逻辑[J].理论探讨,2011(4):140-142.

[33]陈福集,黄江玲.基于演化博弈的网络舆情传播的羊群效应研究[J].情报杂志,2013(10):1-5.

[34]Zhang J,Hong Y.Opinion evolution analysis for short-range and long-range Deffuant-Weisbuch models[J].Physica A Statistical Mechanics&Its Applications,2013,392(21):5289-5297.

[35]张合斌.高校百度贴吧舆情研究[J].新闻爱好者月刊,2009(9):122-123.

[36]方付建.突发事件网络舆情演变研究[D].华中科技大学,2011:130-142.

[37]陈福集,黄江玲.三方博弈视角下政府应对网络推手的对策研究[J].中国行政管理,2013(11):18-21.

[38]Mccoy M E.Dark alliance:News repair and institutional authority in the age of the Internet[J].Journal of Communication,2002,51(1):164-193.

[39]Brooks B S.Journalism in the Information Age:A Guide to Computers for Reporters and Editors[M].Allyn&Bacon,Inc.1996:128-135.

[40]William L Benoit.Sears'repair of its auto service image:Image restoration discourse in the corporate sector[J].Communication Studies,1995,46(1):89-105.

[41]陈忆金,曹树金,陈少驰,等.网络舆情信息监测研究进展[J].图书情报知识,2011(6):41-49.

[42]谢海光,陈中润.互联网内容及舆情深度分析模式[J].中国青年政治学院学报,2006,25(3):95-100.

[43]李恒训,张华平,秦鹏,等.基于主题词的网络热点话题发现[C].全国信息检索学术会议,2009.

[44]刘勘,朱怀萍,刘秀芹.基于支持向量机的网络伪舆情识别研究[J].现代图书情报技术,2013(11):75-80.

[45]Soylu A,Modritscher F,Wild F,Causmaecker P D,Desmet P.Mashups by Orchestration and widget-based personal environments:Key challenges,solution strategies,and an application[J].Electronic Library and Information Systems,2012,46(4):226-234.

[46]刘锦锦.基于BitTorrent的流媒体系统关键技术研究与实现[D].浙江大学,2011:101-113.

[47]王佳.支持Ajax技术的主题网络爬虫系统研究与实现[D].北京交通大学,2011:90-92.

[48]高天宏.互联网舆情分析中信息采集技术的研究与设计[D].北京邮电大学,2015:80-86.

[49]Turney P D.Learning to Extract Keyphrases from Text[C].NRC Technical Report ERB-1057,National Research Council,Canada,1999:1-43.

[50]Mesbah A,Bozdag E,Deursen A V.Crawling AJAX by Inferring User Interface State Changes[C]//Eighth International Conference on Web Engineering,ICWE 2008,14-18 July 2008,Yorktown Heights,New York,USA.2008:122-134.

[51]杨梅.网络舆情热点发现的研究[D].北京交通大学,2008:63-71.

[52]陈桂鸿,曹树金,陈忆金.网络舆情信息提取与预处理研究[J].图书情报知识,2011(6):50-54.

[53]郭岩,刘春阳,余智华,等.网络舆情信息源影响力的评估研究[J].中文信息学报,2011,25(3):64-71.

[54]龙宇.互联网舆情信息采集系统的设计与实现[D].电子科技大学,2013:3-19.

[55]孙玲芳,周加波,徐会,等.基于改进K—means的网络舆情热点事件发现技术[J].计算机与现代化,2014(4):143-147.

[56]金燕.基于本体的Web信息抽取研究综述[J].图书馆学研究,2012(16):2-6.

[57]Fu T,Abbasi A,Zeng D,et al.Sentimental spidering:Leveraging opinion information in focused crawlers[J].Acm Transactions on Information Systems,2012,30(4):1-30.

[58]Vural A G,Cambazoglu B B,Senkul P.Sentiment-focused Web Crawling[C]//ACM International Conference on Information and Knowledge Management.ACM,2012:2020-2024.

[59]Kiss T,Strunk J.Unsupervised multilingual sentence boundary detection[J].Computational Linguistics,2006,32(4):págs.485-525.

[60]Bird S,Klein E,Loper E.Natural Language Processing with Python[M].南京:东南大学出版社,2010:10-19.

[61]Palmer D,Text Preprocessing[M]//Handbook of Natural Language Processing,2nd Edition,Machine Learning and Pattern Recognition,CRC Press,New York,NY,USA,2010:31-35.

[62]Bing L.Web Data mining:Exploring hyperlinks,contents,and usage data(Data-Centric Systems and Applications)[J].Acm Sigkdd Explorations Newsletter,2008,10(2):23-25.

[63]Porter M F.An algorithm for suffix stripping[C]//Morgan Kaufmann Publishers Inc.1997:130-137.

[64]Manning C D,Raghavan P Sch&#,et al.Introduction to Information Retrieval[M].CambridgeUniversity Press,2008:153-169.

[65]Brill E.A simple rule-based part of speech tagger[C].Proceedings of the Workshop on Speech and Natural Language,Association for Computational Linguistics,Harriman,New York,1992:112-116.

[66]Vilares D,Alonso M A,Gómezrodríguez C.A syntactic approach for opinion mining on Spanish reviews[J].Natural Language Engineering,2014,21(1):1-25.

[67]Sanda R,Baizal Z K A,Nhita F.Opinion mining feature-level using Naive Bayes and feature extraction based analysis dependencies[J].2015,1692(1):43-50.

[68]Hangya V,Farkas R.Target-oriented opinion mining from tweets[C]//IEEE,International Conference on Cognitive Infocommunications.2013:251-254.

[69]Gimpel K,Schneider N,O'Connor B,et al.Part-of-speech tagging for Twitter:annotation,features,and experiments[C]//The Meeting of the Association for Computational Linguistics:Human Language Technologies,Proceedings of the Conference,19-24 June,2011,Portland,Oregon,Usa-Short Papers.2011:42-47.

[70]Zarsky B T.Mine your own business!:Making the case for the implications of the data mining or personal information in the forum of public opinion[J].Yale Journal of Law&Technology,2012.

[71]石晶.中文文本的主题分析技术研究[D].中国科学院软件研究所,2007:4-20.

[72]王小华,徐宁,谌志群.基于共词分析的文本主题词聚类与主题发现[J].情报科学,2011(11):1621-1624.

[73]陈友,程学旗,杨森.面向网络论坛的突发话题抽取[C].全国信息检索学术会议,2009.(www.daowen.com)

[74]唐晓波,房小可.基于文本聚类与LDA相融合的微博主题检索模型研究[J].情报理论与实践,2013,36(8):85-90.

[75]阮光册.基于LDA的网络评论主题发现研究[J].情报杂志,2014(3):161-164.

[76]董婧灵,李芳,何婷婷,等.基于LDA模型的文本聚类研究[C].中国计算语言学研究前沿进展,2012.

[77]董婧灵.基于LDA模型的文本聚类研究[D].华中师范大学,2012.

[78]陈磊.文本表示模型和特征选择算法研究[D].中国科学技术大学,2017.

[79]陈险峰.微博舆情分析系统的设计与实现[D].华南理工大学,2015.

[80]刘江华.一种基于Kmeans聚类算法和LDA主题模型的文本检索方法及有效性验证[J].情报科学,2017,35(2):16-21,26.

[81]Liu B.Sentiment Analysis and Opinion Mining[C].Synthesis Lectures on Human Language Technologies,2012:152-153.

[82]Hu M.Mining and summarizing customer reviews[J].Proc.Acm Sigkdd Int.conf.Knowledge Discovery&Data Mining,2004:194-210.

[83]Tsytsarau M,Palpanas T,Castellanos M.Dynamics of news events and social media reaction[J].Climatic Change,2014,90(1-2):31-55.

[84]Suen C,Huang S,Eksombatchai C,et al.NIFTY:A System for Large Scale Information Flow Tracking and Clustering[C].International Conference on World Wide Web,2013:1237-1248.

[85]Zhao Y,Qin B,Liu T.Creating a fine-grained corpus for Chinese sentiment analysis[J].Intelligent Systems IEEE,2015,30(1):36-43.

[86]Liu B.Sentiment Analysis and Opinion Mining[C].Synthesis Lectures on Human Language Technologies,2012:152-153.

[87]Pang B,Lee L.Seeing stars:Exploiting class relationships for sentiment categorization with respect to rating scales[C].Meeting on Association for Computational Linguistics.Association for Computational Linguistics,2005:115-124.

[88]Riloff E,Wiebe J.Learning extraction patterns for subjective expressions[J].Proceedings of Emnlp,2003:105-112.

[89]Cambria E,Schuller H,Xia Y,et al.New avenues in opinion mining and sentiment analysis[J].IEEE Intelligent Systems,2013,28(2):15-21.

[90]周杰.网络舆情话题情感倾向性分析技术研究[D].解放军信息工程大学,2010:3-19.

[91]Zhao Y,Qin B,Liu T.Creating a fine-grained corpus for Chinese sentiment analysis[J].Intelligent Systems IEEE,2015,30(1):36-43.

[92]施寒潇.细粒度情感分析研究[D].苏州大学,2013:4-21.

[93]Hu M,et al.Mining and summarizing customer reviews[J].Proc.Acm Sigkdd Int.conf.Knowledge Discovery&Data Mining,2004:194-210.

[94]Somprasertsri G,Lalitrojwong P.Extracting product features and opinions from product reviews using dependency analysis[C]//IEEE.Seventh International Conference on Fuzzy Systems and Knowledge Discovery,2010:206-211.

[95]Marrese-Taylor E,Velásquez J D,Bravo-Marquez F,et al.Identifying customer preferences about tourism products using an aspect-based opinion mining approach[J].Procedia Computer Science,2013(22):182-191.

[96]Marrese-Taylor E,Velásquez J D,et al.Opinion Zoom:A Modular Tool to Explore Tourism Opinions on the Web[C]//IEEE Wic.Acm,International Joint Conferences on Web Intelligence.IEEE Computer Society,2013:261-264.

[97]Quan C Q,Ren F J.Construction of a Blog Emotion Corpus for Chinese Emotional Expression Analysis[C].Proceedings of EMNLP’2009,2009:1446-1454.

[98]杨超,冯时,王大玲,等.基于情感词典扩展技术的网络舆情倾向性分析[J].小型微型计算机系统,2010,31(4):691-695.

[99]Perkowitz M,Etzioni O.Towards adaptive Web sites:Conceptual framework and case study[J].Computer Networks,2000,31(99):1245-1258.

[100]Liu B.Sentiment Analysis and Opinion Mining[C].Synthesis Lectures on Human Language Technologies,2012:152-153.

[101]薛玮.网络舆情信息挖掘系统的研究[D].北京交通大学,2008:102-113.

[102]Miller G A.WordNet:A lexical database for english[J].Communications of the Acm,1995,38(11):39-41.

[103]Turney P.Thumbs up or thumbs down?Semantic orientation applied to unsupervised classification of reviews[C].Proceedings of the Association for Computational Linguistics(ACL),2005:417-424.

[104]Rebolledo V L,L'Huillier G,Velásquez J D.Web Pattern Extraction and Storage[M].Advanced Techniques in Web Intelligence-I.2010:49-77.

[105]机器学习常见算法分类汇总[EB/OL].[2016-05-18].http://www.ctocio.com/hotnews/15919.html.

[106]Pak A,Paroubek P.Twitter as a Corpus for Sentiment Analysis and Opinion Mining[C].International Conference on Language Resources and Evaluation,Lrec 2010,17-23 May 2010,Valletta,Malta.2010.

[107]Aue A,Gamon M.Customizing sentiment classifiers to new domains:A case study[C].International Conference on Recent Advances in Natural Language Processing,2005:33-39.

[108]Zhou L,Chaovalit P.Ontology-supported polarity mining[J].Journal of the American Society for Information Science&Technology,2008(59):98-110.

[109]Cambria E,Speer R,Havasi C,et al.SenticNet:A publicly available semantic resource for opinion mining[J].Aaai Csk,2010.

[110]Poria S,Gelbukh A,Hussain A,et al.Enhanced SenticNet with Affective Labels for Concept-Based Opinion Mining[J].Intelligent Systems IEEE,2013,28(2):31-38.

[111]Miao Q,Li Q,Zeng D.Mining Fine Grained Opinions by Using Probabilistic Models and Domain Knowledge[C]//IEEE Wic.Acm,International Conference on Web Intelligence and Intelligent Agent Technology,2010:358-365.

[112]Grassi M,Cambria E,Hussain A,et al.Sentic Web:A new paradigm for managing social media affective information[J].Cognitive Computation,2011,3(3):480-489.

[113]Peace J.The use of ontology to represent nursing knowledge about family health history and facilitate automated search for clinical practice guidelines[D].Madison:University of Wisconsin-Madison,2008.

[114]王兰成,徐震.基于情感本体的主题网络舆情倾向性分析[J].信息与控制,2013,42(1):46-52.

[115]陈晓美.网络评论观点知识发现研究[D].吉林大学,2014:194-210.

[116]温有奎.知识元挖掘[M].西安:西安电子科技大学出版社,2005.

[117]Brookes B C.The foundations of information science—Part III:Quantitative aspects:Objective maps and subjective landscapes[J].Journal of Information Science,1980,2(6):269-275.

[118]马费成.在数字环境下实现知识的组织和提供[J].郑州大学学报(哲学社会科学版),2005,38(4):5-7.

[119]王飞跃.社会计算的基本方法与应用[M].杭州:浙江大学出版社,2013:15-40,132.

[120]李建伟.基于知识元的突发事件情景研究[D].大连理工大学,2012.

[121]郭艳敏.基于知识元的非常规突发事件情景模型及生成[D].大连理工大学,2012.

[122]邢梦婷,王曰芬.国内外社会舆情研究的回顾与展望[J].情报理论与实践,2015,38(11):139-144.

[123]曾润喜,陈强,赵峰.网络舆情在服务型政府建设中的影响与作用[J].图书情报工作,2010,54(13):115-119.

[124]孙健.网络舆论对政府公共决策的影响及优化路向——以突发性公共事件为基本视角[J].西北师范大学学报(社会科学版),2014(4):16-21.

[125]谢耘耕,陈玮,刘锐,等.大数据背景下的舆情决策支持系统研究综述[J].新媒体与社会,2014(4):5-12.

[126]赵婷婷.网络舆论对我国公共决策的影响研究[D].首都经济贸易大学,2010:13-20.

[127]张芳源.基于网络舆情的政府决策信息平台功能设计[D].安徽大学,2013:56-70.

[128]王兰成,娄国哲.基于知识图谱的网络舆情管理方法与实践研究[J/OL].[2019-12-26].情报理论与实践:1-7.http://kns.cnki.net/kcms/detail/11.1762.G3.20191223.0858.002.html.

[129]聚合.百度百科[EB/OL].[2016-01-10].http://baike.baidu.com/.

[130]杜晖.基于耦合关系的学术信息资源深度聚合研究[D].武汉大学,2013:3-18.

[131]Boström H,Andler S F,Brohede M,et al.On the definition of information fusion as a field of research[J].Neoplasia,2007,13(2):98-107,IN1.

[132]Hall D L,Mcneese M,Llinas J,et al.A framework for dynamic hard/soft fusion[C].International Conference on Information Fusion.IEEE,2008:1-8.

[133]Khaleghi B,Khamis A,Karray F O,et al.Multisensor data fusion:A review of the state-of-the-art[J].Information Fusion,2013,14(1):28-44.

[134]Khaleghi B,Khamis A,Karray F O,et al.Multisensor data fusion:A review of the state-of-the-art[J].Information Fusion,2013,14(1):28-44.

[135]Khaleghi B,Khamis A,Karray F O,et al.Multisensor data fusion:A review of the state-of-the-art[J].Information Fusion,2013,14(1):28-44.

[136]Wu S,Crestani F.A geometric framework for data fusion in information retrieval[J].Information Systems,2015,50(2):20-35.

[137]胡昌平,胡吉明,邓胜利.基于社会化群体作用的信息聚合服务[J].中国图书馆学报,2010,36(3):51-56.

[138]邱均平,王菲菲,基于共现与耦合的馆藏文献资源深度聚合研究探析[J].中国图书馆学报,2010(3):25-33.

[139]曾建勋.基于引文的知识链接系统构建[J].情报理论与实践,2012,35(2):58-63.

[140]杜晖.基于耦合关系的学术信息资源深度聚合研究[D].武汉大学,2013:3-18.

[141]李劲,程秀峰,宋红文,等.基于语义的馆藏资源深度聚合模型探析[J].湖北民族学院学报:自然科学版,2013,31(2):212-215.

[142]王雨.基于社会网络分析的数字图书馆资源聚合研究[D].吉林大学,2014.

[143]曹树金,马翠嫦.信息聚合概念的构成与聚合模式研究[J].中国图书馆学报,2016(3):4-19.

[144]邓胜利.信息聚合服务的发展与演变研究[J].情报资料工作,2012(1):79-83.

[145]胡昌平,胡吉明,邓胜利.基于社会化群体作用的信息聚合服务[J].中国图书馆学报,2010,36(3):51-56.

[146]马翠嫦.多学科领域视角下网络资源聚合单元概念框架构建研究[C].全国情报学博士生学术论坛,2014.

[147]司徒俊峰.特定学科领域的网络资源语义聚合研究[D].中山大学,2016.

[148]马翠嫦,司徒俊峰,曹树金.网络学术文档细粒度关联与聚合的信息组织机制研究[J].现代情报,2019,39(12):37-45,54.

[149]范涛,吴鹏,曹琪.基于深度学习的多模态融合网民情感识别研究[J/OL].[2019-12-26].信息资源管理学报:1-10.http://kns.cnki.net/kcms/detail/42.1812.G2.20191217.1412.004.html.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈