理论教育 社交媒体意见领袖研究:通过数据抓取揭示微博热点事件舆情高峰

社交媒体意见领袖研究:通过数据抓取揭示微博热点事件舆情高峰

时间:2023-11-17 理论教育 版权反馈
【摘要】:根据本人对全年微博热点事件的观察,该时间段中所抓取的热门微博信息可以反映出事件舆情高峰时的基本情况,数据具有一定的代表性和说服力。第二步,以事件核心词汇为关键词,通过软件抓取目标时间段所有相关微博数据,包括原发微博、转发微博。其中,新浪不提供超过7天的搜索结果排序,因此需要将数据全部抓取,再用软件进行排序。新浪微博日均发布信息数量超过1亿条,特别在热点事件中,信息的更替速度极快。

社交媒体意见领袖研究:通过数据抓取揭示微博热点事件舆情高峰

在选定典型案例后,笔者通过所开发的“SinaFrameWrok”软件[9],抓取了新浪微博平台的相关数据,数据统计步骤和思路[10]如下:

第一步,参考具体事件的百度搜索峰值,以搜索峰值时间的前后5天共11天作为数据抓取的时间段。根据本人对全年微博热点事件的观察,该时间段中所抓取的热门微博信息可以反映出事件舆情高峰时的基本情况,数据具有一定的代表性和说服力。

第二步,以事件核心词汇为关键词,通过软件抓取目标时间段所有相关微博数据,包括原发微博、转发微博。其中,新浪不提供超过7天的搜索结果排序,因此需要将数据全部抓取,再用软件进行排序。同时新浪对数据搜索有限制,超过7天的话题,只提供该关键词每天最多50页的数据。因此,本研究是在新浪平台技术限制的条件下获得的数据样本。另外,网络公共事件中的二级话题较多,数据搜索可能存在关键词不准确的情况,这是本研究的不足之处。

第三步,对所抓取的微博信息进行排序,选择其中被评论数量最多的前15条微博及其评论作为分析样本,这15条微博即为事件中的影响力微博样本,影响力微博的发布群体即为该事件的意见活跃群体。新浪微博日均发布信息数量超过1亿条,特别在热点事件中,信息的更替速度极快。因此,基于研究条件的限制,本研究只在宏观层面考察最有代表性和影响力的意见活跃群体。本研究认为分析每件热点事件中被评论最多的前15条微博及其发布者,可以满足基本研究需要。(www.daowen.com)

第四步,对于如“校车事故”、“动车事故”、“郭美美事件”等超大型公共事件,除了使用软件进行数据挖掘外,本人还通过观察法对结果进行检验,并补充遗漏数据。

第五步,对30件事件中评论数量最多的前15条热门微博(共450条微博)进行筛选,将其中评论少于100条的微博排除,最后剩下共422条微博。对422条微博进行分类,按照内容形式分为事件事实型、观点评论型、段子调侃型和提问互动型4类。

第六步,对样本微博的网友回复进行分析,将该微博收到的总体评价分为支持、反对、争议(支持、反对持平)和中立(无关)4类。同时,对422条微博的发布用户基本资料进行统计,包括:粉丝数量、认证情况证、用户性质、地区、职业、涉及事件等6类。在以上工作的基础上,形成本研究的基础数据表

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈