理论教育 数据探索性分析:决策辅助的网络舆情信息聚合

数据探索性分析:决策辅助的网络舆情信息聚合

时间:2023-10-29 理论教育 版权反馈
【摘要】:知乎话题机制采取了树状的层次结构,一般每个话题都会有专属的一个父话题,以及多个子话题。为了初步了解知乎用户对人工智能话题的关注点,首先统计的人工智能话题的直属的各个子话题的关注情况,保留了关注人数1000以上的。图9-3人工智能子话题用户关注分布从图中可以看出知乎人工智能话题中,用户最为关注的是人工智能相关的理论技术。比如机器学习、计算机视觉、数据挖掘等,这一方面占比大。

数据探索性分析:决策辅助的网络舆情信息聚合

知乎话题机制采取了树状的层次结构,一般每个话题都会有专属的一个父话题,以及多个子话题。为了初步了解知乎用户对人工智能话题的关注点,首先统计的人工智能话题的直属的各个子话题的关注情况,保留了关注人数1000以上的。绘制直方图如图9-3所示。

图9-3 人工智能子话题用户关注分布

从图中可以看出知乎人工智能话题中,用户最为关注的是人工智能相关的理论技术。比如机器学习、计算机视觉、数据挖掘等,这一方面占比大。其次是人工智能的产物,如各类机器人、智慧城市等,占比相对较少。可以初步总结得出知乎用户的关注点分布。

为初步探究样本数据中用户对问题的关注点所在,将这些问题中出现频率比较高的词汇挑选出来展示。但是这样做的缺点是忽略了不同问题本身被用户关注的情况,知乎的话题结构中每个问题都有关注者、浏览量以及回答数。所以在分词时根据这些指标给不同问题赋予权重,也即是如果某问题有100名关注者,那这个问题权重就是100,这些问题中的词汇权重也是100。依照上面逻辑对问题按关注者和浏览量两方面进行分词,将得到的结果汇总,选取出权重最高的80个词。再利用Python中制作词云图的库wordcloud分别绘制词云图(见图9-4)。

可以看出,人工智能话题中出现权重比较高的有机器学习、深度学习、谷歌的AlphGo以及数据算法这些领域。用户比较关注人工智能方面相关技术以及理论方面的发展,这个现象可能跟知乎用户的年轻化和整体学历偏高有比较大的关系(见图9-5)。(www.daowen.com)

图9-4 人工智能关注热点词云图

图9-5 人工智能浏览热点词云图

从用户浏览数据中发现,和用户关注热点稍微不同的是:知乎用户在浏览方面出现了不少关于人工智能的产品,比如机器人、阿尔法狗以及智能语音产品小爱同学等都有比较高的权重,这些在用户关注问题中出现的则相对较少。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈