理论教育 百度知道的分类体系与用户分布分析

百度知道的分类体系与用户分布分析

时间:2023-11-24 理论教育 版权反馈
【摘要】:百度知道的分类体系百度知道是以问题为核心的产品,其数据量大,每天产生几十万的问答内容,因此,其问题在产生、传播的过程中是通过特定的分类体系完成的。百度知道并没有使用常见的以学科为中心进行分类,建立类目体系的方法,而是使用以主题为主学科为辅的创新型分类方式。①百度知道的用户等级分布。③采纳率接近30%,侧面反映出百度知道的高等级用户给出的回答具有一定质量。

百度知道的分类体系与用户分布分析

(1)百度知道的分类体系

百度知道是以问题为核心的产品,其数据量大,每天产生几十万的问答内容,因此,其问题在产生、传播的过程中是通过特定的分类体系完成的。百度知道并没有使用常见的以学科为中心进行分类,建立类目体系的方法,而是使用以主题为主学科为辅的创新型分类方式。由于百度服务的用户群非常大,这样的分类方式减少了许多专业性或学术性的类目,帮助更多的普通用户使用百度知道这个产品,更加贴近实际用户群体。

目前它的分类大约包括14个一级类目,分别是:地区、电脑及网络、电子数码体育运动商业理财生活社会民生、游戏、医疗健康、资源共享、教育科学、烦恼、文化艺术、休闲娱乐。每一个一级类目下还有二级类目,二级类目下是用户自己自拟的标签。在百度知道APP中,所有问题的传播、回答,问题与回答用户的匹配都是通过标签来进行的[64]

(2)百度知道整体的用户分布

百度知道用户活跃度和答案的质量取决于该平台能不能吸引并持续维护高等级用户,只有高等级用户持续不断地提供经验、传播知识,百度知道才能吸引更多的用户,发展壮大。

①百度知道的用户等级分布。在社交问答网站中,用户通过回答问题,参与活动、讨论等获得经验值,经验值的累计提升用户的头衔或等级。高等级用户一般回答量比较多,并得到提问用户的采纳。

考虑到需要提取百度知道的整体用户等级分布情况,本书针对PC端和移动端的用户分别提取半年内各个等级每天在线的活跃用户数。

通过百度知道的客户关系管理系统(CRM系统),设置时间为2014年10月1日至2015年3月31日,选取“日活跃用户数——等级分布”选项,按天下载半年内每天的详细数据。将下载获得的Excel数据,按等级求得不同等级半年每天在线人数的平均值,并计算得出其每个等级占比,即获得以下PC端和移动端用户等级分布表,如表10.13和表10.14所示。

表10.13 百度知道PC端用户等级分布表

续表

表10.14 百度知道移动端用户等级分布表

(www.daowen.com)

续表

根据百度知道的等级划分原则:注册后完成一次提问(包括提出问题,采纳最佳答案,给出感谢)、一次回答被采纳、登录时间超过一周是完成新手任务,这时候获得的经验值大约可以升到3级。中等用户需完成的任务类似,完成之后大约会升到10级。因此,将百度知道的用户划分为初级用户(1~3级用户)、中级用户(4~9级)、高级用户(10级以上)。

从表10.13、表10.14可以看出,在移动端,高等级用户约占总用户的6.34%;而在PC端,高等级用户约占总用户的9.28%。因移动端百度知道产品约是在2012年开始上线,而PC端的产品是在2006年上线,因此在高等级用户占比方面,PC端明显要高于移动端。

②百度知道移动端高等级用户行为。在社交问答网站中,用户通过活跃的行为(回答问题、参与活动、讨论等)获得经验并提升等级,因此,高等级用户是对社交问答网站贡献最多的用户。研究百度知道的高等级用户行为,有利于发现高等级用户的行为趋势及特征,为网站构建、设计、运营提供帮助。

考虑到针对高等级用户的行为研究,本书提取其回答总量、人均回答量、人均采纳量、人均采纳率,它们最能体现用户对网站的内容贡献的数量与质量。

因此,通过百度知道的客户关系管理系统(CRM系统),设置时间为2014年4月1日至2015年3月31日,按月分类并选取以上几个核心指标,按月下载一年内的详细数据,如表10.15所示。

表10.15 百度知道移动端宏观上高等级用户的用户行为数据

从获取到的统计分析数据可以得出:

①百度知道APP在2014年年初至2015年年初之间发展比较迅速,每月在线的高等级用户数及高等级用户的总回答量及采纳量持续增长。

②人均回答量、人均采纳量占比趋于稳定,移动端百度知道的高等级用户整体素质较高。

③采纳率接近30%,侧面反映出百度知道的高等级用户给出的回答具有一定质量。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈