上文已经分析了用户观看直播视频的日模式,得知用户喜欢不同的时段来观看视频,将分析对象从每日数据切换到每周数据,并探究在一周内一个家庭在智能大屏上的视频观看行为,挖掘家庭每周观看行为的周模式。
我们构建了一组每周数据点,其中表示家庭在一周内每小时观看视频的时间量,也就是说,通过连接七个24维每日数据点获得每周数据点集,每周数据点集维度为24×7。中总共有488737个周数据点。
我们将K-Means算法应用于周数据点集,由此产生的簇的质心被认为是典型的周模式。为了确定集群数量的适当值,我们再次使用不同的k值运行K-Means算法。最后,我们将k值设为6,它位于畸变曲线的肘部附近。图30描述了六个典型的周模式:
图30 收视周模式
从图30中可以看出,这些模式有共同点:
(1)几乎所有的周模式都具有周期性,且周期为24小时,即用户每天的直播视频观看行为有固定的观看习惯,且观看习惯不会轻易改变。
(2)几乎所有的周模式曲线形状都有两个峰值,一个峰值所在时间为中午,另一峰值所处时间为晚上,用户在中午和晚上视频观看时长分别在局部时间内达到顶峰,符合传统对时段的认知。(www.daowen.com)
(3)每个周模式都有一个深谷,时间为2:00~6:00,在这段时间内用户大部分都在睡觉,几乎没有任何观看视频的行为。
虽然这些共同点是显而易见的,但它们之间的差异也值得注意。图30a、图30b和图30c中曲线形状都有两个峰值,且两个峰值之间差距不大,曲线形状相似,但峰值量不同,从图30b中的最高水平到图30a中的中间水平,再到图30c中的最低水平。图30a曲线形状中,峰值出现的时间是中午12:00,在下午5:00有一个小峰值,而后一直下降,即用户主要观看行为集中在中午前后时间。而图30b和图30c在中午12:00出现第一个小峰值,然后在晚上8:00达到峰值,显示用户主要的观看行为集中在中午前后时间和晚上前后时间。因此,图30a中的周型命名为“中午模式”,图30b和图30c中的周型分别命名为“双高模式”和“双低模式”。
另外,图30d和图30e中第二峰和第一峰的峰体积之差比其他峰要大得多,表明用户主要观看行为集中在晚上。图30d和图30e中虽然峰值都出现在晚上,但是这两个模式的曲线形状有两点不同:
(1)图30d和图30e两个模式的曲线形状的峰值量不同。图30d中的峰值量远大于图30e的峰值量。
(2)图30d和图30e曲线形状中出现峰值的时间不同。图30d曲线形状中出现峰值的时间是晚上8:00,而图30e出现峰值的时间被推迟到晚上10:00。结合图30d和图30e两者的区别,图30d中的周型被称为“晚上(高)模式”,图30d中的周型被称为“晚上(低)模式”。在图30f中,一周内有明显的上升趋势,且周末看大屏视频的时间比平日要多得多,例如从图30f周末的曲线形状可以看出,中午的视频观看行为较工作日有明显的增长。因此,图30f中的周模式被命名为“周末模式”。典型的六类周模式命名如表33所示:
表33 收视周模式命名
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。