理论教育 优化用户观看时间模式的家庭筛选

优化用户观看时间模式的家庭筛选

时间:2023-05-27 理论教育 版权反馈
【摘要】:为挖掘分析用户观看视频的时间模式,选择适合于检测时间模式的家庭至关重要。99835户家庭中满足条件有94180户,大约94.3%。更高的比例并不意味着大量用户一天内花很多时间观看视频,而表明普通用户在大多数日子里至少会观看一段视频。为了避免对大用户的潜在偏见,我们进一步删除了那些在30%的时间内花费超过6小时观看视频的家庭,最终筛选出15191户。

优化用户观看时间模式的家庭筛选

为挖掘分析用户观看视频的时间模式,选择适合于检测时间模式的家庭至关重要。用于分析视频观看行为的典型每日和每周模式的家庭,需要有长时间的观看行为,并为了进一步分析假日效应,特别是长假(即4周寒假),所选用户观看行为需要有较长的时间跨度。

首先,对于每个家庭i,我们确定日期DF和DL,即家庭i在2018年7月1日至2019年6月30日期间,首次使用直播视频服务的日期和最后一次使用直播视频服务的日期。因为我们的一项分析涉及长假,所以只保留了家庭之间的时间间隔,即DF和DL之间的间隔要覆盖整个寒假(从2019年1月28日到2019年2月24日),符合条件的有99835户家庭,占比大约99.8%。

其次,我们希望选择那些早期采用直播视频服务并且没有过早放弃的家庭。如果时间跨度太短,那么一个家庭每周的行为量是有限的,这不足以检测每周的模式。因此,我们选择那些跨度超过90天(即至少13周)的家庭。99835户家庭中满足条件有94180户,大约94.3%。但是,家庭i从DF到DL的日期范围内的某些天内可能不会观看任何视频。图24显示了样本的时间跨度(即日期DF到DL的天数)。

图24 样本时间跨度(www.daowen.com)

最后,我们要选择那些经常使用视频服务的家庭。如果一个家庭在其活动范围内有一些非活动日,则该家庭可能不适合检测典型的每日和每周模式。对于每个家庭i,我们计算的是家庭i在观看至少一个视频的天数与DF到DL之间的总天数的比率。样本的收视比率如图25所示。我们只保留那些比率大于0.7的家庭,在30%天内不使用视频服务,94180户家庭中满足条件的有18807户,大约19.9%。更高的比例并不意味着大量用户一天内花很多时间观看视频,而表明普通用户在大多数日子里至少会观看一段视频。为了避免对大用户的潜在偏见,我们进一步删除了那些在30%的时间内花费超过6小时观看视频的家庭,最终筛选出15191户。在我们的分析中,选取了15191名智能大屏视频服务的早期使用者和经常使用者,将他们的每日数据点收集在一个集合中,X中的每日数据点总数为4408584。

图25 样本收视比率

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈