理论教育 大数据分析流程及基础模型介绍

大数据分析流程及基础模型介绍

时间:2023-06-14 理论教育 版权反馈
【摘要】:(一)大数据分析的流程大数据分析是基于商业目的,有目的地进行收集、整理、加工和分析数据,提炼有价信息的一个过程。数据分析师对这些都要了然于心。不同的项目对数据的要求,使用的分析手段也是不一样的。通过分析报告,把数据分析的目的、过程、结果及方案完整呈现出来,为商业目的提供参考。

大数据分析流程及基础模型介绍

(一)大数据分析的流程

大数据分析是基于商业目的,有目的地进行收集、整理、加工和分析数据,提炼有价信息的一个过程。其过程概括起来主要包括:明确分析目的与思路、数据收集、数据处理、数据分析、数据展现和撰写报告6个阶段(见图5-4)。

图5-4 大数据分析

1.明确数据分析的目的和思路

一个分析项目,数据对象是谁?商业目的是什么?要解决什么业务问题?数据分析师对这些都要了然于心。

基于商业的理解,整理分析框架和分析思路。例如,减少新客户的流失、优化活动效果、提高客户响应率等。不同的项目对数据的要求,使用的分析手段也是不一样的。

2.数据收集

数据收集是按照确定的数据分析和框架内容,有目的地收集、整合相关数据的一个过程,它是数据分析的一个基础。

3.数据处理

数据处理是指对收集到的数据进行加工、整理,以便开展数据分析,它是数据分析前必不可少的阶段。这个过程是数据分析整个过程中最占据时间的,也在一定程度上取决于数据仓库的搭建和数据质量的保证。数据处理主要包括数据清洗、数据转化等处理方法。

4.数据分析

数据分析是指通过分析手段、方法和技巧对准备好的数据进行探索、分析,从中发现因果关系、内部联系和业务规律,并提供决策参考。

到了这个阶段,要能驾驭数据、开展数据分析,就要涉及工具和方法的使用。其一要熟悉常规数据分析方法,最基本的要了解方差、回归、因子、聚类、分类、时间序列等多元和数据分析方法的原理、使用范围、优缺点和结果的解释;其二是熟悉数据分析工具,Excel是最常见的,一般的数据分析可以通过Excel完成,而后要熟悉一个专业的分析软件

5.数据展现

一般情况下,数据分析的结果都是通过图、表的方式来呈现的,俗话说:字不如表,表不如图。借助数据展现手段,能更直观地让数据分析师表述想要呈现的信息、观点和建议。

常用的图表包括饼图、折线图、柱形图/条形图散点图雷达图、金字塔图、矩阵图、漏斗图、帕雷托图等。

6.撰写报告

最后阶段就是撰写数据分析报告,这是对整个数据分析成果的一个呈现。通过分析报告,把数据分析的目的、过程、结果及方案完整呈现出来,为商业目的提供参考。

一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂、层次明晰,能够让阅读者一目了然。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。

另外,数据分析报告需要有明确的结论、建议和解决方案,不仅仅是找出问题,后者是更重要的,否则就不是好的分析,同时也失去了报告的意义。数据的初衷就是为解决一个商业目的才进行的分析,不能舍本求末。

(二)大数据分析的基础模型

1.AARRR模型

AARRR模型,即Acquisition(获取)、Activation(活跃)、Retention(留存)、Revenue(收益)、Refer(传播)(见图5-5)。

图5-5 AARRR模型

第一步,获取用户。(www.daowen.com)

线上网站通过SEO和SEM,APP通过市场首发、ASO等方式获取。也可以通过运营活动的H5页面、自媒体等方式获取。线下网站通过地推和传单进行获取用户。

第二步,提高活跃度

获取用户后,通过运营价格优惠、编辑内容等方式进行提高活跃度。通过把内容做多、商品做多、价格做到优惠获得的用户,最有价值且活跃度较高。

第三步,提高留存率。

提高了活跃度的,有了忠实的用户,就开始慢慢沉淀下来。运营上,采用内容、相互留言等社区用户共建UCG,摆脱初期的PCG模式。电商通过商品质量、O2O通过优质服务提高留存。这些都是业务层面的提高留存。

产品模式上,通过会员的签到和奖励的机制去提高留存。APP推送和短信激活方式都是激活用户、提高留存的产品方式。

通过日留存率、周留存率、月留存率等指标监控应用的用户流失情况,并采取相应的手段在用户流失之前,激励这些用户继续使用应用。

第四步,获取收入。

获取收入是应用运营最核心的一块。即使是免费应用,也应该有其盈利的模式。

收入来源主要有三种:付费应用、应用内付费以及广告。付费应用在国内的接受程度很低,包括Google Play Store在中国也只推免费应用。在国内,广告是大部分开发者的收入来源,而应用内付费目前在游戏行业应用比较多。

前面所提的提高活跃度、提高留存率,对获取收入来说,是必需的基础。用户基数大了,收入才有可能上升。

第五步,自传播。

以前的运营模型到第四个层次就结束了,但是自社交网络的兴起,使得运营增加了一个方面,就是基于社交网络的病毒式传播,这已经成为获取用户的一个新途径。这个方式的成本很低,而且效果有可能非常好;唯一的前提是产品自身要足够好,有很好的口碑。

从自传播到再次获取新用户,应用运营形成了一个螺旋式上升的轨道。而那些优秀的应用就很好地利用了这个轨道,不断扩大自己的用户群体。

2.漏斗模型

漏斗模型广泛应用于流量监控、产品目标转化等日常数据运营工作中。之所以称为漏斗,就是因为用户(或者流量)集中从某个功能点进入(这是可以根据业务需求来自行设定的),可能会通过产品本身设定的流程完成操作。图5-6是某个网站的用户访问路径以及访问量,相对比较简单,但是非常不直观。通过图5-7的漏斗图,可以直观、深刻地反映用户网站的流失情况和关键点。

图5-6 某网站用户的访问路径和访问量

图5-7 某网站用户访问漏斗图

按照流程操作的用户进行各个转化层级上的监控,寻找每个层级的可优化点;对没有按照流程操作的用户绘制他们的转化路径,找到可提升用户体验,缩短路径的空间。

运用漏斗模型比较典型的案例就是电商网站的转化,用户在选购商品时必然会按照预先设计好的购买流程进行下单,最终完成支付。

需要注意的是:单一的漏斗模型对于分析来说没有任何意义,不能单从一个漏斗模型中评价网站某个关键流程中各步骤的转化率的好坏,所以必须通过趋势、比较和细分的方法对流程中各步骤的转化率进行分析。

(1)趋势。从时间轴的变化情况进行分析,适用于对某一流程或其中某个步骤进行改进或优化的效果监控。

(2)比较。通过比较类型产品或服务间购买或使用流程的转化率,发现某些产品或应用中存在的问题。

(3)细分。细分来源或不同的客户类型在转化率上的表现,发现了一些高质量的来源或客户,通常用于分析网站的广告或推广的效果及ROI。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈