数据挖掘能发现电子商务客户的共性和个性的知识、必然和偶然的知识、独立和关联的知识、现实和预测的知识等,所有这些知识经过分析,能对客户的消费行为如心理、能力、动机、需求、潜能等做出统计和正确的分析,为管理者提供决策依据。具体应用如下:
(一)分类与预测方法在电子商务中的应用
在电子商务活动中,分类是一项非常重要的任务,也是应用最多的技术。分类的目的是构造一个分类函数或分类模型,通常称作分类器。分类器的构造方法通常有统计方法、机器学习方法、神经网络方法等。这些方法能把数据库中的数据映射到给定类别中某一个,以便用于预测,也就是利用历史数据记录,自动推导出给定数据的推广描述,从而对未来数据进行预测。
(二)聚类方法在电子商务中的应用
聚类是把一组个体按照相似性原则归成若干类别。对电子商务来说,客户聚类可以对市场细分理论提供有力的支持。市场细分的目的是使得属于同一类别的个体之间的距离尽可能小,而不同类别的个体之间的距离尽可能大,通过对聚类的客户特征的提取,电子商务网站可以为客户提供个性化的服务。
(三)数据抽取方法在电子商务中的应用
数据抽取的目的是对数据进行浓缩,给出它的紧凑描述,如求和值、平均值、方差值等统计值,或者用直方图、饼状图等图形方式表示,更主要的是从数据泛化的角度来讨论数据总结。数据泛化是一种把最原始、最基本的信息数据从低层次抽象到高层次上的过程。可采用多维数据分析方法和面向属性的归纳方法。在电子商务活动中,采用多维数据分析方法进行数据抽取,针对电子商务活动中的客户数据仓库。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作,这类操作的计算量特别大,所以可把汇集操作结果预先计算并存储起来,以便用于决策支持系统使用。
(四)关联规则在电子商务中的应用
管理部门可以收集存储大量的售货数据和客户资料,对这些历史数据进行分析并发现关联规则。如分析网上顾客的购买行为,帮助管理者规划市场,确定商品的种类、价格、质量等。通常关联规则有两种:有意义的关联规则和泛化关联规则。有意义的关联规则,即满足最小支持度和最小可信度的规则。最小支持度,表示一组对象在统计意义上需满足的最低程度,如电子商务活动中的客户数量、客户消费能力、客户消费方式等。最小可信度即用户规定的关联规则的最低可靠度。泛化规则更实用,因为研究对象存在一种层次关系,如面包、蛋糕属西点类,而西点又属于食品类,有了层次关系后,可以帮助发现更多的有意义的规则。
(五)电子商务对数字特征的具体运用
我们平时在运营电子商务网站,或者进行网络营销的时候,常常会拿到一堆报表和数据,比如访问量、订单量、转化率、投资回报率……大部分公司也能够简单地应用这些数据来指导业务的运营,比如用投资回报率去衡量媒体投放的效果,加大在那些效果好的媒体上的投放量——简单、清楚、直接、有效。可是,有些时候,我们光看到数据,却很难这么方便地得出结论去指导具体的工作。比如某网站最近突然发现转化率下降,他们很担心却不知道转化率下降的原因到底是什么,更不知道自己该做什么。这是因为很多数据外表都包着一层“壳”,要掰开硬壳才能深入地理解那些数字,只有理解了那些数字才可能有的放矢地安排业务的运营。第一个可以用来掰开网站数据硬壳的方法叫作看分布。
1.看分布
绝大部分时候,我们看到的报表显示的都是“总数”或者“平均数”,例如“总访问量:23467”和“平均订单金额:746元”。显示这样的统计数据可以让我们很方便快捷地获取信息,但是另一方面这种抽象化、综合化的数据也会丢失掉许多重要的细节。比如说:(www.daowen.com)
上个月平均订单金额500元,这个月也是500元,看起来很稳定不需要操心。可是实际上有可能上个月50000单都是400—600元,而这个月50000单则是20000单300元,20000单400元,5000单500元,5000单超过2500元——这说明客户购买习惯已经发生了巨大变化:一方面部分客户订单金额在变小(可能是因为产品单价下降,采购数量减少,或者客户选择了比较便宜的替代品)。另一方面出现了一些金额相对较大的订单(可能是中小企业采购,或者是网站扩充产品线见效了)。而光看平均值的话很容易忽视这些潜在的变化,不能及时做出应对。
再比如,两个营销活动带来一样多的流量(100万流量),而且流量的网站平均停留时间是一样的(假设是40秒),看起来两边差不多。可是两边的实际流量情况可能是千差万别的:营销活动A带来的50万流量停留0—10秒,50万停留77秒;而营销活动B带来的20万流量停留0—10秒,60万停留10秒,20万停留160秒。首先这个数据可以帮助我们去判别流量是否异常,是否可能存在作弊流量。其次它告诉我们活动A的页面弹出率比较高,活动B比较低,可能是活动B页面的设计较好。最后它告诉我们活动B页面虽然更能吸引人点击,但是那些人都是点击页面然后很快就离开了,这一点很值得和活动A进行对比再深入研究。
解决的方法其实蛮简单,就是不要只看平均数和总数,而要多看看分区段的数据。比如很多人停留了不到10秒就走了——弹出率过高,说明很多人只看了一个页面就走了。再去看那些弹出率高的流量来源,发现主要是两个:一是从其他网站上点击了相关链接而转跳过来的,这每天都能带来海量流量,但是很多用户往往点开网页就离开了——因为发现网站的内容并不是他们需要的;二是因为网站的名字比较特别,比如和某电视剧重名,所以很多搜索电视剧的用户来了网站,一看网站并不是讨论电视剧的就走了。然后我们可以根据这两个分析得出一些结论和行动方法,例如之后在投放链接时要看重对方网站与自己用户的重合度,而不是单纯只注重流量。或者说要找出网站上所有可以和该电视剧匹配的产品做个特别的着陆页,把那部分敲错门的用户留下来,关键是我们要看到“平均数”后面的东西,这样才能有深入的洞察,也才能够有合理的行动方案。除了通过查看数据分布来分析数据详情之外,比较常见的方法还有拆因子和拆构成。
2.拆因子,拆构成
网站转化率下降,我们要找原因。因为转化率=订单/流量,所以转化率下降的原因很可能是“订单量下降”,也可能是“流量上升”,还可能是两种情况同时发生。按照这个思路我们可以进一步去查看订单量和流量数据,如果发现主要的原因是“流量上升”而“订单量升幅不明显”,那么下面我们就可以来拆解流量的构成。例如拆成直接访问流量、广告访问流量和搜索引擎访问流量,再看具体是哪部分的流量发生了变化。如果是搜索引擎访问流量上升,就可以进一步分析是付费关键词部分上升,还是自然搜索流量上升,如果是自然流量,是品牌(或者网站名相关)关键词流量上升,还是其他词带来的流量上升,假如最后发现是非品牌类关键词带来的流量上升,就再找原因——市场变化(淡季、旺季之类),竞争对手行动,还是自身改变。假如最近刚好对产品页面进行过改版,就可以查一下是不是因为改版让搜索引擎访问流量变多、权重变高。
最后,我们还可以通过拆分步骤的方法来分析数据。还是用例子来说明问题:我们做了两个营销活动,带来一样多的流量,一样多的销售,是不是说明两个营销活动效率差不多?
不一定。比方说我们可以把每个营销活动的流量拆细,去看每一步,会发现不一样的地方。前面提到活动B虽然和活动A带来了等量的流量,可是这部分流量对产品更感兴趣,看完着陆页之后更多的人去看了产品页面。可惜的是虽然看产品的人很多,但最后转化率不高,订单数和营销活动A一样。
这里面还可以再深入分析,但是光凭直觉,也可以简单得出一些猜测来,例如可能是两个营销活动的顾客习惯不太一样,可能是活动B的着陆页设计更好,也可能是营销活动B的顾客更符合目标客户描述、更懂产品——但是没有在网站上感受到价格优势,还可能是因为活动B带来的用户去访问的产品品类缺货严重等。这些猜想是我们深入进行分析,得出行动方案的起点。它可以帮助我们更快的积累经验,下次设计营销活动的时候会更有的放矢,而不是仅仅写一个简单报告说这两个营销活动效果一样就结束了。
3.分步骤
再举个例子,比如网站转化率下降,我们可以通过漏斗图来分析(见图3-1),拆好之后,能更清楚地看到到底是哪一步的转化率发生了变化。有可能是访客质量下降,都弹出掉了,也可能是从购物车跳转到登录页面时流失了(如果你把运费放到购物车中计算,很可能就看到这一步流失率飙升),这样拆细之后更方便我们分析。
看分布、拆因子、分步骤,这样三板斧下去,一般的数据硬壳也就掰开了。知道症结之后方能对症下药,所以了解数字特征对于电子商务的发展有很大的帮助。
图3-1 网站转化率漏斗图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。