在某超市的一个角落,X品牌的销售品摆放在某处。来自X品牌公司的业务员每天例行公事地来到这个点,拍摄10张照片,怎么摆放销售品、位置有什么变化、高度如何等,这样的点每个业务员一天要跑15个,按照规定,下班之前150张照片就被传回了公司总部。每个业务员,每天产生的数据量在10MB,这似乎并不是个大数字。但公司在全国有10 000个业务员,这样每天的数据就是100GB,每月为3TB。当这些图片如同雪片一样进入公司总部的机房时,这家公司的CIO 就有这么一种感觉:守着一座金山,却不知道从哪里挖下第一锹。
CIO想知道的主要问题是:怎样摆放销售品更能促进销售,什么年龄的消费者在销售品前停留更久,他们一次购买的量多大,气温的变化让购买行为发生了哪些改变,竞争对手的新包装对销售产生了怎样的影响……不少问题目前也可以回答,但它们更多是基于经验,而不是基于数据。
从2008年开始,业务员拍摄的照片就这么被收集起来,如果按照数据的属性来分类,图片属于典型的非结构化数据。要系统地对非结构化数据进行分析是CIO的下一步计划。如果超市、金融公司与销售品有某种渠道来分享信息,如果类似图像、视频和音频资料可以系统分析,如果人的位置有更多的方式可以被监测到,那么摊开在CIO面前的就是一幅基于人消费行为的画卷,而描绘画卷的是一组组复杂的数据。(www.daowen.com)
在日常运营中,产生了销售、市场费用、物流、生产、财务等数据,这些数据都是通过工具定时抽取后展现。这个展现的过程长达24小时,也就是说,在24小时后,物流、资金流和信息流才能汇聚到一起,彼此关联形成一份有价值的统计报告。当公司的每月数据积累达到3TB时,这样的速度导致公司每个月财务结算都要推迟一天。更重要的是,公司的决策者们只能依靠数据来验证以往的决策是否正确,或者对已出现的问题做出纠正,仍旧无法预测未来。当公司采用了基于大数据的创新平台之后,同等数据量的计算速度从过去的24小时缩短到了0.67s,几乎可以做到实时计算结果,这使很多不可能的事情变为了可能。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。