《哈佛商业周刊》指出:数据科学家是21世纪最性感的职业。在获取海量数据后,就要考虑如何去利用数据。数据科学家就是采用科学方法、运用数据挖掘工具寻找新的数据洞察的工程师。大数据时代正是凸显了数据科学家的重要性以及将数据分析和业务结合的必要性。当具备硬件和基础设施条件从而产生海量的数据时,需要有人将大量散乱的数据变成结构化的可供分析的数据,进行整合、清理来形成结果数据集。
人才雷达就是一个典型例子。基于每个人在网络上留下的包含着其生活轨迹、社交言行等个人信息的网络数据,依靠对这些数据的分析,从个人的网上行为中剥离出他的兴趣图谱、性格画像、能力评估,基于数据挖掘的人才推荐平台人才雷达帮助企业更高效地实现人岗匹配,提供猎头服务。为了评估一个技术人员的专业技能,人才雷达利会利用其在专业论坛(如Github、CSDN、知乎、丁香园等)上的发帖数、内容被引用数、引用人的影响力等数据进行建模,完成其专业影响力的判断。同时,微博的数据也被充分利用起来。其中折射出的社交关系也是判断一个人职业能力的因素之一。所以,判别用户在社交网络上好友的专业影响力也是人才雷达推荐系统中的一个重点。同时,即使被推荐者的个人能力难以符合职业需求,但如果他有着能力不错的好友关系,则也可以作为合适的“推荐人”将任务传播到下一层级当中。不同用户在社交网络上的行为习惯也是不同的,比如发微博的时间规律、在专业论坛上的时间长短,这些行为模式可以用来判别其工作时间规律,看其是否符合对应的职位需求。通过各种数据源的融合和分析,人才雷达不仅能够在节省成本的前提下帮助企业提高人才招聘的效率。与传统的猎头业务相比,其采用群体智慧的方式能够更广泛和客观地筛选人才,并且其被动测量的方式也能在一定程度上避免直接面试时部分求职者的虚假表现。它现在的客户有淘宝、微软、百度等知名企业。
亚马逊于2013年12月获得“预期递送(anticipatory shipping)”新专利,使该公司甚至能在客户点击“购买”之前就开始递送商品。该技术可以减少交货时间和减少消费者光顾实体店的次数。在专利文件中,亚马逊表示订购和收货之间的时间延迟“可能会削弱顾客从电商购买物品的热情”。亚马逊指出,它会根据早前的订单和其他因素,预测某一特定区域的客户可能购买但还未订购的商品,并对这些产品进行包装和寄送。根据该专利,这些预递送的商品在客户下单之前,存放在快递公司的寄送中心或卡车上。在预测“预期递送”的商品时,亚马逊可能会考虑顾客过往的订单、产品搜索、愿望清单、购物车的内容、退货甚至顾客的鼠标游标停留在某件商品的时长。这项专利表明,亚马逊希望能充分利用它所拥有的海量客户信息,借此形成竞争优势。(www.daowen.com)
大数据最本质的应用就在于预测,即从海量数据中分析出一定的特征,进而预测未来可能会发生什么。当不同的数据流被整合到大型数据库中后,预测的广度和精度都会大规模地提高。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。