理论教育 掌握互联网大数据思维,实现产业战略运营

掌握互联网大数据思维,实现产业战略运营

时间:2023-06-17 理论教育 版权反馈
【摘要】:大数据的便利已经来到我们身边,我们要用大数据的思维去积极应对。只有掌握大数据的价值链,才能改变现有的数据使用状况,才能用大数据的思维进行产业的战略运营。目前运用大数据比较成功的公司基本分为三类。数据内容比较分散,表现为网络的巨大流量和有价值的数据偏少。Twitter是美国一家非常著名的社交网络公司,每天有4亿个微博,拥有庞大的数据。

掌握互联网大数据思维,实现产业战略运营

近年来,人们越来越感受到数据量的庞大和数据增长的迅猛,人们在分析问题、观察问题和决策等方面对数据的依赖性越来越强,个人电脑的存储空间也由1G、2G发展到1T、2T。随着大数据时代的到来,数据容量单位也发生变化,由早期的KB、MB到现在的TB、PB,存储容量不断出现更大的单位。百度百科对大数据的定义是这样的:大数据(big data)或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。

数据的增长速度非常快,虚拟存储的概念也逐渐被人们接受。网络终端越来越便宜,功能越来越简单易用,电脑只是发出需求的指令终端,很多功能在“云”里按照你的指令进行操作,而最终你得到需要的结果,这一切的工作都是云计算的功劳,只要能上网就能完成这些操作。人们的数据放在电脑里,电脑出现病毒或物理损伤,数据就会不安全,但是存储在“云”端,就不会有这样的问题。从数据的角度,大家对容量的需求非常大,硬盘的容量已经不能满足人们的数据存储需求。“电脑是否可以没有硬盘”的争论一直没有停止,事实上现在的电脑就没有硬盘,电脑会提供你一个“云”的账户,给你一定的免费空间来存储,“云”存储在逐渐替代硬盘存储,在电脑终端上加了一个软件,通过软件可以实现更大的虚拟化的存储空间,这是互联网发展的必然趋势。

Iphone是苹果公司生产的一款智能手机,这样的智能手机不仅具有常规的通信功能,而且具有很多上网的功能,Icloud为苹果手机用户提供一个5G的免费存储空间,为用户安全存储数据提供方便。如果用户觉得这个空间还不够用,可以付费扩展空间。在用户终端越来越简单,没有必要增加更多的硬件配置。

北京的交通拥堵是地球人都知道的事情,尤其是早晚高峰,这已经不需要预测了。但是如果根据历史交通数据,再经过数学模型,计算出一个全北京最佳的交通信号灯管理系统,这就属于大数据的范畴了。无论是国家机关、学校还是企业,都设有信息中心,为单位办公数据、邮件系统数据等提供存储和运算服务。在大数据时代,这个机房完全可以取消,完全可以与第三方“云”进行全面合作,采用托管的形式,信息中心的工作可以迁移到“云”端,既有无限的存储空间,又达到了方便快捷、经济安全。基于“云”计算的数据解决方案已经成为信息中心的发展目标。

2001年“9·11”事件后,美国世贸大厦的绝大多数公司数据遭到毁坏,不能正常工作,有的公司随即破产。但是一家保险公司依然存在,而且十几天后正常运营,这家保险公司的数据除了在本机存储外,在远端也进行了储存。从此以后,计算机网络出现了一个“容灾”的概念,数据的“容灾”能力已经变得越来越重要。在研究“容灾”系统时主要考虑的就是数据不受物理环境的影响,还能安全、可靠。“容灾”已经成为数据存储必须考虑的问题,基于“云”的大数据“容灾”方案已经投入使用,“云”解决了大数据的存储空间和“容灾”的需求,同时为人们提供了全新的大数据应用可能。

“云”是一种虚拟的概念,想做什么事情“云”就能帮你做什么事情。比如,有很多照片和信件需要安全地存放,就可以让“云”帮你做这件事情,申请一个“云”的账号,进行数据存储,这些数据会非常安全地被管理。如果空间不够或功能需要增加,都可以向“云”端申请,你的需求都会得到满足。很多著名企业都在搭建大数据平台,既可以为自己的企业运营服务,也可以提供作为第三方的云平台服务。亚马逊谷歌华为等公司都已经建成具有相当规模的云服务平台,不仅可以提供大数据的常规服务,而且可以针对用户个性化的需求,提供专属的大数据定制服务。

我们正处在大数据快速发展的时代,每天大量的数据陪伴我们生活和工作。Facebook是基于年轻人的社交网站,拥有用户超过5亿,每天照片更新的数量是1000万张,1000万张照片需要更新,这是一个海量的数据。Facebook不仅拥有如此大规模的数据量,而且拥有大数据的分析系统,通过大数据的分析,对用户的兴趣等方面有一个准确的掌握,可以精准地为用户提供多方面的推送服务,大数据的分析为商家提供准确的需求信息,为用户提供更方便、快捷的服务。大数据的便利已经来到我们身边,我们要用大数据的思维去积极应对。

价值链是产业生存的关键,大数据的价值链对于大数据时代的产业发展是非常关键的。这个世界上存在的数据非常多,数据的有效利用率却很低,普通人使用大数据的技能欠缺,不会用数据,不会更有效地分析数据,更不善于深层挖掘数据和进行关联性的数据重组。只有掌握大数据的价值链,才能改变现有的数据使用状况,才能用大数据的思维进行产业的战略运营。目前运用大数据比较成功的公司基本分为三类。

基于数据本身的公司。这类企业最大的特点是数据量非常大,而且与数据相关联的用户人数非常多。但是,企业本身的运营并不依靠数据,从数据中提取价值或者用数据催生出创新的想法的可能性很小。数据内容比较分散,表现为网络的巨大流量和有价值的数据偏少。这类企业数据的价值主要体现在与网络运营公司共享数据流量而带来的利润和数据贩卖而产生价值上。

Twitter是美国一家非常著名的社交网络公司,每天有4亿个微博,拥有庞大的数据。Twitter的做法是把数据授权给一家数据公司,也叫贩卖数据,把它的数据变得有价值而形成盈利。我们看Twitter本身并不需要更多的信息,只需要发布的内容,内容好、影响力大、能够形成二次传播就可以了。Twitter将数据打包贩卖,这是数据公司价值的一种,但是由于数据的应用价值较低,数据的贩卖效果不会太好。Twitter是很多以数据流量为价值的公司的典型代表,盈利模式过于单一。

基于技能的公司。有些企业具备行业的技能,但并不一定拥有数据,通常是咨询公司、技术型公司或数据分析公司。这些公司运用其数据分析技能,从数据分析中得出有效的“点子”,“点子”形成价值。沃尔玛就是借助这些公司的创新性进行“点子”运营。沃尔玛是全球非常有名的百货公司,其仓储的开放式营销深受人们喜爱,可是很多人去沃尔玛购物并没留意是否留下销售的数据,已经留下的是有关商品的分类和数量信息,并没有留下消费者个人的基本信息,比如年龄、性别、购买趋势等并没有留下,沃尔玛这样的公司也并不需要。沃尔玛将商品类型、数量以及销售效果等信息提供给数据分析公司,进行数据的关联和重组,运用数据处理的专业技能,进行数据的挖掘和分析,得出的“点子”提供给沃尔玛,用于营销策略的创新。沃尔玛关注的是经营的思路和点子,并不关注数据本身,它的数据只是很有局限性的针对商品的数据,没有对人的数据分析。沃尔玛作为世界优秀的企业,其经营核心靠点子支撑。走进沃尔玛,你会觉得它的模式新颖,商品摆放不可思议,购物的路径、结算方式等令用户耳目一新,这些是它的特色,是根据点子公司的创新带来的。这样的“点子”公司掌握专业技能,不拥有数据,但是数据的分析技能就形成这类公司的核心价值链。

基于思维的公司。过分强调数据和技能的重要性是不可取的,随着技术的发展,越来越多的技能会被程序化,越来越容易被更多的人掌握。数据和专业技能并不是成功的关键,对数据的重组、挖掘等具有创新想法才是最重要的,这些想法运用到实际中才是成功的关键。大数据时代更推崇数据统计科学家,他们具有数据统计方面的独特思维,虽然对专业并不精通,甚至根本不了解,但是他们的思维不受任何限制。他们会从数学统计理论层面去寻找可能性,利用这样的机会创新数据处理的办法,运用独特的思维去挖掘数据会产生新的价值,基于这样一个经营群体的公司模式,是大数据价值链最核心的一种。

谷歌公司就是把大数据价值链的三种形式通吃的公司。用户在使用谷歌公司的搜索引擎功能时,经常出现拼写错误,它利用出现拼写错误的数据创建一个世界上最好的拼写检查程序的创新点子。同时,谷歌公司具备挖掘数据价值的技术,在大数据价值链中同时扮演三个不同角色,与谷歌公司其他项目整合后,带来巨大的利润。谷歌公司还通过应用程序接口,把掌握的数据授权给别人使用,于是数据既可以重复使用,又可以产生附加的价值。亚马逊公司像谷歌公司一样,也是大数据价值链通吃的公司,亚马逊公司的Kindle电子书阅览器记录读者重点标注和强调的内容,出版社肯定非常希望得到如此有价值的数据,作者同样很希望知道读者的这些数据。但是,亚马逊公司并没有将这些数据卖掉,而是“雪藏”这些数据,因亚马逊公司具有挖掘数据的技术和能力,可以自己通过这些有价值的数据创新点子,产生新的价值。

IBM的大数据专家乔纳斯(Jonas)提出要让数据“说话”。在大数据时代,数据处理技术日臻成熟,人们能够在瞬间处理海量的数据。但是如何能够让大数据“说话”,不是一件简单的事,需要人们改变传统的思维方式,需要大数据的思维作为指导,这样才能让数据更有发言权。大数据思维的核心观点有三个:第一,分析要做的事情,必须拥有与之相关的所有数据,而不是依靠抽样等方式获得部分数据;第二,思维需要放弃因果,崇尚关联;第三,大数据时代的数据具有混杂性。

很长时间以来,准确分析大量数据是一个挑战,由于历史久远和存储设备的欠缺,人们无法得到事情的全部数据,这其实就是一种无意识的自省,是当时受技术条件限制的人为限制,人们花费很多精力去研究数据处理的最佳算法,去研究最接近数据全部的抽样分析系统。现在,技术条件已有很大提高,我们应该追求数据的全部,让数据具有“说话”的能力。

苹果公司已故CEO乔布斯在与癌症做斗争的过程中,对自身DNA和肿瘤DNA进行全部数据排序,为此付出巨额费用。他得到的不是一个只有一系列标本的样本,而是包括整个基因密码的数据文档。对于一个普通癌症患者,医生只能期待他的DNA排列与实验中使用的样本足够相似。乔布斯的医生能够基于他的特定基因组成,按所需效果用药,如果癌症病变导致药物失效,可以更换另一种药物。虽然乔布斯的愿望没有最终实现,但是这种获得所有数据而不仅仅是样本的方法,还是将乔布斯的生命延长了好几年。

全数据的模式是“样本=总体”,抽样的目的就是用最少的数据得到全部数据的效果。当我们已经可以获得海量数据时,抽样就失去了意义。广播电视行业很重视收视率这一指标,索福瑞是一家专门从事收视率调查的公司,但是其调查数据目前也只能是经过抽样而形成的数据,不是数据的全部,尽管在评测中采用很多科学的数据处理方法,但毕竟不是全部数据,其“说话”的能力会打折扣的。美国的“塔基特”折扣店,可以对顾客进行怀孕预测,通过对顾客在这家折扣店购买商品的全部数据进行分析,结合孕妇在怀孕后购买商品的类别发生变化的情况,进行怀孕预测,准确率非常高。全部数据所带来的是精准,“样本=总体”的数据模式是这个时代所需要的。

数据化是大数据思维的前提,信息技术的变革大多依赖技术的进步和变革,而忽视信息的存在方式。我们应该更关注信息的存在方式和信息的数据化。日本先进工业技术研究所的越水重臣教授领导的研究团队,所做的研究是一个人的坐姿,很少有人会认为一个人的坐姿表现出有价值的信息,当一个人坐着的时候,他的身形、坐姿和重量分布都可以数据化,通过这些数据的挖掘,可以形成独属于每个乘坐者的精准数据资料。这样的研究成果可以应用到汽车的防盗系统、车主自动识别系统和汽车座椅的设计上。数据可以从最不可能的地方提取出来,这样的创新思维是信息独特的价值。

数据化并不是数字化,数据可以理解为是事实,而数字化应该是把模拟数据通过“1”和“0”的二进制代码转换,形式数据由模拟到数字的转化,数字化是数据的基础。2004年,谷歌公司发布数字化计划,将要对所有版权条例允许的书籍全部进行数字化,而且研发自动翻页的扫描仪,对上百万册图书进行扫描数字化,但是谷歌公司所做的这些只是把数据进行数字化存储起来,如何查到这些书目和书的内容仍然没有好的办法,没有搜索关键词是无法找到自己需要的内容的。谷歌公司拥有数量庞大的数字图书,还需要能够设定文本的字、词、句等可识别的识别元素,这样的数字图书才能被人们在网络上通过关键词搜索找到,才能形成数据化的图书。我们身边的很多事情都有可能进行数据化,方位可以数据化,地理信息系统(map info)可以成为数据化信息,为人们出行提供准确的服务。沟通可以变成数据,社交网络平台不仅为我们提供寻找和维持朋友的场所,也将我们日常生活的元素提取出来,再转化成具有新用途的数据。

Facebook通过搭建社交网络平台,将关系数据化,在此之前,社交关系一直被视为信息存在,但从来没有被界定为数据。Facebook的“社交图谱”让人们真正认识到社交数据的存在和价值。世间万物都可以成为数据,而且这些数据会带给人们使用价值。一旦这个世界被数据化,只有你想不到的,没有信息做不到的事情,人们拥有数据分析的工具,就可以在更多的领域大规模进行数据处理,在大数据时代,惊喜无处不在。

大数据时代专家的消亡与数据科学家的崛起,是一个非常明显的趋势,行业专家和技术专家的光芒会由于大数据时代的统计学专家和数据分析专家的出现变得暗淡,行业专家和技术更多凭借业内的经验去分析问题、做出决策,而数据科学家完全凭借数据分析的精准结果去帮助人们解决问题,他们不受旧观念的影响,能够让数据“说话”。当然,在强调数据科学家重要的同时,不能忽视行业专家和技术专家的作用,在大数据时代,只是他们的主导地位发生了变化。

现在广播电视行业收视率比较高的节目都是创设的节目,都是数据团队运用数据进行的创作。创设出来的节目在人物、场景、内容等方面都是完美的,人们都追求完美。原创的节目会在一些环节出现问题,因为行业专家也会出现不完整和不全面的创设。可以这样说,行业专家和技术专家的作用在减弱。数据发出的声音是主导节目创作的根本。广播电视方面的专家技能太弱,谁能做出好节目很大程度取决于数据分析。电视台在逐渐沦为节目制作方,而且电视台节目制作更多依赖数据公司,因为没有相关的数据,没有数据团队的帮助,创作出来的节目就不会赢得更多受众的喜欢。没有数据非常可怕,对数据的分析变得如此重要,数据已经主宰整个传媒产业的发展和稳定。(www.daowen.com)

放弃“因果”,崇尚“关联”,这不是一句简单的话,是需要改变观念的,不是简单地放弃,而是需要从思维方式上转变。大数据时代做事情是去探求“是什么”,而不是“为什么”。

相关联的关系会帮助人们做成事情。如今,一系列快速发展的新技术和新软件为人们提供更有效的利用关联关系做事情的可能。日常生活中,人们习惯性地凭借因果关系考虑事情,所以人们经常会认为,因果关系更容易使用和理解,推理更严谨。但是,数学推理论证有时是非常艰难的,甚至是不可能的。

父母经常告诫孩子,天冷时不戴帽子和手套会感冒,事实上,感冒和穿戴没有直接的关系,只是人们在事情发生后第一时间想到的是因果关系——不戴帽子和手套在天冷时会出现感冒的现象,但天气冷时出现感冒也可能是其他原因,如病毒性流行感冒等原因。两种感冒的治疗方案是不一样的,但你感冒后去医院看病时,医生在没有对你进行必要的检查前是不会简单给出你的病因。如果一味强调因果关系,就会有可能出现判断的错误。

国家希望国民的幸福感越来越强,如何制定政策实现这一愿望却不是一件简单的事情。国民的收入和幸福感是成正比的,但事实上,收入和幸福感之间是存在复杂的动态关系的,对于不同收入水平的人群,这样的动态关系不是线性关系,而是曲线关系,收入的高低并不是与幸福感呈现因果关系的。这个发现对决策者是非常关键的,如果只看到线性的因果关系,就会出现政策重心倾向增加收入上,认为这样才能增加全民的幸福感。一旦发现这种关系是非线性的,策略的重心就会变成提高低收入人群的收入水平上。

关联是大数据时代分析问题、研究问题的有效方法,关联物是研究和预测事情的关键。具体来讲,相关联的两件事情,当一方数值发生变化时,另一方也随之变化。关联的事情中一方变化大时,另一方也会发生较大变化。这样的关联关系称为强关联。通过寻找关联物而形成强关联关系的事情,对预测和判断非常有利。沃尔玛公司注意到每当季节性飓风来临时,不仅手电筒的销量在增加,蛋挞的销量也在增加。于是沃尔玛在飓风来临的季节,就会把手电筒和蛋挞摆放在相邻位置,为顾客提供方便,产生非常好的效果。手电筒和蛋挞通过飓风季节形成强关联,运用这样的强关联关系,产生非常好的营销效果。

科技的进步让人变得更懒,也就是自身的处理能力降低,无论是主观的还是客观的,但是被选择的对象在日益增多,从纷繁复杂的商品(电商)到海量曲库中的乐曲,从婚恋网站的男女朋友到交通管理的信号灯,不一而足。基于技术条件下的大数据,就是可以使人们“变懒”的一个手段。基于你的历史行为,判断出你可能的喜好乃至需求,将最佳结果推荐给你。这就是大数据,它是你的贴心管家,或者说是最懂你的朋友。沃尔玛公司曾经做过的“啤酒”和“尿布”调研,在研究中发现,一类顾客经常在购买尿布的同时也购买啤酒。尿布跟啤酒自然是毫无关联的两个品类的商品,从个人经验上来看,根本想不到二者的联系。后来发现,这是一类社会现象所导致的。美国有很多年轻夫妇,尿布用完后,女主人在家带孩子,男主人就去超市买尿布,买完尿布之后,男主人通常会顺便买些啤酒。

要认同数据的混杂性。在大数据时代数据量越来越大,使用所有办法获得的数据变为可能,但是数据量大就会导致结果的不准确,异常数据、错误数据也会混杂在其中,结果的不确定性就会增大。关键是人们要接受这样的事实,要允许不精确的结果,努力避免这些不利因素的影响。在小数据时代,数据的错误率越低越好,因为搜集的信息比较少,所以人们必须保证记录下来的数据的准确性。为了使搜集的数据更准确,很多科学家一直致力于优化信息搜集的工具。搜集信息的有限性将会使细微错误得以放大,甚至有可能影响最后的结果。在大数据时代,虽然错误数据和异常数据混杂在其中,但是由于数据量大,错误数据和异常数据所占比重较小,对结果影响也相对较小,如果在搜集数据时采取一些措施优化数据,得到的结果会更趋于准确,大数据通常是用概率去说话。让人们习惯这样的思维方式,需要相当长的时间,而且会出现一些问题,所以当人们试图通过扩大数据去使结果更精确时,必须接受大数据的混乱状态。

谷歌公司在2006年提出“搜集全世界的数据资源,并让人人都享受这些资源”的目标,并推出谷歌翻译系统。谷歌翻译系统开始利用更大、更繁杂的数据库进行翻译工作。从各种各样语言的公司网站上,去寻找联合国和欧洲委员会这些国际组织发布的官方文件和报告译本。尽管输入源很混乱,但和其他翻译系统比较而言,谷歌的翻译质量是最好的,翻译的内容更多,到2012年,谷歌数据库涵盖60多种语言,其中包括14种语言的语音输入。之所以能做到这一点,是因为该系统将语言视为能够判断可能性的数据,而不是语言本身。谷歌翻译系统比其他翻译系统更灵活,翻译更准确。如今人们掌握的数据库越来越全面,甚至是全部数据,不需要担心某个数据对整套分析的不利影响,要做的就是接受这些繁杂的数据并从中受益。

运用大数据思维进行数据分析,提供了可以信赖的结论,但是,它不是标准答案,是人行动的参考答案,对人的帮助是暂时的,更好的方法和答案还在未来。大数据在实用层面的影响很广泛,解决了大量的日常问题。大数据将重塑人的生活、工作和思维方式。在某些方面,一旦面临一个僵局,大数据就会提供基于数据的创新策略。大数据需要人们重新讨论决策、命运和正义的性质,人的世界观正受到相关性优势的挑战。拥有知识曾意味着掌握过去,现在则更意味着能够预测未来。

信息社会是大数据的重要标志,人们搜集的所有数字信息现在都可以用新的方式加以利用,尝试新的事物并开启新的价值链。但是,这需要一种新的思维方式,并将挑战社会机构,甚至挑战人的认同感。可以肯定的是,数据量将继续增长,处理事情的能力就会增长,笔者不认为大数据是一个单纯的技术问题,应当更多地考虑让数据“说话”会带来的变化。现在,我们可以获得比以前更多的信息并进行分析。在诠释世界时,数据不再是限制人们努力的因素了,可以利用更多的数据,甚至是全部数据。但是,需要创新的思维,特别是要改变人们理想中构成有用信息的因素。

人们“做新、做多、做好、做快”的能力释放出无限价值,产生新的赢家和输家。大部分的信息价值来自二级用途,即选择价值,而不是人们所习惯认为的基本用途。结果,对于大多数的数据来说,尽可能多地搜集、等待信息增值并且让其他更适合挖掘其价值的人来分析它才是明智之举。能置身于信息流中央并且能搜集数据的公司会在大数据时代迅速崛起。有效利用大数据需要专业技术和丰富的想象力,即一个能容纳大数据的心态,但价值的核心归功于数据本身。有时,重要的资产并不仅仅是能清楚地看到信息,更是从人们与信息交互中搜集到的数据分析,聪明的公司可以用它来改善现有的服务,或推出全新的服务。

大数据也带来巨大的风险。它不仅抹杀了目前用以保护隐私的法律和技术手段,还催生出一系列无效的核心技术方法和法律手段,用以保护大数据。过去个人身份信息包含的是名字、社会安全号码、税收记录等,其构成简单明了,因此隐私保护相对比较简单,只要确保不使用这些信息即可。今天,即使是最无害的数据,只要被数据搜集器采集到足够的量,也会暴露出个人身份。

应对大数据的汹涌来袭,没有万无一失的方法,必须建立规范自身的新准则。随着人们越来越熟悉大数据的特征和缺陷,可以改变一系列的惯例来帮助人们应对这种冲击。需要把进行隐私保护的责任从个人转移到数据使用者身上,也就是说,数据使用者应该以负责人的态度使用数据。

在一个预测的时代里,目前主要的推荐算法大致可以分为两类,一类基于行为,另一类基于内容。基于行为的分析,顾名思义,即对用户在互联网、移动互联网留下的“痕迹”——浏览、点击、收藏、购买、二次购买的分析,得出未来会选择购买的预测和推荐结果。基于行为的分析,属于群体智慧,综合利用群体用户的行为偏好,用户之间会相互影响,更加符合现实世界中的用户行为。基于内容的分析,包括对文字、图片、音频、视频等信息的分析,得出预测和推荐的结论。内容的“基因”和用户的偏好相匹配,最有代表性的是“潘多拉”的音乐推荐项目,将曲库中所有歌曲都由四百多位专家打上标签,然后建立个人与音乐的联系,从而完成音乐的推荐。内容的分析只针对个人,与用户之间关系无关。

人类的自由意志神圣而不可侵犯,这一点不可轻视。我们不仅需要承认个人进行道德选择的能力,还要强调个人应为自我行为承担责任。大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成人类的伟大。这提示人们应该乐于接受类似的不准确,因为不准确正是人之所以为人的特征之一。就好像人们学习处理混乱数据一样,因为这些数据服务的是更加广大的目标。毕竟混乱构成了世界的本质,也构成了人脑的本质,而无论是世界的混乱还是人脑的混乱,学会接受和应用它们才能得益。

大数据掀起的风暴正在席卷各行各业,近期影视业就备受瞩目。中国影视要想缩小与好莱坞的差距,既要把故事讲好,能够跨界、懂营销,又要懂科技创新,知道如何借助新技术来驱动行业发展。身处信息时代,大数据正在给中国影视业带来新的发展空间和机遇。

不管是星座还是血型,抑或塔罗牌,当亲友神乎其神地告诉你白羊座的特征是“热情开朗,敢于挑战”、金牛座的特征是“稳重肯干值得依靠”时,你可能会惊诧为什么和实际如此吻合,当然,并没有人敢绝对地告诉你星座、血型、塔罗牌会完全准确。但是,大数据就可以骄傲地告诉你,它统计出来的结果足够精准,“读心术”“未卜先知”都是大数据分析头上的耀眼光环。不管你信不信,最懂你的人,就是大数据。人们在互联网上的一切行为都会留下数据脚印,通过对这些数据的分析,就能够得到消费习惯、职业、喜好甚至性格等信息。

大数据时代媒体的转型发展,是技术和战略问题,将对未来的媒体形态和格局产生深远影响。2013年被称为“大数据元年”。美国政府将“大数据研究和发展计划”上升到国家战略层面,美国正在打造“数据政府”,输入申请文件可以进行无人的审批和运作,这是真正的“数据政府”。大数据正由技术热词变成一股社会浪潮,影响社会生活的方方面面。大数据也促使媒体的转型与发展,媒体通过对数据的整合和分析,针对不同的受众需求,满足个性化和专业化的需求。利用大数据和关系链,为用户筛选、推荐最适合的内容,提供近乎量身打造的节目,体验社交媒体的感受。

近年来,大数据被应用到影视制片行业,基于对观众喜好的分析,去预测、设计观众喜欢的剧情,找观众喜爱的演员出演相关的角色,甚至可以去预测票房。所有的预测都是在掌握数据的基础上,经过一定的模型处理,得到接近真实的结论,在某种程度上为决策提供依据。大数据正在不同行业上演着传奇故事,最近,连电影电视也张开双手捧起这个“潘多拉盒子”。大数据对影视营销带来的影响,得到业界的肯定,似乎对影视内容制作也带来冲击。尤其是美国的Netflix公司运用大数据分析投拍的电视剧《纸牌屋》在四十多个国家和地区大获成功,被网友们称为美国白宫版的《甄嬛传》。这部标准的政治剧最特别的地方就在于,不是传统意义上由制片人制作好再出售,而是由一家视频网站投资并制作;不在电视台播放,只在网络上播放。正因如此,美国的《福布斯》杂志称此举“可能会动摇美国传统电视产业,传统电视产业的变革即将从《纸牌屋》开始”。有趣的是,这部电视剧的导演和男主角都是被“算”出来的。喜欢观看1990年BBC版本《纸牌屋》的观众,同样是著名导演大卫·芬奇的拥趸,同时,他们还是奥斯卡影帝凯文·史派西的忠诚影迷——这是美国Netflix公司通过使用大数据对用户习惯进行分析后得出的结果。他们将这三个要素整合到一起投拍了新版《纸牌屋》,该剧无论是剧情设置还是选择演员、导演阵容,都以用户在网站上的行为和使用数据作为支撑,从而受到观众热捧。大数据就这样进入了电视剧行业。Netfilx是大数据运用在电视剧上首个突出的成功典型。Netflix搜集每天网上产生的三千多万个用户的行为,包括每个用户观看视频时会在哪里暂停、回放、快进以及评论和搜索请求,将其记录下来并进行分析。Netflix或许并不能准确地知道单个观众点击暂停按钮的个人原因,但是如果足够多的人在整段视频中的同一个地方有了相同的举动,那么数据就开始显露出意义了。结果,Netflix比观众还要清楚自己的观影喜好,根据大部分观众的喜好来调整剧情、主演等环节,最终根据官方公布的数据,四分之三的订阅者都会接受Netflix的观影推荐。

大数据几乎贯穿了《纸牌屋》包括制作、营销、发行在内的所有环节。看似枯燥的数据,却记录了用户对电视内容的喜好和口味,这就是《纸牌屋》走红的秘密。它正在撬动影视圈由明星、名导决定收视率的基础。由于拍什么、谁来拍、谁来演,由数千万观众的收视统计决定,《纸牌屋》被誉为电视剧行业通过互联网挖掘用户行为数据并对其进行分析预测的第一次战略运用,这似乎给电视剧、视频网站从业者带来了一种新思路。它的迅速蹿红,让国内影视业更清晰地看到大数据的力量。《纸牌屋》的制片费用,需要Netflix新增100万一年期合约付费用户,才能收回,相当于增加3%的用户。但至今没有人知道《纸牌屋》的点击量,Netflix也守口如瓶,没有透露究竟如何分析积累的数据,重点和变量是哪些,可能《纸牌屋》的大数据目前也是一个试水。目前影视业对于大数据的认识还处于初级阶段,国内还没有比较成型的尝试。但不少中国视频网站已开始纷纷效仿《纸牌屋》模式,表示将以数据为依据,推出自制影视剧。如大年初一上映的影片《爸爸去哪儿》,春节期间创下了票房佳绩,这部影片启动后,做得最多的事情就是数据分析。

在大数据时代,媒体在发生颠覆性的变化,尽管对大数据在影视上的应用,大家有不同角度的关注,但是“数据分析不会促生经典,但可以复制经典;大数据不会创造艺术,但可以防范风险”。大数据与影视有着密不可分的合作伙伴关系,前者会给后者提供比较准确的市场分析及预测,反过来庞大的影视受众会赋予大数据更高的价值。大家期待大数据与影视的联姻,能够创造出更多为观众所喜爱的文化产品。影视业在大数据时代面临着机遇和挑战,影视业应主动地搜集数据、分析数据、使用数据,从而在大数据时代掌握主导性话语权,占据更大的市场空间。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈