数据的角色以及形态从计算机诞生伊始就一直在变化。1964年,IBM发明System/360大型计算机,这个时代的计算机最主要的目的是替代手工操作,以主机/终端的计算模式为主,数据以集中的方式保留在主机。后来摩尔定律出现,伴随着计算能力的迅速提升,PC端处理能力的增强使得客户机/服务器的计算架构成为主流,数据变得分散,服务器端与客户端都有数据。TCP/IP协议的出现以及宽带网络的发展使得网络边界延展开去,互联网进入人们的工作与生活,数据开始跨越企业边界去流动,数据之间的共享开放成为可能。云计算的出现和兴起,使得成千上万台廉价的服务器能够通过虚拟化和分布式计算等技术随需提供计算和存储能力,云计算成为类似于水与电这样的公共基础设施服务,这正有如信息时代的第二次工业革命。云计算的出现使得数据可以随时在线,数据成为如同货币、石油一样的资产,数据成为激发生产力的核心资源,使得信息经济越来越名副其实,数据也成为连接云、网、端的核心。
图9-1 数据时代的技术基础(阿里数据经济研究中心,2015)
1.数据技术群落
数据技术意味着信息技术的发展,终于有能力、以低价格的形式还原、映射、记录和支撑商业世界的运行。如图9-1所示,数据时代的技术基础并不是单一的某种技术,而是以云计算和大数据技术为核心的技术群落,这一组新的技术群落包括云(计算)、大(数据)、智(智能化)、物(物联网)、移(移动互联网)等,它们共同驱动了数据时代的到来。
图9-2 数据技术群落(阿里数据经济研究中心,2015)
分析IT技术演变可以发现,IT时代实际上是以高价位、高稳定性封闭的技术为主导的时代,商业化硬件与软件技术在那时获得了繁荣和发展,技术最主要还是应用在企业内部的信息化建设为主,企业要投资大量的资金建设自己的机房,选用昂贵的技术架构去支撑自己的业务系统,最主要的数据处理还是内部数据和结构化数据处理为主,处理的数据主要来自内部信息系统如ERP上所产生的数据;数据的流动和共享也主要在企业内部为主。著名的摩尔定律,吉尔德定律以及迈特卡尔定律,诠释了互联网发展的技术基础,也为数据技术奠定了硬件的基因。在某种意义上讲,摩尔定律从微观角度解释了产品性能提高而成本降低的现象;吉尔德定律则提出了主干网带宽的增长速度至少是运算性能增长速度的三倍;迈特卡尔定律则从宏观角度解释了产生这种现象的社会渊源,随着一种技术的使用者不断增多,每一个使用者从使用中获得的价值也不断增加,但使用费用却不断下降的现象。如图9-2所示,服务器、存储、网络带宽成本的降低以及相应技术处理能力的增强,共同为云计算的广泛使用奠定了基础,这也使得数据的流动、共享以及开放成为现实。云计算使得成千上万台的服务器利用分布式处理技术和虚拟化技术形成横向扩展的计算能力,用户使用订阅服务的模式,以低价的成本,就可以获得前所未有的计算和存储能力。
软件的发展,尤其是数据管理技术的发展,成为数据时代到来的另一个技术基础。据统计,今天的数据中只有15%的数据是以二维表形式为代表的结构化数据,85%的是来自于机器数据、图像、视频、音频、网页、社交媒体以及日志等多种来源的半结构化或非结构化数据。如图9-3所示,从数据管理技术的发展来看,最早的数据管理实际上是以文件管理为主,数据与应用紧密捆绑在文件中,直到1960年开始,网状数据库的出现开始将数据与应用分开;1970年关系数据库理论出现,数据处理的技术开始出现质的改变,之后以关系数据库技术为核心的数据管理技术开始主导数据管理市场;1990年以后数据仓库技术的发展,则使得数据分析成为数据管理的热点方向;直到互联网的快速发展带来了Google分布式系统GFS、MapReduce和BigTable,随之以其为基础的Hadoop进入到Apache基金会,意味着与云计算匹配的大数据管理技术的软件基础已经基本准备就绪,软件不再是商业化软件主导,而是开源技术成为主导。总之,数据技术群落中的关键词是经济性、虚拟化、分布式、开源、横向扩展,这些因素使得数据主体不再是传统的大企业,而成为拥有勃勃生机的中小企业。在数据应用层面,尤其是数据分析与挖掘以及应用层面的技术领域里,炙手可热的数据可视化、人工智能、机器学习、数据挖掘以及模式识别技术的发展,带动着数据技术更深层次的应用。机器学习是人工智能的核心和基础,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习是“用数据或以往的经验,以此优化计算机程序的性能标准。”可见数据是机器学习和人工智能的基础。深度学习的出现和发展,使得人工智能迈上了新的台阶。
图9-3 数据技术发展方向(阿里数据经济研究中心,2015)
图9-4 数据产业概览(阿里数据经济研究中心,2015)
2.数据产业
数据作为一个新兴的产业领域,已经在全球进入到应用发展的阶段,随着大数据应用的不断发展,应用成为越来越主要的牵引力。借助芯片、传感器、智能终端等科技领域的快速进步,存在着众多的技术创新主体,既有硬件起步的IBM、HP、EMC、Cisco等,也有软件制胜的Oracle、微软,纷纷采取收购或转型的方式向云计算和大数据方向进军。IT业务范式不再是“硬件+软件”主导,而是“数据+服务”主导,由于以云计算作为基础设施,数据在此之上的流动、共享以及价值发现变得更加容易。如图9-4所示,围绕着数据的收集、存储、管理、分析、挖掘和展现等不同功能,催生新的不同角色分工,从数据生产者,数据提供者、数据服务提供者、第三方数据市场、数据解决方案提供者到数据消费者、数据资产评估机构等多个物种,都在数据时代涌现。围绕着数据解决方案提供者和数据服务提供者角色,基于云平台的数据分析服务最受关注。
从核心要素投入的角度来看,数据的持续投资已经使之成为过去几十年来经济增长的核心投入要素。不论是把大数据比喻为石油一样的自然资源,还是把它看作全新的生产要素,社会经济的发展都已经越来越取决于数据利用的效率。从基础设施的角度来看,经济、社会活动的正常运作,有赖于基础设施发挥其支撑功能。随着经济形态从工业经济向信息经济和数据经济加速转变,基础设施的巨变也日益彰显。数据时代的基础设施,是指云计算、大数据等基础设施。生产率的进一步提升、商业模式的创新,都有赖于对数据的利用能力,而云计算、大数据基础设施将让用户像用水、用电一样,便捷、低成本地使用计算资源。“网”不仅包括原有的互联网,还拓展到物联网领域,网络承载能力不断得到提高、新增价值持续得到挖掘。“端”则是用户直接接触的个人电脑、移动设备、可穿戴设备、传感器,乃至软件形式存在的应用,是数据的来源、也是服务提供的界面。新的基础设施、新的生产要素,为商业创新带来了巨大的变革活力。如表9-1所示,数据时代包括基础设施、投入要素、支柱产业、商业模式和组织模式、文化惯习等在内的一整套技术经济范式,已开始逐渐显现其雏形。
表9-1 数据时代技术-经济范式对比(阿里数据经济研究中心,2015)
3.数据的商业影响(www.daowen.com)
(1)数据是直接赋能于商业创新的核心触媒
自从人类从农业社会进入工业社会以来,商品的生产和流通就不仅仅是物质的转变和移动,同时也包括对各种商业信息的处理。虽然信息处理领域经历了一轮又一轮的技术革命,但在总体上受制于IT技术的就绪度和普及率,事实上只有少量比较关键的数据得到了记录、收集、整理和分析。而且严格地说,这类数据其实更接近于加工后的信息,只是对复杂商业世界的一种简化,而不是实时、全方位的数据。随着云计算带来的海量数据收集、存储和计算能力的飞跃,原则上所有商业活动中产生的数据都可以被收集下来。数据量的飞升,带来了商业运作逻辑的根本变化。当商业活动围绕少量的重要数据展开时,企业内的管理和企业间的协作是单向的、线性的。而当数据是全方位、实时产生的时候,企业内的管理和企业间的协作就越来越像互联网一样,要求网状、并发、实时的协同。
(2)数据的分享/交换,驱动着商业运作逻辑转向网状协同
图9-5 数据驱动业务流程(阿里数据经济研究中心,2015)
在云计算和大数据之前,商业运作的基本过程是结构化的数据附着于结构化的流程,而现在的情势则正在转向非结构化的数据驱动非结构化的流程。互联网、云计算的到来,让企业的商业环境发生了巨变。商业环境的基本特征是企业单边主导地位逐渐丧失,员工和消费者等个体,则正在获得极大的主导权,同时是数据产生的主要来源。持有多样终端的员工和企业之外的消费者所产生的数据类型,主要都是文本、视 频、图片等非结构化的数据,这在根本上改变了企业所拥有和需要运用的数据类型。非结构化的数据并不必然地附着于企业的流程,大部分情况下漂移于企业固有的商业流程之外,不依赖于企业流程而存在。企业流程重组基本特点将是非结构化的数据驱动非结构化的流程,以消费者为中心的、非固化的、灵活动态的商业流程协同。
数据之前信息是商业决策的附庸,对于管理决策只起到辅助作用。典型如企业内部的BI部门,就是定位于通过数据分析帮助高管做决策。但这样的模式无法利用好今天大部分的新数据。而在互联网时代,全方位的实时数据直接驱动商业决策,企业必须改变自己的流程来适应流动的、非结构化的数据,而不是对数据削足适履。最适合这种数据特征的运作模式将是一张新的网:实时协同的价值网。在工业时代线性控制的逻辑下,企业内部表现为流水作业和科层制结构,在企业之间则表现为线性的单向供应链,其基本特性是:集中化所导致的单向化、片面化分工,单向化传送(以企业为中心向消费者交付产品);每个环节上都由单一角色(专门化)执行预设的功能(每一个企业和个体都变成了“螺丝钉”);供应链各角色之间是“线性串联”和紧密耦合的关系。而在互联网时代网状协同的逻辑下,企业内部开放化、社区化,在企业外部则表现为以消费者为核心的网状协同的在线价值网,其基本特性是:分布式所导致的多元化分工,多向化互动(消费者与企业的紧密互动);价值网里每一企业的角色都随消费需求而变,并在不同价值网里扮演多样化的角色;价值网里各角色之间的关系是“超链接”和松散耦合的关系。大数据的分享/交换,是网状协同运作逻辑中最关键的一环。由特定的共享/交换机制所连接起来的企业之间(B2B)以及企业与消费者之间(B2C)的协作,才能让大数据在流动中发挥巨大价值——既然知识必然地分布于不同的个人和组织之中,那么唯有通过分享和交换机制,让大数据流动到拥有相关知识的个人或组织那里,才能够挖掘出它的价值。从IT到 数据技术 的演变,其实正说明了IT技术发展半个多世纪至今,才真正开始有能力去支撑、映射、驱动真实商业世界的运作。
(3)数据推动社会分工/协作跃上全新高度
一般而言,分工的深化同时也意味着交易成本(包括协作成本)的上升。但云计算+大数据的数据时代,则可能在多个层次上破解工业时代分工深化与交易成本上升之间的相互锁定,进而提供一套新高度上的分工与协作体系,突破工业经济时代的可能性边界,极大地扩展社会经济的新边疆。如图9-6所示,社会分工全面深化表现出如下特点:一是新的分工体系将变得更为精细化,基于对大数据的分享和交换,特色生意将越来越多,职业种类也将不断分化;二是协作将走向大规模、实时化、社会化,大规模协作将越来越普遍;三是工业时代的分工协作是一种基于分工的协作,而信息时代的分工/协作则是协作前提下的分工;四是企业和消费者等基本经济角色的含义将发生重大变化,消费者正在转变为产消合一者,企业组织正在转变为开放社区,员工正在转变为知识化的专家。分工全面深化的原因是:大市场才会发育出大分工,互联网和云计算支撑起了一个广度与深度达到了历史新高峰的全球大市场;互联网、云计算、大数据大幅降低了C2C、B2B、C2B之间的协作成本;云计算、大数据技术,支撑发育出了淘宝、支付宝等高效、高频、海量的交易系统与交易机制,从而能够支撑起高度复杂的分工;与工业时代企业的资产专用性不同,云平台以平台共享的方式,在云计算中心的初始固定投入与APP、垂直应用、增值业务等的边际投入之间,进行了一种超出企业资产专用性边界的社会化分工。
图9-6 数据推动社会分工协作跃上新高度(阿里数据经济研究中心,2015)
(4)平台是数据时代分工协作的主要载体
图9-7 数据平台和客户端应用(阿里数据经济研究中心,2015)
平台模式由来已久,但在互联网时代,却获得了全新的规模、内涵与影响力。据哈佛大学托马斯·艾斯曼的观察,全球最大100家企业有60家企业的主要收入也来自平台商业模式。全球性巨型平台的出现,使平台成为一种越来越重要的经济现象、组织现象、社会现象。大平台+小前端成为越来越多商业组织的基本商业结构,如淘宝平台(海量网店+海量买家)、苹果平台(海量APP+海量用户)、谷歌平台(海量网站和广告主+海量用户)、快的平台(海量司机+海量乘客)、蚂蚁金服平台(大量金融机构和创业者+金融消费者)等。在单个企业内部,如海尔内部的平台+2000多个自主经营体,以及企业平台化的员工创客化、用户个性化、小微公司成为海尔基本单元等。如图9-7所示,平台扩展的逻辑是用户需求倒逼组织平台化、个人专家化与柔性化。消费者和用户的个性化需求,倒逼商业组织向着大平台+小前端化的方向去演化,这样才能接得住大量小(批量)多(品种)快(反应)的用户和消费需求。而对于组织内部的小前端,甚至对每一位社会成员来说,则会面对专家化 和柔性化的考验。每个人必须要自我监督、自我管理、自我提升,学会更加柔性化地生存与发展。互联网、云计算、大数据带来了社会化、规模化的分工与协作体系,带来的专业化效率全面突破了工业时代的限制。巨平台+海量小前端平台则成为这一新型分工形态的全新载体与重要依托。
(5)各产业的数据技术化进程
在数据化的过程中,人、事、物都在被数据化,瞬间产生了大量人与人、物与物、人与物之间的数据,数据技术受到了各界广泛关注,已渗透到金融、医疗、消费、电力、制造等几乎各个行业。随着大数据领域的新产品、新技术、新服务不断涌现,行业的数据化进程正在加速。不同的行业基本上会沿着信息化、在线化、云化、数据化的过程发展。大部分企业信息化以自身信息系统建设为主线;在线化意味着内部数据开始走出企业边界,外部数据可以走进企业内部;云化意味着可以利用云的基础设施实现成本最大化节省,同时实现数据管理能力的最大化,数据之间能够很容易地互动起来;前面的三步主要围绕着业务数据化,数据化则意味着数据业务化的过程,需求方与供应方的信息壁垒消除,数据成为驱动业务创新的核心要素。具体来看,行业数据化进程的速度,与行业的信息化水平、行业与消费者的距离、行业的数据拥有程度最为相关。第一类是互联网和营销行业。互联网行业本身就是离消费者最近的行业,同时拥有大量实时产生的数据,在线化是其企业运营的基本要素,因此 数据技术化的程度是最高的。与之相伴的营销行业,是围绕着互联网用户行为分析、为消费者提供个性化营销服务为主要目标的行业,因此这一行业的数据化程度也很高。第二类是信息化水平比较高的行业,比如金融、电信这两类行业,它们内部信息系统相对比较完善,对内部数据有大量的历史积累,并且有一些深层次的分析类应用,目前正走在内外部数据结合起来共同为业务服务的阶段。政府行业的信息化程度和数据化程度差异较大,但政府的数据化将会是未来整个数据时代发展的关键,它通过数据开放可以使政府数据在线化走得更快,从而激发数据类创新创业的大发展。第三类是制造业、物流、医疗、农业等行业,它们的数据化进程还处在初级阶段,但未来消费者驱动的C2B模式会倒逼着这些行业的数据化进程逐步加快。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。