理论教育 打造超智能:数据中台多维处理的催化作用

打造超智能:数据中台多维处理的催化作用

时间:2023-06-06 理论教育 版权反馈
【摘要】:数据中台通过引入和处理大数据来降低信息熵,它们既是一个集合计算能力、数据库、储存和消息传送等多种服务资源的可编程接口,也是分布在云端的多维大数据处理平台。国内数据中台的代表性企业是阿里云,其通过打通数据来构筑起“阿里云智能”平台,为众多企业提供云端之上的轻资产运维服务。

打造超智能:数据中台多维处理的催化作用

什么是智能?理论上来说,能够降低信息熵(不确定性)的就是智能。吴军在《智能时代:大数据与智能革命重新定义未来》一书里就讲到了类似的观点,“智能问题从根本上讲是消除不确定性的问题,大数据则是解决不确定性问题的良药”。

比方说,我们手上有一张动物的图片,它既可能是猫,也可能是狗。这时候的信息熵(不确定性)还比较大,人类通过引入一些常识信息(比如“猫是三瓣嘴”“狗是长嘴巴”等)就可以判断图片中是猫或者是狗,从而降低信息熵;而人工智能也可以通过机器学习猫和狗的历史图片的数据特征,来判断图片中是猫还是狗。

但“凡事无绝对”,即便是高等智能的人类,也会有低智或弄巧成拙的时候,也就是智能也有可能会增加信息熵,比如有人会判断图片中的腿跟马腿很像。数字智能也是如此,只要是智能,都会有意外,但偶尔的意外并不妨碍互联网公司发展大数据智能,不妨碍它们构建智能化的“数据中台”。

数据中台通过引入和处理大数据来降低信息熵(不确定性),它们既是一个集合计算能力、数据库、储存和消息传送等多种服务资源的可编程接口,也是分布在云端的多维大数据处理平台。

中国最广为人知的大数据观点出自汉代的司马迁,他说:“以史为鉴,可以知兴替。”根据信息熵理论,当人们掌握大量数据信息之后,就可以降低甚至消除事物的不确定性。司马迁告诉我们,当我们掌握了历史上各朝代的经济、社会、政治法律军事等的大量信息之后,就可以引入当前的社会环境中判断“历史周期律”会怎样发生了,就和我们或者人工智能判断上述图片中是猫还是狗一样。(www.daowen.com)

互联网巨头们构建云化的数据中台,主要是发挥两个层面的数据优势:一是数据量会很大,数据量大就可以产生“简单智能”,比如数据库中有很多狗的照片,那么数据中台就可以通过机器学习,来判断一张照片是否是狗的照片;二是数据的维度会很多,多维数据可以产生“超智能”,比如数据库中除了狗的海量照片,还有猫、猴子、狼、兔子等各种动物的海量照片,那么数据中台就可以通过机器学习来判断一张照片中的动物究竟是什么了。

根据信息熵理论,在一个封闭的信息系统中,信息的增加意味着确定性的增加。也就是在一个封闭的信息系统中,信息越来越多,就越来越有序,而想要获得更大的确定性(更小的信息熵),则需要给这个封闭系统增加新的信息。

所以,大数据和多维数据对智能的意义不言而喻。其规律是:越多维度、越大量的数据,就可以产生越高级的智能。既然阿尔法狗理解了海量的棋谱就成了围棋大师,那么当阿尔法狗熟读了海量历史书籍人物传记后就会成为人类预言家,如同“以史为鉴,可以知兴替”一样。而当人工智能掌握了历史、天文地理、物理、生物、化学、心理学等足够多的人类三维空间的数据以后,谁知道它会不会制造出能够理解“四维空间”的超级智能,像刘慈欣在《三体》一书中所描述的一样,可以窥见三维空间的无限细节,为我们展现人类世界宏观到微观、从亘古到未来的全貌呢?

国内数据中台的代表性企业是阿里云,其通过打通数据来构筑起“阿里云智能”平台,为众多企业提供云端之上的轻资产运维服务。阿里云可以为企业提供从IaaS、PaaS到SaaS的全套“云计算”服务,其数据中台的内核包括两方面,一个是数据技术能力,另一个就是数据资产,阿里巴巴企业内的各个业务都在共享同一套数据技术和资产。阿里巴巴内部为这个统一化的数据体系命名为“OneData”,它意味着未来从前端的商品设计、制造,中端的订单、物流、支付到后端的用户使用、售后等多维数据全部都可以被打通,这样的数据中台也正是张勇眼中阿里巴巴商业操作系统的根本。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈