《吕氏春秋》中有一段话:审堂下之阴,而知日月之行,阴阳之变;见瓶水之冰,而知天下之寒,鱼鳖之藏也。这段话告诉我们:知识到底是什么。知识,其实是信息之间的联系,让人们能够通过一部分信息来获得另外一部分信息。如从“堂下之阴”到“日月之行,阴阳之变”;从“瓶水之冰”到“天下之寒,鱼鳖之藏”。
DLKW体系的理论就是这样的观点:知识是信息的关联(图1)。
知识有很多种。科学知识是因果知识。例如,已知物体的质量和它的受力,就能够求得加速度大小。但是除了科学知识外,人类还有两种特别重要的知识:感性知识和相关性知识。人们看到某个图像信息后,就知道这是一朵玫瑰花,把图像信息与“玫瑰花”的文字信息关联起来,就是一种概念性知识。相关性知识也是一种关联,如张三喜欢吃萝卜,这个知识没有因果,但是有关联。
在日常生活中这两种知识都十分重要。过去,计算机很难处理这两种知识。比如说图像处理,程序难以从图像中获得表示其为“玫瑰”的信息,也难以从科学原理推理出张三喜欢吃萝卜。但是,在大数据时代,计算机具有了处理感性知识的技术和能力。无法通过推理得到的相关知识也可以通过数据分析得到,这就是大数据时代。这个时代让计算机掌握的知识更加完整,带动人类社会进入智能时代。
图1 DIKW体系
工业大数据与普通大数据不同。工业界对确定性要求非常高,希望获得真正的因果知识。但是一般来说,单纯的数据分析只能获得相关性,无法得到真正的因果。笔者的观点是:工业大数据分析工作,不要止步于相关,但不要纠结于因果。我们可以从数据中发现相关性,用人类的科学知识保证因果关系。
换句话说,工业大数据分析可从相关性开始,经过人的加工和确认得到因果关系并应用于工业中。这里需要用到数据,但也要用到数据之外的知识。
西方有句名言:“世界上有三种谎言——谎言、弥天大谎和统计学。”但是从数据看问题,经常会得到一些错误的结果。这在工业界尤其司空见惯。在数据分析过程中,要得到可靠的结论,首先要求能够被解释,其次能够从多个角度论证。一个结论若能被多个互相独立的证据论证,这个结论就会逐渐变得严密可靠。(www.daowen.com)
对于工业大数据的应用者来说,不应该过分强调数的“大”,这是因为遇到数据量大的困难,可以请专业的公司来解决。对使用者来说,应该关心怎么从数据获得知识、应用知识,进而创造价值。对应用者来说,“数据大”是件好事情。根据经验,数据分析和应用的关键在于数据质量。数据大了以后,更容易让数据质量提高,这就是大数据的意义所在。
我们把工业大数据的应用分为三个层次:
第一个层次是获得知识。这是属于数据分析师的职责。
第二个层次是管理和运营。这个层次主要是把管理者和专业技术人员的思想和知识转化成计算机可以用的数字化知识,可以称为工业智能。
第三个层次是决策者关注的企业战略和业务转型。这种应用工作的关键是梳理和重构业务逻辑,具体的、与IT相关的技术工作一般可以交给专业公司解决。
这三个层次所对应的人员面临的问题不同,不应该混淆在一起。对于第一层次大体上可以分成数据分析、数据建模两类,是由数据科学家主导,体现数据科学家专业水平。第二层次是有关企业管理与运营的问题,用数字化的方法定义并解决企业面临的业务问题,由管理者或者专业技术领域专家主导。第三层次是有关企业战略与转型、业务创新的问题,使用数字化条件对企业的业务和经营进行重构式创新,由企业家或者高管主导。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。