量化奠定了数据化的内核
原始社会和先进社会的分界线之一就是记录信息的能力。最早期文明中古老的抽象工具源于基础的计算,包括计量长度和重量。早在公元3000年之前,在印度河流域、埃及和美索不达米亚平原地区,信息记录的水平就比较高了,日常计量也有十足的长进,尤其是在美索不达米亚平原一带,产生了一种记录生产和交易的精确方法,这是书写进步的功劳,早期文明也因此得以计量和记录下来,为日后的研究提供了依据。因为有了计量和记录,也就有了数据,这是最早的数据化根基。
人类活动在计量和记录中得到重现,像是建筑物的建筑方式和使用的原材料被记录下来,从此后就可以用类似的方法来建造房子,或是进行实验等等,譬如以改进方式来建造新的建筑物,然后依次循环。一旦有了交易记录的话,那么一块田地丰产时的稻谷产量是多少就会很明确,还有政府税收多少也能因此了解。预测和计划必须有计量和记录为基础。记录让交易的双方明确了对方的赊账状况,要是缺失了这些凭证的支持,那么欠债的一方绝对可以赖账。
计量在几百年当中从最初的长度和重量领域慢慢扩展到了面积、体积和时间之上。公元前的最后十个世纪,西方的计量方法基本都已经产生,尽管它还有众多的缺陷存在。早期文明,计量方法在计算上总有很大的困难,即便是非常简单的计算,像罗马数字的计算系统在数字计算上就不太合适,原因在于记数制上缺少十进制,哪怕是专家碰上大数目的乘除都会感到困难重重,而一般人通常就是简单的乘除都无法完成。
印度在公元1世纪的时候就发明了一套数字系统,随后几经辗转到了波斯,波斯人对其进行改进,又传到了阿拉伯国家,阿拉伯人大大改进了它们,它们就成了现在人们广泛使用的阿拉伯数字的前身。十字军东征尽管使当地的人民陷入战火之中,可同时又让地中海东部迎来了西欧文明,其中最重要的一个部分就是阿拉伯数字的引入。在公元1000年,教皇西尔维斯特二世在民众中推行阿拉伯数字。到了12世纪,阿拉伯数字的介绍书籍被翻译成了拉丁文,在整个欧洲地区传播,算术因此迎来了自己的春天。
阿拉伯数字在传到欧洲之前,算术就因为计数板的使用而有了较大的改进。所谓计数板就是在光滑的托盘上用代币来代表数字,代币的移动就可以被用来表示某个区域的加减。只可惜计数板也有自己的短板,过大或是过小的计算是不能同时运算的。还有一个缺陷是计数板上由于数字变化过快,只要是微小的一个碰撞或是错误的移位都可能会导致南辕北辙的结果。显然计数板尽管可以用来计算,但它不适合记录。数字记录一旦在计数板之外的话,计数板上的数字还是要转换成罗马数字,这无疑太费时费力了。
算术因此给数据添加了新的价值,除了可以被记录下来以外,还可以再分析和利用。12世纪开始阿拉伯数字就出现在欧洲,可是到16世纪晚期才真正被广泛使用。16世纪开始数学家就开始向人们宣传阿拉伯数字的优势,相比计数板计算的速度要快6倍。可是真正让阿拉伯数字为大家所接受还是由于复式记账法的出现,显然这就是数据化工具中的一种。
会计手稿早在公元前3000年就已经出现了。只不过在接下来的几百年里它始终缓慢发展,而且大多数时候都停留在了记录某个地方特定的一场交易的阶段。当时对于记账人和他的雇主来说,最重要的莫过于去判断一个账户或是自己从事的某个行业是否能盈利,记账法很明显已经无法轻易地得出答案。14世纪的时候,意大利会计已经开始流行用两本账本来记录交易,这种尴尬的局面也就得到了挽回。通常这样的记账法优势是借贷相加,就能够通过表格来了解账户的盈利和亏损情况。从那时起数据就开始有了它的利用价值,只是它仅仅是局限在读出盈亏情况罢了。(www.daowen.com)
现在的会计业和金融业不断发展,复式记账法被视为其不断发展的结果。实际上在推进数据利用的过程当中,这就好比是一个重要的里程碑。因为相关的账户信息的分类记录由于它的出现而实现。它的基础是一系列记录数据,也是信息记录标准化最早的例子,会计们因此能互相看懂对方的账本。复式记账法的规律能让账户盈亏情况的查询变得更为简单,交易的记账线索能够从中发现,这样一来所需的数据就越容易找到。在设计理念中它包容了“纠错”的思想,今天的技术人才可以以此为借鉴。要是有一个账本中有问题,那么就可以从另一本账本中进行查询。
复式记账法和阿拉伯数字一样也并非一开始就受到欢迎。200年以后,它广受欢迎是源于一个数学家和一个商业家族的推荐,也是他们改变了数据化的历史。
说到这名数学家,他就是知名的修士路萨·帕西奥利(Luca Pacioli)。1494年,他有一本推荐给普通读者和商人的数学教材出版。此书一经出版大获成功,曾经风靡一时。这本书是历史上第一本全部使用阿拉伯数字的书籍,也因此推动了阿拉伯数字在欧洲的广泛使用。此外这本书的最大意义在于详细论述了复式记账法。此后的几十年,此书关于复式记账法的论述被译成了6种语言,在世界上有多个通用版本。
而上文提到的商业家族,其实就是美第奇家族,他们是威尼斯商人和艺术资助人。16世纪欧洲最有影响力的银行家族非他们莫属,这是由于他们采用了当时世界上最为先进的数据记录方法——复式记账法。由于帕西奥利的著作和美第奇家族的成功,也让复式记账法一举成为标准数据记录法的基础,当然也让阿拉伯数字成了不可替代的数字。
数据记录不断发展,人们对世界的探寻也在不断前进,似乎关于时间、距离、地点、体积和重量的精准记录成了所有人的愿望。19世纪,科学家们陆陆续续发明了各种记录和测量电流、气压、温度和声频的单位和方式,科学一下子进入了量化的时代。好像不论是什么事物都可以被测量、划分和记录,人们对单位量化和记录的疯狂程度甚至已经到了需要用精细的划分来理解人的智慧了。不过这一轮伪科学的热情很快就消散了,而人们对一切量化的工作热情似乎从未消退。
测量数据和记录数据因为有了新工具和开放的思维得到了蓬勃的发展,因此也催生了现代数据化。所有数据化的根基都已经搭好了,这一切在模拟时代是不可能完成的,还可能需要无止尽的激情和耐心,不夸张地说,怎么也要有奉献一生的准备,这其中最典型的例子就是16世纪就没日没夜地观察天体运动的第谷·布拉赫(Tycho Brahe)。模拟时代成功的数据化例子并不多见,因为缺乏很好的运气,需要将大量的偶然事件叠在一起。最为幸运的应该是中校莫里,因为负伤他只好坐在办公室,也因此发现了珍贵的航海日志,只是这份幸运并非人人都有。在数据化的实现过程中必须有很重要的一点,也就是挖掘出潜藏在数据中的巨大价值,这才能揭示出最新的奥秘。
数字测量和存储设备因为计算机的出现而应运而生,数据化的效率也提高了不少。计算机的数学分析从数据中挖掘出了越来越多的潜在价值。简单地说,数据化是数字化的结果,但是数字化最终是替代不了数据化的。模拟数据成为计算机可读的数据是源于数字化,但是它和数据化之间的区别是本质化的不同。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。