在互联网诞生初期,数据库主要的类型是关系型数据库,这是一种采用了关系模型来组织数据的数据库。1970年由IBM的研究员E. F. Codd(埃德加·弗兰克·科德)博士首先提出,在之后的几十年中,关系模型的概念得到了充分发展并逐渐成为数据库结构的主流模型。简单来说,关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。
随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站时已经显得力不从心,暴露了很多难以克服的问题,而NoSQL的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL泛指非关系型的数据库,它的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。
谷歌(Google)公司的三篇著名论文(GFS,Bigtable,MapReduce)奠定了谷歌大数据的基础,而谷歌的PageRank算法实现了当时几乎最先进的数据搜索算法。PageRank通过网络浩瀚的超链接关系来确定一个页面的等级。Google把从A页面到B页面的链接解释为A页面给B页面投票。Google根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级。简单地说,一个高等级的页面可以使其他低等级页面的等级提升。而这个技术正是数据第二阶段,通过复杂的设计网络和算法进行重新整理和归纳,让原本看似并无关联的数据成为可以分级分类的高质量数据,让大数据和复杂网络模型成为可能。
但是构建在这之上的大数据最大的问题就是无法解决信任问题。因为互联网将使全球的互动越来越紧密,伴随而来的就是巨大的信任鸿沟。目前现有的主流数据库技术架构都是私密且中心化的,在这个架构上永远无法解决价值转移和互信问题。所以区块链技术将成为下一代数据库架构,通过去中心化技术,将在大数据的基础上解决全球互信这个巨大的难题。通俗来说,该技术可被理解为全体参与记账的技术,过去人们使用一台台中心化的服务器记账,而在区块链技术系统中,每个人都可以参与记账,并共同鉴定记录的真伪。(www.daowen.com)
区块链可以和大数据连接,大数据预测分析可以和自动执行的智能合约完美结合。区块链技术加入经济支付层面,作为量化工具,海量自动执行的任务会解放大量的人类生产力。区块链也会促进大数据向下一个数量级发展。通过这项技术,即使没有中立的第三方机构,互不信任的双方也能实现合作。简而言之,区块链类似一台“创造信任的机器”。
区块链技术作为一种特定分布式存取数据技术,通过网络中多个参与计算的节点共同参与数据的计算和记录,并且互相验证其信息的有效性(防伪)。从这一点来看,区块链技术也是一种特定的数据库技术。这种数据库将会实现Melanie Swan所说的第三种数据类型,即能够获得以基于全网共识为基础的数据可信性。从目前来看,我们的大数据还处于非常基础的阶段,但是当进入区块链数据库阶段时,将进入真正的强信任背书的大数据时代,这里面的所有数据都将获得坚不可摧的质量。
分布式的区块链开辟了各种可能性,例如:分布式投票(如Agora),选民可使用加密货币代表他们的选票,而拥有最多额度账户的候选人将由此胜出;分布式域名注册(DNS,如Namecoin),将根据加密货币的模式来实现独立的ICANN的工作;分布式存储(例如Maidsafe和Storj),无须信任的节点在一起工作(使用加密货币作为支付手段)来交换存储空间和带宽;甚至是分布式的、点对点的异步消息传递平台,例如BitMessage(比特信)和Twitter(推特)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。