【摘要】:目前一般采用国际数据公司的大数据定义上来总结大数据的特征。规模性大数据的特征首先体现为“数据量大”,存储单位从过去的GB到TB,直至PB、EB。社交网络、移动网络、各种智能终端等,都成为数据的来源,企业也面临着数据量的大规模增长,IDC的一份报告预测称,到2020年,全球数据量将扩大50倍。多样性一个普遍观点认为,人们使用互联网搜索是形成数据多样性的主要原因,这一看法部分正确。
目前一般采用国际数据公司(IDC)的大数据定义上来总结大数据的特征。
(1)规模性(volume)
大数据的特征首先体现为“数据量大”,存储单位从过去的GB到TB,直至PB、EB。随着网络及信息技术的高速发展,数据开始爆发性增长。社交网络、移动网络、各种智能终端等,都成为数据的来源,企业也面临着数据量的大规模增长,IDC的一份报告预测称,到2020年,全球数据量将扩大50倍。此外,各种意想不到的来源都能产生数据。
(2)多样性(variety)
一个普遍观点认为,人们使用互联网搜索是形成数据多样性的主要原因,这一看法部分正确。大数据大体可分为3类:一是结构化数据,如财务系统数据、信息管理系统数据、医疗系统数据等,其特点是数据间因果关系强;二是非结构化的数据,如视频、图片、音频等,其特点是数据间没有因果关系;三是半结构化数据,如HTML文档、邮件、网页等,其特点是数据间的因果关系弱。(www.daowen.com)
(3)高速性(velocity)
数据被创建和移动的速度快。在网络时代,通过高速的计算机和服务器,创建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、分析并返回给用户,以满足他们的实时需求。
(4)价值性(value)
相比于传统的小数据,大数据最大的价值在于通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法进行深度分析,发现新规律和新知识,并运用于农业、金融、医疗等各个领域,从而最终达到改善社会治理、提高生产效率、推进科学研究的效果。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关计算机导论的文章