理论教育 大数据特征简介-计算机(软件)工程导论

大数据特征简介-计算机(软件)工程导论

时间:2023-11-24 理论教育 版权反馈
【摘要】:大数据有4个特征,简称4V:Volume、Variety、Velocity、Value。如图8-1所示为近年来数据规模的增长。图8-1 数据规模呈指数级增长2.多样性一个普遍观点认为,人们使用互联网搜索是形成数据多样性的主要原因,这一看法部分正确。

大数据特征简介-计算机(软件)工程导论

大数据有4个特征,简称4V:Volume、Variety、Velocity、Value。

1.规模性(Volume)

大数据的特征首先体现为“数据量大”,存储单位从过去的GB到TB,直至PB、EB。随着网络及信息技术高速发展,数据开始爆发性增长。社交网络、移动网络、各种智能终端等,都成为数据的来源,企业也面临着数据量的大规模增长,互联网数据中心(Internet Data Center,IDC)的一份报告预测称,到2020年,全球数据量将扩大50倍。此外,各种意想不到的来源都能产生数据。如图8-1所示为近年来数据规模的增长。

图8-1 数据规模呈指数级增长

2.多样性(Variety)

一个普遍观点认为,人们使用互联网搜索是形成数据多样性的主要原因,这一看法部分正确。大数据大体可分为三类:一是结构化数据,如财务系统数据、信息管理系统数据、医疗系统数据等,其特点是数据间因果关系强;二是非结构化的数据,如视频、图片、音频等,其特点是数据间没有因果关系;三是半结构化数据,如HTML(超文本标记语言,Hyper Text Marked Language)文档、邮件、网页等,其特点是数据间的因果关系弱。(www.daowen.com)

3.高速性(Velocity)

数据被创建和移动的速度快。在网络时代,通过高速的计算机和服务器,创建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、分析并返回给用户,以满足他们的实时需求。如图8-2所示为我国各大互联网企业每分钟产生的数据量。

图8-2 数据产生的速度

4.价值性(Value)

相比于传统的小数据,大数据最大的价值在于通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法进行深度分析,发现新规律和新知识,并运用于农业金融、医疗等各个领域,从而最终达到改善社会治理、提高生产效率、推进科学研究的效果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈