大数据开启了一次重大的时代转型,正在改变人们的生活以及理解世界的方式,并将给各行各业的发展模式和决策带来前所未有的革新与挑战,教育行业同样不可避免。我们已经进入了一个“数据驱动学校,分析变革教育”的大数据时代。[1]
1.大数据
(1)什么是大数据?进入2012年,“大数据”一词越来越多地被提及。按照Wiki的定义,大数据是指“所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息”。[2]人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。哈佛大学社会学教授加里·金(Gary King)说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”
一般认为,大数据是符合“4V”特征的数据集,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value),如图6-1所示。
图6-1 大数据的特征[3]
1)海量的数据规模(Volume)。一般认为数据量达到太字节(TB,Terabyte)和拍字节(PB,Petabyte)级别,甚至是艾字节(EB,Exabyte)和泽字节(ZB,Zettabyte)。[4]
2)多样的数据类型(Variety)这是指多种数据类型的复杂性,包括结构化、半结构化和非结构化数据。随着传感器、智能设备和社会协同技术的爆炸性增长,数据类型复杂多样,包括文本、微博、传感器数据、音频、视频、点击流、日志文件等。
3)快速的数据处理(Velocity)。这是指数据创建、处理和分析的速度在持续加快,对数据实时处理有着极高的要求,遵从1秒定律(即一般要在秒级时间范围内给出分析结果,否则就失去价值)。
4)巨大的数据价值(Value)。大数据中蕴含着巨大的数据价值,但具有数据价值高而价值密度低的特点。
(2)大数据有多大?Facebook披露的一组数据可以给我们一个初步的印象。根据统计,Facebook每天的数据量为:[5]
1)每天Facebook上分享的内容条数达25亿条。(www.daowen.com)
2)每天处理27亿次“Like”按钮点击。
3)每天上传3亿张图片。
4)每天由人工或系统自动执行的请求达到7万次。
5)每天产生超过500TB新数据。
6)使用Hadoop查询语言Hive,每30min扫描105TB数据。
2013年中国产生的数据总量超过0.8ZB(相当于8亿TB),是2012年的2倍,相当于2009年全球的数据总量。预计到2020年,中国产生的数据总量将是2013年的10倍,超过8.5ZB。[6]
2000年,数字存储信息只占全球数据量的25%,75%的信息存储在报纸、书籍、胶片、磁带等媒介上。到2007年,人类共存储超过300EB的数据,其中数字数据占到93%。2013年,全球总存储数据量达到1.2ZB,其中数字数据占比超过98%。数字数据的存储量维持每三年增长一倍的高速增长,信息数据化程度的大幅提升推动了数据的价值显现。[3]
(3)大数据的魔力。大卫·罗斯柴尔德(David Rothschild)是微软纽约研究院的一名经济学家。在2012年美国总统大选中,他正确预测了51个选区中50个地区的选举结果,准确率高于98%。2013年,大卫·罗斯柴尔德David Rothschild通过大数据分析,对第85届奥斯卡各奖项的归属进行预测,成功预测了24个奥斯卡奖项中的19个。2014年,大卫·罗斯柴尔德David Rothschild再次通过大数据分析对奥斯卡各奖项进行预测,在24项预测中正确预测21项,继续向人们展示现代科技的神奇魔力。
2.教育大数据
2013年年底,IBM公布了最新的未来5年5大预测。这些预测是通过对22万名技术从业者的调查后,由IBM的众多实验室合作分析得出的结论。IBM的这5项预测分别是:更有智慧的教室、更有智慧的商店、更有智慧的医疗、更有智慧的安全、更有智慧的城市。这些预测均基于一个事实:机器正变得越来越有智慧,会努力去了解人,分析理由,并以越来越自然和个性化的方式参与进来。[7]这些预测的背后,其实都隐藏着大数据的身影——不仅彰显着大数据的巨大价值,更直观地体现出大数据在各个行业的广阔应用。云计算、大数据分析以及适应性学习将为这些创新提供技术支持。
教育领域的大数据反映了认知,具有强大的创造性与切实的价值。大数据将给现在的教育体制带来变革:可以通过对教育大数据的获取、存储、分析,找出教学过程中的问题,完善教学方法,构建学习者学习行为相关模型,分析学习者的已有学习行为,并对学习者的未来学习趋势进行预测。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。