理论教育 城乡要素互动中的信息与数据优化策略

城乡要素互动中的信息与数据优化策略

时间:2023-05-26 理论教育 版权反馈
【摘要】:而“信息”则是对数据处理加工后的结果,人们会把对自身有价值的数据称之为信息。其次,信息和数据又是相互联系的。数据是数据采集时提供的,信息是从采集的数据中获取的有用信息。信息是数据有意义的表示。图4数据与信息的关系2.城乡要素互动中的信息大数据的来源从不同的角度可以有不同的归类方法。

城乡要素互动中的信息与数据优化策略

信息存在于一切事物中。从本质上说,人类任何活动都是信息活动。实际上,视觉形成于大脑皮层,大脑中的视觉中枢如同计算机的解码器,对人眼睛采集的外界信号进行分析和处理,最终产生视觉。听觉、味觉、触觉的形成同样如此。既然是信息活动,人类活动就能够以数据的形式被记录下来(过去主要是书籍,现在是互联网),进行分析和研究。信息是事物运行的状态和方式,人类通过获得、识别自然界中的不同信息来区别不同事物,得以认识和改造世界。互联网在城市与乡村的迅速普及,使得人们每天的生产与生活活动更多地依赖网络,也必定在网络上留存大量的数据与信息。这些信息有人们发布的信息,也包括人们的网络活动以网上痕迹的形式留存下来的社会活动信息。除此之外,遍布乡村各处的工业设备、汽车、电表上的数码传感器也在随时产生着大量数据和信息,这些信息包括位置、运动、震动、温度、湿度乃至空气中化学物质的变化等等,这些信息中有许多就是城乡要素互动的信息,或通过其他形式展现而有助于研究城乡要素互动关系的信息或数据。这些信息中,有些属于相关行业部门的信息,有些是城乡人员流动留存的社会活动信息,有些是政府在社会治理中生产的信息,借助现代化的大数据平台和工具,本着“优势互补、资源共享、互利合作、共同发展”的原则与理念,可实现行业、社会数据与政务信息的叠加利用,推进城乡大数据的集成化存储、管理、开发、应用和共享,就可以为城乡要素的流动提供相关决策和管理依据,极大地提高了管理决策的科学水平。

1.数据与信息的关系

城乡融合过程中从头至尾都会涉及信息与数据,数据和信息之间既相互区别又相互联系。首先,数据和信息是有区别的。数据是反映客观事物属性的记录,而信息是客观事物的具体表现形式,“数据”的概念更客观一些,指的是那些能够不依赖人们主观意愿而转移、变化的现实存在。而“信息”则是对数据处理加工后的结果,人们会把对自身有价值的数据称之为信息。“数据”是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合,它是可识别的、抽象的符号。它不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。例如,“0、1、2……”“阴、雨、下降、气温”“学生的档案记录、货物的运输情况”等都是数据。在计算机科学中,数据是用于输入计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称。信息,指音讯、消息、通信系统传输和处理的对象,泛指人类社会传播的一切内容。人通过获得、识别自然界和社会的不同信息来区别不同事物,得以认识和改造世界。在一切通信和控制系统中,信息是一种普遍联系的形式。

其次,信息和数据又是相互联系的。数据经过加工处理后,就成为信息,而信息也需要经过数字化成数据后才能进行存储和传输。数据与信息的关系就是原料与成品的关系。数据只有经过加工和解释,才能具有意义、深化为信息。从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。数据是数据采集时提供的,信息是从采集的数据中获取的有用信息。信息可以简单地理解为数据中包含的有用的内容。人们无法掌握“所有的数据”,却可以掌握可以让自己做出判断的“足够的信息”。数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。而信息是数据的内涵,信息是加载于数据之上,对数据做具有含义的解释。数据和信息是不可分离的,信息依赖数据来表达,数据则生动具体表达出信息。数据是符号,是物理性的;信息是对数据进行加工处理之后所得到的并对决策产生影响的数据,是逻辑性和观念性的。信息是数据有意义的表示。数据是信息的表达、载体;信息是数据的内涵,是“形”与“质”的关系。数据本身没有意义,数据只有对实体行为产生影响时才成为信息。信息是数据的含义,数据是信息的载体。这里涉及数据冗余问题,数据冗余就是指数据的重复或过剩,这是许多数据集的常见问题。数据冗余无疑会增加传输成本、浪费存储空间,并导致数据不一致,降低可靠性。比如,摄像头收集的图像和视频数据中就存在大量的数据冗余,大量的图像和视频数据存在着时间、空间和统计上的冗余,采用视频压缩技术的目的就在于减少视频数据的冗余,以减少数据存储和传输的负担。

图4 数据与信息的关系

2.城乡要素互动中的信息

大数据的来源从不同的角度可以有不同的归类方法。从国家、企业、个人层面来看,主要分为以下几个大类:(www.daowen.com)

(1)国家数据库。包含公开数据和保密数据两个方面。公开数据如GDP、CPI、固定资产投资宏观经济数据,历年统计年鉴或人口普查的数据,以及地理信息数据、金融数据、房地产数据、医疗统计数据等等。保密数据涉及军事数据、航空航天卫星监测、刑事档案等不宜(或一定时期内不宜)向社会公开的数据。

(2)企业数据。主要是指互联网平台企业在平台运营者产生的数据,如国内的百度阿里巴巴腾讯新浪微博、亚马逊等,国外的如Twitter、Facebook等公司的用户消费行为数据及社交行为数据。像Facebook每天要处理23TB的数据,腾讯每日新增加200TB~300TB的数据,阿里巴巴积累的数据量已经超过100PB。此外,大数据还包括旅游公司的酒店、交通、门票等订单数据,医院的检测数据及死亡病因数据,农业的养殖培育数据,等等。交易数据包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等,成千上万的数字、文本、音频、视频等数据为企业的业务和运营提供了决策依据,通过数据进行加工产生的价值为企业也提供了可观的利润

(3)机器设备数据。主要指传感器产生的数据,如手机、监控探头行车仪、基站数据、智能家居、智能穿戴设备等,来自感应器、量表和其他设施的数据、定位/GPS系统数据等。这些功能设备会创建或生成数据,例如智能温度控制器、智能电表、工厂机器和连接互联网的家用电器的数据。一是手机等移动设备。移动互联网的兴起让面向移动设备的数据采集技术有了迅速发展,能够上网的智能手机等移动设备越来越普遍。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据到个人信息资料或状态报告事件等。目前使用最多的为Android或iOS的采集SDK(Software Develop Kit),这种技术能帮助统计APP的基础数据,包括用户数、活跃情况、流失比例、使用时长等;用户的位置、安装列表、通讯情况等通过授权也可以采集。网络爬虫是另一类广泛使用的互联网采集技术,常被用于进行大规模全网信息采集、舆情监控、竞品分析等领域。二是物联网无线射频识别设备。物联网的关键技术之一是无线射频标签(RFID)。安装有RFID微型标签的读卡器在近距离发出信号时,带有RFID的物品能自动返回其唯一的序列号,从而实现自动大批量辨识物品信息的工作。RFID技术解决了物品信息与互联网实现自动连接的问题,结合后续的大数据挖掘工作,能发挥其强大的威力。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令等。三是工业设备传感器。在工业制造业里,传感器(Sensor)是另一类常见的大数据采集装置,它能将测量到的信息按一定规律变换为电信号输出,通常用于自动检测和控制等环节。传感器的种类极为丰富,大到机械设备、汽车、飞机、建筑物,小到一个智能设备,都可以安装很多种传感器,传递温度、压力、位置、位移、光敏、距离、化学感应、生物、磁场等各类信号。未来携带传感器+大数据平台的智能设备将越来越多,当前基于传感器数据的大数据应用才刚刚起步,这方面有着广阔的前景。预计到2030年全球传感器数量将突破100万亿个。

(4)个人数据。个人数据包括个人工作或生活中拍摄的照片、录音、聊天记录、邮件、电话记录、文档等数据,以及通过微信、博客、推特、维基、脸书、Linkedin等社交媒体产生的数据流。此外,个人数据还包括大量个人网络行为数据,即每个人上网留下的痕迹。

实施乡村振兴战略,是以城乡统筹、城乡一体、产业互动、节约集约、生态宜居、和谐发展为基本特征,并以城市与乡村、新型农村社区协调发展、互促共进为基本目标。在城市与乡村统筹、互动、一体、集约以及协调发展的过程中,会产生大量的包括以上所列举的各类数据,因此城乡要素互动的过程、状态、方式等必将以数据的形式呈现出来。比如,在城乡劳动力流动中,整体上表现为城乡之间劳动者时间、位置与空间的变化。就求职者属性来讲,包括劳动者身份信息、自然属性、学历信息、工作信息、意愿以及求职行为属性等;就用工部门属性来讲,包括岗位信息、岗位要求、工单位信息、岗位用工情况等,这些都是信息。求职者在搜索引擎中输入的关键字,也是信息,它表明了求职者的某种求职意愿或对工作的某些方面感兴趣,这种行为都可以通过大数据记录下来。失业率能反映一国劳动力市场的变化情况,中国人民大学中国就业研究所与智联招聘联合发布的“中国就业市场景气报告”中采用CIER指数(中国就业市场景气,CIER指数=市场招聘需求人数/市场求职申请人数)来反映就业市场的整体走势,目的就是通过不同行业、城市职位供需指标的动态变化,来反映劳动力市场上职位空缺与求职人数的比例的变化,从而起到监测劳动力市场景气程度以及就业形势的作用。招聘需求人数、求职申请人数、行业、职位、城市等这些都是信息,既然是信息,就可以通过数据的形式进行存储、处理和分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈