理论教育 中国的U-NIS、大数据战略与智能化战略

中国的U-NIS、大数据战略与智能化战略

时间:2023-05-28 理论教育 版权反馈
【摘要】:为了应对“信息化”这一全球共同的战略选择,我们国家也制定了国家层面的信息化战略及相应的实施规划。为实现上述目标,未来10~40年,我国的信息化战略将以以下6项重点任务为主攻方向。其中短期目标是:以信息化改造传统产业,推进企业高端化,实现设计研发信息化、生产装备数字化、生产过程智能化和生产经营网络化,促进企业变革与转型。

中国的U-NIS、大数据战略与智能化战略

为了应对“信息化”这一全球共同的战略选择,我们国家也制定了国家层面的信息化战略及相应的实施规划。2017年我国颁布了《国家信息化发展战略纲要》,它是在我国网民数量、网络零售交易额、电子信息产品制造规模已经位居全球第一;一批大信息技术企业和互联网企业跻身世界前列;“互联网+”迅速异军突起,经济社会数字化、网络化转型步伐加快;网络空间的正能量进一步汇聚和增强;我国已经进入新型工业化、信息化、城镇化、农业现代化同步发展的关键时期,这样的大背景下提出的,用以规范和指导我国未来信息化发展的纲领性文件,是我国国家战略体系的重要组成部分。

我国信息化战略的终极目标是:到21世纪中叶,我国全面步入信息化社会,成为引领全球信息化发展的重要强国。

为实现上述目标,未来10~40年,我国的信息化战略将以以下6项重点任务为主攻方向。

图2-1 我国信息化战略的重点任务

以上6项重点任务凝聚成一个总任务,即建设“惠及全民,无所不在的信息网络体系(Ubiquitous Information Networks Systems,U-INS)”,实现“构建称心如意、惠及大众的信息基础设施,引领国民经济高质量发展,推动新兴科学发展以及维护国家与社会安全”4个分目标。

其具体任务如图2-2所示。

在以上任务中,与信息管理密切相关的有以下几项任务:

1)构建无所不在、称心如意的信息网络

第一,全面部署基于IPv6的下一代网络,解决网络由于地址不足而带来的网络应用瓶颈,提高网络的安全性和可管理性,实现无论何人、何物、何时、何地均能够轻易地通过网络实现互联的目标。

第二,实现基于Web3.0的语义网络的大规模应用,人们可以借助自然语言调动、组合网络资源,获取个性化的信息应用服务,这些服务包括:基础设施(计算能力、存储能力)服务(IaaS)、平台服务(PaaS)、数据服务(DaaS)以及软件服务(SaaS)。

图2-2 我国信息化战略的具体任务

第三,实现传统媒体网络与互联网媒体的联动融合,构建无所不在的“传感网”与物联网,实现大规模综合信息的实时获取与协同感知,实现网络信息空间与物理世界的有机融合。

第四,实现多模态的智能交互机制,形成和谐、普适的人机交互环境,满足设备的互联性、数据的共享性、交互的自然性。

第五,建立网络服务科学体系,实现泛在的、可持续的网络服务,实现网络信息在数字社会中的广泛应用。实现这一任务的技术路线如图2-3所示。

图2-3 构建称心如意的信息网络

2)发展数据、知识服务产业

数据知识服务产业是伴随信息技术的飞速发展和应用的日益广泛而发展起来的一个全新的产业,它是围绕数据和知识的生产,并从数据知识的提供与服务中创造经济、社会价值的全新产业。其又可以细分为数据产业与知识产业。

数据产业是指围绕数据的收集、处理、存储、传播、分析、管理和服务,以及相关软硬件研发与制造而形成的相关产业的总称。

而知识产业则泛指以知识产品的生产、流通和应用以及相关服务的提供为核心业务的产业。随着信息技术的日益成熟和广泛应用,数据知识产业将会逐渐成为社会发展与经济增长中具有支配性作用的重要力量,信息资源的开发、利用也将成为信息化的重要内容。

发展数据知识服务产业,首先需要解决数据的汇集与存储问题,因此首先得发展低成本的海量存储技术,原子存储、全息存储以及关联存储等新兴存储技术,普及存储服务,实现面向应用领域的海量的人、机、物三元世界数据的有效存储,为广大终端用户提供无所不在的智能存储和个性化存储,形成数据的网上互联,实现存储服务的普及应用。

将数据转化为内容和知识,则要依赖有效的计算手段和分析软件,因此需要研制低成本、高通量、高可用、易编程的大规模并行计算系统,研究支持高效的数据挖掘和知识提取并行算法,实现时变、多源、多模态、有噪声的数据处理

同时还需要发展语义互联网技术,中文语言分析工具,实现话语理解和场景理解;提供专业化的中文内容服务和用户参与的内容计算;发展支持语义、内容和文化的普惠信息网络基础平台,实现知识与情感理解。

此外,还要大力发展具备推理和学习能力的智能互联网;发展支持语义、内容和文化的数据知识服务的技术体系,实现连接三元世界的内容服务,提供对数据内容综合理解基础上的多目标决策支持。实现这一任务的发展技术路线如图2-4所示。

图2-4 发展数据知识服务产业

伴随上述任务的逐步实施,信息消费将成为创新最活跃、增长最迅速、辐射最广泛的新兴消费领域,对于优化经济结构、普惠社会民生、拉动内部需求、促进广泛就业、引领产业升级将发挥重要的作用。预计到2020年,我国的信息消费将达到6万亿元的规模,带动相关领域的产出达到15万亿元。

3)实现两化融合、推动产业升级换代

实体经济是社会生产力的集中体现,是强国之本、兴国之基,是物质财富创造的根本源泉。经过长期的努力,我国的工业产业在形成完整的工业体系的同时,在数字化、智能化领域也正在紧跟时代的潮流,实现“信息化”与“工业化”两化融合,推动互联网、物联网、大数据、人工智能同实体经济的深度融合,引领我国实体经济实现向价值链高端的转型,是我国信息化战略的又一重点任务。

其中短期目标是:以信息化改造传统产业,推进企业高端化,实现设计研发信息化、生产装备数字化、生产过程智能化和生产经营网络化,促进企业变革与转型。广泛使用信息技术推动高能耗、高物耗和高污染行业改造,推动供应链管理(SCM)和客户关系管理(CRM),发展电子商务,降低物流成本和交易成本,实现精准、高效生产。

而长期目标是:完善工业软件理论体系,促进产业从信息化向集成化和智能化转变。集成化将从企业内部全生命周期(设计、生产、销售、服务)、全方位层次(设备控制、生产执行、企业管理)走向产业链一体化;智能化则将从实现企业的信息和功能集成,发展到知识和智能集成,最终实现企业的人机智慧集成。

为实现以上任务,我国相继制定了《中国制造2025》和《智能制造发展规划》,重点围绕制造领域的关键环节,开展新一代IT与制造装备融合的集成创新和工程应用。通过政产学研用联合攻关,开发智能产品和自主可控的智能装置并实现产业化。依托优势企业,紧扣关键工序智能化、关键岗位机器人替代、生产过程智能优化控制、供应链优化,建设重点领域智能工厂/数字化车间。在基础条件好、需求迫切的重点行业、重点企业中,分类实施流程制造、离散制造智能装备和产品,新业态、新模式、智能化管理、智能化服务等试点示范及应用推广,建立智能制造标准体系和信息安全保障系统,搭建智能制造网络系统平台。

到2020年,制造业重点领域智能化水平显著提升,试点示范项目运营成本降低30%,产品生产周期缩短30%,不良品率降低30%。到2025年,制造业重点领域全面实现智能化,试点示范项目运营成本降低50%,产品生产周期缩短50%,不良品率降低50%。

重点任务:

①发展产品设计的创新理论。目标是提高产品设计的效率、质量。包括:全生命周期的产品数字化建模与仿真技术;产品快速开发的设计与管理技术,最终用户自行设计的技术。

②发展各种流的集成建模与优化技术。包括:物质流、能量流、资金流、信息流、价值流等仿真。

③发展企业管理的创新理论和平行管理理论。包括:帮助企业实现全面创新的软件实现技术与方法体系的构建,驱动企业从单一创新、部分创新走向整个产业链的集成创新;运用平行控制和平行管理理论与方法,建立人工系统对动态变化的企业的等价实施描述,通过计算实验揭示企业与环境要素间的相互作用规律。

④构建挖掘工业大数据的核心技术体系。形成依托信息物理系统(CPS)的、面向不同的生产对象的基于数据汇总、分析、预测能力,实现虚拟与现实生产空间的映射与融合,打造面向产品全生命周期的数据管理平台,提升整个生产过程的智能化水平。(www.daowen.com)

4)促进交叉、汇聚科学的发展

研究多算法间的交互行为及交互机制;构建算法网络理论,突破软件结构化与高可信软件关键技术;研制具有推理、感知、学习能力的计算机系统;突破脑信号处理与脑、机结合系统关键技术;建立多个算法协同工作的新型分布式与交互式算法理论;奠定高可信软件系统的设计方法学;研制具有思维、多模态交互能力的计算机系统。

实现基因组蛋白质组、结构组等组学(nomics)数据深度整合,建立基于系统生物学的生物起源及演化动力学,推进生物计算学的发展,实现活生物体系统以及生物体整体的模拟及其状态预测。在基因与蛋白质的计算机辅助设计、比较基因组分析、生物系统模型、细胞信号传导与基因调控网络研究、专家数据库、生物软件包等领域发挥重要作用。

构建面向社会活动、社会过程、社会结构、社会组织和社会功能的计算理论和方法。在若干领域构建平行社会系统的模拟仿真系统,实现计算社会实验,确定复杂系统管理的决策及反馈机制,克服传统社会研究缺乏“先验性”的关键性障碍。实现社会计算理念与方法的常态化与社会化,实现重大问题的科学分析与决策支持。

构建算法对演化与人类智能(脑科学认知科学、人工智能)建模;发展具有演化及人类智能特征的计算理论,研制成功具有情感计算的、能够自然交互的计算机及类脑计算机。

这中间,属于社会科学范畴管理科学(尤其是信息管理)要特别关注依托信息技术所形成的社会计算学的发展。

社会科学从产生、发展到现在,所走过的是一条坎坷不平的道路,正如美国社会学家柯林斯和马科夫斯基所说的,社会科学并不是一门不可能的科学,但的确是一门很艰难的科学(柯林斯等,2006)。所谓很艰难的科学,主要是指社会科学在研究方法上经历了一个艰难探索的过程。

社会科学研究方法被作为重要问题进行探索并引起争论开始于20世纪50年代,此时西方社会学的定量研究迅速发展成为主流研究方法。随之而来的是对各种方法的争论。例如,美国纽约1956年召开了一次“社会测量大会”,聚集了一大批当时顶尖的社会科学学者,对社会科学研究方法的发展提出了多种意见与构想。心理学家史蒂文斯(S.S.Stevens)提出社会科学研究需要测量手段的更新(reinvent measurement),社会学家拉扎斯菲尔德(Paul Lazarsfeld)提出需要关注定性研究与定量研究之间的关系问题(Mohr et al.,2014)等。这次会议对此后包括社会学在内的社会科学研究方法的发展起到了重要的推动作用,特别是进一步提高了定量方法在社会学研究中的主导地位。

进入20世纪70年代后,由于计算机的发展与广泛使用,以及由此所带来的各种数据分析统计软件的问世,社会科学研究在大样本问卷调查、数据的多变量统计建模与分析方面,达到了一个前所未有的水平。与此同时,人们也在积极探索其他研究方法,如进行社会科学实验和开展社会现象的计算机建模研究等。

尽管如此,社会科学研究方法所面临的问题似乎越来越多、越来越严重。社会科学研究方法领域的专家、美国国家科学院院士、密歇根大学谢宇教授坦承“现在用于研究社会和社会关系的所有方法,包括定量与定性方法,都存在局限性”。在他看来,社会科学中最明显也是后果最为严重的问题是研究方法上的矛盾,社会科学也因此而分化为不同的阵营。

社会科学研究方法所面临的困境,实际上是人类行为研究所受时代条件限制的反映。大数据时代的到来,正在为社会科学研究方法突破困境创造条件。

20世纪90年代中后期以来,一系列技术进步使得社会科学研究方法的进一步创新成为可能,其中最重要的成就表现在4个方面:其一,社会网络理论与研究方法的发展;其二,人工智能的发展带来新型文本与影音资料处理系统的问世;其三,计算机模拟领域内基于行动者模拟方法(Agent-Based Modeling,ABM)的发展;其四,互联网的快速发展,特别是移动互联网时代的到来。1996年,经济学界先人一步,出版了《计算经济学手册》(Handbook of Computational Economics,Amman et al.,1996),正式宣告了“计算经济学”的诞生。在最近10年内,正是这些新的理念和技术推动着人们不断探寻社会科学研究方法上的根本性突破,为新计算社会学的产生做好了必要的准备,新计算社会学的孕育过程逐渐完成。

2009年,包括哈佛大学教授拉泽尔(David Lazer et al.,2009)在内的15名顶级学者在《科学》(Science)上共同署名发表论文,正式提出“计算社会科学”(Computational Social Science)这一概念。文章预言一个以新计算机技术、互联网为基础,具有无限可能性的计算社会科学的产生正在成为现实。过去,我们只能够获取间断的、片面性的社会数据,而如今,借助视频监控、电子邮件、计算机智能命名系统等,社会科学家搜集与处理海量数据的能力得到了空前提升,人们将在前所未有的深度和广度上自动地收集和利用数据,为社会科学的研究服务。这正是计算社会科学得以产生的一个重要原因。另一个原因是认知科学的发展。人类对自身认知机制的深入了解,神经生物学、计算机科学以及其他学科的融合,为人类行为研究的计算机模拟提供了条件。

在这两个原因的共同推动下,一种崭新的社会科学研究方法被提了出来。“计算社会学”(Computational Sociology)这个名词已在瑞泽尔(George Ritzer)2007年出版的《布莱克威尔社会学百科全书》(Blackwell Encyclopedia of Sociology)中出现(Bainbridge,2007)。2014年8月美国社会学界举办的“新计算社会学研讨会”则首次提出了“新计算社会学(New Computational Sociology)”的概念。

所谓社会计算学目前还没有一个明确和公认的定义。笼统而言,它是一门现代计算技术与社会科学之间的交叉学科。国内有学者将其定义为:面向社会活动、社会过程、社会结构、社会组织和社会功能的计算理论和方法,是依托信息技术的横向拓展而形成的社会学的一门学科分支,它使用密集演算的方法和模拟仿真手段来研究和剖析复杂的社会现象。借助计算机模拟、人工智能、复杂统计方法,以及社会性网络分析等新的途径,由下而上地塑造虚拟与现实社会互动的模型,来分析与测试复杂社会过程,从而从根本上解决既往的社会科学研究缺乏有效的实验分析手段而导致的不具有“先验性”的缺陷。从而形成一整套用计算科学方法为重要研究工具,以传统人文社会科学理论为指导,有效地洞察、分析和解决社会、经济、政治等诸多领域问题的理论与方法学体系。

为实现其目标,社会计算学应该具备5个重要能力:

(1)综合信息的实时获取的能力

即针对所面临的问题,进行综合信息有效的实时采集,并为个性化应用实现关联信息的存取能力,是进行社会计算学计算和分析处理的基础。海量社会信息的智能化感知对社会信息的精准、实时和智能化获取是社会计算研究的数据基础和前提。新兴社会媒体信息作为典型的大数据应用,不仅数据量增长迅速,而且具有多源性、异构性、混杂性和个体倾向性,增加了精准获取社会媒体数据的难度。此外,重大社会经济事件通常具有瞬时爆发、快速传播、大范围扩散与海量数据积聚等特点,给社会媒体信息的实时感知带来很大困难。因此,社会计算研究需寻求社会媒体数据的精准感知和主动获取方法,通过自适应地构建和优化部署社会传感网络,提高社会媒体信息获取的效率和质量。

(2)内容计算与理解的能力

即对采集到的信息进行计算处理并理解其“内容”,提取分析问题所需的数据,为进一步数据建模和模拟提供支撑的能力。其要解决的核心问题包括:在海量社会信息的深度理解方面,底层社会信息与高层语义之间存在的语义鸿沟;以及在社会信息的计算方面,社会信息存在多样性、混杂性、噪声多、数据量大等问题。另外社会认知状态还具有较大的模糊性。

基于上述需求,多源、异构社会信息深度理解的关键技术主要包括:①在多源异构海量异构网络信息的深度融合方面,形成包括关键目标语义的提取与关联分析技术、基于内容的跨媒体分析与索引技术,以及交互式语义检索及多媒体内容的可视化表示技术。②在海量社会信息的处理与分析方面,形成包括观点和情感挖掘技术、大规模网络社区发现技术、网络群体影响力识别与分析技术、数据驱动的机制设计和演化博弈技术等。

(3)构建平行社会系统的能力

即借助计算机的模拟仿真分析手段,构建能够准确模仿现实系统的人工系统,通过两套系统的相互连接,对二者的行为进行对比分析,形成对各自未来状态的“借鉴”和“评估”,提高预见结果和洞察风险的能力。

早期的建模方法主要是通过一致性假设,并采用数学方程来描述社会规律。随着社会问题复杂性的增加,传统的自上而下的建模方法已经无法满足复杂系统的建模需求。同时,计算技术的广泛应用和数值计算方法的发展成熟,特别是可获取和可利用数据量的激增,使得利用仿真的方法研究社会系统的动态特性成为现实。20世纪90年代初,美国Rand公司提出了人工社会的概念,其核心思想是采用基于智能体的基于数据驱动的建模方法,自底向上地构建复杂社会系统的模型。目前,基于海量社会信息的人工社会构建方面的关键技术与方法主要包括:①社会分层模型构建技术。其通过研究社会群体的类型、分布、组织结构和社会网络关系,以及个体的行为和交互方式,构建社会群体的社会分层模型。②多智能体协调技术。其通过分析多智能体交互行为,构建合理有效的多智能体协调机制。③大规模高保真人工社会环境构建技术。其通过社会环境的基本要素进行一致性描述,并结合实时海量社会数据,构建开放且支持互操作的大规模高保真人工社会环境。

(4)计算社会实验和决策支持的能力

即使计算模拟成为“计算实验室”中的“试验”过程和“生长、培育”复杂系统的手段,进行特定系统的社会计算试验,对相关决策行为和政策的可能结果进行反复试验、比对和评估,从而实现优化决策以及有效控制与管理的能力。

复杂社会的整体行为往往是不可预知的,因此不能使用传统的还原论方法进行处理,也往往不存在最优的解决方案。数据驱动的计算实验即成为一种分析、管理复杂系统的有效解决方案。其核心思想是“将计算机作为实验室”。通过设计大量虚拟或者真实的社会和经济事件场景,利用数据驱动的计算实验的可设计性和可反复进行等特点,对复杂社会系统中的实际问题进行计算实验,从而实现社会、经济形势等的平行执行与管理。复杂社会系统计算实验与平行执行的关键技术主要包括:①基于人工社会的社会学习与推理。该技术可为社会组织的规律和结构以及社会关系进行分析和推理。②基于人工社会的计算实验。该技术主要通过智能模拟、交互,实现重大社会问题的计算实验。③平行系统互动与优化。人工社会与实际社会构成了平行系统,该技术通过平行系统体系结构设计及优化、平行系统互动调节与反馈,实现对实际社会的有效管理与决策支持。

(5)复杂系统的决策、执行与反馈的能力

即利用平行系统进行管理和控制,使管理的角色从被动到主动,从静态到动态,从离线到在线,由从属地位上升到平行地位,发挥人工系统在管理、控制中的作用,并增加实际系统对决策信息的反馈,实现自动的调节与控制,并同时提高计算社会试验的预见性、准确性、可控性的能力。

上述关键技术与方法的实现需要面向海量数据的计算环境平台的有效支持。同时,需要构建统一的、可编程的社会计算实验平台和实验环境,动态可视化显示社会计算的实验评估结果。社会计算支撑平台与环境构建关键技术主要包括:①大规模、分布式计算平台的构建。该技术主要解决海量社会群体数据的实时采集、分析与计算,实现具有高计算能力、高存储能力、高稳定性、高安全性的数据管理系统和分布式并行存储与集群计算环境。②计算实验和平行执行编程语言的精确描述与表示。③实验设计、评估、数据可视化、平行系统序优化模块的标准化与可扩展化设计。④图形化编程环境设计。该技术可以实现动态可视化的实验平台管理与配置。

发展社会计算学需要解决以下3个层次的学科问题和关键技术:

①技术层:形成支持社会计算的相关基础技术,包括:数据获取与组织技术、机器学习与数据描述技术、内容理解与情感挖掘技术、分析结果与过程的动态可视化技术、计算心理学与社会计算学。

②模型层:形成在基础技术支持下对特定社会问题和现象进行模型构建的方法,包括:认知与行为建模、复杂网络与复杂系统分析、模型综合集成与人机交互研讨等。

③决策层:其主要思想是人工社会与现实系统的平行管理。借助所构建的广泛模型,提供准确的模拟和仿真结果,支持最终决策者的决策。

发展社会计算的战略步骤:

第一阶段:实现社会计算基础理论与重大问题领域的典型性应用。包括:常态化和非常态化的社会监控与舆情分析,尤其是对突发事件的监控与覆盖;城市交通及化工过程的智能化控制;电子商务机制的研究和电子商务计算实验研究。

第二阶段:完善社会计算理论与技术框架,实现重要领域内的普及应用,以舆情监控为基础,构建综合社会信息系统并完善社会安全的应急管理体系;在交通智能控制基础上,实现对其他公共设施和环境的智能管理;在电子商务研究基础上构建对商业系统的智能分析和决策系统。

第三阶段:通过社会计算的更广泛应用,促进政府与企业组织的决策科学化,实现社会各职能的数字化,包括数字政府、数字经济、数字企业等。同时社会计算不断完善,形成一门具有理论框架和技术支持的完整学科。

第四阶段:通过对各种应用方法的推广、普及以及社会计算的教育,实现社会计算理念与方法的常态化和社会化。最终形成完整的数字社会并构成知识引擎,支撑智能决策。同时在社会计算学基础上,发展出社会宏观信息学。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈