交通运输物流大数据分析与应用

交通运输物流大数据存储模式优化方案

我们需要找到满足大数据要求的数据存储模式运用于交通运输物流领域。早期的基于C/S架构的单数据库模式监控规模不大,传感器采集数量有限,所有的数据都存储到一个数据库中,如图3.2所示,显然这种单数据库模式是不可能适用于交通运输物流领域的大数据分析的。图3.2早期的单数据库模式2000年以后,Web技术取代了C/S架构,成为主流架构,逐渐出现了早期网络存储模式。
理论教育 2023-06-11

文本训练的具体步骤及自定义词库形成

文本训练的结构图如图5.7所示。图5.7文本训练的结构图文本训练的具体步骤如下:第一步,从爬取到的数据中抽取所有文章的标题,并且按其所属分类,将属于同一类的标题存储在一个txt文档当中,一共有多少个类,就会产生多少个对应的标题文件。图5.8自定义词库形成图自定义词库文件的每一行代表一类,行中包括这一类中的所有词以及该词在这一类中的权重。
理论教育 2023-06-11

基于CluStream的交通运输物流活动实时热点分析应用

实时准确地发现物流热点区域,可以帮助决策用户获取实时的决策信息。本节介绍如何使用CluStream算法对交通运输物流热点区域进行分析,并使用Web-GIS在地图上实现展示聚类结果的热力图。利用Apache Kafka的TOPIC配置项将两类流式数据进行区分。图4.8点落在最近微簇边界外情况2由于数据流的不断演化,Xi是一个新簇。
理论教育 2023-06-11

大数据分析平台软件的基础架构设计方案

一般来说,大数据系统都是由多个子系统集成构成的系统,考虑到大数据架构的设计原则以及大数据系统构建的经济性和稳定性,软件基础架构设计方案将全面采用成熟的开源项目成果,比如非结构化存储采用HDFS分布式文件系统,结构化数据存储采用HBase分布式数据库系统。大数据系统逻辑架构是一个多层次的体系架构,采用“分布式平台+分析式应用”的模式进行设计。
理论教育 2023-06-11

分布式存储技术解析

分布式存储系统,是将数据分散存储在多台独立的设备上。常见的各种类型的分布式存储技术框架如下。由于HBase分布式存储系统具有可伸缩等特点,所以可以在廉价的PC服务器端上搭建起大规模的HBase存储集群。
理论教育 2023-06-11

物流企业信用评价指标在大数据环境下如何应用?

在大数据背景下,物流企业在客户中的口碑及在运营过程中的信用记录都可以通过互联网进行更全面、更透彻的挖掘。大数据算法使得这些潜伏在互联网中的海量数据得以发挥价值,更加真实地反映某一物流企业的信用情况。大数据使得企业信用数据来源呈现出多样化、多层次的特点。
理论教育 2023-06-11

大数据在交通运输物流业的应用

近年,大数据的相关技术方法在交通运输物流领域的应用越来越多,在车货匹配、运输线路分析、销售预测与库存、设备修理预测、物流中心选址等方面有着广泛的应用。
理论教育 2023-06-11

国内大数据的发展历程

2012年10月,中国计算机学会大数据专家委员会成立。2015年9月,国务院发布《促进大数据发展行动纲要》,旨在促进中国数据技术的发展。2017年1月,工业和信息化部印发大数据产业“十三五”发展规划。2019年9月大数据产业生态联盟联合赛迪顾问发布《2019中国大数据产业发展白皮书》,报告指出2018年中国大数据产业规模为4384.5亿元,预计2021年将达8070.6亿元。
理论教育 2023-06-11

国内交通大数据研究的最新进展

为了适应大数据时代的发展要求,更好地利用大数据为交通现代化服务,国内学者对大数据方法和技术在交通领域的应用进行了广泛而深入的研究。段宗涛和康军等人将大数据应用到车联网的研究中,提出了一种车联网大数据环境下的交通信息服务协同体系。段宗涛、郑西彬等人对道路交通领域业大数据进行了相关研究。
理论教育 2023-06-11

资源调度管理优化

Hadoop中有三种调度器最为常见,分别如下。在某种意义上,YARN是一个负责集群资源管理的云计算系统。此外,这些新框架可以利用YARN的资源管理器来提供新的应用管理器实现。
理论教育 2023-06-11

大数据的特征及分析

数据处理速度也是大数据和传统的数据挖掘技术本质的不同。随着对大数据研究的深入,对大数据的认识也越来越全面,学者们在3V特征的基础上,提出了大数据的5V特征。数据的真实性和质量是成功决策的基础,追求高质量的数据是大数据的要求与挑战。如何有效获取充分的语义信息支持大数据质量管理是第三个挑战性问题。当前大多数数据质量管理方法没有自动错误检测修复功能,难以直接应用于大数据。
理论教育 2023-06-11

流式数据聚类方法优化探讨

表4.1聚类算法比较2.流式数据聚类算法在流式数据模型提出后,流式数据挖掘便成为热点研究内容。与传统的静态数据聚类算法相比,流式数据聚类算法有很大的不同。图4.2流式数据的算法的演化与发展由于流式数据具有海量、高维、实时等特点,流式数据聚类算法比传统的聚类算法要复杂许多。目前影响比较大的流式数据聚类算法有以下几种。
理论教育 2023-06-11

OWL属性约束及描述逻辑语法对应关系

表3.3给出了OWL类构造算子(类约束)与描述逻辑语法的对应关系。表3.2OWL元素对应的描述表3.3OWL类构造算子与描述逻辑语法的对应关系续表除了类与类之间的关系之外,要描述严格的知识还要有约束,OWL对公理也提供了很多属性和类的约束,每个类不同的特性都是由属性约束表达出来,不同的属性约束可表示该类需要呈现的不同的知识,OWL表示的属性为数据属性和对象属性,其中对象属性专用的axiom有inverseOf、Symmetric、Functional、Inverse、Transitive。
理论教育 2023-06-11

文本分类技术综述

图5.6文本分类的结构图文本训练就是对训练文本进行分词、预处理、词频统计和权重计算等,以便初步提取每一类别的特征值,文本分类就是在文本训练的基础上,根据每一类的特征值对测试文本采用一定的分类算法进行文本分类。
理论教育 2023-06-11

物流企业信用评估方法探析

对于物流企业的提供方和需求方,其之间的交易存在时间上的延迟。常用的信用评价方法有因子分析法、数据包络分析法、层次分析法以及以上多种方法相结合的方法。从信用评价诞生之后的一个多世纪中,全球各个国家都不断地对信用方法及评价模型进行分析研究。
理论教育 2023-06-11

我国交通运输物流系统建设概况

铁路网全长14.63万千米,仅次于美国的25万千米,是世界第二大铁路网。中国的交通运输系统承载着世界上最大的客运量和货运量。航空运输方面,中国拥有241个机场,客货运量居世界第二位。在城市交通方面,中国有7万多条公共汽车和有轨电车线路,总长约140万千米。轨道交通虽然刚刚起步,但发展迅速,中国现有轨道交通线路226条,总里程7000多千米。经过几十年的发展,中国已经成为一个交通大国。
理论教育 2023-06-11
-已经加载完成-