理论教育 大数据仓库的建设与优化

大数据仓库的建设与优化

时间:2023-06-06 理论教育 版权反馈
【摘要】:图4-8数据库总体结构数据内容设计1)基础地理数据库基础地理数据库包含各比例尺的京津冀范围内的定位基础、水系、居民地及设施、交通、管线、境界与政区、地貌、植被与土质、其他基础地理要素等。包含京津冀范围1∶5万控制点影像库数据。4)生态环境数据库生态环境数据库主要包含京津冀生态环境、环境污染与环境保护、地质环境、湿地、野生动植物、荒漠化和沙化等数据。

大数据仓库的建设与优化

1.数据库设计

(1)总体结构

从建库数据内容上看,大数据仓库除包括能支撑系统正常运行的数据外,最重要的是将京津冀协同发展基础数据库的各类数据成果进行建库管理。

从数据时态上看,除现势数据管理外,还须进行相关历史数据和实时数据的管理。历史数据记录相关归档数据信息,将数据的时态变化信息进行完整管理。实时数据主要包括互联网实时动态数据,如实时路径信息、交通流量信息等内容。

从数据模型上看,系统管理对象涵盖了矢量、栅格、格网、表格,数据库将是一个多类型和多时态的综合数据库,如图4-8所示。

图4-8 数据库总体结构

(2)数据内容设计

1)基础地理数据库

基础地理数据库包含各比例尺的京津冀范围内的定位基础、水系、居民地及设施、交通、管线、境界与政区、地貌、植被与土质、其他基础地理要素等。

①定位基础数据库。

②水系数据库。

③居民地及设施数据库。

④交通数据库。

⑤管线数据库。

⑥境界与政区数据库。

⑦地貌数据库。

⑧植被与土质数据库。

⑨其他基础地理要素数据库。

2)遥感影像数据库

遥感影像数据库包含原始影像数据库、成果影像数据库和控制点影像数据库。

①原始影像数据库。

②成果影像数据库。

③控制点影像数据库。

包含京津冀范围1∶5万控制点影像库数据。

3)自然资源数据库

自然资源数据库主要包括土地资源、水资源、矿产资源、能源资源、森林资源、草地资源、海洋资源、气候资源等数据。

①土地资源数据库。

②水资源数据库。

③矿产资源数据库。

④能源资源数据库。

⑤森林资源数据库。

⑥草地资源数据库。

⑦海洋资源数据库。

⑧气候资源数据库。

4)生态环境数据库

生态环境数据库主要包含京津冀生态环境、环境污染环境保护地质环境、湿地、野生动植物、荒漠化和沙化等数据。(www.daowen.com)

①京津冀生态环境数据库。

②环境污染与环境保护数据库。

③地质环境数据库。

④湿地数据库。

⑤野生动植物数据库。

⑥荒漠化和沙化数据库。

5)交通网络数据库

交通网络数据库主要包括交通基础设施数据、交通运输能力统计数据以及交通实时数据。

①交通基础设施数据库。

②交通运输能力统计数据库。

③交通实时数据库。

6)社会经济数据库

社会经济数据主要包括经济区划、经济统计、区域规划与主体功能区规划、城乡统筹规划、城市管理要素等。

①经济区划数据库。

②经济统计数据库。

③区域规划与主体功能区规划数据库。

④城乡统筹规划数据库。

⑤城市管理要素数据库。

7)人口数据库

人口数据主要包括人口基础信息、人口流动信息、人口就业信息等。

①人口基础信息数据库。

②人口流动信息数据库。

③人口就业信息数据库。

8)法人数据库

法人数据主要包括企业法人、事业法人、机关法人、社团法人、其他法人等。

①企业法人数据库。

②事业法人数据库。

③机关法人数据库。

④社团法人数据库。

⑤其他法人数据库。

2.数据建库方案

对于完成预处理的基础地理数据、遥感影像数据、自然资源数据、生态环境数据、交通网络数据、社会经济数据、人口数据、法人数据等,按照数据质检规则开展数据质量检查工作,质检合格的数据依据相关建库标准,利用建库工具软件,进行数据库结构创建,并利用数据入库模块,将各类数据分别导入数据库;对于质检不通过的数据,重新进行处理直到合格。并建立数据字典、数据库索引和元数据,完成成果数据的建库工作,实现数据库内容的全入库。入库流程如图4-9所示。

图4-9 成果数据入库流程图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈