【摘要】:数据集市是数据仓库体系中的一种小型的部门或工作组级别的数据仓库,从而满足用户对性能的需求。数据集市在一定程度上可以缓解访问数据仓库的瓶颈问题。数据集市技术路线的指导原则包括:1)大规模并行处理能力。数据集市平台可以提供高可用的方案,满足系统的高可用性要求。一般来说,数据集市中的数据,通常按照星形和雪花形模型组织,数据集市平台必须提供针对性的优化,以满足用户响应时间的要求。
数据集市是数据仓库体系中的一种小型的部门或工作组级别的数据仓库,从而满足用户对性能的需求。数据集市在一定程度上可以缓解访问数据仓库的瓶颈问题。根据数据集市应用的不同,可以分成库内集市或库外集市。数据集市技术路线的指导原则包括:
1)大规模并行处理能力。
2)数据高速加载和卸载。
3)存储压缩。
4)快速刷新。
5)海量数据处理能力。数据集市和数据仓库的区别在于数据的范围和主题,数据仓库是全局的整体的数据,数据集市主要服务于特定主题,在某些时候,数据集市的数据量很大,因此,集市需要具备处理大并发、复杂查询的能力。
6)线性扩展能力。数据集市平台应该具备线性扩展的能力,可以满足数据不断增长的需求。(www.daowen.com)
7)工作负载管理能力。提供工作负载管理能力。
8)高可用性。数据集市平台可以提供高可用的方案,满足系统的高可用性要求。
9)数据压缩。必须提供良好的数据压缩能力,降低存储成本,多段备份和恢复时间,满足系统的时间要求。
10)高速数据加载和卸载能力。必须提供高速的数据加载和卸载能力,以保证数据加载和卸载能够在较短的时间内完成,从而减轻运维压力。
11)星形模型/雪花形模型性能优化。一般来说,数据集市中的数据,通常按照星形和雪花形模型组织,数据集市平台必须提供针对性的优化,以满足用户响应时间的要求。
12)满足数据库平台需求的能力。数据集市平台本身是一个数据库平台,除了满足数据集市的特殊需求外,还必须满足数据库平台全部能力。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关数据架构与商业智能的文章