数据库和数据仓库既有区别又有联系。区别在于构建目的不同、管理的数据不同、管理方法不同。联系表现在两个方面:一是数据仓库中的大部分数据来自业务系统的数据库中;二是当前绝大多数数据仓库都是利用数据库系统来管理的。
数据库主要用于实现企业的日常业务运营,提高业务运营的效率。它的事务管理模块的功能对于正确完成业务操作是非常关键的。数据仓库的构建主要用于集成多个数据源的数据,这些数据最终将用于分析,以发现其中隐藏的规律、异常等,以辅助决策过程。数据仓库的构建是为了将数据分析处理与数据库中的事务处理环境分离开,以免大规模的数据访问影响了事务处理的效率。
数据库中的数据通常只包含当前数据,数据的存储应避免冗余,数据的组织应按照业务过程涉及的数据实现,由应用驱动。数据仓库中的数据是按照主题组织的,为了方便分析,应将某一主题的所有数据集成在一起。为了方便快速查找,数据存在大量冗余。数据仓库中的数据通常是历史数据,数据源中的数据按照一定的频率刷新到数据仓库中。数据库中的数据通常是细节的数据,数据仓库中的数据依据分析任务的不同,可以对细节数据进行一定的汇总。
数据库中的数据需要进行频繁的插入、删除、修改等更新操作。因此,除了要通过创建事务保证业务处理的正确性外,还需要复杂的并发控制机制保证事务运行的隔离性。数据仓库中的数据主要用于分析处理,除了初始的导入和成批的数据清除操作之外,数据很少需要进行更新操作,因此也不需要复杂的并发控制等事务管理功能。另外,数据库中数据的更新操作的时效性很强,事务的吞吐率是个非常重要的指标。而数据仓库的数据量十分庞大,分析时通常涉及大量数据,时效性不是最关键的。数据仓库中的数据质量是非常关键的,不正确的数据将导致错误的分析结果。
2.在线分析处理与在线事务处理
在线事务处理(Online Transaction Processing,OLTP),是数据库管理系统的主要功能,用于完成企业内部各个部门的日常业务操作。而在线分析处理(Online Analytical Processing,OLAP)是数据仓库系统的主要应用,提供数据的多维分析以支持决策过程。其主要区别如表11-1所示。
表11-1 在线事务处理和在线分析处理的比较
OLTP系统主要面向日常的业务处理人员,用于实现重复的业务操作,例如银行的存取款业务。OLAP系统主要面向管理人员,可以通过多维的视角观察业务性能指标,交互地探查不同细节层次的数据,数据的查询方式灵活多变,用于验证假设、发现问题,从而辅助决策。为了避免数据冗余以及更新异常等问题,OLTP系统中的数据需要进行规范化处理,通常至少满足三范式(3NF)的要求,而为了便于理解和提高查询性能,OLAP中的数据是不符合较高范式的规范化要求的,数据中存在一定程度的冗余。OLTP系统中的数据是通过短的事务频繁地被插入、删除、修改的,但通常每次操作仅涉及少量数据。OLAP系统中的数据是用于分析的,经常被查询和进行汇总计算,每次涉及大量数据的读取。OLTP系统中的数据通常反映的是当前的状态,而OLAP中的数据是历史数据。OLTP系统中积累的数据会被定期更新到OLAP系统中。评价OLTP系统性能的主要指标是事务吞吐量,即单位时间内系统完成的事务个数。OLAP系统的性能评价指标是查询的响应时间,即从查询提交开始到返回结果所需时间。OLTP系统中事务的原子性、一致性、隔离性和永久性非常重要,为了确保上述要求,并发控制和恢复是非常重要的数据管理模块。而在OLAP中,数据是很少被更新的,并发控制和事务恢复并不重要。
3.业务智能与决策支持系统(www.daowen.com)
决策支持系统(Decision Support System,DSS)是一种交互式的、基于计算机的系统,用于协助决策者使用数据和模型解决非结构化的问题。决策支持系统的用户主要是管理人员和业务分析人员,主要目的是辅助决策者进行科学决策,这点与业务智能是相同的。被广泛接受的决策支持系统的系统架构是对话-数据-模型架构(Dialog-Data-Modeling,DDM),即决策支持系统由数据库管理系统、模型库管理系统和对话产生与管理系统三部分组成。后来,随着人工智能的发展,在此架构的基础上又引入了知识库管理系统,如图11-5所示。
图11-5 决策支待系统的系统架构
决策离不开数据,数据库管理系统用千抽取、存储、更新决策所需的数据,涉及企业内外部的数据。一般决策者通过对数据的查询,可提供决策所需信息。
模型库管理系统主要用于管理决策所需的各种模型,例如财务、统计、预测以及管理等方面的定拭模型,利用这些模型可以进行问题分析。用户利用该系统可以方便快捷地构建和操纵模型。系统提供对模型的分类、删除、复制等维护功能,可以将已有模型进行合并,以及对模型的执行情况进行跟踪、分析和评价,如对变量进行敏感度分析等。常用的模型分析功能包括:因果分析(What-If Analysis)、目标搜索(Goal-Seeking)以及风险分析(Risk Analysis)等。
知识库管理系统提供知识的表示、存储和管理功能,用于支持定量模型无法解决的决策过程,帮助用户建立、应用和管理描述性、过程性和推理性知识。知识库中可以存储和管理专家的领域知识,并通过逻辑推理进行问题的解答,可以减轻用户大量的信息处理和分析的负担。
对话产生与管理系统主要负责用户与系统之间的交互。接受用户的输入,能够与数据库管理系统、模型库管理系统和知识库管理系统进行交互,以各种格式将结果返回给用户,提供图形用户界面以及可视化功能。
决策支持系统中的数据库可以与企业各个职能部门的信息系统中的数据库分离,包含从各个业务系统抽取的数据以及外部数据源的数据。但是,此数据库的数据集成功能较弱。企业内部的各种信息系统内的数据互不关联,存在大量冗余、不一致的问题,数据量庞大。因此,数据库无法满足决策支持系统的需求。业务智能系统则能从大量的数据中发现新颖有价值的知识,以提供更加灵活的查询和报表功能以及多维分析功能,可以对决策支持系统的知识库进行动态更新。因此将业务智能与传统的决策支持系统进行结合,可以进一步提升决策支持系统的功能。
业务智能系统与决策支持系统相比,在数据分析和知识发现方面具有更强的功能。但是它只提供对决策有帮助的信息,并不提供可能的决策方案。用户需要结合自身的领域知识和经验,判断各种决策方案的优劣。系统不具有方案生成、协调、评估等功能,这是业务智能系统的不足之处。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。