业务智能系统是随着数据仓库、数据挖掘和在线分析处理等技术的发展而产生的。通过数据仓库可以集成企业内外的各种数据,为数据的分析处理提供基础。在线分析处理则提供从多个维度探查业务性能指标的交互分析功能。数据挖掘结合人工智能、统计等技术实现对大量数据中潜在模式、规律、异常的发现和评价。如图11-3所示,这些新兴的技术为企业管理人员提供了更强大的决策支持工具。一个业务智能系统通常包含6个主要组成部分:数据源、数据仓库、在线分析处理、数据探查、数据挖掘以及业务绩效管理。
图11-3 旅游企业管理人员的数据需求
1.数据源
业务智能的根本是数据。数据的来源主要包括企业内部的操作型系统,即支持各业务部分日常运营的信息系统,以及企业外部的信息,如人口统计信息、竞争对手信息等。综合多方面的数据进行分析,可以有效提高信息的有效性。
2.数据仓库
各种数据源的数据经过抽取、转换之后需要被放到一个供分析使用的环境,以便对数据进行管理,这就是数据仓库(Data Warehouse)。通常针对单个部门的数据仓库称为数据集市(Data Mart),以区别于企业范围内的数据仓库。数据仓库可以将分析数据与实现业务处理的操作型数据隔离,一方面不影响业务处理系统的性能,另一方面为数据的分析提供了一个综合的、集成的、统一的数据管理平台。
3.在线分析处理
数据仓库中的数据可以通过不同的方法进行分析。在线分析处理(Online Analytical Processing)是其中的方式之一。利用该方法,业务性能度量可以通过多个维度、多个层次进行多种聚集汇总,通过交互的方式可以发现业务运行的关键性能指标的异常之处。多维数据可以进行多种操作,如切片、切块、下钻、上卷等。
4.数据探查
数据探查(Exploration)包括灵活的查询、即时报表以及统计方法等。该类方法属于被动分析方法,因为这些分析方法需要基于分析者对于问题的假设。探查数据的方法可以借助统计上的中心性、发散性以及相关性的统计量分析。在进行多变量分析时也可以借助可视化技术。
5.数据挖掘
数据挖掘(Data Mining)是从大量数据中自动发现隐含的信息和知识的过程,属于主动分析方法,不需要分析者的先验假设,可以发现未知的知识。数据挖掘可以作用于结构化数据,也可以对文本数据以及多媒体数据进行分析。常用的分析方法包括分类、聚类、关联分析、数值预测、序列分析、社会网络分析等。
(1)分类(www.daowen.com)
分类(Classification)是通过对具有类别的对象的数据集进行学习,概括其主要特征,构建分类模型,根据该模型预测对象的类别的一种数据挖掘和机器学习技术。
(2)聚类
聚类(Clustering)是依据物以类聚的原理,将没有类别的对象根据对象的特征自动聚集成不同簇的过程,使得属于同一个簇的对象之间非常相似,属于不同簇的对象之间不相似。其典型应用是客户分群。
(3)关联分析
关联分析最早用于分析超市中顾客一次购买的物品之间的关联性。例如,发现关联规则(Association Rule)“尿不湿—啤酒(0.5%,60%)”,其含义为在0.5%的交易中会同时出现尿不湿和啤酒,且出现尿不湿的交易中会有60%的人会同时买啤酒。根据这种关联性可以指导销售活动以及物品的摆放布局等。关联分析一经提出之后得到了广泛的研究和应用,可以用于各种不同的应用背景。
(4)数值预测
分类技术用于预测类别,类别可以被看作是定性属性的取值。数值预测则用于预测连续变量的取值。常用的预测方法是回归分析。例如,可以根据客户个人特征(例如,年龄、工作类型、受教育程度、婚姻状况等)来预测其每月的消费额度。预测模型的构建需要利用历史数据进行学习。
(5)序列分析
序列分析是对序列数据库进行分析,从中挖掘出有意义模式的技术。序列模式(Sequential Pattern)的发现属于序列分析,它是从序列数据库中发现的一种有序模式。
(6)社会网络分析
社会网络(Social Network)是由个人或组织及其之间的关系构成的网络,社会网络分析是对社会网络的结构和属性进行分析,以发现其中的局部或全局特点、发现其中有影响力的个人或组织、发现网络的动态变化规律等。随着社会媒体、社会化商务的发展,社会网络分析变得非常重要。
6.业务绩效管理
业务绩效管理(Business Performance Management,BPM),又称为企业绩效管理(Corporate Performance Management),是对企业的关键性能指标(如销售、成本、利润以及可盈利性等)进行度量、监控和比较的方法和工具。这些信息通常可通过可视化的工具(如平衡积分卡和仪表盘等)进行展示。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。