理论教育 数据挖掘的主要方式及其应用

数据挖掘的主要方式及其应用

更新时间:2025-01-02 理论教育 版权反馈
【摘要】:数据挖掘是从大量数据中自动发现隐藏的有用信息的过程,是从大量数据中挖掘“宝藏”的过程。数据挖掘的主要方式包括如下几种:1.分类分类是从大量数据中找出不同类别对象的特征,从而对新加入对象进行自动分类。关联规则发现的典型应用是在超市的交易数据中发现哪些商品可能会被同时购买,从而寻找哪些商品捆绑销售能够有足够多的受众。

数据挖掘(Data Mining)是从大量数据中自动发现隐藏的有用信息的过程,是从大量数据中挖掘“宝藏”的过程。发现的信息可能包括行为模式、数据关联、变化趋势、异常情况和有意义的结构等。数据挖掘和联机分析处理都是使用数据仓库数据的重要工具,但OLAP工具主要是展现数据,启发数据分析人员找出规律,得出结论,而数据挖掘可以不用人工参与,主要靠计算机自动发现规律。

数据挖掘的主要方式包括如下几种:

1.分类(Classification)

分类是从大量数据中找出不同类别对象的特征,从而对新加入对象进行自动分类。例如银行会按客户的信用程度分类,数据挖掘能找出各类客户的数据特征,以后就能快速判断一个新客户的信用类别;分类数据控挖掘还可用于预测可能流失投奔竞争对手的客户,预测天文望远镜照片上黯淡的点是否为天体等。

2.聚类(Clustering)

聚类是根据数据特征对数据对象进行自动归类,“聚类”与前面“分类”的不同之处是:“分类”预先知道应该分成哪几类,而“聚类”在操作之前并不知道数据可以分成哪些类别。例加通过聚类操作可以将超市的客户划分成互不相交的客户群,以后超市可以为不同的客户群推荐不同的目标商品。(www.daowen.com)

3.关联规则发现(Association Rule Discovery)

关联规则发现是在大量数据中找出有关联的数据,或者找出同时发生的事件。关联规则发现的典型应用是在超市的交易数据中发现哪些商品可能会被同时购买,从而寻找哪些商品捆绑销售能够有足够多的受众。

4.时序模式发现(Sequential Pattern Discovery)

时序模式发现主要寻找事件发生的时序关系,例如通过对超市数据的跟踪和分析,可能会寻找出时序模式:“如果客户购买了电视,几天后他又买了摄像机,那么他在一个月内购买录像机的概率为50%。”

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈