理论教育 数据挖掘:发现未知有用规律的关键

数据挖掘:发现未知有用规律的关键

时间:2023-10-30 理论教育 版权反馈
【摘要】:掌握这一点是正确理解数据挖掘的关键。数据挖掘的目的是发现未知的、潜在的而且有用的规律或模式,而不是找出某一条数据本身。数据挖掘的这一特征决定了数据挖掘与信息检索的根本区别。随着数据挖掘理论与实践的不断深入,其所涉及的学科领域可能不断增多。按照所采用的技术和方法分类:统计分析类数据挖掘、发现驱动的数据挖掘、交互式数据挖掘和机器学习类数据挖掘等。

数据挖掘:发现未知有用规律的关键

术语“数据挖掘”(Data Mining,DM)中的“数据”并不是挖掘的“目的”,而是被挖掘的“对象”。因此,数据挖掘的目的并不是“挖掘出数据”,而是“从数据中挖掘出隐含的信息、知识、模式和规律”。掌握这一点是正确理解数据挖掘的关键。数据挖掘的定义方法有很多种,但是其内涵是一致的,即从大量数据中抽取和发现有意义的规律和模式的过程。

从数据挖掘的含义可以看出,其基本特征有:第一,挖掘对象——数据量大。数据挖掘的对象往往是存放在数据库、数据集市数据仓库中的大规模数据,数据量一般会超出人的正常分析和计算能力。数据挖掘的数据量大的特征决定了它与传统信息分析之间的本质区别。第二,挖掘目的——发现未知的、有用的规律或模式。数据挖掘的目的是发现未知的、潜在的而且有用的规律或模式,而不是找出某一条数据本身。数据挖掘的这一特征决定了数据挖掘与信息检索的根本区别。第三,挖掘过程——数据挖掘并不是一种工具、软件或算法,而是一个有目的的、不断螺旋推进的人机交互和协同处理过程。

数据挖掘理论是一门综合性较强的新兴学科,目前主要涉及数据库技术、人工智能、机器学习、统计学系统论可视化技术、模式识别等多个学科领域。随着数据挖掘理论与实践的不断深入,其所涉及的学科领域可能不断增多。在实际工作中,数据挖掘的分类方法有很多种,例如:

(1)按照数据集分类:关系型数据挖掘、面向对象数据挖掘、多媒体数据挖掘和事务型数据挖掘等。(www.daowen.com)

(2)按照所采用的技术和方法分类:统计分析类数据挖掘、发现驱动的数据挖掘、交互式数据挖掘和机器学习类数据挖掘等。

(3)按照目的分类:关联规则挖掘、特征规则挖掘、分类规则挖掘、聚类规则挖掘和孤立点挖掘等。

(4)按照应用领域分类:电信业的数据挖掘、金融业的数据挖掘、零售业的数据挖掘和互联网数据挖掘等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈