4.1.4.1 分类算法的研究现状
分类是一个比较古老的问题,它在机器学习、模式识别、数据挖掘和人工智能等领域都得到了广泛研究。到目前为止,已经研究出的经典分类方法主要包括:决策树方法、神经网络方法、贝叶斯分类、K邻近分类算法和基于案例的推理等,还研究出了基于粗糙集、模糊集和支持向量机等的分类方法。
数据分类技术主要分为基于传统技术和基于软计算技术两种。
(1)基于传统的数据挖掘分类方法。
分类技术针对数据集构造分类器,从而对未知类别样本赋予类别标签。在其学习过程中和无监督的聚类相比,一般而言,分类技术假定存在具备环境知识和输入输出样本集知识的老师,但环境及其特性、模型参数等却是未知的。
目前基于传统的数据挖掘分类方法:基于关联规则的分类算法、K邻近分类算法、决策树分类算法、贝叶斯分类算法等。(www.daowen.com)
(2)基于软计算的数据分类算法。
在数据挖掘领域,软计算的用途越来越广泛。模糊逻辑用于处理不完整、不精确的数据以及近似答案等;神经网络用于高非线性决策、泛化学习、自适应、自组织和模式识别;遗传算法用于动态环境下的高效搜索、复杂目标对象的自适应和优化;基于粗糙集理论,根据“核”属性获得对象的近似描述,能有效处理不精确、不一致、不完整等各种不完备信息。当数据集表现出越来越多的无标签性、不确定性、不完整性、非均匀性和动态性特点时,传统数据挖掘算法对此往往无能为力,软计算却可为此提供一种灵活处理数据的能力,软计算的融合与传统数据挖掘方法的结合逐渐成为数据挖掘领域的研究趋势。
目前,已有多种软计算方法被应用于数据挖掘分类算法中,来处理一些具有挑战性的问题。软计算的分类算法主要包括基于模糊逻辑、神经网络、遗传算法和粗糙集等理论的分类方法。这些方法各具优势,它们是互补而非竞争的,与传统的数据分析技术相比,它能使系统更加智能化,有更好的可理解性且成本更低。
4.1.4.2 分类算法的应用领域
分类是数据挖掘中应用领域极其广泛的重要技术之一,经典分类方法在很多领域都得到了应用,比如决策树方法已经成功地应用到医学诊断、贷款风险评估等领域;神经网络则因为对噪声数据有很好的承受能力而在实际问题中得到了非常成功的应用,比如识别手写字符、语音识别和人脸识别等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。