【摘要】:AGNES算法是层次凝聚的典型代表算法。
5.3.1.1 AGNES算法基本思想
凝聚层次聚类是自底向上的策略,首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,逐渐合并,直到所有的对象都在一个簇中,或者某个终结条件被达到要求。终止条件为满足了某个期望的簇数目,或者两个最近的簇之间的距离达到了某一个阈值等。
AGNES算法是层次凝聚的典型代表算法。
图5.2描述了一个凝聚层次聚类方法AGENES和一个分裂层次聚类方法DIANA在一个包括五个对象数据的集合{a,b,c,d,e}上的处理的过程。
初始时,AGENES将每个样本点自为一簇,之后这样的簇依照某一种准则逐渐合并。AGENES层次聚类算法使用单链接的方法,两簇之间的相似度是由不同簇中的两个数据点距离最相近的相似度来定义的。此外当两个簇距离超过用户给定的阈值时聚类过程就会终止。聚类的合并过程反复进行直到最终满足簇数目。
例如,如果簇C1中的一个对象和簇C2中的一个对象之间的距离是所属不同簇的对象间欧式距离中最小的,则C1和C2可能被合并。
5.3.1.2 AGENES算法描述
算法:AGENES算法
(www.daowen.com)
图5.2 AGENES和DIANA算法的处理过程
输入:n个对象,终止条件簇的数目k
输出:k个类簇集合
步骤:
(1)将每个对象当成一个初始簇;
(2)重复;
(3)根据两个簇中最近的数据点找到最近的两个簇;
(4)合并两个簇,生成新的簇的集合;
(5)直到达到定义的簇的数目。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关增量式自适应大数据挖掘算法的文章