理论教育 优化后:K-HarmonicMeans算法简介

优化后:K-HarmonicMeans算法简介

时间:2023-06-17 理论教育 版权反馈
【摘要】:在K-Harmonic Means算法中,对于每个点来说,评价函数都应用了该点到所有中心的距离。而K-Harmonic Means算法是在调和均值的基础上分配给每个点的权重值是动态的。权重系数的更新公式如下:这个准则对于K-Harmonic Means算法的初值点不敏感。在实际应用中,不依赖初始点选取的K-Harmonic Means算法在健壮性方面具有一定优势。

优化后:K-HarmonicMeans算法简介

5.2.3.1 K-Harmonic Means算法工作原理

与K-Means算法一样,是建立在中心基础上的迭代算法。K-Harmonic Means算法是将所有点到所有中心的均方距离的调和平均值的总和作为该算法的评价函数,即评价函数为

这里x1,x2,…,xn是n个样本,w1,w2,…,wk是k类别的质心,λ是一个参数,xi≠wi(i=1,2,…,n;j=1,2,…,k)。为了得到最优算法,我们通过对上式求出关于中心wj(j=1,2,…,k)的导数,并令其等于0,可以得出中心wi的迭代公式

K-Harmonic Means算法的关键是运用了调和平均值这个概念,a1,a2,…,ak的调和平均值定义为

如果a1,a2,…,ak中任何一个元素很小时,调和均值也将很小。如果元素中没有很小的值,那么调和均值将会很大。它就像是一个赋予每一个元素一些权重的极小化函数。

在K-Harmonic Means算法中,对于每个点来说,评价函数都应用了该点到所有中心的距离。而当该点离两个或更多的中心同时都很近的时候,调和均值是敏感的,该算法会自然地将多余的中心转移到那些没有最近中心的点的区域,这样就会创造一个较小的评价函数的值。从另一方面,在K-Means算法的每次迭代中,评价函数都分配给所有点相同的权重值。而K-Harmonic Means算法是在调和均值的基础上分配给每个点的权重值是动态的。当某个点的附近没有可靠近的中心时,调和均值将分配一个较大的权重给该点,而反之,当某个点附近有多于一个的中心可靠近时,调和均值将会分配一个较小的权重给该点。这个准则是非常重要的。权重系数的更新公式如下:

这个准则对于K-Harmonic Means算法的初值点不敏感。从中心的迭代公式中可以发现每个类的中心的迭代不是只和迭代当前类中现有的成员有关,而是和整个数据集中的成员紧密相连的,所以不管初始点选取什么值,对中心的迭代影响都不是很大。在实际应用中,不依赖初始点选取的K-Harmonic Means算法在健壮性方面具有一定优势。

5.2.3.2 K-Harmonic Means算法描述

算法:K-Harmonic Means算法

输入:类的数目k、参数λ和包含n个对象的数据库(www.daowen.com)

输出:k个类簇集合

步骤:

(1)算法初始化并且随机选择初始聚类中心w1,w2,…,wk

(2)根据样本集合以及随机选择的初始聚类中心集合,计算评价函数值

(3)对于每一个样本点xi,计算其在聚类中心w1,w2,…,wk的权重系数

(4)对于每个聚类的聚类中心wi,根据wi的迭代公式重新计算其位置

(5)重复计算步骤(2)至步骤(4),当更新聚类中心位置前后的评价函数差值小于给定的阈值时,终止循环;

(6)输出聚类结果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈