理论教育 交通CPS流式数据聚类及演化趋势发现研究结果

交通CPS流式数据聚类及演化趋势发现研究结果

时间:2023-11-20 理论教育 版权反馈
【摘要】:与ECNMF 进行比较的相关算法分别为:将传统的Kmeans 算法在主成成分分析子空间中进行聚类;规范切算法[128];以及基于NMF 的聚类算法。在下面所有实验中,所有的比较算法性能通过聚类准确率和标准互信息进行衡量。NMI 值越高,表明聚类算法的聚类结果质量越好。首先,使用Kmeans 算法的聚类结果结合特征标签作为目标标签进行特征聚类结果评价;其次,使用Kmeans 算法的聚类结果结合用户数据作为目标标签进行用户数据聚类结果评价。

交通CPS流式数据聚类及演化趋势发现研究结果

与EC⁃NMF 进行比较的相关算法分别为:将传统的K⁃means 算法在主成成分分析(Principle Component Analysis,PCA)子空间中进行聚类;规范切(Normalized Cut,Ncut)算法[128];以及基于NMF 的聚类算法。

在下面所有实验中,所有的比较算法性能通过聚类准确率和标准互信息进行衡量。

定义3.4 聚类准确率(Clustering Accuracy,ACC)定义为[129⁃130]

其中,ri和li分别为聚类算法得到数据点xi的标签与实际标签;δ(x,y)为delta 函数,当x=y 时,δ(x,y)=1,否则δ(x,y)=0。map(ri)为最优映射函数,将聚类算法得到的类别ri映射到数据集合中等价类别[143]。需要说明的是,ACC 越高,表明聚类算法的聚类质量越好。(www.daowen.com)

定义3.5 标准互信息(Normalized Mutual Information,NMI)定义为[144]

其中,ni和nj分别表示分类标签i 和聚类标签j 的样本数目;ni,j为第i 个类中属于实际的第j 类的样本数目;k(a)和k(b)分别为真实的和预测的聚类数目。若聚类结果与分类标签完全匹配,NMI =1;若需要聚类的样本处于随机分布,则NMI=0。NMI 值越高,表明聚类算法的聚类结果质量越好。

因为所用的数据集中没有预定义的分类标签,本实验中通过交替的方式对聚类结果进行评估。首先,使用K⁃means 算法的聚类结果结合特征标签作为目标标签进行特征聚类结果评价;其次,使用K⁃means 算法的聚类结果结合用户数据作为目标标签进行用户数据聚类结果评价。每一个时间步,给出不同的聚类数目,在随机的环境下对算法进行测试。在下面所有的实验中,所有的实验结果都是20 次实验的平均值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈