理论教育 社区发现方法和学术影响力测评

社区发现方法和学术影响力测评

时间:2023-10-06 理论教育 版权反馈
【摘要】:表1.1社区发现的三种主要方法社区发现方法的性能可以用来自于培育社区结构生成的综合数据来评估,算法应该仅从网络拓扑结构中发现社区。这一问题的几种解决方案已经被提出。另一方面,Map Equation Framework可用于获取流是如何通过一个系统的信息,因此,也适合通过在流上表示限制条件来分析加权和定向网络。因为引文网络也是定向的,所以Map Equation Framework是分析文献计量网络的自然选择。

社区发现方法和学术影响力测评

许多网络呈现出高度组织化的结构。例如,许多社会系统在其网络特性方面展现了同质性:具有相同属性的节点倾向于形成紧密联系的群组,称作社区、聚集或者模块。对于一些数量有限的系统,我们可能获得关于节点分类的信息。例如,维基百科是一个通过文章间链接而成的大型网络,每篇文章必须属于至少一个类目。总之,尽管这些社区不是所谓先验的,而且,在一小部分幸运的例子中分类信息是可靠的,但是这些信息经常集成在网络的结构信息中,信息量丰富。因此,社区发现是研究人员在研究网络时最常用的一项技术。同时,推荐系统和网络可视化则是社区发现的两个最常用的应用。

Fortunato(2010)全面总结了社区发现的方法。这里我们只提及其中三种主要方法(见表1.1)。

表1.1 社区发现的三种主要方法

社区发现方法的性能可以用来自于培育社区结构生成的综合数据来评估,算法应该仅从网络拓扑结构中发现社区(Lancichinetti,Fortunato,Radicchi,2008)。通过这些基准测试,我们发现模块最优化会受限于分辨极限(Fortunato,Barthelemy,2007)。如果可识别群组的大小依赖于整个网络的规模,那么我们认为社区发现的方法就有一个分辨极限。结果是大型网络中已定义好的模块能被合并。这一问题的几种解决方案已经被提出。Louvain方法(Blondel et al.,2008)为在最优化过程中发现最大的本地模块提供一种聚集的层次树。另一种方法使用一个可调节的分辨率参数,即所谓的自由分辨率方法(Traag,Van Dooren,Nesterov,2011;Waltman,Eck,2012)。(www.daowen.com)

使用Map Equation Framework的优势之一在于它的两层规划的分辨极限依赖于社区间链接的整个权重,而不是整个网络所有链接的权重(Kawamoto,Rosvall,2014)。因此,Map Equation不用借助于本地最大量或可调节参数,其输出结果比模块最大化受分辨极限的影响要小。另外,对许多网络而言,在Map Equation的多层规划过程中分辨极限会完全消失。

一方面,层次模块模型(Peixoto,2013)同样很少受到分辨极限的影响,选择哪种方法最终依赖于要研究的特定系统。例如,块模型也能发现二分网结构,因此也适合分析食物链。另一方面,Map Equation Framework可用于获取流是如何通过一个系统的信息,因此,也适合通过在流上表示限制条件来分析加权和定向网络。因为引文网络也是定向的,所以Map Equation Framework是分析文献计量网络的自然选择

上述算法都在开源软件中实现了。三个特别相关的网络图书馆提供这些方法:NetworkX(http://networkx.github.io/),graph-tool(http://graph-tool.skewed.de/)和igraph(http://igraph.sourceforge.net/)。尽管igraph也有Infomap的基本应用,但我们推荐最流行和功能强大的应用软件Map Equation Framework。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈