理论教育 学术影响力测评的网络输入输出格式

学术影响力测评的网络输入输出格式

时间:2023-10-06 理论教育 版权反馈
【摘要】:1.4.3.6.btree和.bftree格式在分层网络导航中一旦导入层级结构就能够浏览网络,我们使用一种定制的流格式,包括宽度优先的树结构,包括每个子网络的链接流。

学术影响力测评的网络输入输出格式

这部分我们介绍Map Equation软件包应用中可以作为输入的或作为输出产生的所有文件的格式。

1.4.3.1 Pajek的.net格式

在Map Equation软件包应用中,网络数据被存储为Pajek的.net格式能被加载。Pajek格式在文件的两个不同部分说明了节点和链接。在.net文件中,网络节点有一个唯一的标识符和标签。节点的定义开始于行*Vertices N,N表示网络中节点的数量。节点名或标签在节点标识符后被直接引用。链接部分开始于行*Edges L或者*Arcs L(不区分大小写),L是链接的数量。权值可以通过增加一正整数的列赋给节点。下面我们显示一个有6个节点和8条有向加权链接的网络。

Pajek使用*Edges定义无向链接,*Arcs定义有向链接。Map Equation软件包接收*Edges和*Arcs,用户界面的加载按钮选项确定算法处理的是有向还是无向网络。有向链接还有从哪到哪的权重表。即,上面列表中的第一个链接从节点1到节点2,权重为3.0。链接的权重是可选的,默认值为1(我们总计链接的权重定义不只一次)。节点权重是可选的,在编码的有向版本中,权重设置了每个节点接收到瞬移随机游走的相对比例。

1.4.3.2 链接列表格式

除了Pajek.net文件,层级网络导航也能加载一个链接列表。链接列表是描述网络的最小格式,只通过如下所示的一组链接说明。每一行对应着三个一组源目标权重,用特定数值描述了节点间的权重。权重可以是任意非负值。如果没有,默认链接权重为1。节点被假定为从1开始,节点的总数根据最大节点值确定。

1.4.3.3 Pajek的.clu格式

给定一个网络输入文件,在所有的应用中说明节点的聚类是可能的。聚类信息以Pajek的.clu格式提供。在Web应用中,通过点击Load Cluster Data文件能被加载。Infomap用参数-c读取聚类信息,如下所示,clusterfile.clu Pajek's.clu format只是模块任务的一个列表。

上述聚类文件说明网络中节点1~3属于模块2,节点4~6属于模块1。Infomap利用参数-clu生成一个.clu文件。

1.4.3.4 .map和.smap格式

包含在网络中的信息和聚类文件可以作为一个独立的.map文件加载到Web应用中,此文件也包含着模块一级的链接和节点信息。.map文件以网络中节点、模块和链接的数量作为开始,接着是网络中模块、节点及模块间的链接信息,如下所示。

这个.map文件由Infomap生成,也包括节点长度和节点流量等信息。Infomap的输出内容中,模块下的名称默认来自于模块内流量最大的节点,0.5和0.0697722分别表示模块内所有节点的流量和、从此模块出发的每一步流量。节点以列表方式列出,有指派给它们的模块和流量。此外,模块间所有的链接都按流量从高到低的顺序列表。Infomap用参数-map可生成.map的文件。

下面的.smap文件与上述的.map文件对应,多了些重要信息。

.smap文件包含着Alluvial生成器中生成一个重要图的必要信息。与上述.map文件相比,此文件也包含了那些不重要的独立模块和那些经常被聚类的模块信息。例子中,在*Insignificants 1下的注释2<1表示模块2中的重要节点与模块1中的重要节点聚到一起常常比置信水平更高。在模块指派方面,我们使用冒号表示显著聚类的节点,用分号表示没有显著聚类的节点。例如,1:1“Node 1”0.209317中的冒号表示属于最大节点集的节点被聚类的概率要高于Bootstrap网络的置信水平。.smap文件由1.4.1.2节所述的代码生成。详细信息可参见Rosvall和Bergstrom(2010)。(www.daowen.com)

1.4.3.5 .tree格式

Infomap的默认输出是一个.tree格式的文件,包含着识别出的层级结构信息。下面的.tree文件层级结构有三层。

每一行以一个节点的多层模块指派开始。从粗到细,模块指派以冒号分隔,每一层的所有模块按它们所包含的节点的总PageRank排序。而且,最后那个逗号后的整数是最精细层模块里的等级,小数值是随机游走的稳定状态数量。最后是在引号内的节点名称。Infomap通过默认参数或者参数-tree来生成.tree的文件。

1.4.3.6 .btree和.bftree格式

在分层网络导航中一旦导入层级结构就能够浏览网络,我们使用一种定制的流格式,包括宽度优先的树结构(.btree和.bftree),包括每个子网络的链接流(只有.bftree)。用这种方式,只要加载文件的一小部分就可以对上层结构进行可视化,更深层的结构则根据需要加载。Infomap使用参数-btree和-bftree各自生成.btree.和bftree的文件。☞

总结

这一章主要关注如何使用Map Equation Framework来简化和高亮度显示网络中的重要结构。我们已经阐述了几种用于大型网络分析和可视化的应用。但是,我们没有涵盖所有特征,新软件也在开发。最后,为提供最大可用性和用户友好界面,我们介绍了和命令行软件一样快速的Web应用环境。我们会继续研究不同的方案,利用新的Web技术使之成为可能,欢迎所有的反馈。

【注释】

[1]L.Bohlin,D.Edler,A.Lancichinetti,M.Rosvall,Integrated Science Lab,Department of Physics,UmeåUniversity,901 87,Umeå,Sweden,E-mail:martin.rosvall@physics.umu.se.

[2]科学家协作网络可在http://mapequation.org/downloads/netscicoaut hor2010.net下载。

[3]生成重要模块的代码可在www.tp.umu.se/rosvall/code.html#mapchange下载。

[4]https://bitbucket.org/mapequation/infomap。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈