【摘要】:通常,一些基本的前处理操作需要在实际预测发生前执行。这些由Linkpred自动完成。如此一来,这种方法就变为可能,至少在理论上可以实现完美的预测,100%的查准率和100%的查全率。然而,这样做可能导致高估预测的准确率。这些可通过设置最小度不是1而是其他值来改变。几乎所有的链接预测的相关研究专门处理无向网络,因此,Linkpred主要在无向网络上测试,不支持有向网络。Shibata、Kajikawa、Sakata在一个文献引文网络中研究链接预测。
通常,一些基本的前处理操作需要在实际预测发生前执行。
按定义,链接预测是预测链接而不是节点的操作。然而,正如网络进化一样,它们的节点也一样在进化。因此,我们不能假定训练网络和测试网络都包含同一组节点。为了公平的比较,我们需要将所分析的节点限制为在训练和测试网络中的普通节点。这些由Linkpred自动完成。如此一来,这种方法就变为可能,至少在理论上可以实现完美的预测,100%的查准率和100%的查全率。
众所周知,对孤立节点(没有任何邻居的节点)的任何预测是困难的,因为我们没有关于它们的信息。类似地,度低的节点有时被丢弃,因为有关它们的信息太少(Liben-Nowell,Kleinberg,2007)。然而,这样做可能导致高估预测的准确率(Guns,2012;Scripps,Tan,Esfahanian,2009)。默认状态下,Linkpred移走孤立节点,保留其他节点原封不动。这些可通过设置最小度不是1而是其他值来改变(参见2.5.4节)。(www.daowen.com)
一方面,合作者网络是无向的,例如,链接能从两个方向被穿越。另一方面,有向网络有固定方向的链,引文网络是一个最好的例子。几乎所有的链接预测的相关研究专门处理无向网络,因此,Linkpred主要在无向网络上测试,不支持有向网络。Shibata、Kajikawa、Sakata(2012)在一个文献引文网络中研究链接预测。但是,他们本质上把网络当无向来对待,而且只预测两个节点间链接的出现或消失。研究假定较新的文章引用较早发表的文章。一种类似Linkpred的方法是可能的:首先,转化有向网络为无向网络,然后,再应用链接预测。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关学术影响力的测评 方法与实践的文章