一个Web页面i的PageRank值,表示为pi,则
在这里,α表示一个阻尼因子参数,Bi表示所有链接到Web页面i的Web页面集合,mj表示Web页面j链接的所有Web页的数量,n表示被排序的Web页面总数量。阻尼因子参数α能被设置为从0到1的值。根据Brin和Page(1998)以及Page等人(1999),一般设置为0.85。
由式(4.1),可以得到下列推断:
·链接到Web页面i的Web页数量越多,Web页面i的PageRank的值越高。
·链接到Web页面i的Web页的PageRank值越高,Web页面i的PageRank的值越高。(www.daowen.com)
·对那些链接到Web页面i的Web页来说,这些Web页链接到其他Web页的数量越小,Web页面i的PageRank的值越高。
·阻尼因子参数α的值越接近1,上述影响效果越强。
因此,PageRank思想是这样的,一个Web页面被认为重要,那么一定有大量其他的Web页链接它,这些链接的Web页自身也足够重要,它们链接的Web页数量必须不太多。PageRank方法也能被不太正式地解释为一个投票系统。从一个Web页到另一个Web页的链接表示前者对后者的一张投票。一个Web页面越重要,它投票的权重越大。一个Web页面可能投票给多个Web页面,这种情况下它投票的权重被等分到每个页面上。一个Web页面的重要性是由它收到的投票的总权重所决定的。
PageRank方法的一个难点是一些Web页面不链接任何其他Web页。没有向外链接的网页在PageRank文献中被认为是悬点。处理悬点最常见的方法是创建从每一个悬点到其他Web页的人工链接。更详细的关于悬点问题的讨论[2]可参见Langville和Meyer(2006)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。