PageRank知识普及

来源:Physicsprince 时间:2008-06-23 22:40 字体:[ ] 收藏 我要投稿

  大家知道,PageRank是Google用于评测一个网页“重要性”的一种方法。在糅合了诸如Title标识和Keywords标识等所有其他因素之后,Google通过PageRank来调整结果,使那些更具“重要性”的网页在搜索结果中的排名获得提升,从而提高搜索结果的相关性和质量。

  PageRank是基于“从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系来判定所有网页的重要性。其计算公式是:

  R(i) = ( 1 - d ) + d·∑ j∈B(i) R(j)/N(j)

  式中:

  R(i)——表示网页i的权威度;

  B(i)——指向网页i的网页集;

  N(j)——网页j中指向其他网页的超链接数;

  d——衰减因子,0

  从式中可以发现以下事实:

  1 指向网页i的链接数越多,网页i的网页级别越高;

  2 网页i的网页级别与施链网页的网页级别有关(或权威度有关),即来自权威网页的链接将比来自非权威网页的更有利于提高网页i的网页级别;

  3 网页i的网页级别与施链网页的链出数有关,当一个施链网页的链出数(出度)较少时,更能说明施链网页对网页i的肯定程度;

  4 对所有采集到的网页计算它们的PageRank值,是一个大型的多元一次方程,为了节省时间,Google不采取通常的高斯消元法,而是采用递归方式来逼近最优解。

  显然,PageRank可以作为网页评价的权威性或影响力的指标。

作者 physicsprince 的个人空间 本文仅代表作者观点,与站长网立场无关.
0% (0)
0% (0)
编辑热线:0516-83818833 Email:0051@vip.163.com 20秒注册会员 结交站长朋友 分享你的精彩
站长评论(0)
评论加载中…
相关新闻

热门新闻

推荐新闻