对PageRank(PR)你了解多少?
文章来源:http://www.chinaotree.com 更新时间:2012/2/10 访问次数:12484次PR值的定义
PR值全称为PageRank(网页级别),2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(Larry Page)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。它是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的重要标准之一。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中令网站排名获得提升,从而提高搜索结果的相关性和质量。
PR级别
级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎(越重要)。例如:一个PR值为1的网站表明这个网站不太具有流行度,而PR值为7到10则表明这个网站非常受欢迎(或者说极其重要)。一般PR值达到4,就算是一个不错的网站了。Google把自己的网站的PR值定到10,这说明Google这个网站是非常受欢迎的,也可以说这个网站非常重要。
PR相关算法
基本思想:如果网页T存在一个指向网页A的连接,则表明T的所有者认为A比较重要,从而把T的一部分重要性得分赋予A。这个重要性得分值为:PR(T)/C(T)
其中PR(T)为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加。
PR(A)=(1-d)+d(PR(t1)/C(t1)+…+PR(tn)/C(tn))
A代表页面A
PR(A)则代表页面A的PR值
d为阻尼指数。通常认为d=0.85
t1…tn 代表链接向页面A的页面t1到tn
C代表页面上的到外链接数目。C(t1)即为页面t1上的到外链接数目
从计算公式可以看到,计算PR值必须使用迭代计算才能得到。
优点:是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。
不足:人们的查询具有主题特征,PageRank忽略了主题相关性,导致结果的相关性和主题性降低;另外,PageRank有很严重的对新网页的歧视。
特别注意事项
PR也有真假之分。假PR即PR劫持。很多站长为了短时期内获得高PR,他们将自己的网站做301跳转到一个高PR的网站。注意google在更新PR的时候,会赋予这个网站与跳转后的网站相同的PR值。但是这样的PR是假的,没有任何用处。如果站长取消301后,PR会重新评估,回到最初的PR值。而且劫持过来的PR不会给友情链接带来PR分值的。所以Anzone说,大家换友情链接的时候,不要和PR劫持的网站交换链接。