PR是PageRank的縮寫。Google PR理論是所有基于鏈接的搜索引擎理論中最有名的。SEO人員可能不清楚本節(jié)介紹的其他鏈接理論,但不可能不知道PR。
PR是Google創(chuàng)始人之一拉里佩奇發(fā)明的,用于表示頁面重要性的概念。用最簡單的話說就是,反向鏈接越多的頁面就是越重要的頁面,因此PR值也就越高。
Google PR有點類似于科技文獻中互相引用的概念,被其他文獻引用較多的文獻,很可能是比較重要的文獻。
1.PR的概念和計算
我們可以把互聯(lián)網(wǎng)理解為由結(jié)點及鏈接組成的有向圖,頁面就是一個個結(jié)點,頁面之間的有向鏈接傳遞著頁面的重要性。一個鏈接傳遞的PR值決定于導入鏈接所在頁面的PR值,發(fā)出鏈接的頁面本身PR值越高,所能傳遞出去的PR也越高。傳遞的PR數(shù)值也取決于頁面上的導出鏈接數(shù)目。對于給定PR值的頁面來說,假設能傳遞到下級頁面100份PR,頁面上有10個導出鏈接,每個鏈接能傳遞10份PR,頁面上有20個導出鏈接的話,每個鏈接只能傳遞5份PR。所以一個頁面的PR值取決于導入鏈接總數(shù),發(fā)出鏈接頁面的PR值,以及發(fā)出鏈接頁面上的導出鏈接數(shù)目。
PR值計算公式是
PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))
· A代表頁面A。
· PR(A)則代表頁面A的PR值。
· d為阻尼指數(shù)。通常認為d=0.85。
· t1...tn代表鏈接向頁面A的頁面t1到tn。
· C代表頁面上的導出鏈接數(shù)目。C(t1)即為頁面t1上的導出鏈接數(shù)目。
從概念及計算公式都可以看到,計算PR值必須使用迭代計算。頁面A的PR值取決于鏈接向A的頁面t1至tn頁面的PR值,而t1至tn頁面的PR值又取決于其他頁面的PR值,其中很可能還包含頁面A。所以PR需要多次迭代才能得到。計算時先給所有頁面設定一個初始值,經(jīng)過一定次數(shù)的迭代計算后,各個頁面的PR值將趨于穩(wěn)定。研究證明,無論初始值怎么選取,經(jīng)過迭代計算的最終PR值不會受到影響。
外部頁面Y向循環(huán)注入PR值,循環(huán)中的頁面不停迭代傳遞PR,如果沒有阻尼系數(shù),循環(huán)中的頁面PR將達到無窮大。引入阻尼系數(shù),使PR在傳遞時自然衰減,才能將PR計算穩(wěn)定在一個值上。
2.PR的兩個比喻模型
關于PR有兩個著名的比喻。一個比喻是投票。鏈接就像民主投票一樣,A頁面鏈接到B頁面,就意味著A頁面對B頁面投了一票,使得B頁面的重要性提高。同時,A頁面本身的PR值決定了A所能投出去的投票力,PR值越高的頁面,投出的票也更重要。在這個意義上,傳統(tǒng)基于關鍵詞匹配的算法是看頁面自己說頁面內(nèi)容是什么,基于鏈接的PR則是看別人怎么評價一個頁面。
第二個比喻是隨機沖浪比喻。假設一個訪問者從一個頁面開始,不停地隨機點擊鏈接,訪問下一個頁面。有時候這個用戶感到無聊了,不再點擊鏈接,就隨機跳到了另外一個網(wǎng)址,再次開始不停地向下點擊。所謂PR值,也就是一個頁面在這種隨機沖浪訪問中被訪問到的概率。一個頁面導入鏈接越多,被訪問到的概率也越高,因此PR值也越高。
阻尼系數(shù)也與隨機沖浪模型有關。(1-d)=0.15實際上就是用戶感到無聊,停止點擊,隨機跳到新URL的概率。