
PageRank,網頁排名,又稱網頁級別、Google左側排名或佩奇排名。PageRank™是以公司創辦人拉里·佩奇(Larry Page)命名。是一種由搜索引擎根據網頁之間相互的超連結計算的網頁排名。它經常和搜索引擎優化有關。 PageRank系統被Google用來體現網頁的相關性和重要性。Google的創始人拉里·佩奇和謝爾蓋·布林1998年在史丹福大學發明了這項技術。[1]
PageRank 通過網路浩瀚的超連結來往來確定一個頁面的等級。Google 把從 A 頁面到 B 頁面的連結解釋為 A 頁面給B頁面投票 Google 根據投票來源(甚至來源的來源,即連結到A頁面的頁面)和投票目標的等級來決定新的等級,簡單的說,一個高等級的頁面可以使其他低等級頁面的等級提升。
目錄 |
一個頁面的「得票數」由所有鏈向它的頁面的重要性決定。到一個頁面的超連結相當於對該頁投一票。一個頁面的 PageRank 是由所有鏈向它的頁面(「鏈入頁面」)的重要性經過遞歸演算法得到的。一個有很多鏈入的頁面會有很高的等級,相反如果一個頁面沒有任何鏈入頁面,那麼它沒有等級。
2005年初,Google 為網頁連結推出一項新屬性 nofollow,令網站管理員和網誌作者可以做出一些 Google 不會計算為投票的連結;這些連結不算作"投票"。nofollow 的設置可以抵制評論垃圾。
Google 工具條上的 PageRank 從 0 到 10。它似乎是一個對數標度演算法。這個演算法的細節是未知的。PageRank 是 Google 的商標,PageRank 技術已經申請專利。
PageRank 演算法中的點擊演算法是由 Jon Kleinberg 提出的。
假設一個由4個頁面組成的小團體:A,B, C 和 D。如果所有頁面都鏈向A,那麼A的PR(PageRank)值將是B,C 及 D的和。
繼續假設B也有連結到C,並且D也有連結到包括A的3個頁面。一個頁面不能投票2次。所以B給每個頁面半票。以同樣的邏輯,D投出的票只有三分之一算到了A的 PageRank 上。

換句話說,根據鏈處總數平分一個頁面的PR值。

最後,所有這些被換算為一個百分比再乘上一個係數q。由於下面的演算法,沒有頁面的PageRank會是0。所以,Google通過數學系統給了每個頁面一個最小值1 − q。

所以一個頁面的 PageRank 是由其他頁面的PageRank計算得到。Google 不斷的重複計算每個頁面的 PageRank。如果您給每個頁面一個隨機 PageRank 值(非0),那麼經過不斷的重複計算,這些頁面的 PR 值會趨向于正常和穩定。這就是搜索引擎使用它的原因。
這個方程式引入了隨機瀏覽的概念,即有人上網無聊隨機打開一些頁面,點一些連結。一個頁面的PageRank值也影響了它被隨機瀏覽的機率。為了便於理解,這裡假設上網者不斷點網頁上的連結,最終到了一個沒有任何鏈出頁面的網頁,這時候上網者會隨機到另外的網頁開始瀏覽。
為了對那些有鏈出的頁面公平,q = 0.15(q的意義見上文)的演算法被用到了所有頁面上, 估算頁面可能被上網者放入書籤的機率。
所以,這個等式如下:

p1,p2,...,pN是被研究的頁面,M(pi)是鏈入pi頁面的數量,L(pj)是pj鏈出頁面的數量,而N是所有頁面的數量。
PageRank值是一個特殊矩陣中的特徵向量。這個特徵向量為

R是等式的答案

如果pj不鏈向pi, 而且對每個j都成立時,
等於 0

這項技術主要的弊端是,舊的頁面等級會比新頁面高,因為新頁面,即使是非常好的頁面,也不會有很多連結,除非他是一個站點的子站點。
這就是 PageRank 需要多項演算法結合的原因。PageRank 似乎傾向於維基百科頁面,在條目名稱的搜索結果中總在大多數或者其他所有頁面之前。原因主要是維基百科內相互的連結很多,並且有很多站點鏈入。
Google 經常處罰惡意提高 PageRank 的行為。Google 究竟怎樣區分正常的連結交換和不正常的連結堆積仍然是商業機密。
|
檢 • 論 • 編 • 歷
|
|
|---|---|
| 董事會主席兼執行總長:埃里克·施密特 · 董事兼技術總裁:謝爾蓋·布林 · 董事兼產品總裁:拉里·佩奇 · 首席財務官:喬治·雷耶斯 其他董事:保羅·歐德寧 · 約翰·亨尼斯 · 阿瑟·萊文森 · 安·馬瑟 · 約翰·杜爾 · 拉姆·希拉姆 · 雪莉·蒂格曼 · 高級顧問:阿爾·戈爾 |
|
| 廣告 | AdSense · Advertising Professionals · AdWords · 分析 · Base · Checkout · Click-to-Call · DoubleClick · Insights for Search · Trends |
| 通訊 | Answers · Apps · 日曆 · Dodgeball · Friend Connect · Gmail · GrandCentral · 網上論壇 · Talk · Joga Bonito · Orkut · Picasa Web Albums · Reader · Translate · Panoramio |
| 電腦應用程式 | Android · App Engine ·Browser Sync · Chrome ·Code · Co-op · 桌面 · 地球 · Gears · Gmail Mobile · Keyhole ML · Lively · Hello · OpenSocial · 軟體集 · Picasa · 拼音輸入法 · Sites (JotSpot) · SketchUp · Talk · 工具列 · Updater · Video Player · Web Accelerator · Gmail Store |
| 出版 | Alerts · App Engine ·Bookmarks · Blogger · 文件 · FeedBurner · iGoogle · Jaiku · Knol · Library Project · Map Maker ·Mashup Editor · 筆記本 · Page Creator · Sites · Video Marketplace · YouTube |
| 搜尋(PageRank,Sitemaps) | Audio Indexing · 圖書 · Code · 桌面 · 財經 · GOOG-411 · Google Search Appliance · 圖片 · 地圖 · Moon · 新聞 · 專利 · Products/Froogle · SearchWiki · 學術 · Street View · Usenet · 視訊 · 網頁 |
| 參看 | 子公司 · Google炸彈 · Google審查 · 批評 · 谷歌 · Google.org · Googleplex · Google歷史 · Google玩笑(英文) · 手氣不錯 · 實驗室 ·標識 · 節慶標識 · Platform · 產品列表 · Summer of Code · WiFi |
| 術語及概念 | Google 經濟體系 · Google (動詞) |
| 技術 | MapReduce · Google檔案系統 · PageRank |
Why are we here?
All text is available under the terms of the GNU Free Documentation License
This page is cache of Wikipedia. History