SEO專家筆記: Pagerank深入研究 (三)

延續之前的文章"SEO專家筆記: Pagerank深入研究 (一)“、以及"SEO專家筆記: Pagerank深入研究 (二)“,我們談到了Pagerank的特性以及演算法的公式,現在再來看看Pagerank更多的事情 …

 由這篇論文"The Anatomy of a Large-Scale Hypertextual Web Search Engine“,可以看到更多Pagerank與Google的細節。

論文中說到Google的特點: “The Google search engine has two important features that help it produce high precision results. First, it makes use of the link structure of the Web to calculate a quality ranking for each web page. This ranking is called PageRank … Most search engines associate the text of a link with the page that the link is on. In addition, we associate it with the page the link points to." 

大致的翻譯是: Google搜尋引擎有兩個重要的特性,以協助產生精準的結果。第一個是Pagerank,第二個是Anchor text。Pagerank演算法是其他搜尋引擎所沒有的,而Goole不僅把anchor text與含有該anchor text的網頁相關,還與連往的網頁相關。

並且除此之外,還說到: “Aside from PageRank and the use of anchor text, Google has several other features. First, it has location information for all hits and so it makes extensive use of proximity in search. Second, Google keeps track of some visual presentation details such as font size of words. Words in a larger or bolder font are weighted higher than other words. Third, full raw HTML of pages is available in a repository." 

大致的翻譯是: Google還使用所有點選的資料,所以可以知道哪些資料是搜尋相關的。並且Google還使用排版性質的權重,如粗體或是較大的字體,並且將網頁完整的html內容存在資料櫃中。 


 在這篇論文中,就很清楚的把後來的Pagerank演算法列出來如下: PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn)) 也就是如下的樣子:

並且我們可以從以下的圖,看出來加入Pagerank之外的因素之後,Pagerank已經不是page rank,因為許多排名並不一定是Pagerank高的排在前面,之所以會這樣,就是因為已經加入諸如IR score等等因素。