Google專利：怎樣鑒別和處理垃圾鏈接

在自己網站上使用SEO作弊手法，諸如隱藏文字，隱藏鏈接，關鍵詞堆積，隱藏頁面，JS轉向等，是比較傳統的作弊方式，也更加危險。因為證據確鑿，被抓住沒什麼好狡辯的，證據全在自己網站上擺著呢。

而靠垃圾鏈接提高排名，就有點說不清道不明的感覺。在博客或論壇群發，就算被檢測到，搜索引擎在處理時也會比較謹慎，因為很難斷定群發是誰幹的。雖然大部分情況下是站長自己幹的，但鑒於現在很多人為瞭排名能變成黑客，也不排除有些人為瞭陷害競爭對手，給競爭對手群發一下。

所以怎樣鑒別和處理垃圾鏈接是個頭疼的問題。搜索引擎頭痛，老老實實做站的站長也頭痛。

前兩天Google提交的一份專利剛剛被批準，標題是：在互相鏈接的數據中檢測鏈接垃圾之方法，就是研究怎樣檢測和處理垃圾鏈接。專利中討論瞭很多鑒別鏈接工廠的數學公式，我完全看不懂，懂編程的可以研究一下。我承認大學時學的高數、線代等一點也不記得瞭。

這份專利特意提到瞭兩類鏈接工廠。一種是做一大堆網站，目的就是共同連向一個主網站，使主網站排名提高。這種鏈接工廠的特征是鏈接向主網站的這些頁面，往往權重(比如Google PR)都很低。而正常的，真正重要的網頁通常都會有至少一些比較重要的鏈接。

另外一種鏈接工廠是，一堆網站互相之間交叉鏈接起來。這種鏈接工廠的特征是，這群網站在鏈接模式上基本上形成一個孤島，很少與圈子之外的網站有正常鏈接關系。

專利中提到被判斷是鏈接工廠或有鏈接工廠嫌疑的，可能會采取以下措施：

這些頁面的鏈接在計算權重時，完全不被考慮

頁面上的鏈接權重被降低

頁面上的鏈接權重被懲罰

這些頁面本身重要性被降低

這些頁面本身重要性被降低，同時發出的鏈接重要性也被降低

這些懲罰措施都是可以預見的，所描述的兩種典型鏈接工廠也不少見。不知道專利中所描述的數學公式，在判斷這些鏈接工廠時的準確率有多高?

原文鏈接：/seoblog/2009/03/31/link-spams/

The Blog