Google專利:怎樣鑒別和處理垃圾鏈接

在自己網站上使用SEO作弊手法,諸如隱藏文字,隱藏鏈接,關鍵詞堆積,隱藏頁面,JS轉向等,是比較傳統的作弊方式,也更加危險。因為證據確鑿,被抓住沒什麼好狡辯的,證據全在自己網站上擺著呢。

而靠垃圾鏈接提高排名,就有點說不清道不明的感覺。在博客或論壇群發,就算被檢測到,搜索引擎在處理時也會比較謹慎,因為很難斷定群發是誰幹的。雖然大部分情況下是站長自己幹的,但鑒於現在很多人為瞭排名能變成黑客,也不排除有些人為瞭陷害競爭對手,給競爭對手群發一下。

所以怎樣鑒別和處理垃圾鏈接是個頭疼的問題。搜索引擎頭痛,老老實實做站的站長也頭痛。

前兩天Google提交的一份專利剛剛被批準,標題是:在互相鏈接的數據中檢測鏈接垃圾之方法,就是研究怎樣檢測和處理垃圾鏈接。專利中討論瞭很多鑒別鏈接工廠的數學公式,我完全看不懂,懂編程的可以研究一下。我承認大學時學的高數、線代等一點也不記得瞭。

這份專利特意提到瞭兩類鏈接工廠。一種是做一大堆網站,目的就是共同連向一個主網站,使主網站排名提高。這種鏈接工廠的特征是鏈接向主網站的這些頁面,往往權重(比如Google PR)都很低。而正常的,真正重要的網頁通常都會有至少一些比較重要的鏈接。

另外一種鏈接工廠是,一堆網站互相之間交叉鏈接起來。這種鏈接工廠的特征是,這群網站在鏈接模式上基本上形成一個孤島,很少與圈子之外的網站有正常鏈接關系。

專利中提到被判斷是鏈接工廠或有鏈接工廠嫌疑的,可能會采取以下措施:

這些頁面的鏈接在計算權重時,完全不被考慮

頁面上的鏈接權重被降低

頁面上的鏈接權重被懲罰

這些頁面本身重要性被降低

這些頁面本身重要性被降低,同時發出的鏈接重要性也被降低

這些懲罰措施都是可以預見的,所描述的兩種典型鏈接工廠也不少見。不知道專利中所描述的數學公式,在判斷這些鏈接工廠時的準確率有多高?

原文鏈接:/seoblog/2009/03/31/link-spams/