Google定義隱藏頁面

大傢都知道隱藏頁面(cloaking)是作弊手法的一種。隱藏頁面通常是根據訪問請求的IP地址判斷是搜索引擎蜘蛛還是普通用戶,然後對蜘蛛和普通用戶返回不同的內容。

但是根據IP不同返回不同內容,有的時候又不是作弊。所以這兩者之間的界限,經常比較模糊。Google站長博客前兩天發瞭個帖子,對四種情況做瞭比較明確的定義。下面半翻譯,半評論。

地理定位 Geolocation

根據用戶的地理位置,返回不同的針對特定地理位置的內容。判斷這個地理位置可以是訪問的IP地址,也可以是存儲在用戶電腦中的cookie,也可以 是註冊用戶所提供的地址。比如一個足球網站,如果一個已經註冊過的用戶提供的用戶信息中地址填的是北京,當這個用戶訪問網站時,就返回更適合北京用戶的內 容,更多報道北京隊的成績等。

IP Delivery IP傳送

不太清楚應該怎樣準確翻譯,姑且叫做IP傳送吧。

IP delivery是上面所說地理定位的一種。因為IP地址都是分配給不同地區的ISP,根據發送訪問請求的IP地址,就可以判斷出用戶的地理位置,然後返回相應的內容。

IP delivery隻是一種返回更恰當內容的技術手段,不一定就是作弊。像上面例子所說,一個沒有註冊的訪問者來到網站,服務器通過檢測用戶IP地址,發現瀏覽者是來自北京,完全可以返回與來自上海的瀏覽者不同的內容。不但不是作弊,而且是更用戶友好。

隱藏網頁 Cloaking

這就屬於作弊瞭。指的是搜索引擎蜘蛛訪問時返回一套經過優化的內容,而普通用戶訪問時又返回另一套內容。鑒別是否是搜索引擎蜘蛛的方法還是包括通過 IP地址判斷,因為IP地址屬於哪個ISP或大的網絡公司是可以查出來的。這也就是隱藏網頁與IP delivery常常混淆的原因。

首次點擊免費 First Click Free

有一些新聞網站內容是要收費的,但是又希望被搜索引擎收錄。Google提供瞭首次點擊免費機制,也就是說用戶通過Google搜索結果來到這樣的 收費網站,第一次點擊時,用戶可以看到正常內容,也就是Google蜘蛛所抓取的內容。但是同一個用戶的第二次點擊,將看不到新聞內容,而會被要求登錄或 付費。

比較IP delivery和隱藏頁面就可以知道,IP delivery是正常的事,隱藏頁面是作弊。搜索引擎所要求的並不是不允許使用IP delivery,而是不要把搜索引擎蜘蛛特殊處理。假設搜索引擎蜘蛛是來自紐約數據中心,網站返回的內容就應該是同樣來自紐約的普通用戶看到的內容,而 不應該返回一套無論來自哪裡的普通內容都看不到的,隻有搜索引擎蜘蛛才能看到的內容。

隱藏頁面其實是相當危險的技術。比如說從大傢不知道是屬於Google的IP地址,發出與普通瀏覽器一樣的訪問請求,抓取頁面,抓取的內容與來自同一地理位置的正常蜘蛛抓取的內容一比較,就知道是否存在cloaking。

作者: Zac@中新國外主機
原載: 點石互動搜索引擎優化博客
版權所有,轉載時必須以鏈接形式註明作者和原始出處及本聲明。