Matt Cutts訪談 關於Google索引和301重定向等

這篇訪談有點早瞭,是今年3月份時的事。Matt Cutts針對Google的爬行,索引機制以及對301重定向,重復內容處理的問題做出瞭些回答。訪談的原文比較長,SEOmoz有人以插圖的形式很好的再現瞭這次訪談的大致內容,比較直觀,這裡我進行下轉載。

#1. 關於爬行和索引

關於索引問題,我想應該很多朋友都有體會,為什麼我的站Google收錄的很少?為什麼我發的反鏈Google都沒有收錄?

Google目前的索引量到底有多大,大傢可以在Google裡搜索a試試,從這個結果應該能看出個大概。

About 25,420,000,000 results (0.17 seconds)

然後,根據資料,截止到2007年2月,互聯網上已經發現的網站數量是108m,810,358個。

我們暫且拿當今的Google索引量,除以兩年前的網站數目,也就是平均下來,每個站的Google收錄量不到300。那麼實際情況呢?

很多時候,並不是Google沒有發現你的頁面或者反鏈,隻是覺得這些頁面或者反鏈不夠重要,沒什麼必要加入到他們的索引數據庫裡以供用戶查詢時返回結果。

那麼什麼樣的頁面才是重要的頁面?Google又是怎麼判斷的呢?PageRank是這份插圖所列舉的一個例子。

#2. 站內重復內容

這裡提到瞭盡量使用canonicalization來避免站內重復內容導致的索引問題。