近來在網上看了篇相關百度蛛蛛的爬動代碼的詮釋,發覺和如今的爬動有點變更,已至於著手時看我的小游戲站www.zz.la這個站的日記看不懂
是啥子意思,通過多次研討終於清楚那裡面,所以今從新收拾詮釋如下所述:
做seo的朋友都曉得,研討se爬動規律對於網站優化意義重大,尤其是對百度蛛蛛Baiduspider的研討。本文詮釋一下子百度蛛蛛爬動後回返代碼
代表的具體涵義:
2xx 成功
200 正常;煩請已完成。
201 正常;緊接 POST 指示。
202 正常;已接納用於處置,但處置尚未完成。
203 正常;局部信息 — 回返的信息只是一小批。
204 正常;無響應 — 已收繳煩請,但不存在要回送的信息。
3xx 重定向
301 已移動 — 煩請的數值具備新的位置且更改是長久的。
302 已找到 — 煩請的數值臨時具備不一樣 URI。
303 請參看其他 — 可在另一 URI 下找到對煩請的響應,且應運用 GET 辦法檢索此響應。
304 未改正 — 未按預先期待改正文檔。
305 運用攝理 — 務必經過位置字段中供給的攝理前來訪問問煩請的資源。
306 未運用 — 不再運用;保存此代碼以便日後運用。
4xx 客戶機中顯露出來的不正確
400 不正確煩請 — 煩請中有語法問題,或不可以滿意煩請。
401 未權力委托 — 未權力委托客戶機過訪數值。
402 需求付款 — 表達計費系統已管用。
403 嚴禁 — 縱然有權力委托也不必過訪。
404 找不到 — 服務器找不到給定的資源;文檔不存在。
407 攝理證明煩請 — 客戶機首先務必運用攝理證明自身。
410 煩請的網頁不存在(長久);
415 媒介類型不受支持 — 服務器不接受服務煩請,由於不支持煩請實際體的款式。
5xx 服務器中顯露出來的不正確
500 內裡不正確 — 由於不測事情狀況,服務器不可以完成煩請。
501 未執行 — 服務器不支持煩請的工具。
502 不正確網關 — 服務器收繳來臨自上游服務器的失效響應。
503 沒有辦法取得服務 — 因為臨時轉載或保護,服務器沒有辦法處置煩請。
譬如說:
2008-05-10 00:28:03 W3SVC818374 222.214.218.36 GET /log/ – 80 – 221.10.254.26 Baiduspider+
(+/search/spider.htm) 200 0 0 21089
假如你的網址是www.zz.la這就意味著百度蛛蛛在2008-05-10 00:28:03 爬過http://www.zz.la/log/ 這一頁,200 0 0 21089中的200協議代碼
代表了煩請已完成也就是它發覺這頁並以入庫了。依據這個我們可以多檢查iis日記,研討蛛蛛爬動的途徑,找出自個兒網站存在的問題,繼續往前修改。