百度蛛蛛狀況碼與百度快照是否相關系

  做網站有大半年了,今日首次寫這類文章。至於為何要寫這篇文章,是由於2009年下半年以來一至今,百度常常不正常,造成眾多站長的網站顯露出來快照不更新,快照回檔,甚至於被K的現象。所以在HKSEO論壇和seowhy論壇上常常看見有點站長說,期望百度能盡量加快更新自個兒的快照。實際上快照次日是否更新,不盡然要寄期望於別人,只要自個兒查查web日記,就能曉得。也就是我今日要跟大家說的話題。

  下邊我就簡單的談一下子關於百度蛛蛛過訪網站後,web日記所回返的狀況碼與首頁的百度快照是否會更新之間的關系,所談到的都是小弟大半年以來每日仔細查看自個兒網站的web日記裡百度蛛蛛的爬動殘跡所摸索出來的規律,期望對大家有點幫忙。

  大家可以試驗著敞開web日記的.log文件,web日記的默許途徑是C:\WINDOWS\system32\LogFiles\W3SVC1 ,seo用虛擬主機的朋友可以找空間商索取。敞開文件夾下的.log文件,搜索百度蛛蛛,百度蛛蛛的姓名為baiduspider。而後一直Enter,可以查出百度蛛蛛過訪網站後留下的全部足跡。在查尋中,注意一下子百度蛛蛛姓名面前的IP,還有整行最終的狀況碼。

  普通事情狀況下,蛛蛛抓取網頁假如回返200 0 0代碼,則表達該網頁已經成功編入引得,200 0 64是指引得數值庫已經存在,沒有發覺網頁有更新的內部實質意義,不必從新引得的意思。304 0 0是指原來緩和沖突的文檔還可以沿用,跟200 0 64意思應當相差無幾吧。 (值當一提的是:200 0 64並不是網上眾多人說的會被K站或降權,是正常現象,動態網站抓取的時刻大部分數顯露出來200 0 0,即使是網站沒有更新。)

  在說一下子蛛蛛IP,我的web日記裡查到的蛛蛛IP普通都是220.181.7.*和123.125.66.*比較多,還有一個61.135.162.*,這三個段的IP是抓取網頁的,123.125.68.*這個段的是百度沙盒蛛蛛IP。61.135.168.*這個段的蛛蛛是抓取圖片的。然而百度蛛蛛應當還有眾多,有可能是依照網站的地區和線路發放蛛蛛的吧。具體事情狀況還要具體看待。然而有一點兒可以肯定的是,在網站沒被降權的事情狀況下,只要有兩個IP段的蛛蛛(譬如我的日記裡的220.181.7.*和123.125.66.*這兩個段)都抓取了網站首頁且回返的狀況碼是200 0 0,那就無須每日等到零晨四點看百度更新首頁的快照了(我曾經常常等到凌晨四五點纔睡覺兒,呵呵,然而如今普通都是在早晨六七點纔更新快照)。

  普通百度首頁快照比較慢、網站權重比較低還是被降權的網站,蛛蛛普通都是回返的200 0 64的狀況碼。我有一個被K過的網站,當初每日都只有123.125.68.*這個段的IP,且狀況碼都是回返的200 0 0。