經過IP地址看網站日記尋覓百度蛛蛛爬動規律

  對於各位站長來說,百度的收錄是關切的重中之重。理解百度蛛蛛的爬動規律因此更好的改善收錄事情狀況也是一定要掌握的。眾多網站到現在為止運用的都是虛擬空間,都能夠供給日記。

  日記是指在網站根目次下的logfiles文件夾裡邊日子.txt文本文件有眾多紹介經過http檢查回返指示的那種方法來檢查蛛蛛,這處就不紹介了。

  如今更多的網站是沒有供給可以經過軟件來檢查的日記款式。

  更多的是大致相似下邊的日記款式,如下所述:

  03:28:34 GET /goods.php 202.108.7.205 200 34696 390

  第1 03:28:34 過訪時間

  第二 GET /goods.php 過訪的頁面 get表達取得

  第三 202.108.7.205 過訪網站的源IP

  第四 200 成功過訪

  第五 34696 390 表達記錄的內部實質意義體積

  都是這種款式的日記怎麼樣去剖析了,一個一個看的頭都大了。北京禮物網站的日記記錄每日都有1M多,上千條記錄豈不是會看都頭暈目眩。

  注意了,奉告大家一個竅門。通過長時期仔細查看發覺,百度的蛛蛛的出處服務器IP地址都是歸屬一個域下邊的通個網段。啥子意思了,就是所有都是以202.108開頭的IP,IP地址都是大致相似於202.108.X.X。這個網段的IP地址是位於北京網通電報大樓,歸屬全國互聯網中心基乾機房,如今此IP段已經斷絕蹤跡了。(基本上全被大網站運用了,如新浪、雅虎等)那末抽調你的日記,用ctrl+f查尋一下子有沒有這個網段的IP。有的話那這個就是百度蛛蛛的過訪地址了,而後就查尋一下子過訪的時間,那末就可以找出來百度蛛蛛過訪你網站的時間規律了。對於大家依照蛛蛛爬動時間來更新網站內部實質意義的效用那是杠杠的啊。

  最終,禮物 熱烈歡迎大家拍磚,完全原創自個兒的體會。過載請留名,謝謝!