IIS日記剖析工具之EXCEL數值透視表

  互聯網上剖析IIS的工具倒是不少,然而我沒有遇見能夠合乎我要求的,普通的都是只能查問IIS日記內的蛛蛛爬動的回數罷了。下邊說個比較簡單且十分實用的辦法,經過EXCEL的一點簡單的公式做出意料得到的一系列數值,例如時間間隔,爬動頁面,回返狀況碼,網址參變量,蛛蛛類型,蛛蛛IP等,經過以上數值可以施行對網站的問題的排查,更正。 首先務必有自個兒的服務器還是能夠檢查IIS日記的職權范圍,經過FTP將iis日記文件從空間中下載到本地 服務器取得IIS日記的形式:敞開IIS,點擊要查問網站>右鍵>屬性>網站選項卡>屬性>即可看見如圖 若是空間的話有點空間服務上會將日記文件放在網站根目次的。假如沒有的話可以向服務商索要。

  


  而後依據途徑施行查尋相應的文件夾然,可以看見文件夾下有眾多.log文件就是日記文件,而後經過FTP下載到本地。

  


  假如文件過大操作起來有可能不方面,可以運用UltraEdit敞開,篩查你意料得到的數值(具體自個兒下載一個研討下)。文件不曲直常大可以運用記事本直接敞開後復制到EXCEL。

  


  而後將前4行刪去,挑選A列,點擊excel數值>分列>瓜分符號

  


  



seo

  下一步>其它>輸入空格>下一步>完成。這麼第1步就完成了。

  


  而後挑選A1列>右鍵>插進去 而後將C,D,E,I列刪去。在第1行作別輸入:日子,時間,網頁,參變量,端口,IP,蛛蛛,狀況碼 額外解釋明白一下子參變量,參變量這個是動態網頁面問號(?)後面的局部。 這個途徑後面的參變量值為3,那末組合在這以後真似的URL就是?3 因為這個解釋明白蛛蛛仍然可以辯白參變量的,有點網站投放廣告後面常常都會帶上參變量施行計數,但通過抓取後參變量都會被去除的。所以盡力不要在內部實質意義頁運用此類的URL。

  


  選中G列>數值>用篩子選>點擊G列箭頭>文本用篩子選>裡面含有

  


  輸入baidupider 點擊確認。即可看見全部百度蛛蛛過訪的數值 這麼的話大概的數值已經閃現出來了,假如檢查google在用篩子選時刻輸入googlebot就可以了。隨即制造一個簡單的數值透視表易於剖析。 一次順著次序:插進去>數值透視表>數值透視表>確認 在右側按先後順著次序勾選網頁,蛛蛛,時間。而後點擊蛛蛛後面的小三角學

  


  點擊標簽用篩子選>裡面含有>輸入baidupider。既可以用篩子選出最後要看的網頁的spider爬動時間周密數值,當然可以依照其它組合施行用篩子選各類數值,就不演習了。

  


  Luigi's blog原創,過載請注明 謝謝