SEO診斷:透過Log日記找到網站死扣兒

  不久前和一位朋友談天,互換了下對八月底百度算法更新的一點看法。終了的時刻朋友讓我幫他剖析一下子他的新站,網站的問題是快照稽留在八月十五號,況且快20天百度沒有收錄新內部實質意義。采取簡單的辦法辦理單的互相談話獲悉,網站上線2個月,每天堅決保持更新原創內部實質意義和外鏈。自從百度收錄後,文章隔天收錄,長尾詞名次也不賴。不過八月十九號快照回檔到815後,快照再未更新過。通不為己甚析這個站的群體結構和內部實質意義,發覺整站結構清楚清楚,並沒有嚴重的結構上的問題,文章內部實質意義圖文並茂,寫的也不賴,並且長尾詞名次的確不賴,這對一個新站來說做的很不賴。

  為何快照不更新,新內部實質意義不再收錄?難不成是百度自身的問題,仍然有別人的眼睛看不到的癥結?這個時刻想起了日記剖析,有的時刻只有透過外在看問題。從朋友處要來了前一天的網站LOG日記,下圖是日記剖析工具得出來的蛛蛛綱要截圖。從圖上我們可以看見三大主流搜索引擎網站的蛛蛛過訪回數、稽留時間和總抓取量等信息。

  


  朋友這個站歸屬一個新站,外鏈無幾,整個兒網站的資訊量也不曲直常大。根據私人的經驗剖析,蛛蛛單次抓取量(總抓取量÷過訪回數)達到80-100已經總算一個十分不賴的數碼了。緣何網站的新內部實質意義不收錄?

  第二步蒞臨了網站目次的抓取事情狀況。下圖是截取一段了三大主流蛛蛛目次抓取Top3目次的一個截圖,從圖上我們可以看見圖上的archiver目次的抓取量遠遠超過於其它的網站目次。這個數值讓我有些不心情安定了。

  


  從朋友的網站理解到,這是一個每天歸檔目次,從圖上我們可以看見的是2010年0九月0五號回返的當日宣布內部實質意義為空(朋友這個站建站纔2個多月)。

  


  經過站長工具可以看見,該URL回返的是200狀況碼。此時心理約略有底了,蛛蛛在這個目次的爬動一定碰到了艱難。

  


  為了證驗自個兒的判斷,經過Editplus敞開了LOG文件,不出所料幾大蛛蛛在抓取archive目次時陷於了死胡同兒。

  


  癥結找到達,接下來就是怎麼樣處置這個問題。因為這個文檔歸檔功能是朋友購買的一款插件,所以朋友仍然期望能夠保存這個每天歸檔欄目,畢竟錢花了適用到實處,不求該欄目能帶來流量但卻是個有好處的補給。剛著手思索問題經過NOFOLLOW來屏蔽蛛蛛爬取,不過想來想去仍然不妥,畢竟已經收錄的頁面仍然給了蛛蛛爬動的餘地,又會顯露出來文中所謂死循環。

  最終,給了朋友兩條提議:

  1、 結合插件研發者修復此BUG;

  2、 刪去整個兒archive目次回返404狀況碼,況且在robots中屏蔽archive目次;

  整個兒的診斷過程是這樣的。很很長時間候當我們網站顯露出來問題的時刻,請無防敞開你的網站LOG日記,仔細相比較並剖析裡邊的數值,將會對你找到問題的存在的地方有非常大的幫忙。