一個沒有料到的端由影響了我們站的收錄

  弱弱seo的問一下子,為何我發的文章不可以換行? 和一個朋友花了一個多月的時間做了個康健方面的站,上線後找人加內部實質意義,一星期後去baidu和google都提交處理了,最後結果次日都收錄了。 baidu一百多篇,google一千多篇,一切的事情狀況都還好。 但接下來的一周纔發覺問題了,眼看一個星期就這樣過去了,baidu不再更新快照,兩個星期,仍然不更新,內部實質意義我們每日都在加,加得還不少,應當都是原創。但google一直在更新,還很快。 外鏈也在加,怕一下增添了,每日按兩三個的速度在增加,固然在baidu裡domain出來的物品沒有幾個。 接下來的日期,我也試著在網上尋覓為何會這麼子,也沒有明確的一個講法,說得最多的就是我們有可能在作弊,但我們不擁有。在這個時期,我也在看apache的日記,發覺baidu只來了首頁和其他幾個簡單的內頁,就沒有接著向裡邊走了。下邊我說說baidu在爬我們網站的規律:

  1. 每隔一個鍾頭左右來一次,幾乎只爬首頁。

  2. 每每來都爬了robots.txt的。 問題就是出在這個robots.txt上,由於在網站上線一個星期後,也就是在baidu收錄我們在這以後,我們為網站做了urlrewrite, 也就是加了個.htaccess文件。 網站是php的,用了一個框架,在htaccess文件裡,有這樣一條規則,就是假如發覺沒有的文件,就重定向到一個我們寫好的頁面,本意是友善的提醒用戶這個頁面不存在。但,這個條規則用在robots.txt上就出問題了,baidu打算取robots.txt的時刻,回返的不是他希望的款式,而是我們的出錯頁面。 這就是問題的溯源了,baidu肯定覺得我們不期望他來抓取我們的網站,所以不再向下爬了。

  於是,我去baidu上下載了一個標准的robots.txt文件,放在了根目次下,測試了一下子能不可以下載,OK。可以了,這會兒已經是晚上12點多了。也無論了,睡去了。 次日早晨起來,site:,O my lady ga ga,更新了,更值當慶賀的是,在接下來的二十幾個鍾頭裡,每每site都能收到不一樣的收錄數目,當然,不盡然都是增加,但總體來是增加的,無上的時刻已經有一千多篇了。

  這就是這次我要寫的物品了,期望大家在寫Url Rewrite的時刻,不要把robots.txt疏忽了。 各位看官,你如今site:已經沒有那末多了,由於後面還有一個意料不及的問題造成了收錄和名次的減退,也是值當總結概括的,有時候間再寫哈。