談談百度也中了H1N1病毒

  近來H1N1鬧得滿城風雨,全國人民皆知。這不前幾日連百度也中了H1N1病毒。

  在搜索引擎網站的更新速度中百度對於門戶新聞網站以及其它更新量大的網站引得速度都很快,基本受騙天更新。不過對於更新量小的網站,例如醫院網站,兩者就有較大差別,譬如google對於高權重並提交處理sitemaps和ping的網站,其引得速度可以達到分鍾級別,有時候剛纔更新完一篇文章,幾分鍾後就能在google中找到,但對於百度來說,引得速度較慢,一般僅只是爬去了網站的首頁,搜索題目,還是目次頁,而對於文章的內部實質意義頁很少。

  依據我對這個新站的仔細查看,該網站主要是一個醫療類型的服務網站,從收錄的快照中可以看出百度對於網站首頁的關心注視仿佛好象尤其高。我是在網站首頁改版固定內部實質意義未曾完備的事情狀況下,首先經過外部軟文鏈接,以及百度的曉得,貼吧為匡助。不到一個周的時間被百度所收錄,經過對有關醫療網站剖析,一般事情狀況下。半個月之內宣布的文章,運用百度搜索文章題目,排在面前的基本上都是門戶網站過載或聚齊來的文章,而醫院站點的文章大部分千篇一例,所以文章的內部實質意義含量在搜索引擎網站中顯得細小,那末怎麼樣增長針對專業內部實質意義更新少,行業特點標志表面化的大致相似萬眾男科網這麼的網站流量呢?假如百度也是不幸運中了H1N1病毒也許我們能找到一點端由吧!

  一、摹擬抓取剖析

  (1)依據百度在該站5.16的一次爬行動物記錄顯露:

  #Software: Microsoft Internet Information Services 6.0

  #Version: 1.0

  #Date: 2009-05-16 14:42:56

  #Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status

  2009-05-16 14:42:55 W3SVC490114653 61.129.14.17 GET /robots.txt – 80 – 61.135.190.55 Baiduspider+(+/search/spider.htm) 404 0 64

  首先爬行動物找到的是網站首頁頂部導航信息,百度在讀取了一次robots回返404往後就暫停。因為網站內頁內部實質意義還沒有完備的事情狀況下,百度在讀取首頁後,又會間隔較長時間纔會過訪內頁。依據摹擬顯露,百度的首次管用過訪是:

  2009-05-16 01:23:32 W3SVC490114653 61.129.14.17 GET /index.htm – 80 – 61.135.162.212 Baiduspider+(+/search/spider.htm) 200 0 0

  其次百度的下一次讀取很有可能是接著先讀取首頁內部實質意義,在site:wznanke.com中我們可以經過快照顯露出,然而在第二次爬取首頁的時刻,沒有讀取robots(摹擬爬行動物顯露)。

  2009-05-16 08:24:26 W3SVC490114653 61.129.14.17 GET /index.htm – 80 – 61.135.162.212 Baiduspid er+(+/search/spider.htm) 200 0 0

  在接下來,有可能百度會對首頁的鏈接施行稍多的讀取,因為該網站在逐層完備中全部接下來,網站應當完備有關內裡鏈接,不接受死鏈接的顯露出來,依據摹擬爬行動物記錄:

  2009-05-1608:26:01W3SVC490114653 61.129.14.17 GET /remensousuo/RuHeJianFei/index.htm – 80 – 61.135.162.212 Baiduspider+(+/search/spider.htm) 200 0 0

  依據百度baiduspider的每一階段爬取網內部實質意義的不一樣,我們可以趁早依據有關規則調試網站的有關布局。尤其針對新站上線,百度不會很快就給予收錄,只有當你的網站在搜索引擎網站有了一定得權重的時刻,況且有一定高品質的反相鏈接,百度會給該網站一個閾值,隨著該閾值的提高,這會兒百度纔會著手收錄有關內部實質意義頁面,這會兒網站纔會有更多來自百度的流量。

  尤其是對網站內部實質意義還在逐層完備中,而又操切期望百度收錄的站長來說,切莫認識不清提交處理各大搜索引擎網站。在這半中腰我首先經過的是有關外鏈的文章來宣傳網站,經過百度給與權重較高的百度空間、貼吧、曉得、合適百度常常敬辭更新時間較快的門戶網站,諸如:新浪、網易、tom在有關社區重點編撰一定品質的文章,這麼百度視為該網站取得的外部權重較高,於是自願收錄那裡面。

  當然百度也不會僅只是H1N1病毒的廣泛散布者,只要我們找到達百度交來規則的法寶,這種H1N1病毒也將被廣大站長同志掃除淨盡掉。