SEO謠風終結者之GZIP壓縮對蛛蛛抓取的影響

  之前寫過一篇終結SEO謠風的文章,徹底訓斥了同一ip會被K的議論的傾向,這一次,讓我們來徹底終結Gzip壓縮技術會影響蛛蛛抓取這一觀點,還Gzip一個清白。

  首先,Gzip到盡頭是個啥子物品?GZIP最早由Jean-loup Gailly和馬克 Adler開創,用於UNIX系統的文件壓縮。我們在Linux中常常會用到後綴為.gz的文件,他們就是GZIP款式的。現今已經變成Internet 上運用十分存在廣泛的一種數值壓縮款式,還是說一種文件款式。HTTP協議上的GZIP編碼是一種用來改進WEB應用手續性能的技術。大流量的WEB站點每常運用GZIP壓縮技術來讓用戶感覺更快的速度。說得更簡單清楚一點兒,Gzip就是用來壓縮你的頁面,它的終用盡目力的就是加快網站的過訪速度,因此提高用戶體驗認識。

  綜上所述,我們得出了卻論,Gzip就是加快網站過訪速度,增長用戶體驗認識的一種辦法,值當注意的一點兒是,它是一個服務器端的行徑,也就是說,它是經過服務器的功能來對網頁施行壓縮的,而它所需求的客戶端支持僅只是瀏覽器需求支持Gzip,僅此罷了!我們曉得,市面兒上幾乎全部主流瀏覽器全部支持Gzip壓縮技術,而作為前端頁面調整資深專家firefox的Yslow插件也把Gzip壓縮是否開啟作為一個頁面是否符合標准的評分兒標准。由此看來,Gzip不是一個歪門邪道的技術,而是作為一個合乎W3C的標准而存在,試提問這麼的標准,有那一個搜索引擎網站會去抵制呢?

  我們曉得,蛛蛛抓取頁面的過程,其實是一個客戶端行徑,而Gzip壓縮是一個服務器端的行徑;蛛蛛抓取實際上和平常的人用瀏覽器瀏覽網站沒關系差別,惟一的差別就是它讀的不是通過瀏覽器解析過的頁面,它是直接讀的頁面源代碼。這麼,問題就迎刃而解了,經過嘗試我們發覺,通過Gzip壓縮的網頁和未通過Gzip壓縮的網頁,二者的源代碼沒有不論什麼的差別。既是沒有差別,那又怎麼有可能去影響蛛蛛抓取網頁呢?

  請小心開啟Gzip,這句話實際上並沒有錯,由於它說的壓根兒就跟蛛蛛抓取沒有一毛錢的關系,這句話的原意是指,開啟Gzip會耗費一點服務器的資源,換言之,假如要運用這種壓縮技術,服務器的配備布置必須要中常級高的的,小規模的服務器譬如虛擬主機,假如開啟了Gzip會導致服務器轉載,而導致系統不迅速。有的人不曉得為何就把這句話跟搜索引擎網站抓取結合了起來,因此誤導了廣大生手站長。這處分享一個無須配備布置服務器就可以開啟Gzip 壓縮的辦法:

  譬如你的網站首頁地址是www.xiaohao.net/index.php,那末,你就用記事本敞開index.php文件,在頁面肥部加上一句Ob_Start(‘ob_gzhandler’);就擺平了。這麼index.php就通過了Gzip壓縮,假如你還想壓縮別的php文件,那末一次敞開加較早一代碼就行了。

  造謠可恥,傳謠可憎,信謠令人悲傷,闢謠值得尊敬!期望廣大站長能夠擦亮眼球,不要輕易相信謠風,也期望關於SEO的謠風能夠越來越少,最終期望這是最終一篇SEO謠風終結者系列文章。