運用utf-8編碼的網站對百度收錄的影響

  在國際化的今日,運用UTF-8編碼的網頁已經越來越多,可搜索引擎網站百度為何仍然認為合適而使用GB2312編碼?Google的網頁快照幾乎沒有雜亂的符號,百度的就不一樣了,朋友的QQ站 ,上線不到一個星期.GG和百度都收錄了,可是我檢查下首頁的百度快照發覺一個問題,百度抓取的首頁裡邊根本一片非常黑,啥子物品也沒有,但GG顯露是一切正常的,著手沒關系放在心上,由於有可能是緩存的問題罷了,果不其然不到幾天,百度快照也正常了,收錄也正常,由於這站的文章幾乎都是手工原創的,不少QQ站都來搜集裡邊的內部實質意義,所以不到半個月,百度就收錄1300頁以上的頁面了,IP也一直上昇中,但上星期,也就是7K7K小游戲被K的同時,qqqmd也顯露出來了相同的事情狀況,做站那末積年,可謂,qqqmd這站都是以用戶為主的,由於我只是幫人建站,並不是管理者,管理者是位很負責任的女學生。

  在被K的第三天左右,這女學生找到我並問我,為何百度裡SITE沒了頁面了,由於那邊建站時,是用了UTF-8編碼的網頁來調配使用百度的搜索代碼,所以她的站是用百度內置搜索的,從她口中理解到,她的站和7K7K小游戲被K是同一時間的,於是我想,7K7K小游戲會被K或許只有競價的關系,當然也有可能是數值遺失,攜帶疑問,我總結概括了一下子以下幾點:

  1 運用utf-8編碼的網站影響並不表面化,但收錄多了總會萌生影響,理由是,幫客戶建站無數,往往是utf-8編碼的網站問題不是普通的多。

  2 本身qqqmd是QQ寫名字類,火星文,繁體字大量,對數值處置有一定影響。

  3 網絡故障,譬如磁盤陣列架上的某條光纖出問題。再有就是單塊硬盤出問題。那末一朝顯露出來故障,儲存在這臺服務器上還是硬盤上的網站天然也就從搜索引擎網站的引得中消逝了。對於百度這種大型的搜索引擎網站肯定會有專門的服務器硬件的保護團隊。所以若是天真的引得問題還是網絡問題那末應當不久時間就能還原。也就是為何眾多朋友的站被K掉沒兩天又奉復了。但若是硬盤掛掉那這就很慘。如今的硬盤無論是服務器用的SCSI仍然私人用的SATA品質仿佛好象都不可以和曾經相形。加之如今.cn的站點泛濫,導致的載荷是不由得不重視的。

  4. 自身服務器不定。

  5 普通好網站,過載的人多,外鏈數也比較難扼制,特別是新站,所曾經一階段我並無要求她去發外鏈,她也是正常更新網站罷了。

  6 至於眾多人一直說的啥子百度人工過問網站收錄之類,我反對這些個觀點。百度並沒有找你收費(那一些打電話來找你要錢的也是百度在各個城市的攝理企業,除開業務合作外,和百度實seo際上沒啥關系),為何要投入那末多的人的勞力來人工審查核定你的站點?你當他的職員不要工錢。

  如今網絡背景下,啥子都SEO,啥子都惡意優化,但試提問,好的網站,會那末難區別嗎,期望百度技術上有更好的生長,她的網站每日從google soso上也能來3千IP左右,所以,我只能奉告她錯過百度,並不會錯過網站本身的價值的,只要你堅決保持,你的支付總有一天獲得全部人的許可的。