怎麼樣將網址規范化

  網址規范化一直是圍困並攪擾站長以及搜索引擎網站的一個問題。據估計,網上有10百分之百-30百分之百的URL是內部實質意義相同但URL不同的不規范化網址。這就導致幾個問題。譬如:

  對站長來說,多個URL存在散布了頁面權重,有弊於名次。

  對搜索引擎網站來說,耗費資源,耗費帶寬。

  搜索引擎網站發覺多個網址內部實質意義相同時,不會辦罪,而會盡有可能找出那一個應當是規范化的網址。但手續畢竟只是手續,有可能出錯,挑出來的有可能不是站長想要的那一個規范化網址。

  網站上網址規范化問題太嚴重的話,也有可能影響收錄。一個權重不頎長的域名,能收錄的總頁面數碼是有限的。搜索引擎網站把資源花在收錄不規范的網址上,留下給真正不一樣內部實質意義的資源就減損了。

  要解決URL規范化問題也有眾多選項,譬如:在Google管理職員具中設置帶3W和不帶3W的,哪個是規范化版本運用301轉向,把不規范化URL所有轉向到規范化URL,保證運用的CMS系統只萌生規范化網址,保證網站上全部內裡鏈接都指向規范化網址,在提交處理給搜索引擎網站的網站地圖中所有指決定范化網址,但這些個辦法都各有限制。

  Google管理職員具不舒服合使用於其它搜索引擎網站,有的站長由於某種端由做不成301轉向,CMS系統大多事情狀況下不受自個兒扼制,內裡鏈接自個兒可以扼制,但別人鏈接到自個兒網站上就不受扼制了,總之,固然有解決辦法備選,但網址規范化到到現在為止截止仍然個不小的問題。

  不久前Google,雅虎,微軟並肩宣布了一個新的標簽canonical tag,用於解決網址規范化問題。

  簡單說,就是在HTML文件的頭部加上這麼一段代碼:

  意義就是這個網頁的規范化網址應當是:

  /product.php?item=swedish-fish

  下邊這些個URL都可以加上這段代碼:

  /product.php?item=swedish-fish&category=gummy-candy

  /product.php?item=swedish-fish&trackingid=1234&sessionid=5678

  這些個URL的真正規范化網址就都變成:

  /product.php?item=swedish-fish

  簡單說,這個標簽相當是一個頁面內的301轉向。差別在於用戶並不被轉向,仍然稽留在未變網址上,而搜索引擎網站會把它當作是301轉向處置,也就是說把頁面鏈接的權重都集中到代碼三拇指明的規范化網址上。

  額外有幾個細節站長需求注意:

  這個標簽只是一種提議或暗中示意,而不是指令,它不像robots文件那樣子是個指令。所以搜索引擎網站會非常大程度上思索問題這個代碼,但並不是百分之百,還會思索問題其它事情狀況來判斷規范化網址。這也避免站長可能把網址弄錯。

  這段代碼既可以運用完全地址,也可以運用相對地址。一般仍然提議運用完全地址比較擔保。指定的規范化網址上的內部實質意義,與其它運用這段代碼的非規范化網址內部實質意義可以有一點不一樣,不盡然一致。譬如在電子商業上的事務網站上有眾多按價格、顏色,、尺寸上昇下降排序,生成的URL全部不同,但內部實質意義大體相同,只有纖小差別,就可以運用這個標簽。

  指定的規范化網址可以是不存在頁面,回返404,也可以是還沒有被收錄的頁面。不過不提議這樣做,別沒事找事。這個標簽適合使用於同一個域名內,涵蓋二級域名。但不舒服合使用於不一樣域名之間,避免有人要挾。別把這個標簽當救命草,首先仍然得把網站結構做好,盡力防止顯露出來URL規范化問題。這只是最終沒有辦法的辦法。

  敏銳的人民代表大會概能從這個新標准裡看見樹立數量多外部鏈接的機緣。最終提一句,這個標准被3大搜索引擎網站Google,雅虎,微軟同時支持,為何沒提百度呢?想的起來看見報導,從搜索量來看,百度是天底下第二大搜索引擎網站,為何不攜帶我們一塊兒玩?

  筆者: Zac@SEO每日一貼

  原載: 點石相互作用搜索引擎網站優化博客