搜索引擎網站會不會抓取帶#號(哈希值)的URL

  在我的網站各個地址中,難以避免顯露出來一點帶#的URL,普通是經過點擊某個鏈接,跳轉到網頁的某個位置,成功實現信息內部實質意義的迅速定位。本站運用的文章內目次是這樣的做的。不過,這種帶#的URL搜索引擎網站會被收錄嗎?

  1、啥子是哈希值?

  在阮一峰的博客中有一篇文章可以美好的詮釋哈希值,#值不是http煩請,而是一個瀏覽器動作。經過#,可以迅速定位到網頁中的某個具體位置。例如#comment-121,便會迅速定位到id=comment-121或這個位置。

  2、搜索引擎網站會不會抓取帶#號(哈希值)的URL

  解答是普通不會。搜索引擎網站抓取頁男寵先要遵循http協議,可是#不是協議內的內部實質意義。而其實也是這麼,我們不擁有見過搜索引擎網站的搜索最後結果中,哪一條記錄可以迅速定位到網頁內的某個位置的。因為這個,期望經過在網站裡外添加帶#的錨鏈接來讓搜索引擎網站首次過訪時迅速定位是不事實的。當然,搜索引擎網站蛛蛛為了摹擬真實用戶,在進入了網站在這以後,融會貫通過一點技術成功實現摹擬鼠標點擊的效果,這個時刻,頁面的錨鏈接仍然起效用,但不論什麼鏈接在搜索最後結果中時,都不會帶#。

  3、URL 中的 #! 有啥子效用?

  這是一個違背2中的特殊的事例,谷歌會抓取帶有#!的URL。Google規定,假如你期望Ajax生成的內部實質意義被瀏覽引擎讀取,那末URL中可以運用#!(這種URL在普通頁面普通不會萌生定位效果),Google會半自動將其後面的內部實質意義轉成查問字符串_escaped_fragment_的值。例如/#!/username等效於/?_escaped_fragment_=/username,而帶?的URL是會被抓取的,所以#!的URL會被谷歌收錄。

  4、搜索引擎網站會不會抓取帶#號(哈希值)的URL給我們的啟發

  一、不要打算用robots.txt屏蔽#的網址。我之前翻過一個不正確,即在嗖錄網的robots.txt中參加了disallow:/*#*規則,以打算屏蔽這些個帶#的URL被抓取。但其實,這個作法是不正確的,首先#在robots.txt是注解符號,它後面的內部實質意義會被注解掉,所以這條規則成為了disallow:/*,即阻擋收錄本站全部頁面,幸虧我在今早發覺,並馬向上行了改正。其次,搜索引擎網站不會抓取帶#的URL,因為這個沒有不可缺少加一條這麼的規則。

  二、可以利用#和ajax接合來掩飾沒想到被抓取的內部實質意義。在我們的一點網頁中,有可能有點內部實質意義是我們沒想到直接奉告搜索引擎網站的,還是一點隱私不期望被抓取,因為這個我們可以認為合適而使用#來扼制這些個信息的顯露。例如我們增加一個按鍵,當URL中帶#show-info-123時,顯露123的私人信息,而不帶時不顯露。而對於搜索引擎網站來說,會半自動疏忽帶#的URL,因為這個123的私人信息不會被抓取。

  文章來自:嗖錄網;原文地址:/search-engine-dont-catch-hash-url/ 熱烈歡迎大家來嗖錄網交流SEO經驗與技術。