百度索引量和收錄下降原因解決方案

  百度索引量是每個站長都很關註的數據,索引量的多少以為這參與百度網頁排名數據量的多少。今天早上在百度站長平臺查看瞭一下索引數據,令我大吃一驚,索引量在一夜之間減少瞭588,由之前的1187變成瞭599。當然,在這個過程中,我在數據統計後臺看到的百度來路流量並沒有減少的跡象。按照百度官方的說法,這種情況站長不用太在意。

  

  在向下探討之前,先來看幾個基礎知識。

  百度索引量是什麼?百度的索引量是百度蜘蛛抓取網站的頁面數;

  百度索引量和收錄量的區別?百度索引是百度蜘蛛抓取網頁內容建立的搜索候選頁面,這些候選頁面是未來增加網站收錄和更新網站頁面快照必須要有的。百度索引量在百度站長平臺後臺查詢,收錄量直接使用site:(域名)

  為什麼索引量會大幅度下滑,這個問題朱海濤並不專業。看過站長社區版主老呂的一篇文章,分析的相當詳細。對比瞭下,唯一的可能性就是robots.txt文件。前幾天我在robots.txt文件總增加瞭一句”Disallow: /*?*”,禁止收錄一切包含問號的鏈接,來屏蔽動態鏈接。

  除此之外,空間服務商還在.htaccess文件中增加一句代碼 “deny from 220.181.158.218”.空間上設置這句代碼是防止網站惡意流量的。我查詢瞭下,這個ip地址對應有可能是百度蜘蛛,不知道空間商在幫助我屏蔽惡意訪問流量的時候是否有考慮到這方面的因素。

  不管怎樣,保險起見,還是需要去站長反饋中心去反饋下問題。站長反饋的時候註意描述清楚,並且截圖說明問題。百度站長平臺申訴反饋地址: /feedback

  

  下面是百度站長平臺社區版主老呂的文章,詳細說明瞭索引量為什麼會下降的原因,並且給出瞭解決方法,值得每個站長認真的閱讀一遍。

  索引量是流量的基礎,索引量數據的每一個變動都撥動著站長敏感的神經,索引量下降之後該如何著手分析一直是各位討論的熱門話題。這次站長社區版主老呂又拔刀相助瞭,看看史上最全的百度索引量下降原因分析及解決方案吧

  一、百度索引下降分析簡圖

  

  二、導致百度索引量下降的常見原因網站方原因

  1、內容數據所在的網址url未規范統一

  【自己站點url規范統一】

  多域名都可以200狀態正常訪問網頁內容;一域名下出現多種url形式可以訪問相同內容,如大小寫url、url規則變更等。

  解決:選擇主域名(或主url),其他域名下的所有url都301重定向到主域名(或主url),並站長工具提交域名改版(或目錄url改版)

  【外部平臺使用己站數據】

  A、市場合作,站點數據調用到其他平臺上;內容主動外發,推廣人員完整轉發自有內容到高質量平臺這兩個原因都有可能導致搜索引擎收錄瞭外部平臺的內容而拒絕瞭原網站內容

  解決:使用站長平臺鏈接提交工具的主動推送功能,及時提交網站新出現的鏈接,延遲將內容調用到其他平臺的時間;

  B、被鏡像,用戶通過其他舉辦主體的域名或url直接可訪問己方內容。

  解決:關註域名解析安全和服務器安全;綁定唯一可解析的域名或唯一可訪問的url;頁面內容中鏈接使用絕對地址

  2、站點受青睞度下降

  【網頁內容相關】

  A、內容質量度下降

  解決:提高內容質量度,詳見百度站長學院相關內容;杜絕簡單拷貝,多做整合信息。

  B、更新量及頻率下降

  解決:穩定的更新頻率,視內容發展情況,擴充編輯團隊,生產更多新內容,讓網站索引避免下降,持續增加。(當更新量及頻率下降明顯,那麼配額就會下降,首先表現抓取頻次下降,導致索引量下降)

  C、時效性信息消失

  解決:時效性的信息,大部分一般在數據庫不會長期保留,所以需要持續挖掘新的時效信息點,整合相關內容。

  D、部分區域出現不良信息

  解決:杜絕大量外鏈軟文、惡劣彈窗廣告、非法敏感類信息、專門針對搜索引擎作弊的內容等

  【觸犯懲罰算法】

  解決:關註站長工具消息和百度網頁搜索動態。按官方公告說明來整改站點,並進行反饋,然後等待算法更新。

  【特型url不被信任】

  解決:定制各類url的索引查詢規則;定位索引量下降的特型url;排查該類url當日、前一日、本周、歷史索引情況;找出未被入庫的數據可能存在的問題;處理完後,增強該類url與百度數據溝通(途徑有sitemap、批量提交url、數據推送等)。

  【站點被搜索引擎信任度下降】

  A、非法投票嫌疑(鏈接工廠等)

  解決:珍惜自己頁面的投票權,對於劣質網頁堅決不投票,盡量減少站點的導出鏈接。

  B、主題變動(如從教育領域跨入醫療領域)

  解決:將舊領域的網頁進行死鏈處理後向百度進行提交,封禁相關舊url的被訪問權,然後再上線新主題相關內容,加強對百度的數據提交

  C、受牽連

  相同ip下非法站點偏多,同一域名所有人舉辦的網站大都被懲罰且情況惡劣等

  解決:離開惡鄰,獲取搜索引擎的各產品的相關反饋方式,請求給予解禁,等待恢復正常索引。

  D、政策性原因

  如香港主機、國外主機站點由於各種你懂的原因,穩定性可能較差

  解決:國內主機備案,合法符合政策經營

  3、網頁模板相關

  【主體內容區域對蜘蛛的限制】

  解決:取消登陸查看信息等限制,讓蜘蛛便捷暢快的采集到己站數據

  【啟用瞭對蜘蛛不友好的技術】

  解決:對需要蜘蛛識別的內容,不要啟用對蜘蛛不友好的技術來調用。

  【響應式模板幹擾蜘蛛識別頁面類型(pc、移動)】

  解決:提交特定的url對應關系(盡量parrten級);meta標記移動版本url及適合瀏覽的設備;自主適配;增強pc、移動不同模板源碼標簽的區分度,幫助百度識別頁面類型

  4、源碼相關

  【源碼錯誤較嚴重,如編碼錯誤、標簽使用錯誤等;源碼改動嚴重,蜘蛛采集數據後重新觀察分析;某類url下的TD(網頁title、description)變化,如變化比例大、變化頁面量大,頁面進行更改後會重走建索引庫流程,如果頁面質量達不到建索引庫標準會從線上消失】

  解決:校驗源碼,準確的源碼是蜘蛛采集數據進行分析的基礎;link內鏈結構、url地址形式、頁面主題、頁面各區域html標記等盡量維持改動前的情況;逐步、分期更換TD(網頁title、description),結合頁面主題、用戶實際需求來制定合理的TD,不欺騙不誤導用戶。

  5、已入庫的url對蜘蛛狀態有變化

  【robots聲明,禁止蜘蛛抓取】

  解決:查看百度站長工具robots及抓取情況。

  【url規則變化,原有url無法訪問】

  解決:特別是linux和win服務器之間的數據遷移,可能會出現大小寫url支持變化,確保各類url規則不變化。url必須重構的時候,做好舊新url301重定向,站長工具提交改版需求。

  【提示錯誤頁面】

  解決:由於誤刪,則可以數據恢復,並維持url對應網頁內容的更新變化,提高抓取頻次。如果確定要刪除,那麼提交死鏈,刪除死鏈後,再robots禁止,這種情況的索引下降無需擔憂。

  【被入侵】

  解決:防止url對蜘蛛進行非法跳轉操作;防止url對應的網頁內容對蜘蛛出現內容大變化,特別是一些違法亂紀的內容

  6、DNS、服務器問題

  【DNS問題】

  dns不穩定;dns不安全

  解決:選擇可靠的dns服務;溝通強調對蜘蛛的穩定性;防止dns解析到非正常ip;防止解析的網站ip頻繁變動。防止dns管理漏洞,導致被惡意解析;防止dns解析掛靠在小代理等技術能力、管理規范、道德法律約束都欠缺的平臺上。

  【服務器問題】

  A、可訪問性差

  解決:盡量讓目標地區所有運營商來路的用戶都能在3秒內打開網站,最佳1秒內;監控網站運行狀態,合理設置目標地區的所有運營商監控節點及監控項目、監控頻率

  B、屏蔽百度ua或ip

  解決:多利用百度站長工具,查看百度抓取網頁的情況,可見

  /thread-15392-1-3.html

  C、防刷壓力值設定

  解決:將蜘蛛解析到專用空間;如出現訪問陡增的ip,查看是否為蜘蛛再確定是否禁止訪問。

  三、導致百度索引量下降的常見原因百度方原因

  1、配額再分配

  同類數據量接近索引分配總額,配額量再分配,有升的就會有降的

  解決:超過競品,爭取高額分配。

  2、數據異常錯誤

  A、錯誤懲罰

  應對某類作惡行為而新算法上線,但由於蝴蝶效應,導致部分站點被錯誤懲罰而清除大量索引。

  解決:反饋百度方,請求解除懲罰。

  B、地區性數據異常

  部分地區數據抓取或查詢異常,導致誤判站點情況而清除相應索引數據或輸出錯誤索引量,如百度dns系統升級事件。

  解決:反饋百度方,由百度檢查各地蜘蛛執行情況。

  C、接口調用數據錯誤、數據丟失、數據備份衍生異常

  解決:反饋百度方,由百度檢查相關數據情況。

  說瞭這麼多,有的站長遇到百度索引量下降情況可能還是仍然不知道怎麼辦。最基礎的做法是去百度站長平臺查看下robots.txt的設置,然後分別抓取網站每個分類目錄和二級域名的網頁,查看是否抓取正常和驗證robots.txt文件是否設置有誤。如果都沒有問題,再檢查下友情鏈接和外鏈數據。當然如果網站轉載文章和抄襲文章過多或者原創質量過低,這樣收錄量和索引量下降是遲早的事瞭。此外,網站索引量下降未必是壞事,如果我們的網站存在大量重復網頁,動態網頁,和無效網頁,這些網頁都被百度索引帶來的是副作用。設置robots.txt文件(利用robots文件做seo優化,讓蜘蛛更好的抓取網站)必然會導致索引量的下降,這種情況下,索引量下降對我們網站是由好處的。

  來源:朱海濤自媒體(微信/QQ號:81433982),原創文章如轉載,請註明本文鏈接: /6174