內部資料:抄襲重復內容對網站排名的影響

重復內容一直是網站管理員們熱議的話題之一,我們覺得很有必要對在各種會議上和網站管理員支持論壇中我們被問及的常見問題作以下統一解答。

在做深入探討之前,我想先簡要談談網站管理員們經常擔憂的一個問題:在大多數情況下,網站管理員往往對擅自抄襲和傳播自己內容的第三方無能為力。我們知道這並不能歸咎於網站管理員們,這也就意味著同一內容出現在許多不同網站其本身並不理所當然地被認為是違反瞭網站管理員指南。這僅僅導致瞭Google必須增加一個額外步驟,即鑒別內容的原創來源,而這正是Google所擅長的,在大多數情況下原創內容源都能被正確地識別出來,從而不會給發佈真正原創內容的網站帶來任何負面影響。

一般而言,我們把網站內容雷同問題主要分為兩種情況:

站內內容重復,比如同一內容(經常是無意識地)在您的網站內重復出現。

站間內容重復,比如您網站的內容(同樣,經常也是無意識地)在其他網站重復出現。對於第一種情況,您可以親自動手解決Google對您網站上的重復內容進行索引的問題。您可以閱讀 Adam Lasnik 發表的Deftly dealing with duplicate content以及Vanessa Fox 發表的Duplicate content summit at SMX Advanced。這兩篇文章都提供瞭一些很好的建議,幫助您解決站內內容重復的問題。這裡還有一個特別的建議幫助您避免站內內容被重復索引:您可以將您希望被抓取的URL序列包含在您的站點地圖文件中。遇到包含同一內容的不同網頁時,這麼做有助於我們準確收錄您真正想提供給用戶的那部分內容。其他有關於站內內容重復的信息您可以參閱討論此主題的有關幫助中心文章。

第二種情形可能是有人剽竊瞭您網站中的內容,並將其展示在其他網站上牟利。同時,網絡代理服務器也經常抓取通過代理方式訪問的網站的部分內容。當在不同網站遇到相同內容的時候,我們會基於許多不同的依據來判斷究竟哪個網站才是原創,而這樣的判斷通常是準確的。這也意味著,當您發現有人剽竊瞭您的內容時,您大可不必過分擔心它對您的網站在谷歌搜索排名上的負面影響。

如果您將自己網站的內容與他人分享, 但同時還希望自己的網站被識別為原創來源的話,您需要請合作夥伴在其網站內容上添加指向您原創內容的鏈接。您也可以在Vanessa Fox最近發表的文章Ranking as the original source for content you syndicate找到其他有關處理這一問題的建議。

有些網站管理員會有這樣的疑問: 什麼原因會導致有時候抄襲內容反而比原創內容的排名還要高呢?這應該是個特例,但如果您真的遇到這種情況,請您務必做到:

檢查一下您的內容是否能被我們抓取。您可能無意間在 robots.txt文件中阻止瞭部分內容被正常訪問。

您可以檢查一下Sitemap文件,看看您自己是否改動過那些被抄襲的特定內容。

檢查您的網站是否符合網站管理員指南。最後我想指出的是,在絕大多數情況下,含有雷同重復內容並不會對您的網站在谷歌搜索上的排名有負面影響。這些內容可能已經被過濾出去瞭。如果您參照上述提到的一些建議,您會瞭解到怎樣才能更精確地控制搜索引擎抓取的內容以及出現在索引中的內容版本。隻有被確認為蓄意或惡意抄襲時,雷同重復內容才有可能會被視為違反瞭網站管理員指南。