對百度《談談原創項目那點事》的一點看法

  在五月十六號百度推出石榴算法的公告同時,百度站長學校也宣布了一篇《談談原創項目那點事》的文章,主要是談到達百度打壓網站搜集內部實質意義泛濫的誓願,堅決保持激勵原創內部實質意義,原創筆者,為原創供給合理的排序和流量。百度信誓旦旦地要堅決保持走辨別原創之路,甚至於捨得創建項目組消除耗戰。對此,本人當然是舉雙手雙腳贊同的,只是這條原創辨別之路走起來並不由得易,甚至於可能衍娩出越來越多的歧路。本人在此提出幾個疑點,就原創項目所面對的問題提出一點看法。

  首先,請分辨清楚楚有賴百度保存生命的網站和不聽從靠百度保存生命的網站。就是說有一點網站的流量並不是經過百度網站關鍵詞搜索進來的,它們並不放在心上seo和sem為什麼物。它們有一小批是最原始的建站思考的線索,為了用戶體驗認識和用戶需求而去建站,用戶進入了網站感到好的就經過口碑相傳來不斷擴張用戶群;也有一小批網站是經過其它非搜索渠道為用戶獲悉,形成一個印象意識,時間久了就為越來越多用戶運用,這種形式如瀏覽器植入,軟件植入,導航網站展覽等;還有局部網站是經過線下推廣為用戶所清楚知道,如早期的校內網,如今的團購網站等。所以,實際上仍然有不少網站是不必有賴百度保存生命的,這些個網站是否原創內部實質意義百度根本管不著。看下淘寶網索性直接就用robots.txt屏蔽掉百度的收錄,卻依舊是全世界alexa名次前20的網站。所以只能說百度的原創項目是針對在百度整體體系下保存生命的網站。

  其次,在百度整體體系下保存生命的高權重網站存在數量多的互相搜集互相過載,百度怎麼樣打壓?在谷歌就有過大網站被狠毒打擊的事情狀況,之前也有過一點中國大網站作弊,而後被谷歌減低pr的事情狀況顯露出來。不過百度對大網站就放縱得多,之前一個網站在綠蘿算法上線後依舊是購買了數百友鏈的,仔細查看了幾個月這個網站居然一點兒降權的跡象都沒。也不曉得是百度算法的問題,仍然百度根本就對大網站不得已。試提問下如今國內的大資訊門戶網站有若乾新聞內部實質意義是不一的呢?百度會對這些個網站施行降權處置麼?

  其三,百度到現在為止的原創辨別源流算法對原創文章的辨別到盡頭有多非常准確?看看源流算法的原話:首先,經過內部實質意義相仿程度來聚合搜集和原創,將相仿網頁聚拼湊作為原創辨別的候選聚齊;其次,對原創候選聚齊,經過筆者、宣布時間、鏈接指向、用戶述評、筆者和站點的歷史原創事情狀況、轉發軌跡等上百種因向來辨別判斷出原創網頁;最終,經過價值剖析系統判斷該原創內部實質意義的貴重低繼續往前合適的引導最後排序。這處提出的疑問是,如果說一篇原創文章先顯露出來在一個低權重網站,百度又遲遲未收錄這篇文章,這會兒一個高權重網站把這篇原創文章搜集走了。百度怎麼判斷?源流算法會起效用麼?所以本人感到百度應當增長源流算法對原創文章抓取機率,否則你一篇原創文章由於新站權重低難於被收錄,在這以後許久纔收錄卻被百度確定地認為為非原創了,那豈不抱怨?

  第四,百度的原創辨別對於非內部實質意義頁是怎麼處置呢?如今有眾多網站除開內部實質意義頁外還有眾多內部實質意義列表頁,題目展覽頁,產品頁,商鋪頁等,對於這些個頁面百度是怎麼處置?像一點分類信息網站或b2b網站的內部實質意義列表頁可謂是千變萬化,但也不擯除列表內部實質意義中存在數量多搜集,它們的手續只消調試一下子面所開列表內部實質意義宣布的順著次序就可以制作出眾多不一樣的列表頁,百度又怎麼樣辨別呢?

seo

  最終,仍然很支持百度開展原創項目標,只是期望這個項目能夠更加顧忌到中小站長的好處,畢竟這些個整體纔是更加依存百度整體體系生長的。