從關鍵詞分析看百度算法

我們都知道關鍵詞分析在算法中起著承上啟下的作用。百度在還沒調整算法之前所用的關鍵詞分析是最大匹配法:正向匹配法,逆向匹配法和雙向匹配法。比如輸入小學生作文(用GG):他分割為:小學生/作文(看快照)。百度框計算沒出來,算法沒調整之前。分割與GG一樣。自從百度發佈瞭框計算,他的算法也做瞭很大的調整。包括關鍵字分析,超鏈接分析,域名,收錄等。首先他對關鍵字分析做瞭很大的改變。我們都知道百度技術大會中所說的框計算就是:用戶輸入內容-》百度框判斷內容是屬於算數,購物,股票,外匯還是我們常規的關鍵詞。當我們在百度輸入1+1.5的時候百度會直接給出答案。當我們輸入股票代碼的時候百度會直接給出股票走勢圖。這一切的一切都是百度所說的提高用戶體驗。其實說白點就是:百度的關鍵詞分析的算法變瞭,變成瞭:基於理解的分詞方法那什麼叫基於理解的分詞方法呢?

其基本思想在分詞時候同時進行句法,語義分析。模擬人對句子的理解過程。由於漢語語言知識龐大與復雜。這種分詞法實現起來是非常的困難。以百度現在的狀況隻能說明這種系統處在試驗階段。因為隻有這種分詞算法才能達到用戶最想要的結果真正的提高用戶體驗。但百度用這種方法提高瞭用戶體驗嗎?

隻能說提高一部分,但忽略瞭根本。一部分就是剛才所說的。輸入算數自己給出答案等等。忽略瞭根本在那呢?就是之前的關鍵詞匹配法。現在百度弄不清方向瞭,當我們搜索平常關鍵詞(不包括算數,股票,購物等關鍵詞)的時候如:小學生作文為例。第一頁排名的都是老站。而且老站的主站一個,子目錄一個。有時候還有一些博客的文章。10個位置,重復瞭3個站。新站呢?基本在第二頁。這說明瞭什麼?說明瞭百度管你三七二十一老站排前,新站第二頁去。(老站排前面的原因是什麼呢?不知道大傢有沒有想過。)當我們輸入:小學生作文大全的時候,百度給出的結果都是網絡購物關於小學生作文大全書籍的信息。試問一下:有多少人輸入小學生作文大全為瞭就是買書?這恰恰又降低瞭用戶體驗。

說道用戶體驗不得不說下SOSO。騰訊搜搜一直都是很低調的。在百度提高用戶體驗的這些算法。Soso去年就實現並用於實踐中,那時SOSO還是用GG的搜索接口。體驗度比百度還好。現在SOSO獨立瞭。不用GG的接口。它在搜索平常關鍵詞時候就做到瞭重復性這個問題。10位置。給瞭主站位置基本很少給子目錄一個位置。相比之下SOSO用戶體驗比百度強一點。

百度這算法能否再改變呢?能否改變為之前的算法。還是繼續他所謂試驗中的用戶體驗呢?我們拭目以待。

AD一下(本人剛入門,做瞭一個福州SEO,。雖然曾經在百度第一頁呆過,GG第四名呆過。不過對於優化還是稀裡糊塗的。現在認為:SEO優化不好,是因為SE理解不夠。QQ:273585416 希望和大傢一起探討,一起努力學習。