百度漢字分詞技術的一點兒小料想

  大家都曉得,百度的漢字分詞技術比GOOGLE做的好,以下援用網絡上找到的一張圖片解釋明白:


  從上圖可以推斷出,百度碰到一個關鍵字,應當是先不施行分詞,而是先檢索百度各種學科的詞目和百度指數有指數的漢字詞施行般配,沒有辦法非常准確般配的話,再施行分詞,前兩年在百度搜索關鍵字利川新聞網時,被分為利川/新聞/網,自打這個關鍵字有指數往後,百度會把它看做一個完整的網站關鍵詞。

  當然,百度的分詞技術肯定比我私人推斷出來的要復雜的多,作為百度旗下的產品,百度不會讓步自個兒的資源,肯定會參照百度各種學科的詞目作為分詞算法的一小批,所以一樣做搜索的騰訊搜搜也研發了自個兒的各種學科,不過我們往後在做SEO的時刻,碰到比較偏的長尾網站關鍵詞不可以被准確分詞的事情狀況下,可以在百度各種學科開創一個詞目,而後在參照資料裡加上自個兒的鏈接,這麼還可以解決百度有關產品權重比我們的網站高的問題。

  本文由利川在線原創,HKSEO平臺首發,過載請seo注明來源,本文出處網址: