分詞切詞研究(實例篇)

這篇文章論策討論的是中文分詞技術,對seo具有指導意義。可以通過中文分詞的研究獲得百度的長尾流量。

1、百度分詞是根據內容中,第一次出現關鍵詞相關詞為標準來分的。例如正浩生物科技有限公司這個詞

如果你的正文中第一個出現的是正浩這個詞,那麼你的頁面上的關鍵詞就會被拆分成正浩和生物科技有限公司兩個詞,標題中一定要包含關鍵詞,但不一定要完全匹配,但內容中出現的關鍵詞是要跟百度分詞完全匹配的,在完全匹配中又會根據文件URL路徑的深度來進行排序,在關鍵詞都完全匹配的情況下,比如說目錄比文件有優先權,根目錄下的文件要比二級目錄下的文件有優先權,完全匹配的會排在前面,然後再是部分匹配的。

2、在關鍵詞沒有完全匹配的情況下,如果有分詞,比如說:SEO資料庫這個關鍵詞,有一個網頁裡第一次出現的關鍵詞是SEO,並且有較高的關鍵詞密度,但是這個網頁中卻沒有資料庫這個關鍵詞,而另一個網頁裡第一次出現的關鍵詞是資料庫,那麼這個網頁的關鍵詞就會被拆分成 SEO 資料庫 兩個詞,雖然第二個網頁裡包含有SEO 資料庫 但是第一個網頁還是會排在第二個網頁的前面,這說明關鍵詞的前面部分是最重要的。

3、關鍵詞第一部分出現的頻率是排名的關鍵,比如說 SEO 資料庫,如果兩個網頁都沒有完全匹配,都是含有兩個分詞,那麼SEO這個分詞密度高的網頁將會排在前面。

4、如果完全匹配,但是關鍵詞第一出現是在頁面內容的最後面部分,那麼這個網頁的排名將比前面這些頁面還要低。所以關鍵詞盡早在內容中出現是非常重要的。

5、百度根據第一次出現的相關關鍵詞切詞,如果第一次出現的相關關鍵詞是關鍵詞的尾部,那麼就從後面開始切,如果是前面部分就從前面開始切,也就是根據網頁內容的順序和反序進行分詞,順序的時候就是以關鍵詞前半部分為起點,反序的時候就是以關鍵詞的後半部分為起點。例如:正浩生物科技有限公司 這個關鍵詞,如果你的網頁中第一次出現的關鍵詞是正浩生物,那麼你這個頁面的關鍵詞會被拆分成正浩生物和科技有限公司兩個詞。

6、可以根據百度的切詞原理,自己來選擇比較好作的關鍵詞頭部(也就是調整你網頁內容中第一次出現的關鍵詞)。也就是進行人為切詞,百度會進行從前往後判斷,也會從後往前面切。

7、如果在關鍵詞沒有完全匹配的情況下,並且關鍵詞出現得不完整,比如說:正浩生物科技有限公司,網頁的內容包含的關鍵詞中如果沒有正浩這個詞,那麼切詞就會從生物開始,但是這樣的網頁都會排在比較靠後瞭,因為你關鍵詞的前部分都沒有包含。

8、缺詞的情況下下,如果與不缺詞的網頁進行比較的話,那還是根據切詞前部分的密度進行排序,也就是說按照切詞的順序,如果切出來的詞,前部分的密度比後部分的密度比例是關鍵,例如一個網頁中,前部分與後部分關鍵詞的比例是1:2,另外一個網頁的比例是1:4,那麼當然前面的那個網頁排名要靠前。同樣在缺詞的情況下,切出來前詞短的排名有優勢。

希望以上這些能幫助大傢瞭解百度的關鍵字排名規則。

本文由 站長論策首發 轉載請留鏈接,謝謝!