縹渺蝶舞:關於網頁信噪比和有關度計算

  研討SEO這樣長時間,突然發覺自個兒老是稽留在SEO的門跟前來回走不前,今日起著手研討一點seo更深的物品,呵呵。

  普通我們查有關網站關鍵詞有可能融會貫通過兩個形式,一個是檢查百度有關搜索,額外一個是通看一遍測,看看兩個辭匯之間是否具備有關度,其實後面一種方法是相當不科學和不正確的。

  還想的起來小達哥做163信箱這個詞的時刻,在百度搜索163信箱顯露出來丘仕達這個網站關鍵詞嗎?當初眾多人著手研討有關網站關鍵詞,前段時間我也做過大致相似實驗,搜索SEO顯露出來縹渺蝶舞。那末這到底是怎麼樣顯露出來的呢?

  舉個例子,我們如今有兩個網頁

  A網頁的內部實質意義是手機描寫,顯露出來無上頻率的網站關鍵詞是:手機,藍牙,彩屏

  B網頁的內部實質意義是手機服務,顯露出來無上頻率的網站關鍵詞是:中國移動,彩鈴,短信

  假如我們僅只依照目測的話,我們會得出以下的最後結果

  A網頁和B網頁是不有關的

  搜索A的詞不會顯露出來B,而搜索B的詞,不會顯露出來A

  這是表面化有不正確的,我們在檢查網頁辭匯的有關度的時刻,假如僅只看見的是網頁外表的辭匯,我們沒有辦法把握眾多有關長尾辭匯,我們要看見的是這個詞後面隱含更深的意義。

  我們在搜索手機這個網站關鍵詞的時刻,搜索引擎網站回返的數值往往可能會是以下這麼

  {彩屏*彩屏在文章中的權重,藍牙*藍牙在文章中的權重,彩鈴*彩鈴在文章中的權重,}

  依照這麼的算法,我們就可以將一篇文章中的網站關鍵詞拓展現多個有關辭匯,也可以將其它有關辭匯所對應的矢量拓展更多的辭匯。

  這麼我們就需求計算一個有關辭匯的矩陣M。

  如果如今有a詞和b詞

  那末M(a,b) = {網站關鍵詞a,b的有關度}

  這麼以來,兩篇文章的有關度的計算公式就成為了R= Sigma Vi*M(a,b)*Vj

  那末有關度到盡頭怎麼樣計算呢?

  舉個例子,手機和藍牙,我們用以下形式計算

  一個文章聚齊 {W},總文章數量為N,那裡面包括單詞A的文章總額為N1,包括單詞B的文章總額是N2,包括{A+B}的文章總額是 N12,那末有關性這樣計算

  CorrAB= N12/(N1+N2-N12)-(N1*N2)/(N*N)

  注意,這處計算的最後結果可能會成為負值,假如A和B都是少量的

  CorrAB= N12/(N1+N2-N12)

  這麼就可以算出兩篇文章中的有關度了

  如今讓百度來奉告我們手機和藍牙之間到盡頭會被百度覺得有多顯得年輕關度

  搜索手機:百度一下子,找到有關網頁約100,000,000篇

  搜索藍牙:百度一下子,找到有關網頁約28,000,000篇

  搜索手機+藍牙:百度一下子,找到有關網頁約22,400,000篇

  Corr{手機,藍牙}=22,400,000/(100,000,000+28,000,000-22,400,000)=0.21 也就是21百分之百

  利用這個方法計算網頁信噪比,是權衡一個網頁網站關鍵詞的最正確的,當然也是最中心的算法。呵呵,看清楚了嗎?沒有的話多看幾次,這些個都是一個seoer所務必領有的哦~