相關搜索的兩種實現方式

相關搜索,想必大傢都不會陌生,尤其是對SEO、PM乃至各位文案編輯妹子來說,從中皆可以看到蠻多的有價值的訊息。

隻是,你知道給定的用戶查詢,搜索引擎是怎麼計算出相關搜索的嗎?

一般來說,有兩種方法:

1、基於查詢會話的方法

大傢都知道,搜索引擎會統計分析用戶的搜索行為,將此轉化為查詢會話。然後通過各種數據挖掘算法來對查詢會話進行統計處理,如果一個查詢詞a和查詢詞b經常一起出現,那麼自然,我們可以認為兩者是相互關聯且值得推薦的。

當然,這樣做也會有兩個很明顯的問題暴漏瞭出來,用戶的一次連續的查詢可能不是針對的同一個主題,這樣,在對用戶的兩次查詢進行拆分時,很難精準的進行切割。同時,該方法是以單個用戶的查詢會話作為基礎來統計的,所以在對數據進行挖掘時不能體現不同用戶查詢之間的關聯。

2、基於點擊圖的方法

當然,在用戶的搜索日志中,除瞭簡單的查詢之外,還有對站點的點擊數據。如果能將此利用起來,也不失為一種很好的查詢相關搜索的方法。

一個簡單的邏輯為:

用戶查詢瞭關鍵詞p,然後點擊瞭網址D1和D2分別6次和8次,那麼此時我們就可以針對p建立起一個向量[0,6,8,0],針對另一個查詢詞q同樣可以建立起對應的向量。

OK,這就再次回到瞭根據空間向量計算相似度的模型中。既定相似度大於某個值,則這兩種搜索即為相關。

當然,如果需要做的嚴謹一些,就需要將被點擊的內容之間的相似度計算考慮在內。因為不同的鏈接地址對應相同或相似內容的現象在搜索引擎中屢見不鮮。

額,細心的盆友們也發現瞭,這個計算量,還是蠻驚人的

除標註外,《SEO科學之美》中的文章均系Rude原創;

轉載請註明鏈接地址/search-engine/related-search.html。

延伸閱讀:

  • 從內容到文章網狀模型 談如今的SEO思路?
  • 百度取消外鏈 SEO優化方向標
  • 便宜又大碗 利用百度商貿 引導優質流量