Bing中心搜索開發部對搜索品質的見地

Bing中心搜索開發部對搜索品質的見地

題記:這是一篇來自Bing中心搜索開發部經理的一篇文章,本文講訴了Bing的一系列功能改進,這只是一篇平常的的搜索功能改進 紹介,但通課本文, 我們會發覺,搜索引擎網站會把數量多精神力放在研討許多人在搜索時犯的錯、怎麼樣准確了解用戶的意向、以及利用詞庫供給更精准的內部實質意義上頭。所以盧松松信任,不管是 bing、Google仍然百度,都會這樣做。

在Bing,我們許諾供給最好的搜索最後結果, 固然研討小組數值開鑿資深專家,在不斷供給我們的中心拼音書寫和名次算法,可事實是總有某些歷史上的留下來下的欠缺,這局部是由於許多人過於倚賴搜索所犯的不正確,在這 篇文章中,我的同事Bill Ramsey(Bing的開發部經理),將從三個方面紹介欠缺的發生率和嚴重性:網址查問、追蹤鏈接和有關搜索。

 網址查問常見的不正確

這 是搜索欠缺的主要出處之一,牽涉到到我們所謂網址查問,例如facebook.com或雅虎網站/信箱的查問,乍一看,你有可能會覺得這是一個簡單 的問題。畢竟搜索引擎網站(Bing)裡面含有數十億網址,找到一個般配的網站沒若乾困難程度。但在事實中,這品類型的查問實際相片比本人好看當復雜。由於我們全部人會用無數的 拼音書寫與變體。

例如,facebook.com就有上千個不一樣的變體,如facebookc.om,facbook.com,和 ww.faceboo.omc,除開這類拼音書寫不正確外,許多人並不老是曉得准確的URL。例如西南航空企業是southwest.com,但有點人打算搜 swair.com達到該企業的網頁。同時,我們一般看見的網址,如雅虎網站/信箱時,准確是URL是mail.yahoo.com的排列。

縱然我們找出了你真正的搜索意向,但惡意網址或垃圾郵件送出者提出了另一個挑戰。他們獵取最高級域名對象如coolmathgames.com(人其實是為coolmath-games.com)的URL。

這是我們的欠缺,我們主要經過三個領域來解決這類不正確的查問辦法

第1, 准確辨別URL,我們可以就遮攔,經過確認的網址,我們防止如涵蓋像searscardcom.com垃圾最後結果的問題。

第二, 施行摹擬用戶不正確測試,通清點數目十億的原板型,我們能夠解決常見的拼音書寫不正確的網址。

第三, 我們會剖析,尋覓像swair.com網站,運用戶最後將終了預先規定網站southwest.com。

 

另 一個例子,適合使用於機器學習標准樣式,像facebooklogin.com 的查問相當於 facebooklogin.net,這是很常見的域名後綴輸入不正確。這個之外,像bed bath and beyond.com 輸入成 bedbathandbeyond.com。我們的板型已經適合了這些個變動,會主動把搜索最後結果改正,下邊的例子是facebook的用戶:

 

刪去駢枝追蹤的有關鏈接

搜 引得擎的關鍵功能之一,是查問執行拼音書寫和查問擴展的組件,拼音書寫會匡正數百個不正確的查問,而搜索顯露出來的詞和詞組(下邊的查問框,表明我們變更了用戶的查問),我 們把這種改建作為追索。例如,假如你輸入關於成功英雄的較重要的事,我們將顯露涵蓋引號的成功的英雄較重要的事,但我們有可能只顯露關於成功的英雄和事 跡,我們會架設所相關於你的意向。

 

在以往,我們用近義詞作為我們追蹤鏈接的一小批,但會常常造成搜索最後結果離開正道正題,造成近義詞追蹤變成駢枝的功能, 全部我們在不斷擴張詞和詞組的定義,幫忙其用戶更好的施行般配。

 

所以這項功能我們已經刪去,這個附帶加上的價值半大,當Bing變更一點近義詞的話,追蹤鏈接有可能沒可能添加更多的有價值的信息,所以我們將搜索最後結果的顏色改為黑色。我們將接著盡力盡量為用戶指定的搜索詞和詞組供給更好的查問。

 改進有關搜索

有關搜索,這個大家很知道得清楚,在許多人起初搜索時,我們會把有關的搜索避免搜索最後結果左側,如今調試到右側,例如搜索布拉德·皮特:

 

  (注:Bing中國版還沒有變,百度和Google在底部。)

  有時候我們會查問搜索最後結果的題外話。例如AMD會給用戶供給意料不及的搜索最後結果,經過改善我們的有關板型。

 

同時,我們也獲得了別處改進,逾越相關有關搜索中的款式條款,即KSN WeatherLab 中的 KSN Weather Lab,(注:一點實驗性項目,處於測試階段),並防止在安全搜索中檢索到成人內部實質意義。

論斷:

搜索引擎網站的有些在於它會始末倚賴於人,而許多人總會有不一樣欠缺的,我們做的是減低欠缺率和搜索率,期望許多人可以做更少的搜索並做更多的事。

筆者:Dr. William Ramsey—— bing中心搜索開發偏旁席研發經理

文章出處:盧松松博客 本文地址: