尋求更好的搜索最後結果

Mole定律描寫了集成電路半導體數年即可翻倍的事情的真實情況。與什麼的似,世界范圍的WWW正以到現在為止每9個月增加一倍的速度飛速進展,並還將以指數速度接著增加。值當暗自高興的是,Mole定律及其未起名稱的推論還能接著以連續不斷提高的速度和開銷來對付不斷增加的網絡負載。而另一方面,在從Web或數值庫房中找到你所需求的內部實質意義卻並非突飛猛進,固然檢索到有關最後結果的速度正以兆兆字節甚至於十倍於此的速度增加。


很表面化,在傳遞高品質的檢索最後結果上方面,其進展未能與幾年翻倍的Mole定律齊頭共進。事情的真實情況上,『搜索最後結果定律』可以依據不斷增加的數值體積及其復雜性來逆向描寫。


2004年五月Nielsen Norman Group宣布了其2004 Web可用性調查最後結果,那裡面著重提出了搜索已變成Web應用成功道路上的很大絆腳石之一。據調查,過訪搜索引擎網站已變成88百分之百的Web對話中的第1步,同時用戶均勻在每每對話中會過訪3.2個站點(過訪搜索引擎網站不計算在內)。


就搜索成功性而言,全部用戶(涵蓋間或運用或內行的用戶)對搜索最後結果滿足的回數百分率僅為42百分之百。盡管僅對內行的用戶來說這一數碼可以達到50百分之百,但這還是意味著敗績。


最糟糕的搜索經歷常發生在運用公司網站點搜索而不是運用巨型搜索引擎網站的時刻。Jakob Nielsen是搜索可用性方面的資深專家和Nielsen Norman Group的負責人,他將內裡公司網的搜索功能描寫為『不值一用』。很多用戶甚至於用盡力避免免企業准許研發內裡公司網搜索引擎網站項目,而更傾向於運用Web搜索引擎網站在防火牆外尋覓與其企業有關的信息。


上面所說的問題的局部端由是從實質上看搜索是一種輸入輸出流。大約有60百分之百的被調查用戶僅在搜索著手時鍵入一個單詞,額外的20百分之百用戶鍵入了兩個單詞。只有1百分之百的被調查用戶運用了高級搜索功能,而運用引號或其它查問語法對搜索進一步優化的用戶僅有3百分之百。這個之外,調查還表明搜索最後結果頁面中的第1條鏈接獲得了51百分之百的點擊率,第二條取得了16百分之百。從搜索引擎網站企業的數值庫總得出了一樣的最後結果,並由此萌生了關於搜索的另一條定律:不要過高的希望用戶運用比搜索引擎網站所供給基本工具技法更多的手眼來取得得信任息。


Nielsen提議了一點基本策略來改正用戶的查問動作,譬如一個簡單的可視化搜索框,它有至少27個字母寬以激勵用戶施行多單詞查問,並有拼音書寫查緝和對查問條目施行手動改正的功能。


『你可以經過提出取得前1000條搜索條目並判斷找到這些個單詞或短語的關緊位置一般應當何在,由此對搜索引擎網站增加主動判斷。』 Nielsen說到。『同時可以經過查緝搜索日記以檢查最常用的條目以及哪一些辭匯被用來搜索這些個條目,而後再參加近義詞對搜索引擎網站施行調試。』


這個之外,Nielsen還提到運用合適的內部實質意義元素如頁面題目,大字題目和提要等,會有助於改進搜索最後結果。從這些個步驟中得出了另一條搜索定律:『僅只有賴半自動查問是不會獲得良好的搜索最後結果的。』


同時,公司網數值以團體化和非團體化(如電子郵件、Office文檔、Web頁面、音頻文件等)的方式同時存在,同時這些個數值還處於單獨的狀況,並未為被檢索作好准備。另一條搜索定律由此萌生:你不可以在你不成解的物品中尋覓你想要的。


在Nielson Norman Group的研討最後結果及經過調查取得的關於運用標准樣式的信息下,搜索引擎網站只得采取處理辦法使自個兒變得更為伶俐,同時能更正確各個方面的為大部分數用戶帶來良好的搜索最後結果。絕大多人不會讓自個兒費力的面臨高級搜索技法以克服現存搜索的限制性。至少,大多企業需求查緝其搜索機制,增加對原始數值分類的投入,並認為合適而使用一個有專門團隊保護和昇班的專業搜索引擎網站。


如Autonomy、FAST、Google、Northern Light、Verity和Vivisimo等企業供給了認為合適而使用各種技術手眼的公司搜索引擎網站。Google有自個兒的『PageRank』及文本般配技術。Autonomy則運用如概念般配(concept matching)技術、貝葉斯審理決定規則推斷技術等。


專門的搜索引擎網站關心注視於特別指定領域,如針對工程技術信息的GlobalSpec,它與普通的強力搜索引擎網站相形能夠供給更好的最後結果。又如IBM到現在為止正在研討的WebFountain,它運行著成千個手續以不斷檢索信息並對內部實質意義歸類,同時認為合適而使用天然語言剖析以供給前後文參照。WebFountain被預設用於高度復雜的查問,譬如追蹤剖析一個企業或產品的知名度。


不過仍然不要巴望近來在搜索引擎網站領域會有重大打破。Yahoo搜索實驗室的首席科學家Gary Flake說:『今日的搜索引擎網站猶如音樂進展史受騙年的8軌灌音帶同樣。』至少對如今來說,這萌生了賅括搜索最後結果的最後定律——冒犯的援用莎士比亞的臺詞對白:『終日苦苦追尋,而一朝領有,卻發覺追尋中的支付越過了所取得的價值