搜索常見問題及解決辦法小結

筆者:搜索引擎網站9238



1.信息太少或找不到
  1.1別字
  1.2 不符合理的關鍵字
  1.3 沒有最新信息
  1.4 信息搜集不夠



2.檢索最後結果有關性差
  2.1 動態分類
  2.2 綜合搜索
  2.3 重復信息
  2.4 提要顯露影響感受上的有關性
  2.5 漢字切詞
  2.6人工指定局部搜索最後結果
  2.7 網站直達
  2.8 有關性算法
  2.9 使聚在一起用戶反饋



3.死鏈接
  3.1 網頁快照
  3.2 網頁立即預覽
  3.3 搜索最後結果半自動播放



4.速度慢
  4.1 檢索速度慢
  4.2 搜索最後結果網頁敞開速度慢



5.用戶支持
  5.1 ilor
  5.2 搜索專題:
  5.3 有關搜索
  5.4 toolbar,瀏覽器 button,地址欄搜索插件
  5.5 大致相似網頁
  5.6 網站直達功能
  5.7 供給高級檢索界面
  5.8 開放高級搜索語法
  5.9 個性化設置(preference)
  5.10 搜索最後結果排序形式可選
  5.11 email訂閱搜索最後結果
  5.12 移譯其他語言搜索最後結果
  5.13 准許選用其他搜索引擎網站
  5.14用戶交流
  5.15 網站關鍵詞




前 言



以我的運用經驗,用戶在運用搜索引擎網站方面,最不滿意的5個問題是:



  1. 信息太少或找不到
  2. 檢索最後結果有關性差
  3. 死鏈接
  4. 速度慢
  5. 用戶支持不夠



以下從一個平常的用戶的角度,簡單總結概括了萌生這些個問題的有可能端由,以及針對這些個問題的一點已知解決辦法,都是有的搜索引擎網站做過的。




1.信息太少或找不到



用戶運用搜索引擎網站找到的信息太少或找不到的端由,主要是
 1.1別字
 1.2不符合理的關鍵字
 1.3沒有最新信息
 1.4信息搜集不夠



1.1別字:
(用戶對所找正題人地生疏、同音字、網絡通假字泛濫等各種端由造成的不正確網站關鍵詞眾多,但用戶很難自個兒發覺自個兒輸了別字,只會怪搜索引擎網站找不到信息。多個搜索引擎網站有針對別字的解決方案。)



--Yahoo
  Yahoo的作法也是給出用戶正常搜索網站關鍵詞,但提醒有可能更准確的網站關鍵詞。如搜索『britny spear』,yahoo會提醒Other Spellings: Try searching for britney spear instead。但yahoo的鑒別率較低,並且漢字雅虎不支持。
--Directhit和NBCi
  Directhit的作法是,給用戶正常搜索最後結果,但在『有關搜索』中給出一個有可能更准確的網站關鍵詞。
  運用overture之前的NBCi也是這種作法。
--google
  Google在給用戶正常搜索最後結果的同時,把有可能更准確的網站關鍵詞顯露在搜索最後結果頁頂端,用『你要找的會不會是:』來表達。如用戶搜索『chrismas』,會獲得『chrismas』的搜索最後結果和『你要找的會不會是:chrismas』
--excite
  excite的Zoom In曾有查緝拼音書寫不正確的功能。准確單詞會顯露出來在Zoom In中,後邊跟(sp)表達。
--MSN
  msn采取主動更正不正確的形式,用戶搜索『britny spear』,會獲得修改後的『britney spear』的搜索最後結果。
--Ask Jeeves
  Ask Jeeves也是在身後主動修改用戶的拼音書寫不正確。譬如用戶搜索”speling” ,Ask會半自動搜索 “spelling”。
--openfind和3721
  openfind曾供給依稀檢索,支持同音、容錯,但如今已撤下。
  3721的長江以南地區音和同音搜索局部解決了用戶讀音非常不好造成的別字。



1.2 不符合理的關鍵字:
(用戶匱缺搜索常識,不懂運用合理的網站關鍵詞組合,也是找不到信息的端由之一。)



--黃反屏蔽:
  有點用戶不曉得局部搜索引擎網站會屏蔽黃色和反動詞,以為搜索引擎網站找不到信息。
--天然語言搜索:
(一點搜索引擎網站向用戶供給不一樣程度的依稀檢索或天然語言檢索功能,有助於解決用戶不懂運用合理網站關鍵詞組合的問題。)
  -Openfind:以前支持簡單的依稀檢索。
  -askjeeves:憑極大的問題庫來支持天然提出問題搜索。
  -iphrase:基於語義庫的天然語言檢索。
  -we變態op和kenjin:可以用整段文章或整篇網頁檢索,如今均已關閉。
--推廣搜索常識
(推廣搜索常識,可以增長用戶水准,減損這種不正確,並培育忠實用戶)
  -好的搜索幫忙文檔:某些搜索引擎網站的搜索幫忙寫得美好。
  -提醒搜索技法:
    263、fm365曾在搜索頻帶首頁常常提醒搜索技法;
    google有時候利用搜索最後結果頁提醒搜索小常識。
  -搜索有獎競賽:新浪、賽迪的兩種搜索有獎競賽
  -電視宣傳:
    年前新浪在北京臺的電視宣傳
    近期百度在教育臺的電視宣傳
  -出搜索卷帙:
    Altavista出過一本『The Altavista Search Revolution』,當初曾有不小的影響。
    『我是野虎』搜索引擎網站出過一本書。
  -電視臺文章:略
  -搜索論壇:新浪搜索論壇效果顯著。
--Fast(alltheweb)
  Fast的『pre-analysis』功能可以給用戶輸入的網站關鍵詞半自動加雙引號施行詞和詞組檢索
  支持半自動鑒別長網站關鍵詞串中的關緊單詞、刪?quot;noise” words再檢索,該功能是默許的,但可在高級設置中關掉。
--Altavista,
(Altavita覺得:當用戶輸入2-4個詞時,它們一般在找裡面含有全部單詞的文件,不過,當5個以上的網站關鍵詞,裡面含有多個概念時,用戶常常是處於’find stuff like what I describe here’,即『找一點我描寫的這麼的文件』的狀況,這種事情狀況下,它們並非要求搜索到的文件務必裡面含有全部他輸入的單詞。)
  -對於2-4個單詞的網站關鍵詞,altavsta會從一個大約500,000的短語辭典中尋覓,假如合乎那裡面的某條短語,就把你的網站關鍵詞半自動當作短語來搜索,但也會回返包括全部單字的網頁。
  -對於5個或更多單詞的網站關鍵詞,altavista會先尋覓合乎條件的短語,也會尋覓裡面含有局部單詞的網頁。



1.3 沒有最新信息:
(搜索引擎網站抓取和引得大數目級網頁需求時間,因為這個存在信息落後性。但用戶不懂這原理,數量多的用戶用搜索引擎網站尋覓新聞特別是暴發事情,一點搜索引擎網站認為合適而使用綜合搜索或對局部網頁迅速更新的辦法開始階段的解決了這個問題。)



--Fast(alltheweb)
  -在傳統搜索最後結果前加最多2條即某一時期最新的聞,並供給『more news articles』的鏈接。
  -供給獨立的新聞搜索,對3000多個新聞網站樹立迅速引得,最快可檢索到1分鍾前的新聞。
--inktomi
  -對它約1億的高權值網頁庫增長引得更新頻率(每9天),付費登錄網頁支持最快每日更新。
--新浪
  -綜合搜索中包括新浪自個兒的新聞搜索,並有『更多』鏈接,指向獨立的新聞檢索。
--雅虎
  -改版後的雅虎在傳統搜索最後結果後加上最多3條自個兒的新聞題目搜索,並有『更多』鏈接。
--google
  -在傳統搜索最後結果前加最多4條新聞,搜自聞名新聞網站(英文)。
  -對320萬權值高或更新頻率高的網頁每日更新一遍引得。
  -供給一個新聞資源鏈接網頁,供給一個新聞入口網頁列出分正題的當天要聞。



1.4 信息搜集不夠
(這是一個長時期存在,需求長時期盡力盡量的問題)



--支持更多網頁類型:
  frame,redirect,java,動態網頁,利用linkanalysis局部引得,各種書契和符號組合的鑒別引得
--支持更多文件款式:
  wkx,mw,xls,flash,pdf,ppt,ps,doc,rtf ,doc,圖象,視頻文件,音頻……
--增長網頁庫品質:
  去重,減損死鏈接,優化網頁挑選策略
--趁早更新:
  同1.3
--增大網頁庫數目級:




2.檢索最後結果有關性差




2.1 動態分類
(運用同一個網站關鍵詞搜索,不一樣用戶需要的信息是不一樣的,譬如『石器時期』,他找的是歷史有關信息?游戲有關信息?若是游戲有關信息,他找的又是重名網站?官方網站?戰網?游戲紹介?買游戲產品?游戲新聞?攻略?但搜索引擎網站一般只把一類信息排在前,造成其他信息搜索者覺得有關性差。隨著網頁數目的迅疾提高,這問題會更嚴重,搜索最後結果動態分類有助於這個『用戶信息需要多元化』的問題。)



--northernlight
  人工設計目次接合半自動歸類
--queryserver、vivisimo
  主要利用最後結果提要提出取得網站關鍵詞歸類
--teoma
  利用超鏈剖析對最後結果網頁歸類
--fast
  利用dmoz分類目次接合半自動歸類
--znow
  利用周密的設計目次歸類
--Guidebeam
  對搜索最後結果網頁剖析歸類
――oingo
  利用語義庫分類



2.2 綜合搜索
(用戶搜索一次,同時看見跟該網站關鍵詞有關的多種信息,也有助於改善上面提到的用戶信息需要多元化的問題)



--sina:一次供給目次、網站、網頁、新聞、商品等多種搜索最後結果。
--britannica:一次搜索,同時顯露產品、卷帙、網站、百科大全書、雜志、灌音帶等的搜索最後結果。
--google:供給字典、分類目次、新聞、股票、電話、地圖搜索等,依據關鍵字顯露不一樣內部實質意義。



2.3 重復信息



--不一樣網址的相同內部實質意義引動的重復
  百度:內部實質意義類聚
--網站相互剿襲引動的內部實質意義重復
  Google:相仿內部實質意義類聚



2.4 提要顯露影響感受上的有關性



--動態提要:
  Google:動態提要使搜索最後結果看中去更有關。
(注:2002年三月,百度已昇班為動態提要)
--接合分類目次提要:
  -google對搜索最後結果中被dmoz收錄的網頁,加上了dmoz人工編輯的網站提要,與動態提要共存。
  -openfind利用藍帆的分類目次給出局部網頁搜索最後結果的提要。
--網頁截圖
  girafa、searchshots除書契提要外還供給一張網頁截圖,用戶獲得視物感覺化提要,更易鑒別挑選搜索最後結果。



2.5 漢字切詞
(漢字切詞不准使搜索最後結果有關性差,是一個長時期的、逐漸進展的問題)



--百度的人名漢字切詞專利



2.6人工指定局部搜索最後結果
(人總比電腦更了解人的需要)



--有點搜索引擎網站對熱門兒網站關鍵詞的搜索最後結果作傲人工過問,所以這些個詞的檢索最後結果有關性比其他半自動生成的要好。



2.7 網站直達



--overture的Quick Hit
  overture的名次誰都可以買,但眾多用戶檢索『yahoo』『aol』等網站名時是想上那一個網站,因為這個,overture對這種有官方網站的關鍵字,在檢索最後結果前增加了一條『Quick Hit』,用戶點擊後可直達官方網站。
--msn的realname
  分類目次的信息量小,檢索最後結果的有關性沒有辦法跟網頁檢索同樣靠算法增長,所以msn在分類目次搜索最後結果前,運用了realname,使搜索網站名的用戶可以直達有關網站。
--aol
  aol在分類目次搜索最後結果前,用recommended sites 的方式供給官方網站鏈接。,



2.8 有關性算法



--超鏈剖析的提高(Link popularity、anchortext、context)
  超鏈剖析先天欠缺:使小站、新站、專業站處於不順利地位。一個專業小網站,它的內部實質意義再好,由於不可以迅疾獲得數量多高品質的超鏈,難於獲得合宜的名次。
--內部實質意義剖析的提高
--User popularity
(有點搜索引擎網站利用用戶傾向計數來排序)
  -directhit:按搜索最後結果點擊率及網站稽留時間排序
  -hotlinks、blink:使聚在一起用戶收集保藏夾按網站被收集保藏率排序
  -top9:依據網站過訪人次排序
  -google:曾剖析約1成的搜索最後結果點擊,據以調試有關性算法。利用advanced toolbar使聚在一起用戶過訪習性作剖析



2.9 使聚在一起用戶反饋



--overture、britannica
  他們在每個搜索最後結果頁上放了一個浮動調查,讓用戶以『――、-、+-、+、++』5檔評比推選現時搜索最後結果的有關性,而後依據計數最後結果,趁早研討和改善遭受劣評的搜索最後結果頁。
--google
  英文版准許用戶對現時搜索最後結果頁刊發意見。有5個意見選項可挑選:Off-topic、Offensive、Described poorly、Too similar to one another、The page I was looking for wasn’t listed in the results,額外,用戶可寫上正在尋覓的url或描寫想找的內部實質意義。在Google的新版toolbar也供給了相仿的搜索最後結果用戶投票功能。




——————————————————————————–




3.死鏈接




3.1 網頁快照



--Alexa、google、daypop等搜索引擎網站有應用



3.2 網頁立即預覽



--vivisimo、wisenut:
點擊一條搜索最後結果鏈接後,在現時窗戶中開一個frame,預覽該網頁。可減損用戶從死鏈接遭受的艱難困苦。



3.3 搜索最後結果半自動播放



--metacrawler、metor、robocast:
用戶搜索後,假如挑選半自動播放,可以看見搜索最後結果網頁一個一個的輪番敞開,可設定每個網頁稽留時間、可任何時間敞開新窗戶、可選定幾個網站後敞開半自動播放。省去了用戶不斷點擊的麻煩。





4.速度慢




4.1 檢索速度慢



--利用cache



4.2 搜索最後結果網頁敞開速度慢



--簡化網頁預設
--加快網頁傳道輸送




——————————————————————————–




5.用戶支持




5.1 ilor
(在ilor檢索後,用戶把鼠標移到搜索最後結果鏈接上後,鼠標旁顯露出來4個選項)



--go now-anchor here:
  敞開該項最後結果,並用浮動小窗戶記錄該最後結果的位置,不論什麼時候點一下子浮動小窗戶就可歸來,省去常常按退回的麻煩。可敞開多個anchor。
--onpen in new window :
  在新窗戶中敞開並顯露此項搜索最後結果,
--open in background:
  新窗戶中敞開,但顯露在現時窗戶身後,免得影響現時窗戶眼看東西假想線。
--put in my list:
  在彈出的浮動小窗戶中收集保藏本鏈接,以便其他時間再看。可收集保藏多個鏈接。



5.2 搜索專題:
(人工制造一個紹介某領域優秀網站和搜索常識的專題,對用戶頗具幫忙)



--About:700多個搜索專題
--Northernlight:26個Special Editions
--263搜索:游戲、性愛、mp3、教員節、桌面兒等搜索專題



5.3 有關搜索



--baidu、altavista、we變態op、nbci的有關搜索
――excite的zoom in
――askjeeves的有關問題



5.4 toolbar,瀏覽器 button,地址欄搜索插件



--toolbar:google、openfind
--瀏覽器button:google
--地址欄搜索插件:3721



5.5 大致相似網頁



――alexa:為alexabar、ie、netscape供給的有關網站功能
--teoma:Experts」 link 也具備尋覓同類網頁的功能
--google:大致相似網頁



5.6 網站直達功能



--手氣不賴



5.7 供給高級檢索界面



--略



5.8 開放高級搜索語法



--站內搜索、題目搜索、短語檢索、時間限止、inurl較常用



5.9 個性化設置(preference)



--准許用戶自個兒設定並記憶搜索引擎網站設置:fast、altavista、wisenut、google



5.10 搜索最後結果排序形式可選



--zeal、nbci的分類目次搜索,以前可挑選依照relevance、new、popular、link任一規則排序。
--northernlight可按照規定的時間間排序。



5.11 email訂閱搜索最後結果



--profusion、northernlight:
  訂閱指定關鍵字的搜索最後結果,有更新的搜索最後結果會半自動email送出。



5.12 移譯其他語言搜索最後結果



--altavista、google:供給對搜索最後結果的移譯



5.13 准許選用其他搜索引擎網站



--yahoo、google、ask:在搜索最後結果頁上供給其他搜索引擎網站的鏈接,用戶點擊後,調配使用其他搜索引擎網站檢索現時網站關鍵詞。



5.14用戶交流



--節日問候
--專用email、論壇、反饋提交處理入口
--供給不收費提交處理網頁入口、及robot.txt教學文檔



5.15 網站關鍵詞



--yahoo、google:定期展覽熱門兒網站關鍵詞計數最後結果
--chinaren、21cn:曾骨碌顯露其他用戶現時搜索網站關鍵詞