搜索和BI工具接合 全公司搜索風起雲湧

  英特網資料核心(IDC)的剖析家Sue Feldman稱:有調查顯露,完整的公司搜索已經累次變成受調者心裡最具優先權的思索問題事情的項目。她說,在以往的兩年中,當公司發覺它們的決策系一統直在疏忽內部實質意義層面的時刻,它就變得更加關緊了。

  你需求的大部份數值都掩飾起來了—— 不過何在呢?他們藏在無團體的數值中,和深深的網絡中。

  隨機搜索技術,在用於從網絡中取回基本數值的時刻是美好用的,還是在確認你硬盤上某個需求文件的位置也很有效。但只有經濟活動智慧(BI:business intelligence) 工具能力對貯存在極大的企業數值庫中的信息施行條分縷析。故而,對於知識辦公者來說,對於搜索引擎網站和BI工具的需要一樣都在提高。對它們來說,需求被發覺況且施行剖析的數值俯拾即是。

  它有可能存在於企業的結構化數值庫中, 還是,有可能在無團體的文件和電子郵件中,也有可能存在於平常的的網絡上,還是存在於不可以被平常的網絡搜索引擎網站追蹤到的很多網絡站點上。它存在並掩飾於深深的網絡中。

  搜索引擎網站和BI工具的接合

  將搜索引擎網站和BI工具接合,會使事物變得簡單起來。不管有團體的或無團體的數值、在平常的的網絡上或深度網絡上的數值,都可路程經過通用的網絡搜索引擎網站界面接入。讓我們如果一下子,如果說你想要了解某一特別指定產品為何銷量減退。你可以從一個客戶關系管理數值庫(CRM)搜索煩請著手, 去標定誰休止了訂貨。不過你有可能還想要發覺,那一些客戶是否發電流通過子郵件或打電流通過話,訴說對產品的埋怨?

  這些個有可能也存在於CRM(客戶關系管理)文件中,也有可能它被你專門負責與不過癮客戶交道的電話核心的代表們記在了筆記中。

  但關鍵是,你不可以經過檢查某一種數值資源而獲得各個方面的圖景。好消息兒是你有許大多數據出處、有很多工具和很多辦法,可以改良獲得所需數值的有經驗。

  這篇文章探索追究搜索引擎網站和BI工具的接合,這是一個最近興起的市場,一點廠商和行業剖析家用其它的姓名人稱它: 聯手搜索,公司搜索,習性搜索,知識管理和信息接入。不管啥子專門用語,都解釋明白,接合是一個正在生長的發展方向。

  數值越多,所需求開鑿的數值也越多

  舉例來說,Endeca ,Fast Search(迅速搜索)和其它一點公司正在為自個兒的,搜索引擎網站和BI工具的氫結合能力鼓吹。還有一點公司, 涵蓋Bright Planet(亮堂的行星)和Deep Web Technologies(深度網絡技術)在內,則供給搜索多樣數值庫的通用界面。

  華盛頓諮詢企業Barquín國際的領導人及數值庫房學會的第1任會長Ramon C. Barquín說:第1個步驟是意識剖析家們的目前的狀況, 它們是 BI 的傳統消費者,它們務必逾越它們現存的工具。

  Barquín堅決保持覺得BI 剖析家們,知識辦公者們和隨機的網絡搜索者們失去了 90百分之百甚至於更多的本應為它們找到的數值——還是是由於它們不可以搜索無團體的企業資源,例如文件和電子郵件,還是是由於它們沒有逾越平常的網絡界面的工具。

  深度網絡(有時候被叫做掩飾的網絡,或不可以見的網絡)上的資源,涵蓋這麼一點英特網站點,假如你曉得網址,你就能走訪它,並且在裡邊搜索,不過假如不曉得網址,這些個站點的內部實質意義不會被經濟活動網絡搜索引擎網站發覺。

  一點一般的深度網絡站點,涵蓋那一些專攻氣象數值的站點、航空企業飛行行程安置和價錢的站點、股票的站點、專利權的站點,電話號頭的站點和更多其他站點。科研者和網絡研發者要比隨機運用者們更明白,在深度網絡中掩飾了若乾資源。對於能提高網絡搜索寬度和深度的工具,例如Sitemap Protocol, mod oai 和 OAIster等,它們也曉得的更多

  深度網絡搜索企業Bright Planet(亮堂的行星)的並肩興辦人Jerry Tardiff說:在 2000 年,我們做了一點剖析況且發覺,來自那一些深度網絡數值庫的文件量遠比每私人所謂那一個英特網要大的多——-比已知的英特網大200到500倍。

  因為這個我們需求思索問題,這些個盡力盡量會給我們帶來啥子,在今日可以利用它做啥子?況且,我們在不長的日後內能希望獲得啥子?

  橫亙兩個領域的並肩幻想

  不論什麼人都想從每每搜索中獲得盡有可能多的數值,這表面上很像符合思維規律,真實不是那末簡單的。私人事情、經濟活動策略和技術使這個場景變得復雜起來。舉例來說, BI 和搜索,傳統上分歸屬二種不一樣類型的運用者,它們各操作各的工具。

  對於一個正在施行廣告搜索的隨機運用者來說,他想在搜索中,將無團體的數值和有團體的數值聯手起來。而應用有團體的BI界面是絕對錯的。 Forrester 研討機構的剖析家 Boris Evelson說: 對於這些個運用者,搜索引擎網站供給了更好的應用。

  在這種事情狀況下,最好是應用一個,能在後端對有團體和無團體的數值均施行梳理、並且可將最後結果顯露在純一窗戶的搜索引擎網站。這麼的產品可從 Endeca 和FAST那邊取得。同時 , 一點網絡搜索引擎網站,例如 Alacra , CloserLookSearch 和Northern Light,也正著力於為公司研發這項技術。

  另一方面, Evelson 接著講道, 簡單搜索的樣本例子是不必為責任沈重的剖析家辦公, 剖析家需求對數值切片、收拾、將數值整合 (沿襲某領域或品類做數值大略敘述),從提要深入到細節,從一個維度跳躍到另一個維度。

  Evelson又補給說,這些個運用者需求一個傳統的 BI界面,有如Business Objects或 Cognos的產品那樣子,尤其是如果它們想要 翻越時間剖析出一個標准樣式, 繼續再跳躍一步,翻越地域剖析出一個標准樣式, 而後將二者聯手,看看那裡面一個是怎麼樣影響另一個的。

  BI 工具能萌生文本搜索所沒可能達到的了解深度,不過因為潛伏數值庫的結實又硬結構,他們的洞悉力也被限止了。相反地,文本搜索不受BI規則的強迫,也不受BI所運行的數值結構的限止。二者接合的目的是:讓許多人能對無團體數值施行信息開鑿和BI剖析,讓許多人對有團體數值做隨機搜索。

  BI 和搜索接合所獲得的發展

  一點企業藉由讓普通的員工(不止只是剖析家)放手運用 BI 工具而取得新的洞悉力。舉例來說,Labarge,一個電子元部件制作商, 將 IBM的Websphere 和數值建設工具這麼的BI 前端,安放在企業的公司資源規劃(ERP) 系統上的主框架內,要得數以百計的員工可以直接運用這款工具。而先前員工們只得依靠IT擔任職務的人為它們做報告陳述。

  沿襲信息運營長官George Hayward 的話,既是員工們自個兒正在直接與數值打教育指導,它們對數值關系的了解會更好。況且學會了把數值當群體對待,而不是把數值當作一系列的報告陳述。

  它們能夠認為合適而使用以往根本沒有料到的辦法,來對多種數值源施行多層級的搜索煩請他說. 它們能夠提出更好的問題,並且能夠自個兒獲得解答。

  有團體數值和無團體數值的區別顯而易見。經濟活動機構們正采取多種辦法,力圖從結構化數值和無團體數值中,找到信息況且聯手信息。一種辦法是給運用者一個純一的搜索界面, 而後將搜索煩請,離合為數值庫煩請和額外要調配使用其他資源的搜索煩請。這些個要調配使用的資源有可能涵蓋自個兒的硬盤,企業貯存網絡,或互聯網。繼續,搜索最後結果挨整合後,將對運用者做純一顯露。

  額外一種辦法是無團體的文本文件、還是相關的數值,參加到數值儲存庫房中。而後,只對儲存庫房做純一搜索查問seo。第三種辦法, 對於那一些領有結果百上千報告陳述的經濟活動機構們,是有用的。這種辦法就是,對經過企業搜索引擎網站能夠發覺的報告陳述施行描寫,以便讓運用者在不可缺少的時刻能夠接觸到完整的報告陳述。舉例來說,今年前一年秋季,Hyperion企業(如今歸屬甲骨文企業)宣告的為它的系統搜索工具增加一個插件,准許對Google OneBox 所貯藏的Hyperion企業數值施行綜合搜索。

  盡管BI 和搜索的整合正在施行,搜索功能的一點長處不可以被疏忽。這些個長處,不論什麼運用最弱搜索引擎網站的人都能奉告你。在從數值庫中找出全部黑 或 白 單詞,與只找黑色或白的顏色的widget,還是找出姓黑 或 白的人,這半中腰是有非常大不一樣的。企業剖析家,研討員和知識辦公著想要找的是與它們相關的全部事物,而不是全部事物。

  全公司搜索

  依據英特網資料核心(IDC)剖析家Sue Feldman的講法:有調查顯露,絕對的公司搜索已經累次變成受調者心裡最具優先權的思索問題事情的項目。她說,在以往的兩年中(當公司發覺它們的決策系一統直在疏忽內部實質意義層面的時刻),它已經變得更加關緊了。

  所說的 內部實質意義, Feldman 指的是儲存在內部實質意義管理系統(而非數值管理系統)中的資料,如文本數值,HTML 文件和其它的材料。 很很長時間候,最關緊的經濟活動數值是無團體的或半結構化的。她接著說.

  對於無團體的或半結構化的數值的開鑿辦法之一,就是應用聯手搜索引擎網站。聯手搜索引擎網站能同一時的運氣行針對好幾個數值庫的搜索煩請。運用者輸入一個純一搜索專門用語, 況且挑選搜索哪個數值庫。搜索引擎網站裡面含有不可少的API (應用手續界面),便捷在合適的數值庫上運行這些個搜索煩請。

  舉例來說,Bright Planet (DQM) 搜索引擎網站,能對 70,000個公眾數值庫,以及經濟活動機構內裡數值庫運行搜索煩請。Lawrence Livermore 國度實驗室的一位計算機科學家,David Fuess說,它們集團應用DQM搜索引擎網站,能為美國廠商尋覓到軍隊人民兩用出口限止品的非美國運用者。不過,他說:試驗在自個兒的身上樹立聯手搜索有可能是令人畏縮的.

  你務必首先理解你願意運行的搜索煩請類型,況且要理解,如在哪裡每一個你想要運用的資源上指導它們,他說. 最大的問題在於,發覺可用的深度網絡資源,況且理解每一個界面。

  Bright Planet幫忙Fuess省去了麻煩.。由於它已經裝配好了很多可用出處了,並且作為DQM 的一部份,樹立了不可少的鏈接。除開使在不一樣數值庫向上行的搜索變得更容易之外,DQM 也准許運用者在設定的時間間隔內,施行相同的搜索問詢,而搜索引擎網站只會閃現最新的、或近來更新過的數值——這麼用戶就不需要每每都閱覽相同的材料。

  Google 使搜索看起來簡單,Fuess 說,不過事情的真實情況受騙對完整性做要求的時刻,搜索就不那末簡單了。運用大致相似 DQM的服務有助於認清這一點兒。假如某處有有關的數值可用,我們能夠發明最大的機緣去發覺它。

  經濟活動應用

  沿襲 Forrester’機構的Evelson的講法,混合了BI 與搜索引擎網站的經濟活動應用,還是是很敏銳的話題。很少有公司是樂意全然商議它們在這個領域中的所作所為。不過,畢竟仍然有一點公司願意談談的。

  舉例來說,一個總部在聖路易斯化學企業Sigma-Aldrich, 運用 Endeca的搜索技術,為客戶供給關於它們產品的最新資訊。用戶搜索或點擊一種化學藥品的目次,就可獲得關於它的描寫、分子式、圖表和價錢、是否有備貨中和儲存在哪一個庫房中、它的事物安盡數據解釋明白 (MSDS) 和其它的有關數值.

  假如某人從 Sigma Aldrich 搜索一種藥學產品, 它們也將需求理解真實性證實和原產地證實。信息總監 Carl Turza說, 假如它們要針對這兩項施行分開搜索,那末我們就是在耗費用戶的時間。.

  除在站點上宣布和運營,他還規劃在公司內裡各個方面擴大 Endeca的運用,涵蓋客戶服務和經濟活動智慧部門。

  由於我不必預先推測這些個搜索煩請,我只要能夠指出針對現存內部實質意義可用的工具,讓我的內裡產品經理搜索它,況且理解它,並且讓欠缺顯露出來就可以了。他說. 當許多人開減弱網絡基礎的搜索應用時,真正的價值就顯露了。

  同時,還有一個例子。國度教育協會 (NEA) 有四個甲骨文數值庫。其數值庫裡面含有14000個聯盟站點和32萬參加者的會員記錄、財政和法律信息。它應用FAST的雷達搜索/BI產品,在數值倉中開鑿信息。

  NEA的財政的和會員服務經理Bill Thompson說:我們有許大多數據,十分期望能找到准確的數值,況且以一種可以了解的形式展出出來。它有可能是一張記分卡,一個曲線圖,一個速度計。為了使數值能以最好的辦法閃現給運用者,不管啥子方式都有可能。

  這麼的應用正在進展況且初露崢嶸, 說話時的這一年晚些時刻,搜索/BI功能就有可能比較完善了。

  開鑿無團體的數值

  這些個工具還是很新,不過可能,只是數值取得和剖析高級演化過程中的一個半中腰步驟。例如FAST,剛於今年前一年購買了Radar產品,並與信息組建企業Cognos和其他一點企業樹立了合作火伴關系。BI廠商Cognos, Hyperion, Information Builders, and SAS則支持Google為公司供給的OneBox服務。利用OneBox,可對數值庫施行搜索。

  最後最後結果有可能是,這些個BI/到處尋找求解釋決方案最後與數值庫本身融拼湊。據傳,微軟 (那斯達克: MSFT)想購買雅虎。Forrester的 Evelson 預計,數值庫廠商最後將會遠離它們如今的關系結構,而向以搜索為基礎的關系結構挨近, 這麼能力比較好的解決無團體數值的問題。

  最新版的關系數值庫小聰明理XML(可擴展標明語言),不過那只是另一種結構化數值,他說. 它們不小聰明理那一些真正地無團體數值,破讀處置文件中隨心的文本和電子郵件。不過,數值庫搜索引擎網站對於大致相似的物品將有完美的表達,並且在這些個搜索引擎網站中鑲嵌結構化數值搜索功能。 (責編:admin01)