Google服務過程中的秘密

Google是我最喜歡的搜索引擎,我被Google的精神而折服,被Google的文化而感染,我可以說是Google的超級粉絲之一瞭,今天看瞭一些東西,與Google的愛好者,以及想瞭解Google的人分享一下。Google,真不愧為世界最強的搜索引擎。下文為Google在為搜索引擎提供搜索過程中的服務過程.

1、搜索框

一切以任何人在網絡上展開搜索為起點。任何關鍵詞,比如:微碼互聯

2、域名服務器

Google域名服務器上的軟件,運行於公司在全世界租用的或自有的數據中心上,其中包括在曼哈頓老港務局的一臺電腦。它們唯一的目的,是計算出哪些集群此刻最不繁忙,以便盡可能高效的指引這些搜索進入Google的集群。

3、集群

這些搜索請求一刻不停地留入Google分佈在全球的各地數據中心的至少200個集群中。

集群控制器,Google天賦表現在它的網絡軟件上,它能幫助一個集群中的成千上萬臺廉價的電腦像一個巨型硬盤一樣工作。那些便宜的電腦允許Google在不停止整個表演的情況下替換局部組件:如果一臺電腦死機瞭,至少有兩臺其他的電腦做好瞭替代它的準備,此間,工程師會把那臺壞瞭的電腦換下。

4、網絡服務器

這個程序把一個查詢分攤給成千上萬臺機器,以便它們能在同一時刻為此次搜索服務。這種差異好比以前是你自己一個人去雜貨店買東西,現在有100個人同時幫你找東西,然後把它扔到你的手推車裡。

5、索引服務器

Google所以知道的一切都存儲於一個巨大的數據庫中。Google有上百臺電腦同時掃描它的卡片目錄以找到每一個相關的條目,而不是僅用一臺電腦篩選這些十幾億的字節。熱門的搜索詞語會被緩此存儲在內存中幾個小時,而不是重新再搜索一遍。

6、檔案服務器

在索引服務器把所有的結果匯編後,檔案服務器抽出所有相關的文件—巨大的數據庫裡的鏈接和文章摘錄。Google如何做到快速地搜索頁面?其實它沒有。Google在它已建立瞭索引的檔案服務器中保存瞭三份互聯網上的所有資料,這些資料都已經分門別類,做好瞭被使用的準備。
容量:基於一些Google發佈的極有限的數據,專傢猜測,Google服務器至少存儲瞭20個perabytes的數據(1pb等於100萬G)。不那麼保守的《連線》雜志則說,Google可能有200個pb的容量。如果你的IPOD隻有1perabytes,你就能存儲大約2億首歌。如果你要在高速互聯網上下載1perabyte大小的東西,你的曾曾曾曾孫可能在2514年後一個字節傳完時仍守在電腦左右。

7、拼寫服務器

GOOGL並不閱讀詞匯。它尋找這些文字的模式,或者是英文或者是梵語。如果它根據你的搜索請求的模式得到1000個結果,但卻找到一百萬個由一個類似模式得到的結果,它會把這些點連接起來,並禮貌地詢問你是否願本想要查詢這些詞語,盡管你的肥手指可能把對沖基金錯拼成對蔥基金。

8、廣告服務器

每一個查詢都同時通過一個廣告數據庫,與之相匹配的數據會被送至頁面服務器,以便它們能出現在搜索結果顯示頁。廣告團隊在跟搜索團隊賽跑。Google立志盡可能提高搜索速度。如果廣告匹配的結果所花費的時間比搜索結果用時更長,它就不會呈現在頁面上,Google也就不能再此項搜索上賺到錢。

9、頁面生成器

Google的頁面服務器它對某一項查詢的成千上萬次搜索結果收集起來,組織所有的數據,然後把這些機靈而又簡單的搜索結果呈現在你瀏覽器的窗口中,整個過程比你讀這個局在所花的時間還要短。

10、顯示結果

一般為0.25秒,或者更短。

Google機器人:Google部署瞭一項稱為蜘蛛(spiders)的項目,為的是建立它自己的互聯網副本。在一些熱門的網站,googlebot可能一小時內要跟蹤若幹次該網站的鏈接。每一次搜索,蜘蛛們就會把每一篇文章獲帶脈的每一個字都保存下來。原始數據將會被搜索集群中,穿過整個工廠,並且有計劃地加速替換掉那些在索引服務器和檔案服務器中的數據,從而保證搜索結果是新鮮的,而非靜止的。

頁面排序:當GOOGLE形成瞭一個搜索結果清單時,通過對內容200多個因素分析,Google會決定一個網站有多可靠。這個網站的內容有多重要。Google方式的秘密是,它會通過每一個網站被其他不同網站鏈接的情況,對該網站的重要性做出評估,換言之,一個網站能否視為可靠,很大程度上取決於鏈接它的那些網站的質量。

電力:隻有一件事會限制Google的表現,那就是公司能買多少電。他最新的數據中心之一(編號:項目02)位於俄勒岡州的哥倫比亞河附近,這個數據中心使用著18億瓦特低價的水力發電站的電。這並非偶然,這正是亞洲與美國網絡的連接處。這個字節工廠有兩個電腦中心,每一個都有一個足球場那麼大。

本文首發艾瑞,轉載請註明作者信息.謝謝!

齊寧 MSN:[email protected] column.iresearch.cn/u/qining/