Google 的隱蔽的事- PageRank 徹底解說

Google 的隱蔽的事- PageRank 徹底解說Google 的隱蔽的事- PageRank 徹底解說 漢字版- –
Tag: google,pagerank

原著:Google の隱蔽的事 – PageRank 徹底解説 Hajime BABA / 馬場 肇
移譯:Kreny / 袁 黃琳 dalouis.com
創編於:2003/12最終更新: 2004年十月二十八號 3:53網站關鍵詞:pagerank, google, link
移譯解釋明白: 一點語句的移譯上運用了意譯,要得盡有可能得合乎漢字的了解和解釋明白思考的線索。
版權聲明:可以恣意過載,過載時請必須以超鏈接方式標見於文字章原始來源和筆者信息及本聲明
) 。

★(2001/2/28) Namazu 的引得中運用的計算 PageRank 的 Perl 腳本代碼 prnmz-1.0.tar.gz 公開下載。

1.前言
近來,搜索引擎網站 Google ()」 是象以下同樣解說的。

關於PageRank
PageRank,管用地利用了 Web 所領有的極大鏈接建構的特別的性質。 從網頁A導向網頁B的鏈接被看作是對頁面A對頁面B的支持投票,Google依據這個投票數來判斷頁面的關緊性。可是 Google 不僅單只看投票數(即鏈接數),對投票的頁面也施行剖析。「關緊性」高的頁面所投的票的名聲會更高,由於接納這個投票頁面會被了解為「關緊的東西」。
依據這麼的剖析,獲得了高名聲的關緊頁面會被給與較高的 Page Rank(網頁等級),在檢索最後結果內的班次也會增長。PageRank 是 Google 中表達網頁關緊性的綜合性指標,並且不會遭受各種檢索(引擎)的影響。倒還不如說,PageRank 就是基於對運用復雜的算法而獲得的鏈接建構的剖析,因此得出的各網頁本身的特別的性質。
當然,關緊性高的頁面假如和檢索詞和句子沒相關聯一樣也沒有不論什麼意義。為此 Google 運用了精練後的文本般配技術,要得能夠檢索出關緊並且准確的頁面。

經過下邊的圖我們來具體地看一下子剛剛所論述的算法。具體的算法是,將某個頁面的 PageRank 除以存在於這個頁面的正向鏈接,由此獲得的值作別和正向鏈接所指向的頁面的 PageRank 相加,即獲得了被鏈接的頁面的 PageRank。

PageRank 概念圖。(引自 Page et al.(1998) Figure 2 ‘Simplified Page Calculation’)

讓我們周密地看一下子。增長 PageRank 的要領,大概有3個。

逆向鏈接數 (天真的意義上的受熱烈歡迎度指標)
逆向鏈接是否來自引薦度高的頁面 (有依據的受熱烈歡迎指標)
逆向鏈接源頁面的鏈接數 (被選中的概率指標)
首先最基本的是,被很多頁面鏈接會要得引薦度增長。也就是說「(被很多頁面鏈接的)受熱烈歡迎的頁面,一准是優質的頁面」。所以以逆向鏈接數作為受熱烈歡迎度的一個指標是很天然的想法。這是由於,『鏈接』是一種被看作「可以看看這個頁面/這個頁會有用」的引薦行徑。不過,值當自滿的是 PageRank 的深刻思考辦法並沒有稽留在此地。

也就是說,不止只是經過逆向鏈接數的若乾,還給引薦度較高頁面的逆向鏈接以較高的名聲。同時,對來自總鏈接數少頁面的鏈接給與較高的名聲,而來自總鏈接數多的頁面的鏈接給與較低的名聲。 換言之「(薈萃著很多引薦的)好的頁面所引薦的頁面,一准也是一樣好的頁面」和「與感受在被胡亂鏈接的鏈接相形,被少量選拔出的鏈接肯定是優質的鏈接」這兩種判斷同時施行著。一方面,來自別人高水准網頁的正規鏈接將會被明確看得起,另一方面,來自貼掛有絕對沒相關聯性的大致相似於書簽的網頁的鏈接會作為「幾乎沒有啥子價值(固然比起不被鏈接來說好一點)」而被看不起。

因為這個,假如從大致相似於 Yahoo! 那樣子的 PageRank 十分高的站點被鏈接的話,僅此網頁的 PageRank 也會一下昇漲;相反地,不管有若乾逆向鏈接數,假如全部是從那一些沒有多大意義的頁面鏈接過來的話,PageRank 也不會隨便昇漲。不只是 Yahoo!, 在某個領域中可以被稱為是有權威的(還是說固定的)頁面來的逆向鏈接是十分有好處的。不過,只是一個勁地在自個兒一點伙伴之間制造的鏈接,譬如像「天真的內裡照顧」這麼的作法很不好看出有啥子價值。也就是說,從矚目於全球全部網頁的視點來判斷(你的網頁)是否真正具備價值。

綜合性地剖析這些個指標,最後形成了將名聲較高的頁面顯露在檢索最後結果的相對靠前處的搜索結構。

過去的作法只是天真地運用逆向鏈接數來名聲頁面的關緊性,但 PageRank 所認為合適而使用形式的長處是能夠不受機械生成的鏈接的影響。 也就是說,為了增長 PageRank 需求有優質頁面的逆向鏈接。 比如假如拜托 Yahoo! 登陸自個兒的網站,便會要得 PageRank 突然昇漲。不過為此務必著力於制造(網頁的)充實的內部實質意義。這麼一來,就要得基本上沒有增長 PageRank 的捷徑(或後門)。不但限於PageRank (Clever 和 HITS 等也一樣),在利用鏈接建構的排序系統中,曾經天真的 SPAM 手法將不再通用。這是最大的一個長處,也是 Google 方易於運用的最大理由。(固然是最大的理由,但並不是惟一的理由。)

在這處請注意,PageRank 自身是由 Google 定量,而與用戶檢索內部實質意義的表現式絕對無關。就像後邊將要論述的同樣,檢索語句不會呈如今 PageRank 自個兒的計算式子上。無論獲得若乾的檢索語句,PageRank 也是一定的、文件本來就有的評分兒量。

PageRank 的定性解釋明白大概是這樣的一點。不過,為了實際計算排列次第、比較等級,需求更定量性的商議。以下一章將做周密的解釋明白。

3.怎樣求得 PageRank
我們有興致的是,在有像超級鏈接建構那樣子的相互參考關系的時刻,定量地曉得哪個頁面是最「關緊」的。換句話膽量大地說,這個也就是嚴緊計算「應當從哪一頁著手讀取」這個指標的過程。就算從誰都不看的小頁面著手讀取也萬不得已。

那末,普通地說為了要得像 Web 那樣子的超級鏈接建構能夠反映在在排列次第上,需求在計算機上樹立超級鏈接建構的數碼板型。 怎麼板型化需求決定於於安裝者的方向目標所以一並而論,不過假如應用圖表理論來仔細查看超級鏈接建構的話,最後每常回到線形代數思索問題辦法上去。這對於 PageRank 也是同樣的。

計算辦法的原理
作為最基本的思索問題辦法,就是用行列陣的方式來表現鏈接關系。從頁面 i 鏈接到另一張頁面 j 的時,將其成分定義為1,與之相反則定義為 0 。即,行列陣 A 的成分 aij 可以用,

aij=1 if(從頁面 i 向頁面 j 「 有 」 鏈接的事情狀況)
0 if(從頁面 i 向頁面 j 「沒有」鏈接的事情狀況)
來表達。文件數用 N 來表達的話,這個行列陣就變成 N×N 的方陣。這個相當於在圖表理論中的「接連行列」。也就是說,Web 的鏈接關系可以當做是認為合適而使用了接連關系有向圖表 S。總而言之,只要樹立了鏈接,就應當有接連關系。

(*注)由點和點連署的線構成的圖形被稱為「圖表(graph)」。這些個點被稱為「頂點(vertex)」還是「節點(node)」;這些個線被稱為「邊(edge)」還是「弧(arc)」。圖表分為兩類,『邊』沒得法向的圖表被稱為「無向圖表(undirected graph)」,『邊』帶得法向的圖表被稱為「有向圖表(directed graph)」。把有向圖表想像成單向通行的道路就可以了。 圖表能用各種的辦法來表達,但普通用在數值結構上的是「接連行列(adjacency matrix)」和「接連列表(adjacency list)」。需求注意的是,若是無向圖表,接連行列 A 就變成了對稱行列,而若是有向圖表,A 便會變成錯誤稱行列。

以下是用位圖表達的 Apache 的在線手冊(共128頁)的接連行列。當黑點呈橫向排列時,表達這個頁面有眾多正向鏈接(即向外導出的鏈接);與之相反,當黑店呈縱向排列時,表達這個頁面有眾多逆向鏈接。

接連行列的例子(認為合適而使用了Apache 的在線手冊)

PageRank 的行列陣是把這個接連行列倒置後(行和列互相交換),為了將各列(column)向量的全體成為 1 (全幾率), 把各個列向量除以各自的鏈接數(非零要素數)。這麼作成的行列被稱為「推移幾率行列」,包括 N 個幾率變量,各個行向量表達狀況之間的推移幾率。倒置的理由是,PageRank 並非看得起「鏈接到若乾地方」而是看得起「被若乾地方鏈接」。

PageRank 的計算,就是求歸屬這個推移幾率行列最大特別的性質值的本來就有向量(優本來就有向量)。

這是由於,當線性變換系 t→∞ 漸近時,我們能夠依據變換行列的完全價值最大的特別的性質值和歸屬它的本來就有向量將其從根本上記敘下來。換言之,用推移幾率行列表達的幾率過程,是反反復復對這個行列施行乘法運算的一個過程,況且能夠計算出前方狀況的幾率。

再者,固然聽起來很難,不過求特別的性質值和本來就有向量的值是能夠嚴緊剖析的一種基礎的算術手眼。我們能夠自由地給向量的起初值賦值,不過由於不停地將行列相乘,獲得的向量卻匯集中在一點特別指定數字的組合中。我們把那一些牢穩的數字的組合稱為本來就有向量,把本來就有向量中特點標志性的標量(scalar)稱為特別的性質值,把這麼的計算辦法總稱為分解特別的性質值,把解特別的性質值的問題稱為特別的性質值問題。

(*注) 對 N 次的正方形行列 A 把滿意 Ax =λx 的數 λ 稱為 A 的特別的性質值,稱 x 為歸屬 λ 的本來就有向量。假如你怎麼也不服水土行列的概念的話,你也可以思索問題 N×N 的二元排列就可以了。同時,也可以把向量思索問題變成長度為 N 的平常的的(一元)排列就可以了。

簡單的例子
讓我們用簡單的例子來試著逐次計算 PageRank 。首先思索問題一下子有像下圖表達那樣子的鏈接關系的7個HTML文件。況且,這些個HTML文件間的鏈接關系只是合攏於這1-7的文件中。也就是說,除開這些個文檔之外沒有其它不論什麼鏈接的出入。額外請注意,全部的頁面都有正向和逆向鏈接(即沒有盡頭),這也是後面將提出的一個關緊假定,在此姑且膚淺入研究討論。

表達頁面間相互鏈接關系的推移圖

首先,把這張推移圖圖表建構的接連列表表達為結構式,就有以下式子。即,依據各個鏈接源ID列舉鏈接目的的ID。

鏈接源I D 鏈接目的 ID
1 2,3 ,4,5, 7
2 1
3 1,2
4 2,3,5
5 1,3,4,6
6 1,5
7 5
以這個接連列表中所表達的鏈接關系的接連行列 A 是以下這麼的 7×7 的正方形行列。一個僅有要素 0 和 1 位圖行列(bitmap matrix)。橫向檢查第 i 行表達從文件 i 正向鏈接的文件ID。

A = [
0, 1, 1, 1, 1, 0, 1;
1, 0, 0, 0, 0, 0, 0;
1, 1, 0, 0, 0, 0, 0;
0, 1, 1, 0, 1, 0, 0;
1, 0, 1, 1, 0, 1, 0;
1, 0, 0, 0, 1, 0, 0;
0, 0, 0, 0, 1, 0, 0;
]
PageRank 式的推移幾率行列 M ,是將 A 倒置後將各個數字除以各自的非零要素後獲得的。即以下這個 7×7 的正方形行列。橫向檢查第 i 行非零要素表達有指向文件 i 鏈接的文件ID(文件 i 的逆向鏈接源)。請注意,各縱列的值相加的和為 1(全幾率)。

M = [
0, 1, 1/2, 0, 1/4, 1/2, 0;
1/5, 0, 1/2, 1/3, 0, 0, 0;
1/5, 0, 0, 1/3, 1/4, 0, 0;
1/5, 0, 0, 0, 1/4, 0, 0;
1/5, 0, 0, 1/3, 0, 1/2, 1;
0, 0, 0, 0, 1/4, 0, 0;
1/5, 0, 0, 0, 0, 0, 0;
]
表達 PageRank 的向量 R (各個的頁面的等級數的隊列),存在著 R = cMR 的關系(c 為定量)。在這種事情狀況下,R 相當於線形代數中的本來就有向量,c 相當於對應特別的性質值的倒數。為了求得 R ,只要對這個正方形行列 M 作特別的性質值分解就可以了。

在分解特別的性質值時有相應的五花八門的數字剖析法,不過本文將不在這處對各種辦法周密解釋明白,請讀者自個兒去閱覽一本妥當的課本(在你的暑假裡一定有這樣一本被湮沒的課本)。在此,我們就姑且運用決 GNU Octave 這個計算手續實際計算一下子特別的性質值和本來就有向量。

(*注) GNU Octave ,是支持數字計算,大致相似於描寫性特別好的 MATLAB 的編程語言。擴展後的處置語言更適應於行列演算,但基本上和C語言的語風相像,因為這個可讀性頎長。周密請參考 同樣成為樹狀的事情狀況下,分數匯集中在sitemap.html中。就算佔領總和的9成也不算希奇。

從如今起能說的是,為了計算有意義的 PageRank,要盡有可能地擯除機械生成的鏈接關系。假如把鏈接關系當做是引薦關系的話更加容易認同了吧。

6.對 PageRank 的私人的見地
(讀者)應當沒有餘地去置疑象 PageRank 那樣子利用超級鏈接來表決排列次第管用手法吧。

然而,閱覽了這些個論文往後作者自身也思索問題了很多問題。在這處,列舉幾個對 PageRank 的私人見地。雖是見地,說到盡頭就是辦法論,或許會有眾多不正確的地方。

關於 dangling page,不相反思索問題的端由是啥子?
只是由於思索問題一定的異樣變化幾率時「偶然性」會成為最簡纔不予思索問題嗎?仍然有時候看漏了啥子嗎?略微有些不太清楚。

改善推移幾率行列的有可能性
提起來,為了保障 PageRank 的純一意義的性質(一意),只要保障推移幾率行列是最簡(有向圖表是強連接)就行了,沒有不可缺少全部的要素 aij 都曲直零要素。事情的真實情況上,像在web上瀏覽 Toyota 交通工具網站後緊繼續跳向性欲情緒網站,繼續又接著跳到白宮網站瀏覽的怪異的人應當是不存在的吧。(請注意這處是指在任何時間間變動蟬聯的方式)。因為這個,如實用的意義上來說,差別於改善若乾的運用便捷程度,應當留下對算法改良的餘地。

思索問題「暫時停留幾率」會怎樣
依據 PageRank 的思索問題辦法,在一定的時間後一准順著鏈接向前邁進到其它的頁面,還是忽然怪異的、歪曲的跳到其它頁面。不過假如對照事實的web瀏覽板型,也要思索問題一定的暫時停留幾率。具體地說,就是推移幾率行列的對角成分中只取( 1-c)/N 的話獲得過小了。在原本全部變遷幾率都一定的事情狀況下,更加進一步剖析會怎樣?由於對於無聊的頁面(瀏覽者)一准會想都沒想到就轉到額外的頁面,反過來對於關緊的頁面卻會稽留較長的時間。

假如思索問題幾率論應用的話一准會思索問題其它很多問題
縱然是將成功實現性置之度外,我們也再來試著進一步思索問題這個想法。幾率論中,存在著一種叫消泯幾率或叫固定幾率的幾率。比起 PageRank 的天真而一樣思索問題辦法,導入這種思索問題辦法會獲得更希望的最後結果,所以不容置疑被大家所期望。大家都曉得馬爾可夫鏈中的分枝過程的思索問題辦法。這是思索問題遺傳基因突變時的一個板型,即,解釋明白通過一定的時間而萌生淘汰的有可能性的板型。眾多人覺得這個思索問題辦法也許會被認為合適而使用。那末導入帶有限止的幾率(禁忌幾率)又會如何呢? 即,相當於導入經過 n 次的推移從狀況 i 移動到狀況 j 時,不通過狀況 k 的幾率。假如思索問題到web瀏覽的性質的話,不是也能不容置疑地變成假定嗎?

不可以作為非馬爾可夫過程(還是說 m次的多重馬爾可夫過程)來思索問題嗎
所說的馬爾可夫過程,就是與以往的經歷無關,只從如今的狀況來確認未來的幾率法則的幾率過程。 馬爾可夫過程只依存於1步之前的過程。這個過程和沒有對以往的記憶,沒有依存於以往經歷的要素。 PageRank 是在天真馬爾可夫過程任何時間間變動而固定的狀況下計算時刻所求得的最後結果。不過,人的總稱的理性舉動務必以非馬爾可夫過程來表達。復雜的過程老是以一點方式和以往有著牽扯。因為這個,不止只純一地剖析從哪一個頁面連署來,而要剖析沿著怎樣的途徑連署而來的。這麼的剖析纔會使其可能變成更有用的排序系統。在能制約住計算量爆炸的范圍內,試著引入非馬爾可夫過程來研討說不穩定也很有趣兒。

在思索問題到和看見的千千萬萬中,有像實際安裝那樣子不太難的物品,也有由於只是嘴上說說而不曉得怎樣實際安裝的物品,無論怎樣,定量地名聲它的效果是極為艱難的。難不成實在是不可以成功實現的物品嗎?

PageRank 的技術有若乾
縱然只是認為合適而使用名聲頎長的 PageRank 技術,作為基本的想法也只是運用了枯竭的數字剖析的手法來成功實現的。不過,象我在這處解釋明白的事物,假如從專業的研討者來看絕對是不容置疑的事物了。只是克服規模這一點兒就能樹立一個專業的研討領域吧。 也可以覺得專業領域的內裡並沒有那末深的止境。事情的真實情況上,我做工,充其量只是表達了「若是非常小型的問題,縱然是課本的手法也能大約地獲得滿意計算量的最後結果」。

盡管是這麼,充其量只觸動到了綱要的外表就在口角說「沒關系嘛,原來是程度這樣簡單的技術呀」 的那種不懂裝懂的人也是有的。在這處事前著重提出:這種缺乏知識的看法是從根本上絕對不正確的。

當然,PageRank 技法的十分好的地方是「從很多優質的頁面連署過來的頁面是仍然優質的頁面」,假如清楚了便會感到是簡單的想法。但更進一步說,真正極美妙的地方是,不止只只是想到一個心思,而是將想法用固定狀況變遷的幾率散布來定式化,為了實際證明其管用性而實際地施行安裝實驗,並證實其在事實領域也能美好地運作的過程。在全部的這些個階段都成功了纔是真正值當被贊美的。

確實,不止有斬新並且靈巧高明的想法,再加上接合課本的手法,也可能制作出能和 Google 倫比(或是高出)的搜索引擎網站。也可謂其實 Google 自個兒也在這樣做著。不過,實際完成的人卻是少得令人吃驚。想象板型中的「肯定能夠完成」的物品和實際運作的物品之間有著天差地別。在實際問題上,處置大規模疏松行列本身,經過普通的手法也是相當的艱難,需求高度的職業技術。應當深深地記在在頭腦中總感到能夠了解的事和成功實現中能夠做的事之間完全會有不可以填埋的差距。不可以不為己甚隨便地思索問題。

7.參照文獻
以下面所開列舉了除開在「前言」媒介紹的基本論文之外的關涉論文。(譯者去掉了很多無用的連署)

S. Brin, L. Page, ‘The Anatomy of a Large-Scale Hypertextual Web Search Engine’,
山名早人,近藤秀和,「解說:搜索引擎網站Google」 (綱要) , 信息處置42卷8號(2001年八月), pp.775-780 (PDF)
原田昌紀,「路標:WWW搜索引擎網站的樹立辦法」 (綱要), 信息處置41卷11號(2000年十一月), pp.1280-1283
原田昌紀,「搜索引擎網站檢索最後結果的排序」,bit 2000年八月號(Vol.32), pp.8-14
美國 Clever Project,「伶俐地運用超級鏈接」 (綱要) ,日經科學 1999年九月號, pp.28-35
Dell Zhang, Yisheng Dong, ‘An Efficient Algorithm to Rank Web Resources’,
Jon M. Kleinberg, ‘Authoritative sources in a hyperlinked environment’, Proceedings of the 9th ACM-SIAM Symposium on Discrete Algorithms, 1998.
以下面所開列舉算術關涉的用來參考的書籍籍。

S.卡琳 著,佐藤健一,佐藤由身子譯,『幾率過程講義』(數理剖析與周邊3),1974年,產業圖書
岩堀信子著,『圖表和幾率過程』 (與數理剖析與周邊4),1974年,產業圖書
伊藤昇 他著,『經濟系、工學系的行列及應用』, 1987年,紀伊國屋書局, ISBN4-314-00477-0
L.V.Atokinson, P.J.哈裡, J.D.赫德森 共著,神谷紀生,大野信忠,佐脅豐,北榮輔 合譯,『數字計算及其應用- FORTRAN77-』, 1993年,Science企業,ISBN4-7819-0690-7
宮澤政清著,『幾率和幾率過程』(現代算術研討小組17),1993年,近現代科學社, ISBN4-7649-1034-9
伊理正夫著,『線形代數II』(岩波講座應用算術11) ,1994年,岩波書局, ISBN4-00-010521-3
韓太舜,小林欣吾著,『信息和符號化數理』(岩波講座應用算術13) ,1994年,岩波書局, ISBN4-00-010523-X
小國力著,『MATLAB及實際上際利用-現代應用算術和CG -』( Information Computing=86),1995年,Science企業, ISBN4-7819-0763-6
長谷川裡美,長谷川秀彥,藤野清次譯,『反反復復法 Templates』(應用數字計算Library),1996年,朝倉書局, ISBN4-254-11401-X
小谷真一著,『測每每和幾率2』(岩波講座現代算術基礎10 ),1997年,岩波書局, ISBN4-00-010640-6
藤野清次著,『數字計算之基礎-以數字解法做為核心』(Library新信息工程之基礎9),1998年,Science企業,ISBN4-7819-0861-6
與相關 Google 的在線新聞公報(日語新聞)已經離合到其另一張頁面(googlenews.html) 。(2003/5/20)

其它,尤其列出幾個覺得相關聯的頁面。

Interview with Google’s Sergey Brin(移譯報導) (LinuxGazette)
Web搜索引擎網站的商業上的事務板型和檢索技術動向-以Google為例- (JCOT報告陳述)
伶俐地分開運用吧! 21百年的搜索引擎網站(InternetWatch)
Web的「地圖」的研討成果揭曉。10%沒有被鏈接 (InternetWatch)
站點研討最後結果「搜索引擎網站之檢索到達一小批」 (HotWired Japan)
檢引得擎的檢索最後結果不公平等 (HotWired Japan)
Google –停住時期,你是好看的– (yomoyomo 氏族)
Google Weblog (Japanese Version)
Patent Death Pending (the cluetrain weblog)
Google’s PageRank: Calculator (Web Workshop)
拜謝過載!其它很多的私人站點和BBS都紹介了此文。

ZDNet China漢字 怎麼樣增長網站在Google中的名次(2003/1/6報導) 。讀不成… 🙂
ZDNet China 怎麼樣名聲一個網站的人氣(2002/8/5報導) 仍然漢字。讀不懂… 🙂
中村正三郎「BRAVO! Linux」Linux Japan 2001年五月號
InternetWatch Watcher選出的今日的站點2001年三月十六號號
InternetWatch 提要新聞2001年二月二十六號號
Google World Japanese 計算機因特網 WWW 主頁檢索 目次
Lycos /計算機、因特網/因特網/站點的檢索、鏈接集/搜索引擎網站/機器人檢索/ Google 目次
Yahoo! JAPAN 商業上的事務經濟公司因特網服務公司間買賣商品(變態oB)檢索,導航 Google 目次
8.附錄:「guguru?/ goguru?」
英語(美式英語)中是沒可能把 Google 念成「goguru」的。 和沒有人伸面的 noodle 發音或標記為「nodoru」同樣,假如硬要用片假名來表達的話應當寫成「グーグル」。

然而,有oo 這個拼音書寫的英文單詞有以下這些個。

book, bool, cook, cool, food, good, hook, look, loop, loose, mood, moon, noon, pool, roof, soon, tool, wood, zoo, …

這些個都是簡單的普通的英文單詞,但無論取哪一個都有「u:」這個發音。至少,對很多的典型的東洋人來說聽起來就是這樣吧。英語(美式英語),oo 的拼音書寫基本讀成「u」。當然,goo就讀成「gu:」。 廣末涼子不也在中古車信息雜志的電視廣告中說「假如要說車,gu―」嗎?額外,潛泳時運用潛泳眼睛兒的拼音書寫是 goggle。

當然,假如 Google 不是英語(美式英語)話那就另當另外的對待了。不過,Google 姓名的由來是從表達10的100次方的英文單詞「googol」而來的,或許仍然英語發音比較適應(google)吧。無須說,googol 的發音也是「guguru」吧。

額外,創業者之一是 Sergey Brin,從他的姓名就能清楚他是俄羅斯出身,也可能是他的英語發音帶有自個兒的方言。假如扯到那邊的話,已經是穿鑿附會了。並且,我也不太明白Google 用俄羅斯的地方口音怎麼發音。假如有識之士在的話,請一定奉告我。

補給(2001/4): 給Google的支持核心發了「是goguru,仍然guguru?」的問詢信的一位讀者,殷勤地給我轉發了這封郵件。對方說固然 Google 自個兒本身的發音是「guguru」,然而,你以你自個兒喜歡的叫法人稱也決不會在意的哦。

Date: Wed,31 Jan 200116:12:01-0800
From:』GoogleTech』
Subject: RE:{Google#034-917 } pronunciation
To:轉送郵件者(Thanks)!

We go by:』GU Gul』

But you are welcome to say whichever you prefer!

Regards,
The Google Team