站在搜索引擎的角度思考SEO

我剛開始學習seo的時候,在論壇看到一個帖子,題目為影響搜索引擎排名最重要的30大因素。我覺得非常不錯,並試圖象背小學語文課本一樣把它背下來,不 過怎麼也背不下來。原因很簡單,人傢總結出來的東西對我來說沒有一點邏輯順序,而且我也根本不理解。

另外根據我的瞭解,大多數seoer對seo基本知識的學習都是混論壇,看高手的博客,我個人認為這裡面存在三個你可能會犯的錯誤:一是容易人雲亦雲,二 是容易被一些錯誤的觀點誤導,三是隻知其然,不知其所以然。

上面兩段是很多人學習seo的不太好的方法,而問題的根本則是在於,這些人不瞭解搜索引擎的基本原理,不能站在搜索引擎的角度來思考seo。下面我從搜索 引擎的角度對影響排名的幾個因素進行解釋,看你是否會知其然,更知其所以然,並留下較深的印象。

一、傳統IR的相關性排序:

在web搜索引擎出現之前,傳統的IR(信息檢索)系統被用來檢索科技文獻等純文本文檔,對檢索的結果也涉及到相關性排序問題。解決方法基於共 有詞匯假設 (即一篇文檔的內容可以用它所包含的詞匯的集合來表示),采用經典的TF-IDF加 權算法。TF就是一個詞在文檔中出現的頻率,它描述該詞在一篇特定文檔中的重要性;IDF是倒排文檔頻率,它描述的是該詞在所有文檔中出現的頻率,即該詞 的普遍重要性,如我,什麼這些詞幾乎在所有的文檔中都會出現,所以這些詞即使在一篇特定的文檔中出現的頻率很高,也不是很重要。總的來說就是,一 個詞在一篇特定文檔的重要性,和TF成正比,和IDF成反比。

二、web搜索引擎的檢索對象網頁,和傳統IR的檢索對象文獻等相比又有什麼不同呢:

1、HTML標簽。和純文本文檔不同,網頁的文本被HTML標簽所包圍,這也給搜索引擎瞭解一個網頁上什麼內容更重要提供瞭豐富信息。搜索引擎 會給出現 在title標簽中的詞以最高的權重,H標簽,strong等等標簽中出現關鍵詞也會有較高的權重。另 外網頁編輯會利用HTML標簽對網頁進行排版,所以出現在網頁開始部分的內容被搜索引擎認為是更重要的。

2、超鏈接。網頁和網頁之間的鏈接是一種參考和推薦的關系。一個網頁被很多網頁所鏈接,那這個網頁很可能是重要的。(鏈接的數量)並且搜索引擎會 參考相互鏈接的一個網頁內容和鏈接的錨文本來判斷另一個網頁的內容。(鏈接的相關性)

三、在現在的web查詢模式下,搜索引擎通過用戶行為挖掘系統搜集用戶行為,加入到搜索引擎排名算法中。比如,在搜索引擎中你那個關鍵詞的查詢 結果頁面, 用戶更多地點擊瞭你的頁面而並非排在你前面的,或者用戶在你網站瀏覽的時間遠大於你的同行網站,則說明你更受歡迎,搜索引擎會給予更高的權重。

聽我說完以上這些,你是否能夠理解,Direct Hit 公司的Gary Cullis 在搜索引擎1999 年年會上將搜索引擎使用的四種技術,即:1.根據網頁本身信息(Author);2. 根據超鏈鏈接關系(Other Author);3.人工編輯產生的目錄系統(Editor);4. 根據用戶行為(User)這其中的三種呢?

原文地址:(/se-think-seo/) ,本文由武漢seo原創首發,轉載請說明出處。