Google Analytics與百度計數原理剖析

  Google Analytics與百度計數的計數數值都是有差別的,並且差別很大,其根本端由在於數值計數的原理和機制是不一樣的。下邊分享一下子Google Analytics與百度計數做出的原理剖析。

  


  百度計數的辦公原理剖析

  百度計數供給的JS,本質上是往頁面中引入hm.baidu.com/h.js的這段代碼,該代碼的內部實質意義會依據後面的參變量有所不一樣,h.js?後面的參變量就是你在百度計數裡的id。

  取得該h.js代碼的同時,百度計數會往你的瀏覽器寫入一個姓名為HMACCOUNT的cookie,該cookie的超過期限時間為2038年,所以只要你沒有清空瀏覽器cookie,基本就永不超過期限。

  h.js被下載後,便執行其腳本代碼取得一點瀏覽器有關信息和過訪出處,取得的信息涵蓋熒幕尺寸、顏色深度、flash版本、用戶語言等。

  從js代碼中可以獲得,全部參變量涵蓋這些個:cc,cf,ci,ck,cl,cm,cp,cw,ds,ep,et,fl,ja,ln,lo,lt,nv,rnd,sb,se,si,st,su,sw,sse,v。這些個參變量的意義大seo概如下所述:

  cc: 不曉得,普通為1

  cf:url參變量hmsr的值

  ci:url參變量hmci的值

  ck:是否支持cookie 1:0

  cl:顏色深度 如 32-bit

  cm:url參變量hmmd的值

  cp:url參變量hmpl的值

  cw:url參變量hmkw的值

  ds:熒幕尺寸,如 ’1024×768′

  ep:起初值為’0′,時間變量,反映頁面稽留時間,款式約略是:如今時間-載合乎時尚間+,+另一個細小的時間值

  et:起初值為’0′,假如ep時間變量不是0的話,它會成為其它

  fl:flash版本

  ja:java支持 1:0

  ln:語言 zh-cn

  lo: 不曉得,普通為0

  lt:日子 time.time(),如1327847756,在第一次煩請沒有

  nv: 不曉得,普通為1還是0

  rnd:十位隨機數碼

  sb:若是360se瀏覽器該值等於‘17’

  se: 和搜索引擎網站有關

  si:計數代碼id

  st:

  su:上一頁document.referrer

  sw: 不曉得,估計和搜索引擎網站相關,普通為空

  sse:不曉得,估計和搜索引擎網站相關,普通為空

  v:計數代碼的版本 ,到現在為止該值為1.0.17

  當這些個參變量都設置完結了(有點參變量並沒有賦值),用篩子選出已經賦值了的參變量,並作為hm.baidu.com/hm.gif的參變量合在一起出一個url, 如:http://upload.chinaz.com//?cc=1&ck=1&cl=32-bit& ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn 。而後煩請該圖片。

  百度計數服務端,經過收繳到這個煩請,並從這個圖片的網址附帶的參變量取得有關信息,記錄訪客過訪記錄;當頁面被用戶關閉的時刻,一樣會被觸動引發一次煩請hm.gif的過程,但這個過程不是全部瀏覽器和所相關閉動作都支持。

  運用運用Wireshark(一款網絡抓包工具)測試可以發覺,瀏覽器一共向服務器端送出了4次煩請:

  煩請一段js腳本代碼。

  加載完結時刻動身一次煩請,並傳交參變量

  退出頁面時刻,散發一次煩請,並傳交參變量,與上表情比較,發覺ep參變量有變動。

  百度計數是基於cookie的,當煩請js腳本代碼的時刻,會在你電腦裡保留一個長久cookie,該cookie作為你的用戶標識。同時發覺,但退出 時刻參 數ep從最著手的0變為了7289百分之百2C115,轉義後是7289,115這是兩個毫秒單位,即7.2秒和0.1秒的意思。同時前兩次煩請 hm.gif的時刻lt參變量(時間,javascript:(new Date).getTime())是未變的。rnd隨機數每每都變。

  Google Analytics的辦公原理

  當用戶過訪了一個裡面含有Google Analytics計數代碼的頁面,這段代碼會被用戶的瀏覽器執行,而這段代碼的效用就是用來使聚在一起這位訪客的信息,譬如瀏覽頁面的URL、瀏覽器類型、操作系統、系統語言、熒幕辯白率等。

  GA計數代碼隨即將這些個訪客信息儲存到Cookie中,Cookie是一段短小的文本,儲存安放於本地,與過訪的網站有關聯,它被用來判斷一個用戶是初次過訪仍然多次過訪,頁面的引薦出處和隨即的頁面瀏覽信息等。

  最終,全部的被使聚在一起到的信息會被送出到Google Analytics的數值服務器上。這個過程比較靈巧高明,我們曉得服務器的日記文件會記錄每一次的文件煩請信息,而Google Analytics使聚在一起數值的形式便是經過向服務器煩請一個透明的1×1的GIF圖片文件,這個文件煩請以及煩請時間會在服務器日記中被記錄,而文件煩請 信息裡面含有了GA計數代碼使聚在一起的數值和Cookie信息,這麼,每當這個GIF圖片收到煩請提出請求時,訪客的過訪信息便會被Google Analytics數值服務器使聚在一起。

  然而Google Analytics只是送出一張gif煩請,很很長時間候會送出多張gif煩請。如果有一個gif圖片沒有辦法計數,那末GA會送出其它gif煩請,

  總結概括:

  網站剖析大師Avinash以前說過只要有數值有90百分之百的正確度,那末就可以趁早采取舉動了。關緊的是能夠看動身展方向,繼續往前采取舉動,而後行測試,不停地優化。

  文章出處:盧松松的博客,過載請注明本文地址,謝謝。