互聯網行業運營:數據分析是什麼

  數據分析這詞匯時髦的不得瞭,然而就像這些年所炒的各種概念一樣,當冷靜下來,請很多人解釋數據分析到底是什麼時,恐怕要有一個不錯的答案很難。

  比較常見的答案是:數據分析就是分析數據。那麼怎麼分析,分析什麼呢?顯然這個答案沒有回答實際的問題。然而,正是這種含糊其詞的狀況,籠罩在業內,尤其是互聯網行業的數據分析領域。似乎數據分析的訴求不斷的提升,但究竟分析什麼,用什麼分析,分析的結果如何應用,不要說想清楚,恐怕連想都沒想過。

  在我看來,數據分析不是一項工作,尤其不是從後臺取個數據,做個圖表的工作,而是一個產品,能夠滿足某種實際工作需要的產品。比如數據指數系統,用來指導運營工作,讓運營的同仁能夠基於指數來評估自身工作的增益或者不足,進一步通過數據鉆取來瞭解指數增加或減少的原因。好吧,這還是有點拗口。舉個第三方的例 子:電視是一個讓用戶休閑的產品,把數據分析想象成電視吧。

  數據分析中,竊以為最重要的事情,就是明確數據分析的目的是什麼,就像上面電視 的例子一樣,要明確電視用來幹什麼,別詫異,玩遊戲,看電影,看球賽,看肥皂劇,唱KTV等等的用法都會使電視有所不同。因此,數據分析的目的決定瞭不同 的方式方法,出發點永遠是如何指導工作,無論是最基礎的瞭解現狀及趨勢,還是機器自動學習的算法改進,永遠如此。

  說到這,數據分析這個產品會有什麼用處呢?太多瞭,多到讓人太容易迷 失,數據會讓人的野心暴漲,看到瞭指標A,會想著指標B,瞭解瞭這些,又希望鉆取,這滿滿無期,雖然也有價值,但是投入產出非常不合理。因此,數據分析這 個產品,給用戶的應該是知識,在沒有轉換成知識之前,所有的數據都是無價值的。我突然告訴你今天華氏105度,你覺得有價值麼?

  說到知識,最好的轉換方式無非是6個字:圖形、對比、鉆取。一圖勝千言,指標增長還是減少,與自己對比,與控制組對比。當發現這些變化時,進入維度中觀看不同的水平,是哪種水平導致瞭這些變化。其實非常簡單,簡單到比培訓什麼同比、環比、均值、眾數、方差、高斯分佈、ANOVA、非參數統計、因子扭矩還帶個旋 轉、貝葉斯分佈等等等等簡單的多。

  一定要目標導向,而不是工具導向。後者很可怕,我曾經遇到過一位同學,他很happy的告訴我他要用 SAS,我問為啥,答案是可以編程。我說好吧,心想真有米,要多麼復雜的模型啊,實際上這復雜的模型就是描述統計量的計算。忘記工具、忘記模型,用目標來指引工作,假設要轉化的知識是給的哪些用戶,他們的業務場景假設是什麼,是需要看數據來評估績效,還是需要數據來改進工作等等。然後把知識告訴他,這就完 瞭。如果說真要讓我推薦個什麼工具,我說SQL\python\R\SPSS\Excel隨便挑一個都行,如果不行,隨時來找我。

  這麼來總結吧:數據分析,就是將數據轉化成知識的產品。所以,不應該有數據分析師這個角色,而是產品經理這個角色。