數據分析的四個層次

1 評論 7951 瀏覽 39 收藏 10 分鐘

編輯導讀:單純的數字是沒有靈魂的,但是數據分析卻可以洞察出數據背后業務的規律。因此,數據分析是商業活動中重要的一項工作。本文將圍繞數據分析的四個層次展開介紹,希望對你有幫助。

一、引言

我通常把數據理解為業務的另一個他,單純的數字是沒有靈魂的,而背后的業務卻是鮮活的。商業數據分析的核心是洞察數據背后業務的規律,本質是數據賦能。我相信從事商業分析的小伙伴們都聽說過,數據分析的三個層次:描述性分析、診斷性分析和預測性分析。

著名的咨詢公司Gartner在2013年總結、提煉出了一套數據分析的框架,如上圖所示,他們把數據分析分成了四個層次,除了剛才說到的三個之外,還有一個處方性分析。診斷出業務的問題之后,還需要結合實際情況,給出運營策略去改善它。我更傾向把處方性分析合到診斷性分析里,因為分析和運營是需要結合在一起的。當然,這些小細節影響并不大。如今在公司0-1的參與項目,先前很多的方法論正好有機會都經歷一遍,所以想結合這些框架梳理一下自己的想法,歡迎大家留言或者進群交流。

本篇文章先跟大家介紹一下數據分析的四個層次:描述性分析、診斷性分析、預測性分析、處方性分析。

二、描述性分析:發生了什么?

通過一些核心指標的數據和前后對比,告訴業務方(或者老板)目前業務的現狀是怎樣的。比如常見的流量、轉化率、收入、成本等等這些指標。往往這些指標是比較宏觀和概括性的,對比完就能對整體的情況有個認知。在公司里,大家經常會用Tableau做日報/周報,其實主要承擔的就是描述性的匯報。

關于描述性分析,需要思考幾個問題,才能讓整個日/周報概括而又具體:

1. 關注哪些業務

首先要思考在日/周報中展示哪些業務,可以提供幾個維度去參考:

  • 老板關心哪些業務?想了解什么信息?
  • 部門負責哪些業務,重點是在推哪些?

可以沿著這個方向去確定要展示的業務。

2. 用哪些指標,如何衡量變好/變壞

善用對比(環比/同比)、趨勢等比較方式,不能只展示指標的數據,還要能直觀的反映出目前狀態是好還是壞。

3. 沉淀分析框架

當然,描述性匯報也需要沉淀診斷性分析的框架。比如說,在周報中展示轉化率指標,不論漲跌,大家肯定會在意是怎么回事。而要分析這事兒,就可以按渠道進行拆解,分成APP端、PC端、小程序端的轉化率等等,分別關注一下。

所以對于該指標的框架性拆解分析,就可以沉淀在描述性匯報中,這樣指標的漲跌就立馬能定位到哪個環節的問題。定位出問題環節后,再細一步的原因就需要去找對應的業務方咨詢了。

三、診斷性分析:為什么會發生?

業務變好/變壞了,除了知道這個結果外,我們還需要通過數據進一步了解為什么會這樣。

在診斷性分析中,就需要去分析業務結果和很多因素的相關性。當然,怎么能較快速地定位到分析哪些因素和結果的關系,要基于對業務的理解??梢源蠹乙黄痤^腦風暴分析業務數據,也可以去調研,或者深度訪談一些業務關鍵角色,讓他們給一些輸入,我們才可能知道從哪些維度去分析數據更合理。

1. 定性分析

若分析的僅是一個特征與結果的相關性,則可以通過畫二者的二維散點圖進行分析,通過圖形描述,可以初步且直觀判斷二者的存在何種相關關系:正相關、負相關、無關;如果相關的話,是線性相關還是非線性相關(拋物線、指數等)。

2. 定量分析

我們通過散點圖可以定性的判斷兩者是否具有相關性。定量上,我們可以通過回歸對他們對關系做出精確的描述。

若結果為連續值,則應用的模型為回歸模型,包括:

1)一元線性回歸

若僅有一個特征與結果相關,并且其是呈線性關系的,則可以進行一元線性回歸,即建立回歸模型y=a+bx計算出截距a和斜率b,x為特征(自變量),y為結果(因變量)。

2)多元線性回歸

在實際業務中,僅單個特征與結果相關的情況是不多見的,大多數都是多特征共同作用導致的結果。若多個特征無多重共線性,且與結果呈線性關系,則可以進行多元線性回歸分析,建立回歸模型y=a+b1x1+b2x2+…+bnxn。

3)非線性回歸

如果回歸模型的因變量是自變量的一次以上函數形式,回歸規律在圖形上表現為形態各異的各種曲線,稱為非線性回歸。常見的非線性回歸模型包括:雙曲線模型、冪函數模型、指數函數模型、對數函數模型、多項式模型等。

四、預測性分析:后續可能會發生什么?

預測性分析就是提前評估后續可能會發生什么?在工作中的場景,經常就是利用現有數據進行測算,評估業務接下來的發展。

比如提前需要測算業務年度成本、年度目標、未來收益的大小等等。

五、處方性分析:該怎么做?

這步的分析通常是接著診斷性分析的,在我們找到了業務變化背后的原因后,我們就需要去想一些策略去改善它。

首先是要定位出業務原因。在診斷性分析這一步,我們在數據上找到了影響結果的因素,這時候就需要去在業務層面上思考原因。

比如說,為了促進用戶轉化,我們發放了優惠券,但是后續發現券的使用很少,單量也沒有上升,這是數據維度的原因。

那業務層面的呢?為什么用戶都不用優惠券呢:

  • 用戶沒有發現優惠券的位置;
  • 用戶覺得優惠券額度小。

這時候有些猜測的原因可以通過數據來論證,而有些原因就需要去調研用戶;如果是優惠券的位置不明顯,我們就需要在產品上調整;如果是優惠券的額度太小,我們就需要去適當調整優惠力度。只有準確找到了業務原因,我們才能用策略根本性地解決它。

我發現很多時候,業務原因的定位是缺失的,往往我們在發現數據原因后,我們就開始思考運營策略了,指向性也非常強,激勵(抓手)+數據維度的改變,這種做法是比較粗糙的??赡芏唐趦扔行Ч?,但是一旦你激勵停止,業務還是會回到原來的狀態。

核心還是要找到業務改變的關鍵動作以及可以運營的業務場景,不能盲目的抓結果!

#專欄作家#

大鵬,公眾號:一個數據人的自留地。人人都是產品經理專欄作家,《數據產品經理修煉手冊》作者。

本文原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

給作者打賞,鼓勵TA抓緊創作!
更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 大家期待已久的《數據產品經理實戰訓練營》終于在起點學院(人人都是產品經理旗下教育機構)上線啦!經過迭代優化,現在已經第7期開啟報名啦
    本課程非常適合新手數據產品經理,或者想要轉崗的產品經理、數據分析師、研發、產品運營等人群。
    課程會從基礎概念,到核心技能,再通過典型數據分析平臺的實戰,幫助大家構建完整的知識體系,掌握數據產品經理的基本功。
    學完后你會掌握怎么建指標體系、指標字典,如何設計數據埋點、保證數據質量,規劃大數據分析平臺等實際工作技能~
    現在就添加空空老師(微信id:anne012520),咨詢課程詳情并領取福利優惠吧!

    回復