大資料分析工程師入門 資料分析的價值

2021-09-29 14:21:30 字數 3560 閱讀 3074

目前很多網際網路公司都有資料分析崗位,但是真正讓資料分析產生業務價值的公司少之又少。因此,本文結合作者自己多年資料分析的經驗和理解,來談談資料分析的價值,希望給從事資料分析工作或者對資料分析感興趣的讀者提供乙個思考資料分析價值的框架,更好地幫助大家利用好資料分析這個強有力的工具,最終讓資料分析產生業務價值,利用資料來驅動業務發展。

對於toc類產品,由於覆蓋的使用者範圍廣、使用者基數大,使用者千差萬別,背景各異。我們又很難對使用者進行透徹的了解(問卷調查也只能覆蓋一部分使用者,並且問卷調查得出的結論可能不一定真實反映整體使用者情況),因此產品怎麼更好地服務於使用者、真正對使用者產生價值是每個提供toc產品與服務的公司非常頭痛的問題。幸好,資料分析為我們了解使用者開啟了一扇窗,使用者在產品上的操作行為為我們了解使用者提供了「蛛絲馬跡」,使用者的操作行為也是使用者最真實意圖的反饋,通過分析使用者行為,我們可以對使用者進行更加細緻的了解,最終指導我們更好地迭代產品為使用者提供更好的服務體驗,通過使用者行為分析獲得的認知,也可以指導我們更好地運營內容及使用者。通過更好地服務使用者,借助合適的變現手段,最終產生商業價值。

深刻地理解和認識資料分析的價值,可以更好地幫助我們發展業務。而資料分析的價值,可以從多個維度來理解,下面我們在第

二、第三小節分別從資料分析本身及業務維度來講解資料分析的價值。

所謂資料分析,就是利用一些資料分析工具、手段、方法或者思維,從海量和異構的資料中發現規律,從而揭示出資料背後的真相,為我們提供決策的依據,指導業務發展。從資料分析本身的方法和形式來看,資料分析的價值體現在如下6個層面。

通過將一些重要的日常關鍵指標,比如每日新增使用者數、dau(daily active user)、會員使用者活躍度、會員購買率等,通過資料視覺化的方式展現出來,可以讓公司老闆或者業務負責人對整體核心資料有乙個整體的了解,能夠把握大的趨勢。這類資料分析的產出一般通過資料包表、dashboard等方式呈現出來。阿里雙十一大屏實時展示總成交量(gmv)就屬於這類價值產出形式。

不管怎樣,對於處在某個發展階段的某個公司,作為資料分析師和資料產品經理,一定要提煉出最具價值的核心指標供公司管理層用於決策(很多核心指標就直接**於管理層的需要),並且具備從不同維度來分解展示資料指標的能力(資料下鑽)。核心指標展示也會為下面其他維度的資料價值體現提供線索和依據。

資料分析的解釋價值,更多是比較簡單的情況導致的問題或者異常,也就是原因是單方面的,這種問題往往容易發現,通過簡單資料分析就可以搞定,而下面的歸因分析可能就是更加複雜的情況了。

歸因不像上面的解釋,可能引起的原因是多方面的,複雜的,歸因分析需要找到引起問題的主要原因,通過解決主要矛盾來避免問題惡化或者提公升資料指標,比如找出使用者流失率高的原因。這些分析原因的過程及總結可以沉澱為對產品和使用者的深刻洞察。

不管是解釋還是歸因,都需要進行多維度的分析比較,將核心指標層層拆解,從中發現問題的蛛絲馬跡。並且需要豐富的業務知識和資料分析技巧,才能從紛繁無渣的現象中發現問題的本質。

**是對產品未來趨勢的判斷,有了精準的判斷可以指導經營活動。比如,如果我們可以相對精準地**廣告庫存,就可以指導我們更好地進行廣告的銷售與投放。**dau、銷量、訂單量等等都是常用的形式。

資料指標的**需要構建數學模型(比如時間序列模型),我們通過歷史資料和提取的重要特徵來構建模型,具體選擇什麼維度作為特徵,需要行業經驗及對相關**問題有深刻的理解,因此對資料分析師有一定的要求,不只是簡單的資料分析,需要懂機器學習或者熟悉業務特徵。

預防是有針對性的防禦措施,是提前思考產品迭代或者運營推廣可能會產生的(負面)影響,針對每類影響確定可能帶來的後果及可行的應對策略。比如產品在首次開啟廣告商業化嘗試時,預估到廣告可能會對使用者體驗的傷害,我們需要從多個維度定義一些統計資料和指標,對廣告投放前後的指標進行比較分析,有針對性地提供一些在出現不利某些情況下(比如使用者留存率下降、投訴增多等)的應對方案。再比如,通過**雙十一可能產生的流量高峰,事先對伺服器進行擴容,避免大流量衝擊對業務造成影響。

預防是一種事前防禦策略,資料分析在其中的作用可以是對將要發生的事件的預判(如上面的**雙十一的流量高峰),也可以對資料指標的監控,根據指標的變化實時對業務進行動態調整。

決策是資料分析的終極價值體現形式,是通過各種維度資料對比、交叉分析、趨勢分析,形成產品迭代、運營的最終解決方案,期望通過該方案的落地執行,提公升產品的使用者體驗與創造商業價值。所有資料分析的最終目的是指導運營與決策。

比如,通過資料分析發現某個頁面使用者體驗很差,進而提出優化該頁面的方案,這就是一種決策過程。又例如,通過渠道分析,對比各個渠道新使用者的留存,再結合各個渠道的推廣費用,挖掘出優質的、價效比高的渠道,從而加大在該渠道上的推廣。這些都是利用資料分析進行決策的例子。

資料分析與挖掘主要的價值體現是上面的6大類,其中(1)、(2)、(3)是對資料的事後探索分析,即對已經發生的事件進行分析、形成結論,(4)、(5)、(6)是事先的決策,在事件發生之前,形成應對方案、解決方案,提前規劃。後面的**、預防、決策也依賴於前面(1)、(2)、(3)的各種探索與分析。

資料分析的價值要想很好體現出來,需要利用探索分析最終形成指導產品迭代優化與運營的最終決策方案。可以說事先決策是比事後探索分析更高階更有難度的價值體現形式,作為資料分析師一定要有從事後探索分析進化到事先決策的意識,這樣才能有更大的成長,也更能發揮資料分析的價值。

簡單來說,toc網際網路產品的總收益等於活躍使用者數 ✖️轉化率 ✖️客單價(真實的收益計算比這個複雜得多,這個公式只是乙個最初略的簡化模型),因此,是否有海量的活躍使用者是公司能否獲得較大商業利潤的前提。

因此,良好的公司經營就一定要提公升使用者體驗,為使用者創造價值,通過發展使用者、提公升活躍使用者規模、提公升客單價,通過廣告、會員等各種商業化形式來獲得商業利潤。

那麼,基於業務價值維度來考慮,資料分析就應該從上面提到的幾點來著手,通過挖掘資料的價值,服務好使用者,最終為公司運營獲得更多的商業利潤。具體來說,資料分析的商業價值主要體現在如下3個維度。

公司的目標是通過服務使用者的同時,最終從使用者身上掙取商業利潤。因此,資料驅動最終的目標也是更好地幫公司做商業化。

對於上面提到的核心指標,我們需要形成資料包表,進行監控,時刻關注指標的變動,通過分析拆解指標,發現問題,尋找原因,甚至是找到提公升這些指標的突破口。通過資料分析、挖掘、構建使用者畫像,進行精準的使用者運營也是一種非常有效的提公升變現能力的手段,同時,多維度的資料分析也可以更好地幫助業務方進行廣告、會員的日常運營決策。

對資料分析從業者來說,除了有很好的資料分析專業素養,是否有業務高度,是否能夠將資料分析跟公司的業務結合起來,特別是跟商業價值結合起來,通過資料分析來驅動業務發展,是核心所在。乙個好的、對公司有價值的資料分析師,一定是乙個商業分析師,他時刻會將提公升使用者體驗、通過資料驅動公司業務發展、通過資料為公司產生商業價值作為衡量資料分析價值的最終標準。

對領導或者公司管理層來說,不能只靠拍腦袋來做決策,除非你覺得自己像賈伯斯一樣牛,能夠洞察需求的本質,甚至創造使用者需求,否則需要形成利用資料做決策的思維意識,至少要利用資料去支撐你的觀點。要善用一切資料來獲得對使用者和產品的洞察,最終用資料說話,否則資料分析崗位形同虛設,資料分析也將流於形式。

隨著大資料技術的發展與成熟,大資料行業應用的不斷深入。使用者行為甚至是跨域、多維度的資料分析越來越受到重視,有資料驅動意識、能夠很好地從資料中發現規律並充分利用這些規律的公司才能夠在激烈的市場競爭中更好地生存下來,是否能夠利用資料來驅動業務發展已經成為公司的核心競爭力。

大資料分析工程師和大資料開發工程師分別能做什麼

通俗解釋開發和分析 非要把他倆分開的話,乙個是偏向於資料,乙個偏向於工程。好比要炒個菜,工程師是燒火 墊勺的那個,偏向於工具的使用。分析師是放調理 掌握火候的那個,偏向菜怎麼做好吃。資料影響生活 資料越來越多的影響並塑造著那些我們每天都要互動的系統。不管是你使用siri,google搜尋,還是瀏覽f...

大資料分析入門

1.大資料的職責和能力 1.類似 資料分析師和資料探勘工程師 又有些不同。2.需要熟悉大資料各類sql外,hadoop,python或scala有一定掌握。3.工作內容 資料採集 清洗和預處理 大資料平台上的資料倉儲的建設 離線資料統計指令碼的開發 實時資料處理作業開發 日常取數和分析 資料視覺化 ...

大資料工程師和資料分析師有何區別?

近幾年,隨著科技的日新月異,許多之前沒有聽過的名詞接踵而出。比如雲計算,比如大資料,可以說雲計算的誕生催生了大資料。所謂大資料,gartner研究機構給出的定義是這樣的 一種需要具有更強決策力 洞察發現力以及流程優化能力的全新處理模式,以此來適應海量多樣化的資訊資產。筆者認為,大資料並非簡單的一種概...