基礎的資料分析

2021-07-25 00:27:26 字數 3349 閱讀 2828

什麼是資料分析?

資料分析是指用適當的統計分析對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。在實用中,資料分析可幫助人們作出判斷,以便採取適當行動。

資料分析的目的是什麼?

資料分析的目的是把隱沒在一大批看來雜亂無章的資料中的資訊集中、萃取和提煉出來,以找出所研究物件的內在規律。

在實用中,資料分析可幫助人們作出判斷,以便採取適當行動。資料分析是組織有目的地收集資料、分析資料,使之成為資訊的過程。在產品的整個壽命週期,包括從市場調研到售後服務和最終處置的各個過程都需要適當運用資料分析過程,以提公升有效性。

在企業裡面,資料分析可以幫助我們掌握企業的運營狀況,商品的**情況,使用者的特徵、產品的粘性、等等。

資料分析的步驟?

資料分析的步驟

1.首先明確分析的思路和目的:

資料分析一定的帶著某種業務目的的。它可能是要追蹤乙個新產品上線之後的使用者使用情況;也可能是觀察使用者在某段時間的留存情況,還有可能是運營某種優惠券是否有效。帶著一定的目的,確定要從哪幾個角度進行分析。然後找到能夠說明目的的指標。

比如想要驗證運營最近的一批優惠券是否有效。我們可以從優惠券的領取情況和優惠券的使用情況兩個方面分析,而優惠券的領取情況的指標可以細化為領取率;使用情況可細化為:使用率、客單價等。

2.資料的收集:

在確定了此次資料分析的核心指標後,就要針對資料指標做資料收集。

有些企業的資料準備非常充分,資料倉儲、資料集市等早早就建設好。有一些企業在資料分析上比較落後,那就需要我們自己做前期大量的資料收集工作。比如使用一些自己公司的或者第三方的資料分析工具進行埋點,拿到日誌。或者使用資料庫中的現有資料,比如訂單資料、基礎的使用者資訊等等。

3.資料處理:

資料提取出來之後,要剔除髒資料(清洗),然後資料轉化。在進行最基本的資料彙總、聚合之後,我們就可以拿到比較簡單的字段相對豐富的資料寬表。

4.資料分析:

資料分析是用適當的分析方法及工具,對處理過的資料進行分析,提取有價值的資訊,形成有效結論的過程。

一般公司所需要觀察的資料大致分為如下幾類:

商業資料:付費金額,付費使用者數,付費率客單價

運營資料:新增使用者數,日活、周活、月活(aarrr模型)

產品資料:關鍵頁面的pv、uv(漏斗模型)

使用者資料:使用者生命週期、使用者留存、使用者客單價、使用者型別(rfm模型...)

商品資料:商品售賣情況,毛利分析....

隨著資料的重要性的凸顯,越來越多的公司已經認識到資料對於公司的經營是十分重要的。所以絕大部分企業都有專門的bi部門進行初步的資料加工、分析,以周報表的形式彙總給管理層做為日常資料所需以及企業決策使用。

在這裡主要介紹兩個簡單的資料分析模型:

aarrr模型:

acquisition(獲取)、activation(活躍)、retention(留存)、revenue(收益)、refer(傳播)

aarrr模型

1.獲取使用者(acquisition)

2.提高活躍度(activation)

產品策略上,除了提供運營模組和內容深化。進行產品會員激勵機制成長體制進行活躍使用者。不僅商品優惠的,vip等標示的icon,對於長業務流程,進行流程激勵體制,產品策略更具多元化。

3.提高留存率(retention)

通過日留存率、周留存率、月留存率等指標監控應用的使用者流失情況,並採取相應的手段在使用者流失之前,激勵這些使用者繼續使用應用。

4.獲取收入(revenue)

獲取收入其實是應用運營最核心的一塊。即使是免費應用,也應該有其盈利的模式。

收入**主要有三種:付費應用、應用內付費、以及廣告。付費應用在國內的接受程度很低,包括google play store在中國也只推免費應用。在國內,廣告是大部分開發者的收入**,而應用內付費目前在遊戲行業應用比較多。

前面所提的提高活躍度、提高留存率,對獲取收入來說,是必需的基礎。使用者基數大了,收入才有可能上量。

5.自傳播(refer)

以前的運營模型到第四個層次就結束了,但是社交網路的興起,使得運營增加了乙個方面,就是基於社交網路的病毒式傳播,這已經成為獲取使用者的乙個新途徑。這個方式的成本很低,而且效果有可能非常好;唯一的前提是產品自身要足夠好,有很好的口碑。

從自傳播到再次獲取新使用者,應用運營形成了乙個螺旋式上公升的軌道。而那些優秀的應用就很好地利用了這個軌道,不斷擴大自己的使用者群體。

漏斗模型:

使用者訪問的路徑

漏斗模型

漏斗模型廣泛應用於流量監控、產品目標轉化等日常資料運營工作中。之所以稱為漏斗,就是因為使用者(或者流量)集中從某個功能點進入(這是可以根據業務需求來自行設定的),可能會通過產品本身設定的流程完成操作。

按照流程操作的使用者進行各個轉化層級上的監控,尋找每個層級的可優化點;對沒有按照流程操作的使用者繪製他們的轉化路徑,找到可提公升使用者體驗,縮短路徑的空間。

運用漏斗模型比較典型的案例就是電商**的轉化,使用者在選購商品的時候必然會按照預先設計好的購買流程進行下單,最終完成支付。

需要注意的是:單一的漏斗模型對於分析來說沒有任何意義,我們不能單從乙個漏斗模型中評價**某個關鍵流程中各步驟的轉化率的好壞,所以必須通過趨勢、比較和細分的方法對流程中各步驟的轉化率進行分析:

趨勢(trend): 從時間軸的變化情況進行分析,適用於對某一流程或其中某個步驟進行改進或優化的效果監控;

比較(compare):通過比較類似產品或服務間購買或使用流程的轉化率,發現某些產品或應用中存在的問題;

細分(segment):細分**或不同的客戶型別在轉化率上的表現,發現一些高質量的**或客戶,通常用於分析**的廣告或推廣的效果及roi。

5.資料展現:

資料視覺化-基本的圖表

資料視覺化是關於資料視覺表現形式的科學技術研究。其中,這種資料的視覺表現形式被定義為,一種以某種概要形式抽提出來的資訊,包括相應資訊單位的各種屬性和變數。

圖表是"資料視覺化"的常用手段,其中又以基本圖表----柱狀圖、折線圖、餅圖等等----最為常用。

資料視覺化-圖表

有人覺得,基本圖表太簡單、太原始,不高階,不大氣,因此追求更複雜的圖表。但是,越簡單的圖表,越容易理解,而快速易懂地理解資料,不正是"資料視覺化"的最重要目的和最高追求嗎?

所以,請不要小看這些基本圖表。因為使用者最熟悉它們,所以只要是適用的場合,就應該考慮優先使用。

資料分析基礎

import numpy as npimport pandas aspd import scipy import matplotlib.pyplot asplt 資料匯入 df pd.read csv r encoding gbk print df.head 前五行 print df.tail 最後...

資料分析基礎學習

2018 09 24 資料分析 匯入資料 資料格式 先修改csv檔案內容的部分格式。正在執行 錯誤 訊息 錯誤 0xc02020a1 資料流任務 1 資料轉換失敗。列 寄投位址 的資料轉換返回狀態值 4 和狀態文字 文字被截斷,或者乙個或多個字元在目標 頁中沒有匹配項。sql server 匯入和匯...

python基礎資料分析

單樣本t檢驗 乙個連續變數與乙個數值的顯著性關係 sm.stats.descrstatsw a b ttest mean 0.1 0.1為引數 雙樣本t檢驗 乙個分類變數 二分類 與乙個連續變數的顯著性關係 方差齊性檢查 a1 creditcard exp a b 0 c a2 creditcard...