乾貨 50題帶你入門Python資料分析(下)

2021-10-07 02:14:53 字數 4608 閱讀 7980

前天推送一篇乾貨 | 50題帶你入門python資料分析(上),今天帶來下篇。

結算時輸入優惠碼3pazju,折後滿150就能再減30

25顯示列唯一值

df[''].unique() ⚠️這裡顯示具體的唯一值

26顯示列唯一值個數

df[''].nunique() ⚠️這裡顯示的是唯一值個數
27

返回列最大/小值的索引

df[''].idxmax()
df[''].idxmin()
28

返回列前幾個大/小的元素值

df[''].nlargest(這裡指定幾個)
df[''].nsmallest(這裡指定幾個)
29

列的值進行截斷

df[''].clip(min,max)#這裡將小於min的值變成min,max同理

30列的值進行替換

df[''].replace("舊的","新的")

df.replace('列':""舊的","新的")

31

利用索引進行排序

df.set_index('列')
32

pandas畫折線圖

df.plot(x='', y='')

plt.show()

33

pandas畫條形圖

df.plot(x='', y='',kind='bar')

plt.show()

34

pandas畫水平條形圖

df.plot(x='', y=['',''],kind='barh')

plt.show()

35

pandas畫散點圖

df.plot(x='', y='',kind='scatter')

plt.show()

36

pandas畫餅圖

df.index= #重新定義顯示的索引

df.plot(x='', y='',kind='pie',legend=false) #設定不顯示圖例

plt.show()

37

pandas畫箱型圖

df.plot(y='',kind='box') #箱型圖非常有利於看資料分布

plt.show()

38

pandas畫直方圖

df.plot(y='',kind='hist') 

plt.show()

39

pandas畫多個圖在同一張畫布

df.plot(kind='',

y=['',''],

subplots=true, #多子圖並存

layout = (1,2), #子圖排列一行二列

title='',

figsize(10,5))

plt.show()

40

業務指標:計算月均消費次數

這裡我們以朝陽醫院銷售資料集為例:

月均消費次數=總消費次數 / 月份數

總消費次數:同一天內,同乙個人發生的所有消費算作一次消費。這裡我們根據列名(銷售時間,社群卡號)結合,如果這兩個列值同時相同,只保留1條,將重複的資料刪除

月份數:資料已經按照銷售時間進行排序,只需將最後的資料與第一條資料相減就可換算出月份數

#總消費次數計算

kpdf = salesdf.drop_duplicates(subset=['銷售時間','社保卡號'])

total = kpdf.shape[0]

print('總消費次數為:',total)

#月份數計算

startday = salesdf.loc[0,'銷售時間']

print('開始日期:',startday)

endday = salesdf.loc[salesdf.shape[0]-1,'銷售時間']

print('結束日期:',endday)

monthcount = (endday - startday).days//30

print('月份數:',monthcount)

#業務指標:月均消費次數=總消費次數 / 月份數

kpi1 = total / monthcount

print('業務指標1:月均消費次數=',kpi1)

41

業務指標:計算月均消費金額

月均消費金額 = 總消費金額 / 月份數

totalmoney = salesdf['實收金額'].sum()

kpi2 = totalmoney / monthcount

print('業務指標2:月平均消費金額=',kpi2)

42

業務指標:計算客單價

客單價=總消費金額 / 總消費次數

kpi3 = kpi2 / kpi1

print('業務指標3:客單價=',kpi3)

下面介紹有趣且實用的分析模型

43rfm模型

首先介紹一下什麼是rfm模型:rfm模型是以使用者的實際購買行為資料,將使用者群體進行分類,其中

r(recency):表示客戶最近一次購買的時間距離現在有多遠

f(frequency):表示用使用者在定義時間段內購買產品或服務的次數

m(monetary):表示使用者在定義時間段內購買產品或服務的金額 然後再更具r、f、m指標進行客戶的細緻分類:包括重要價值客戶、重要發展客戶、重要保持客戶、重要挽留客戶、一般價值客戶、一般發展客戶、一般保持客戶、一般挽留客戶等八類使用者。

再根據模型提出以下問題:1、誰是你最好的客戶 2、有哪些客戶在流逝的邊緣 3、有哪些客戶能轉化能為公司創造更多的價值 4、你必須保留哪些客戶 5、誰是你的忠實客戶 6、哪些客戶有最大的轉化率和可能性

可以檢視我的這篇文章: 44

aarrr模型

aarrr是acquisition、activation、retention、revenue、refer,這個五個單詞的縮寫,分別對應使用者生命週期中的5個重要環節。

45swot分析

swot(企業戰略分析方法)指swot分析法。swot分析,即基於內外部競爭環境和競爭條件下的態勢分析,就是將與研究物件密切相關的各種主要內部優勢、劣勢百和外部的機會和威脅等。

可以檢視我的這篇文章:

46star法則

star法則,即為situation target action result的縮寫,具體含義是:

situation: 事情是在什麼情況下發生

target 你是如何明確你的目標的

action: 針對這樣的情況分析,你採用了什麼行動方式

result: 結果怎樣,在這樣的情況下你學習到了什麼

簡而言之,star法則,就是一種講述自己故事的方式,或者說,是乙個清晰、條理的作文模板。不管是什麼,合理熟練運用此法則,可以輕鬆的對面試官描述事物的邏輯方式,表現出自己分析闡述問題的清晰性、條理性和邏輯性。

47hmw分析法

hmw是什麼?

how might we = 我們可以如何 = 有什麼辦法

找方向:hmw = 解決這個問題的方向,開啟思考的困局

拓展思路:把乙個小問題大幅拓展,把問題想透

頭腦風暴:暫時不需要考慮具體的方案,讓頭腦風暴更高效

創新點:讓每個吐槽都可能被變成創新點

hmw什麼時候用?

頭腦風暴前:解決頭腦風暴效率的問題

分析使用者反饋:在碰到使用者反饋,馬上用hmw分析

和領導pk:用hmw對付領導是乙個好辦法

六頂思考帽

推薦閱讀:我聽過關於「六頂思考帽」最通俗易懂的解釋

49緊急重要四象限

這對於我們平時資料分析或者安排工作是都很有幫助:

50複利思維模型

從下面兩組公式你看出了什麼?

不管做什麼工作,什麼身份,只要你每天堅持比別人多做一點點,人生的積累將會大不同。而如果你每天都懈怠一點點,你有的也幾乎會全部被剝奪。奧利給????

python入門乾貨 python基礎乾貨 01

1.編碼集 ascii 是最早的編碼 ascii值控制字元ascii值控制字元ascii值控制字元ascii值控制字元 nut space soha astxbb etxc ceotdd enqe eackff belggbs hhhti ilfjj vtkkff llcrm msonn siood...

python高階,終端入門乾貨(二)

1.1 重定向命令 重定向也稱為輸出重定向,把在終端執行命令的結果儲存到目標檔案。如果檔案存在會覆蓋原有檔案內容,相當於檔案操作中的 w 模式 如果檔案存在會追加寫入檔案末尾,相當於檔案操作中的 a 模式 終端內容儲存到檔案使用重定向有兩種方式 和 表示每次只寫入最新的資料,原有資料不保留。表示每次...

Python入門乾貨經驗 免費提供資料

建議一 跟著老師學,避免自己在琢磨的過程中,浪費太多時間,走太多彎路。但是我不建議花很多錢去報班,中國大學慕課裡有很多免費的課程 包括985高校在內提供的千餘門課程 可以搜尋 python 關鍵字找到很多相關的免費學習資料,如果是學生的話就更沒有必要浪費錢,錢多當我沒說 我初學 python 時在慕...