對於pandas統計分析,不要太簡單

2021-10-07 09:21:54 字數 1684 閱讀 6521

import pandas as pd

import numpy as np

# 載入資料

detail = pd.read_excel(

'./meal_order_detail.xlsx'

)# print(detail)

# 列名

# print(detail.columns)

# 最大值

print

(detail.loc[:,

'amounts'].

max())

# 最小值

print

(detail.loc[:,

'amounts'].

min())

# 均值

print

(detail.loc[:,

'amounts'

].mean())

# 中位數

print

(detail.loc[:,

'amounts'

].median())

# 標準差

print

(detail.loc[:,

'amounts'

].std())

# 方差

print

(detail.loc[:,

'amounts'

].var())

# 最小值座標

print

(detail.loc[:,

'amounts'

].idxmin())

# 最大值座標

print

(detail.loc[:,

'amounts'

].idxmax())

# 眾數

print

(detail.loc[:,

'amounts'

].mode()[

0])# 非空資料的數量

print

(detail.loc[:,

'amounts'

].count())

# 分位數

q = np.arange(0,

1.25

,0.25

)print

(detail.loc[:,

'amounts'

].quantile(q=q)

)# 描述多個結果

print

(detail.loc[:,

'amounts'

].describe())

print

(detail.loc[:,

'dishes_name'

].describe())

detail.loc[:,

'amounts'

]= detail.loc[:,

'amounts'

].astype(

'category'

)print

(detail.loc[:,

'amounts'

].describe()[

['top'

,'freq']]

)# 統計某列各個元素出現的次數

print

(pd.value_counts(detail.loc[:,

'dishes_name'])

)

pandas的統計分析

import pandas as pd import numpy as np data pd.read excel meal order detail.xlsx print data n data print data 的列索引 n data.columns print data 的資料型別 n d...

pandas統計分析基礎(2)

pandas描述性統計方法的常見方法 方法統計含義 方法統計含義 min最小值 max最大值 mean 均值count 非空數目 median 中位數mode 眾數std 標準差var 方差cov 協方差ptp 極差skew 樣本偏度 kurt 樣本峰度 sem標準誤差 quantile 四分位數 ...

pandas的資料累計統計分析

本文的主要內容是基於中國大學mooc 慕課 中的 python資料分析與視覺化 課程進行整理和總結。資料的累計統計分析是能夠對序列中的前n個數進行累計運算,對於一些大量的資料分析中,可以減少for迴圈的使用,也使得資料的運算變得更加靈活。pandas提供了一組資料累計統計分析函式,這些函式都適用於s...