pandas彙總和計算描述統計

2021-09-07 09:24:22 字數 1309 閱讀 5506

pandas 物件擁有一組常用的數學和統計方法。 他們大部分都屬於簡約和匯**計, 用於從series中提取單個值(如sum或mean)

或從dataframe的行或列中提取乙個series。跟對應的numpy陣列方法對比, 他們都是基於沒有缺失資料的假設而構建的。

看例子:

呼叫dataframe的sum方法將會返回乙個含有列小計的series:

傳入axis=1 將會按行進行求和運算:

除非整個切片(這裡指的是行或列)都是na。通過skipna選項可以禁用該功能:

d1.count() #非空元素計算

d1.min() #最小值

d1.max() #最大值

d1.idxmin() #最小值的位置,類似於r中的which.min函式

d1.idxmax() #最大值的位置,類似於r中的which.max函式

d1.quantile(

0.1) #10%分位數

d1.sum() #求和

d1.mean() #均值

d1.median() #中位數

d1.mode() #眾數

d1.var

() #方差

d1.std() #標準差

d1.mad() #平均絕對偏差

d1.skew() #偏度

d1.kurt() #峰度

d1.describe() #一次性輸出多個描述性統計指標

pandas入門 彙總和計算描述統計

from pandas import dataframe,series import numpy as np df dataframe 1.4,np.nan 7.1,4.5 np.nan,np.nan 0.75,1.3 index a b c d columns one two print df o...

Pandas 基礎 (4) 彙總和計算描述統計

pandas 物件擁有一組常用的數學和統計方法,他們大部分都屬於約簡和匯 計,用於從 series 中提取單個值 如 sum mean 或者從 dataframe 的行或列中提取乙個 series。in 144 df dataframe 1,np.nan 2,3 np.nan,np.nan 0,2 ...

Pandas 描述統計函式

在進行統計描述時,pandas對三個資料物件的軸引數規定如下 series 沒有軸引數 dataframe index axis 0,default columns axis 1 panel items axis 0 major axis 1,default minor axis 2 統計描述引數如...