pandas 常見的統計方法

2021-09-26 15:11:30 字數 642 閱讀 8680

pandas 常見的統計方法方法

說明count

非 na 值的數量

describe

針對 series 或 df 的列計算匯**計

min , max

最小值和最大值

argmin , argmax

最小值和最大值的索引位置(整數)

idxmin , idxmax

最小值和最大值的索引值

quantile

樣本分位數(0 到 1)

sum求和

mean

均值median

中位數mad

根據均值計算平均絕對離差

var方差

std標準差

skew

樣本值的偏度(三階矩)

kurt

樣本值的峰度(四階矩)

cumsum

樣本值的累計和

cummin , cummax

樣本值的累計最大值和累計最小值

cumprod

樣本值的累計積

diff

計算一階差分(對時間序列很有用)

pct_change

計算百分數變化

prod

不同維度上的乘積

pandas 常用統計方法

pandas 物件有一些統計方法。它們大部分都屬於約簡和匯 計,用於從 series 中提取單個值,或從 dataframe 的行或列中提取乙個 series。比如dataframe.mean axis 0,skipna true 方法,當資料集中存在 na 值時,這些值會被簡單跳過,除非整個切片 ...

Pandas常見的效能優化方法

pandas是資料科學和資料競賽中常見的庫,我們使用pandas可以進行快速讀取資料 分析資料 構造特徵。但pandas在使用上有一些技巧和需要注意的地方,如果你沒有合適的使用,那麼pandas可能執行速度非常慢。本文將整理一些pandas使用技巧,主要是用來節約記憶體和提高 速度。在pandas中...

Pandas 資料清洗常見方法

df pd.read csv 檔名稱 df.info df.shapedf.describe df.drop duplicates inplace true data.reset index inplace true,drop true data.loc data 列名 isnull 01 每一列資...