資料分析的pandas常用方法

2021-10-03 20:49:58 字數 695 閱讀 5917

pandas模組為我們提供了非常多的描述性統計分析的指標函式,如總和、均值、最小值、最大值等,我們來具體看看這些函式:

首先隨機生成三組資料

np.random.seed(1234)

d1=pd.series(2*np.random.normal(size=100)+3)

d2=np.random.f(2,4,size=100)

d3=np.random.randint(1,100,size=100)

d1.count()#非空元素計算

d1.min()#最小值

d1.max()#最大值

d1.idxmin()#最小值的位置,類似於r中的which.min函式

d1.idxmax()#最大值的位置,類似於r中的which.max函式

d1.quantile(0.1)#10%分位數

d1.sum()#求和

d1.mean()#均值

d1.median()#中位數

d1.mode()#眾數

d1.var()#方差

d1.std()#標準差

d1.mad()#平均絕對偏差

d1.skew()#偏度

d1.kurt()#峰度

d1.describe()#一次性輸出多個描述性統計指標

必須注意的是,descirbe方法只能針對序列或資料框,一維陣列是沒有這個方法

Pandas資料分析常用方法

指定索引列 names 列名陣列,預設值 none,用於讀取資料的指定列名 eg1 catering sale catering sale.xls data pd.read excel catering sale,names date sale 外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接...

pandas資料分析之常用方法

前言 pandas是python中進行資料處理的乙個非常有用的庫,利用好pandas,可以十分方便的對資料進行處理以及統計分析 直接上 一.pandas資料處理 1.1 pandas中刪除dataframe中行 列 dataframe中刪除滿足條件的行 df df.drop df df.col na...

資料分析 pandas

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...