pandas中groupby常見操作

2021-10-06 01:39:09 字數 879 閱讀 5363

**基於jupyter實現

1. 引入依賴檔案,並定義乙個資料

import pandas as pd

import numpy as np

df = pd.dataframe(

)df

輸出:

2. reset_index() 表示重新設定索引

df.groupby(

['a'

,'b'])

.sum()

.reset_index(

)

輸出:

3. agg傳進來的統計特徵:按照 a 這一列作聚合,c 這一列作統計

df = df.groupby(

'b')

['c'

].agg(

['min'

,'max'

,'mean'

,'sum'

,'count'

,'std'

,'median'])

.reset_index(

)# reset_index()是為了重置索引項

df

輸出:

pandas資料處理之groupby的常用用法

groupby by none,axis 0,level none,as index true,sort true,group keys true,squeeze false,kwargs 用於確定groupby的組。如果by是乙個函式,那麼會呼叫物件索引的每個值。如果傳遞了乙個dict或serie...

pandas聚合函式groupby

1.groupby聚合函式彙總 min 最小值 max 最大值 sum 求和 mean 平均數 std 標準差 size 按照groupby的值計算該值的個數 與count函式的區別在於,size函式會計算nan值,而count函式不會計算nan值 count 計算個數 nunique 去掉重複值後...

pandas分組運算(groupby)

按a列分組 groupby 獲取其他列的均值 方法1 b df b groupby df a mean 按a列分組,獲取b列的均值 print b 方法2 b df.ix 1 groupby df.ix 0 mean 按a列分組 0對應a列,1對應b列 獲取b列的均值 print b 方法3 2.聚...