DataFrame分組和聚合

2022-04-01 03:40:27 字數 1259 閱讀 1664

一、分組

1、語法

grouped= df.groupby(by='

columns name')

#grouped是乙個dataframegroupby物件,是可迭代的(遍歷)

#grouped中的每乙個元素都是乙個元祖

#元祖: (索引(分組的值), 分組之後的dataframe)

2、取值

grouped.count()                 #

獲取分組中非nan的數量

grouped.count()[['

m']] #

獲取m列索引的值, 注意 [['m']] 結果的type是dataframe

grouped.count()['

m'] #

獲取m列索引的值, 注意 ['m'] 結果的type是series

3、多個分組

#

多個分組

grouped= df.groupby(by=['

columns_name1

', '

columns_name2'])

#獲取分組後的某一部分資料

grouped = df1.groupby(by=['

o', 'n'

])grouped.count()['m

']或grouped['m

'].count()

#對某幾列資料進行分組

grouped = df1['

m'].groupby(by=[df1['

o'], df1['

n']]) #

series#或

grouped = df1[['

m']].groupby(by=[df1['

o'], df1['

n']]) #

dataframe

grouped.count()

二、聚合

dataframegroupby物件的聚合方法

函式名         說明

count 分組中非na的數量

sum 非na值的和

mean 非na值的平均值

median 非na值的中位數

std、var 標準差、方差

min、max 非na值中的最小值、最大值

pandas 分組聚合

綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...

pandas資料分組和聚合操作

python for data analysis dataframe可以在其行 axis 0 或列 axis 1 上進行分組。然後,將乙個函式應用到各個分組並產生新值。最後,所有這些函式的執行結果會被合併到最終的結果物件中去。groupby的size方法可以返回乙個含有分組大小的series。for...

七 資料聚合和分組運算

1.df data1 groupby df key1 呼叫 等價於對部分列進行索引 df.groupby df key1 data1 2.分組 groupby 1 選取乙個或一組列 data.groupby data ss ss1 2 通過函式進行分組 dataframe.groupby len 3...