DataFrame分組和聚合

一、分組

1、語法

grouped= df.groupby(by='
columns name')
#grouped是乙個dataframegroupby物件，是可迭代的(遍歷)
#grouped中的每乙個元素都是乙個元祖
#元祖： (索引(分組的值), 分組之後的dataframe)

2、取值

grouped.count()                 #
獲取分組中非nan的數量
grouped.count()[['
m']] #
獲取m列索引的值， 注意 [['m']] 結果的type是dataframe
grouped.count()['
m'] #
獲取m列索引的值， 注意 ['m'] 結果的type是series

3、多個分組

#
多個分組
grouped= df.groupby(by=['
columns_name1
', '
columns_name2'])
#獲取分組後的某一部分資料
grouped = df1.groupby(by=['
o', 'n'
])grouped.count()['m
']或grouped['m
'].count()
#對某幾列資料進行分組
grouped = df1['
m'].groupby(by=[df1['
o'], df1['
n']]) #
series#或
grouped = df1[['
m']].groupby(by=[df1['
o'], df1['
n']]) #
dataframe
grouped.count()

二、聚合

dataframegroupby物件的聚合方法

函式名         說明
count 分組中非na的數量
sum 非na值的和
mean 非na值的平均值
median 非na值的中位數
std、var 標準差、方差
min、max 非na值中的最小值、最大值

pandas 分組聚合

綜合使用資料鏈結統計每個國家的星巴克的數量按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列然...

pandas資料分組和聚合操作

python for data analysis dataframe可以在其行 axis 0 或列 axis 1 上進行分組。然後，將乙個函式應用到各個分組並產生新值。最後，所有這些函式的執行結果會被合併到最終的結果物件中去。groupby的size方法可以返回乙個含有分組大小的series。for...

七資料聚合和分組運算

1.df data1 groupby df key1 呼叫等價於對部分列進行索引 df.groupby df key1 data1 2.分組 groupby 1 選取乙個或一組列 data.groupby data ss ss1 2 通過函式進行分組 dataframe.groupby len 3...

DataFrame分組和聚合

pandas 分組聚合

pandas資料分組和聚合操作

七 資料聚合和分組運算

相關推薦

七資料聚合和分組運算