pandas聚合運算,分組運算

2021-10-23 20:54:39 字數 2638 閱讀 6816

分組運算,先根據一定規則拆分後的資料,然後對資料進行聚合運算,如前面見到的 mean(), sum() 等就是聚合的例子。聚合時,拆分後的第乙個索引指定的資料都會依次傳給聚合函式進行運算。最後再把運算結果合併起來,生成最終結果。

先生成乙個dataframe

)#用key1的索引分類再求平均

df.groupby(

'key1').

sum(

)#用key1的索引分類再求和

df.groupby(

'key1').

min(

)#用key1的索引分類再求最小值

df.groupby(

'key1').

max(

)#用key1的索引分類再求最大值

df.groupby(

'key1'

).describe(

)#用key1的索引分類,對每個分組運用一系列的內建函式

func的引數為groupby索引對應的記錄

grouped=df.groupby(

'key1'

)def

peak_range

(s):

print

(type

(s))

##引數為索引所對應的記錄

# 同時應用多個聚合函式

grouped.agg(

['mean'

,'std'

,'sum'

, peak_range]

)# 針對data求4個聚合資料平均值,標準差,和,波動幅度

)#根據key1分組求平均值,順麵改一下列名稱前面加mean_

)#把錶2拼接到表1右邊

)#transform函式沒看懂,一會再搜一下把

k1_mean

df[k1_mean.columns]

= k1_mean#給原來的k1新加兩個列,也是合併

df

pandas分組運算(groupby)

按a列分組 groupby 獲取其他列的均值 方法1 b df b groupby df a mean 按a列分組,獲取b列的均值 print b 方法2 b df.ix 1 groupby df.ix 0 mean 按a列分組 0對應a列,1對應b列 獲取b列的均值 print b 方法3 2.聚...

pandas數學聚合和分組運算的簡單基礎

什麼都不多說,注釋裡有解釋 from pandas import series,dataframe import numpy as np import os df dataframe print df 將 b 這一列拿出來,按 b 進行分組等操作 group df.groupby b print g...

pandas 分組聚合

綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...