七 資料聚合和分組運算

2021-08-16 10:42:02 字數 666 閱讀 9285

1.

df[『data1』].groupby(df[『key1』])

呼叫 等價於對部分列進行索引: df.groupby(df[『key1』]) [『data1』]

2.分組(groupby)

(1)選取乙個或一組列 data.groupby(data[』ss』])[』ss1』]

(2)通過函式進行分組 dataframe.groupby(len)

(3)通過字典或者series進行分組 data.groupby(dict)

(4)通過索引級別分組 data.groupby(level=「級別名」)

(5)自定義分組鍵:group_key=[『east』]*4+[『west』]*4

3.資料聚合(從陣列產生標量值得資料轉換過程):

(1)sum,mean,min,count

(2)def 函式名:

add.函式名(通過agg呼叫自定義函式)

6.透視表和交叉表

透視表:它根據乙個或多個鍵對資料進行聚合,並根據行和列上的分組鍵將資料分配到各個矩形區域中。dataframe有乙個pivot_table方法,此外還有乙個頂級的pandas.pivot_table函式。除能為groupby提供便利外,pivot_table還可以新增分項小計(也叫做margins):margins=true

pandas聚合運算,分組運算

分組運算,先根據一定規則拆分後的資料,然後對資料進行聚合運算,如前面見到的 mean sum 等就是聚合的例子。聚合時,拆分後的第乙個索引指定的資料都會依次傳給聚合函式進行運算。最後再把運算結果合併起來,生成最終結果。先生成乙個dataframe 用key1的索引分類再求平均 df.groupby ...

利用Python進行資料聚合和分組運算

created by darren chen created on 2018 8 2 import pandas as pd import numpy as np import os,time,sys 像sql這種結構化查詢語言所執行的分組運算的種類十分有限 分組鍵的多種形式 1 列表或陣列,其長度...

python中資料聚合與分組運算

在資料分析處理中,對資料進行分組並對各組應用乙個函式 無論是聚合還是轉換 計算分組統計或生成透視表,是資料分析工作中的重要環節。python提供了乙個靈活高效的groupby功能,它可以使你能以一種自然的方式對資料集進行切片 切塊 摘要等操作。在python中主要有兩個模組 itertools和pa...