pandas數學聚合和分組運算的簡單基礎

2021-09-27 06:24:43 字數 865 閱讀 8966

什麼都不多說,注釋裡有解釋

from pandas import series,dataframe

import numpy as np

import os

df = dataframe()

print(df)

# 將'b'這一列拿出來,按「b」進行分組等操作

group = df.groupby(['b'])

print(group)

# group會自動去重,count()計算每組中非nan的個數

'''print(group.count())'''

# 每個組中非nan的平均值

'''print(df.groupby(['a','b']).mean())'''

# describe() 描述組內資料的基本統計量

b = ['one','two','one','two','two']

a = df.groupby(b).describe()

# 將結果儲存在csv檔案中,讀取csv檔案用read_scv()

if os.path.exists( r'c:\users\asus\desktop\python\資料分析\\01.csv' ) == false :

a.to_csv(r'c:\users\asus\desktop\python\資料分析\\01.csv','w')

print(a)

# head(n) 獲取每個組的前n行

df.groupby('b').head(2)

# transform() 的結果中屬於同行名的元素的值會相同

print(df.groupby('b').transform('mean'))

pandas聚合運算,分組運算

分組運算,先根據一定規則拆分後的資料,然後對資料進行聚合運算,如前面見到的 mean sum 等就是聚合的例子。聚合時,拆分後的第乙個索引指定的資料都會依次傳給聚合函式進行運算。最後再把運算結果合併起來,生成最終結果。先生成乙個dataframe 用key1的索引分類再求平均 df.groupby ...

pandas 分組聚合

綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...

pandas資料分組和聚合操作

python for data analysis dataframe可以在其行 axis 0 或列 axis 1 上進行分組。然後,將乙個函式應用到各個分組並產生新值。最後,所有這些函式的執行結果會被合併到最終的結果物件中去。groupby的size方法可以返回乙個含有分組大小的series。for...