pandas數學聚合和分組運算的簡單基礎

什麼都不多說，注釋裡有解釋

from pandas import series,dataframe
import numpy as np
import os
df = dataframe()
print(df)
# 將'b'這一列拿出來,按「b」進行分組等操作
group = df.groupby(['b'])
print(group)
# group會自動去重，count()計算每組中非nan的個數
'''print(group.count())'''
# 每個組中非nan的平均值
'''print(df.groupby(['a','b']).mean())'''
# describe() 描述組內資料的基本統計量
b = ['one','two','one','two','two']
a = df.groupby(b).describe()
# 將結果儲存在csv檔案中，讀取csv檔案用read_scv()
if os.path.exists( r'c:\users\asus\desktop\python\資料分析\\01.csv' ) == false :
a.to_csv(r'c:\users\asus\desktop\python\資料分析\\01.csv','w')
print(a)
# head(n) 獲取每個組的前n行
df.groupby('b').head(2)
# transform() 的結果中屬於同行名的元素的值會相同
print(df.groupby('b').transform('mean'))

pandas聚合運算，分組運算

分組運算，先根據一定規則拆分後的資料，然後對資料進行聚合運算，如前面見到的 mean sum 等就是聚合的例子。聚合時，拆分後的第乙個索引指定的資料都會依次傳給聚合函式進行運算。最後再把運算結果合併起來，生成最終結果。先生成乙個dataframe 用key1的索引分類再求平均 df.groupby ...

pandas 分組聚合

綜合使用資料鏈結統計每個國家的星巴克的數量按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列然...

pandas資料分組和聚合操作

python for data analysis dataframe可以在其行 axis 0 或列 axis 1 上進行分組。然後，將乙個函式應用到各個分組並產生新值。最後，所有這些函式的執行結果會被合併到最終的結果物件中去。groupby的size方法可以返回乙個含有分組大小的series。for...

pandas數學聚合和分組運算的簡單基礎

pandas聚合運算，分組運算

pandas 分組聚合

pandas資料分組和聚合操作

相關推薦