pandas 聚合函式

2021-10-09 06:26:05 字數 1113 閱讀 2472

將對一列進行計算返回乙個值

方法描述

series.all([axis, bool_only, skipna, level])

是否全為true

series.any([axis, bool_only, skipna, level])

是否有乙個為true

series.corr(other[, method, min_periods])

相關性series.count([level])

series.cov(other[, min_periods])

協方差series.cummax([axis, skipna])

series.cummin([axis, skipna])

series.cumprod([axis, skipna])

累乘series.cumsum([axis, skipna])

累加series.kurt([axis, skipna, level, numeric_only])

峰度series.max([axis, skipna, level, numeric_only])

最大值series.mean([axis, skipna, level, numeric_only])

平均值series.median([axis, skipna, level, …])

中位數series.min([axis, skipna, level, numeric_only])

最小值series.prod([axis, skipna, level, numeric_only])

乘積series.quantile([q, interpolation])

分位數series.skew([axis, skipna, level, numeric_only])

偏度series.std([axis, skipna, level, ddof, …])

標準差series.sum([axis, skipna, level, numeric_only])

求和series.var([axis, skipna, level, ddof, …])

方差series.is_unique

series.str.cat

拼貼字串

pandas聚合函式groupby

1.groupby聚合函式彙總 min 最小值 max 最大值 sum 求和 mean 平均數 std 標準差 size 按照groupby的值計算該值的個數 與count函式的區別在於,size函式會計算nan值,而count函式不會計算nan值 count 計算個數 nunique 去掉重複值後...

pandas 分組聚合

綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...

pandas聚合運算,分組運算

分組運算,先根據一定規則拆分後的資料,然後對資料進行聚合運算,如前面見到的 mean sum 等就是聚合的例子。聚合時,拆分後的第乙個索引指定的資料都會依次傳給聚合函式進行運算。最後再把運算結果合併起來,生成最終結果。先生成乙個dataframe 用key1的索引分類再求平均 df.groupby ...