Pandas中分組計數且不計重複的實現

2021-09-01 19:57:39 字數 488 閱讀 7394

在對dataframe進行分析的時候會遇到需要分組計數,計數的column中屬性有重複,但又需要僅對不重複的項計數(即重複n次出現的項只計1次)。函式如下:

dataframe.groupby([『分組的列名』]).需要計數的列名.nunique()

舉例:陣列「data」如下:

storeid

sales

salesdate

channel

a100

2018/1/101a

902018/1/102a

1102018/1/201b

82.2

2018/1/101b

902018/1/2

02如果要按storeid來統計每一家店的營業日期數(可以通過不計重複的count 「salesdate」來完成)

**如下:

data.groupby(['storeid']).salesdate.nunique()

Pandas 實現分組計數且不計重複

在對dataframe進行分析的時候會遇到需要分組計數,計數的column中屬性有重複,但又需要僅對不重複的項計數 即重複n次出現的項只計1次 函式如下 dataframe.groupby 分組的列名 需要計數的列名.nunique 陣列 data 如下 storei程式設計客棧d sales sa...

演算法期中 分組

對於乙個整數數列a 0 a 1 a n 1 進行分組,要求每組1到2個數,並且同組之和不能大於w.求最少可以分成多少組.1 n 100000,1 a i w 1000000000.例1 當a w 5,minpartition a,w 返回3.將2和3放一組,4和5各自單獨作為一組,共3組.例2 當a...

pandas基礎分組

outputs source import numpy as np n import pandas as pd source 分組 group source 生成資料 outputs execution count 22 metadata output type execute result sou...