Pandas 資料去重

2021-10-09 21:35:47 字數 333 閱讀 8579

drop_duplicats()方法去重

對 dataframe 資料去重

示例:df.drop_duplicats(subset = [『month』,『day』,『time』],keep=『last』,inplace=true)

drop_duplicats引數說明:

引數subset

subset用來指定特定的列,預設所有列

引數keep

keep可以為first和last,表示是選擇最前一項還是最後一項保留,預設first

引數inplace

inplace是直接在原來資料上修改還是保留乙個副本,預設為false

pandas 資料去重

讀取csv格式的資料 df pd.read csv data imdb movie data.csv 去重 統計導演的人數 法1 director count1 len set df director tolist print director count1 去重 統計導演的人數 法2 direct...

pandas去重方法

資料去重可以使用duplicated 和drop duplicates 兩個方法。dataframe.duplicated subset none,keep first 返回boolean series表示重複行 引數 subset 列標籤或標籤序列,可選 僅考慮用於標識重複項的某些列,預設情況下使...

pandas 22 資料去重處理

資料去重可以使用duplicated 和drop duplicates 兩個方法。dataframe.duplicated subset none,keep first 返回boolean series表示重複行 引數 subset 列標籤或標籤序列,可選 僅考慮用於標識重複項的某些列,預設情況下使...