Pandas詳解二十一之移除重複資料

2021-08-21 17:42:35 字數 1260 閱讀 1217

約定

import pandas as pd
dataframe中經常會出現重複行,利用duplicated()函式返回每一行判斷是否重複的結果(重複則為true),drop_duplicates([key1,key2,..])則可去除重複行。

1 判斷每一行是否重複

df1=pd.dataframe()

print(df1)

a  b

0 1 a

1 1 a

2 1 b

3 2 b

4 2 b

5 3 c

df1.duplicated()
0    false

1 true

2 false

3 false

4 true

5 false

dtype: bool

2 去除全部的重複行

print(df1.drop_duplicates())
a  b

0 1 a

2 1 b

3 2 b

5 3 c

3 指定列去除重複行

print(df1.drop_duplicates(['a']))
a  b

0 1 a

3 2 b

5 3 c

4 保留重複行中的最後一行

print(df1.drop_duplicates(['a'],keep='last'))
a  b

2 1 b

4 2 b

5 3 c

5 去除重複的同時改變dataframe物件

df1.drop_duplicates(['a','b'],inplace=true)

print(df1)

a  b

0 1 a

2 1 b

3 2 b

5 3 c

謝謝大家的瀏覽,

希望我的努力能幫助到您,

共勉!

Swift 學習之二十一 ?和 !(詳解)

swift語言使用var定義變數,但和別的語言不同,swift裡不會自動給變數賦初始值,也就是說變數不會有預設值,所以要求使用變數之前必須要對其初始化 如果在使用變數之前不進行初始化就會報錯 plain view plain copy print var stringvalue string err...

(二十一)Python學習之模組初識

一 模組的概念 在python中,乙個.py檔案就稱之為乙個模組 module 使用模組最大的好處是提高了 的可維護性。二 模組的分類 1 python標準庫 2 第三方模組 3 應用程式自定義模組 三 模組的匯入方法 1.import 語句 import module1 module2 modul...

設計模式二十一之命令模式

2.模式的結構與實現 在軟體開發系統中,常常出現 方法的請求者 與 方法的實現者 之間存在緊密的耦合關係。這不利於軟體功能的擴充套件與維護。例如,想對行為進行 撤銷 重做 記錄 等處理都很不方便,因此 如何將方法的請求者與方法的實現者解耦?變得很重要,命令模式能很好地解決這個問題。在現實生活中,這樣...