資料清洗學習之重複資料處理

2021-12-30 04:09:25 字數 1534 閱讀 3562

資料處理

(一)重複資料的處理

(1)函式法:countif(range,criterial)

range:要計數的單元格範圍

criterial:計算條件

eg:a列:員工編號;b列:每個員工編號出現的次數;c列:查詢出現兩次及其以上的重複項,以c9為例,即表示a466074從a1到a9是第3次重複出現。

(2)高階篩選法:

a.選擇資料單元格區域a1::11

b.開始---篩選---高階篩選---選擇「將篩選結果複製到其他位置」---在複製到文字框輸入另乙個存放的區域---勾選「選擇不重覆記錄」核取方塊---單擊確定按鈕

(3)條件格式法

選擇單元格區域---開始---條件格式---突出顯示單元格規則---重複值---將重複值和所在單元格標為不同顏色

(4)資料透視表法

用資料透視表統計各資料出現的頻次,出現兩次及以上就說明該資料屬於重複項,若統計結果為1這說明該資料沒有重複出現。

a.單擊「插入」選項卡---單擊「資料透視表」按鈕---在彈出的是「資料透視表」對話方塊「選擇乙個表或區域」中,選擇資料來源單元格範圍

b.將「編號」欄位拖至行標籤---再將「編號」欄位拖至數值彙總區域

由以上可知,高階篩選法和資料透視表最便捷。

(二)刪除重複資料

(1)通過選單操作刪除重複項

a.選擇a1::11區域---資料選項卡---單擊刪除重複項---在「列」區域下選擇要刪除的列---單擊確定

(2)排序刪除重複項

利用前面的countif系列的第二次重複標記,先排序,然後刪掉大於1的行就行

(3)篩選刪除重複項

資料處理之去除重複資料

coding utf 8 1.概念 把資料結構中,行相同的資料只保留一行。語法 drop duplicates 該方法返回乙個去重後的資料框物件 from pandas import read csv df read csv d python workspace pythonstudy 8.csv ...

spss 資料清洗 處理重複資料

spss 資料清洗 處理重複資料 資料匯入之後就需要對資料進行清洗。資料清洗主要是對多餘重複的資料篩選清除,將缺失的資料補充完整,將錯誤的資料糾正或者刪除。接下來操作如何將重複資料處理操作。步驟一 選擇 資料 標記重複個案 在 標記重複個案 對話方塊中,將所有的變數都放入 定義匹配個案的依據 框中,...

python筆記8 資料處理之去除重複資料

coding utf 8 1.概念 把資料結構中,行相同的資料只保留一行。語法 drop duplicates 該方法返回乙個去重後的資料框物件 from pandas import read csv df read csv d python workspace pythonstudy 8.csv ...