pandas對缺失值的處理

2022-03-28 04:38:19 字數 1461 閱讀 3645

#

pandas對缺失值的處理(判斷是否為空、刪除or丟棄、填充空值)

#pandas使用這些函式處理缺失值:

#isnull 和 notnull :檢驗是否是空值,可用於series和df

#dropna:丟棄、刪除缺失值

#axis:刪除行還是列,,default 0

#how :如果等於any則任何值為空都刪除,如果等於all則所有值為空才刪除

#inplace: 如果是true則修改當前df,否則返回新的df

#fillna:填充空值

#value: 用於填充的值,可以是單個值,或者字典(key是列名,value是值)

#method : 等於ffill使用前乙個不為空的值填充forword fill;;等於bfill使用後乙個不為空的值填充backword fill

#axis : 按行還是列進行填充

#inplace: 如果是true則修改當前df,否則返回新的df

import

pandas as pd

#例項:特殊excel的讀取、清洗、處理

#步驟1 讀取excel的時候,忽略前幾個空行

studf = pd.read_excel("

檔案路徑

",skiprows=2) #

跳過前2個空行

#步驟2 檢測空值

studf.isnull()

studf["分數

"].isnull()

studf["分數

"].notnull()

#篩選沒有空分數的所有行

studf.loc[studf["分數"

].notnull(),:]

#步驟3: 刪除掉全是空值的列

studf.dropna(axis = "

columns

",how="

all",inplace =true)

#步驟4 : 刪除掉全是空值的行

studf.dropna(axis = "

index

",how = "

all",inplace=true)

#步驟5 : 將分數列為空的填充為0分

studf.fillna()

#等同於

studf.loc[:,"

分數"] = studf["分數"

].fillna(0)

#步驟6 將姓名的缺失值天填充

#使用前面的有效值填充,有ffill:forword fill

studf.loc[:,"

姓名"] = studf["

姓名"].fillna(method = "

ffill")

#步驟7 將清洗好的excel儲存

studf.to_excel("

儲存路徑

",index = false) #

去除索引

Pandas 缺失值處理

二 處理缺失值 首先拿到乙份資料,以dataframe提取後,要檢視缺失值的情況 import pandas as pd df pd.read csv df.isnull 獲得true,false的返回值 df.isnull sum 判斷缺失的數量常用此介面來快速判斷各特徵的缺失值情況!df.dro...

Pandas缺失值處理

判斷資料是否為nan pd.isnull df pd.notnull df 判斷缺失值是否存在 np.all pd.notnull data 返回false代表有空值 np.any pd.isnull data 返回true代表有空值處理方式 2 替換缺失值 fillna value,inplace...

Pandas的缺失值處理

處理方式 不是缺失值nan,有預設標記的 判斷資料是否為nan pd.isnull df pd.notnull df pd.isna df 讀取資料 movie pd.read csv date imdb movie data.csv 第一種 刪除 pandas刪除缺失值,使用dropna的前提是,...