Pandas高階處理 缺失值處理

2021-10-05 08:19:50 字數 1427 閱讀 5110

pandas的缺失值型別

應用replace實現資料的替換

應用dropna實現缺失值的刪除

應用fillna實現缺失值的填充

應用isnull判斷是否有缺失資料nan

判斷是否為空
pd.isnull(df)--

---為空pd.notnull(df)--

--不為空

處理方式
1、存在缺失值nan,並且是np.nan

a:刪除存在缺失值的:dropna(axis=

'rows'

) 注:不會修改原資料,需要接收返回值

b:替換缺失值:fillna(value,inplace=

true

) value:替換成的值

inplace:

true

:會修改原資料,false:不替換修改原資料,生成新的物件

2,不是缺失值nan,有預設標記的

電影資料檔案獲取:

movie = pd.read_csv(

"./data/....csv"

)

判斷缺失值是否存在
pd.notnull(movie)
存在缺失值nan,並且是np.nan
1

,刪除注意:pandas刪除缺失值,使用dropna的前提是,缺失值的型別必須是np.nan

movie = movie.dropna()2

,替換缺失值

替換填充平均值、中位數

movie[

'revenue (millions)'

].fillna(movie[

'revenue (millions)'

].mean(

), inplace=

true

)

不是缺失值nan,有預設標記的
處理思路:

1,先替換「?」為np.nan

df.replace(to_replace=

,value=

) to_replace:替換前的值

value:替換後的值

wis = df.replace(to_replace=

'?', value=np.nan)

2,再進行缺失值的處理

wis = wis.dropna(

)

1,將特定欄位為空的索引獲取成列表形式

null_list = data[(data.school_name).isnull()].index.tolist()

2,刪除這些列表

data1 = data.drop(labels=null_list, axis=0, inplace=true)

pandas 高階處理 缺失值處理

存在缺失值nan,並且是np.nan 2 替換缺失值 fillna value,inplace true value 替換成的值 3如果缺失值沒有使用nan標記,比如使用 讀取電影資料 判斷是否全不為空,如果沒有空返回true,否則flase np.all pd.notnull movie 不修改原...

Pandas 缺失值處理

二 處理缺失值 首先拿到乙份資料,以dataframe提取後,要檢視缺失值的情況 import pandas as pd df pd.read csv df.isnull 獲得true,false的返回值 df.isnull sum 判斷缺失的數量常用此介面來快速判斷各特徵的缺失值情況!df.dro...

Pandas缺失值處理

判斷資料是否為nan pd.isnull df pd.notnull df 判斷缺失值是否存在 np.all pd.notnull data 返回false代表有空值 np.any pd.isnull data 返回true代表有空值處理方式 2 替換缺失值 fillna value,inplace...