Pandas 缺失資料

2021-09-27 08:39:03 字數 770 閱讀 9663

一. 處理缺失資料

二. 濾除缺失資料

三. 填充缺失資料

方法說明

dropna根據各標籤的值中是否存在缺失資料對軸標籤進行過濾,可通過閾值調節對缺失值的容忍度

fillna用指定值或插值方法(如 ffill 或 bfill)填充缺失資料

isnull返回乙個含有布林值的物件,這些布林值表示哪些值時預設值 \ na,該物件的型別與源型別一樣

notnullisnull 的否定式

dropna()

1. series:dropna 返回乙個僅含非空資料和索引值的 series

2. dataframe:

行:dropna預設丟棄任何含有缺失值的行,傳入 how = 'all' 將值丟棄權威 na 的那些行。

列:傳入 axis = 1,如 data.dropna(axis = 1, how = 'all')

fillna()

1. df.fillna(0),用 0 填充空值

2. 通過字典呼叫 fillna,可以實現對不同的列填充不同的值:

df.fillna()
3. fillna 缺省會返回新物件,但也可以對現有物件進行就地修改:

_ = df.fillna(0, inplace = true)
以上整理自《利用python進行資料分析》。

Pandas缺失資料

一 缺失值的統計和刪除 缺失資訊的統計 資料處理中經常需要根據缺失值的大小 比例或其他特徵來進行行樣本或列特徵的刪除,pandas中提供了dropna函式來進行操作。dropna的主要引數為軸方向axis 預設為0,即刪除行 刪除方式how 刪除的非缺失值個數閾值thresh 非 缺 失 值 col...

pandas 缺失資料

檢視缺失的比例 全部缺失 df sub set.isna any 1 head 至少有乙個缺失 沒有缺失 資料處理中經常需要根據缺失值的大小 比例或其他特徵來進行行樣本或列特徵的刪除,pandas中提供了dropna函式來進行操作。dropna的主要引數為軸方向axis 預設為0,即刪除行 刪除方式...

Pandas 處理缺失資料

import numpy as np import pandas as pd from pandas import series,dataframes series a b np.nan,c d pd.isnull s 0 false 1 false 2 true 3 false 4 false d...