python,pandas缺失值資料處理

2021-10-03 03:39:16 字數 1903 閱讀 1144

缺失值資料處理方式:

1.資料補齊 2.刪除對應資料行 3.不處理

data.csv檔案內容:

'''uft-8編碼:包含全世界所有國家需要用到的字元,英文**用的較多

gbk編碼:包含全部的中文字元

unicode編碼:把所有語言統一到一套編碼

'''df=pd.read_csv(r"c:\data\data.csv"

,encoding=

'gbk'

)#pandas預設的編碼方式是utf8

#如果python中所要處理的字串中包含中文,那麼最好要搞懂所用字元的編碼,是gbk,還是utf-8,否則容易出現亂碼,以及語法錯誤。

#此處如果不寫encoding='gbk',會報錯((unicodedecodeerror: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte)

判斷每一行是否有空值

'''print

(na.

any(axis=1)

)#any(iterable) 函式用於判斷給定的可迭代引數 iterable 是否全部為false,若是則返回 false,如果有乙個為 true,則返回 true。

針對某列資料具體判斷是否是空值

])#df[邏輯值]

df1=df.fillna(

'1')

#所有的空值都填1 。df中的內容沒有變。na代表空值

刪除整行資料

'''df2=df.dropna(

)#刪除空值資料。df中的內容沒有改變。

python pandas處理空值與缺失值問題

空值與缺失值問題 df.info info檢視資料是否為空,有多少的空值,或者缺失值如果小於10 直接刪除,否則另作考慮 一 空值與缺失值 空值 在pandas中是 缺失值 在dataframe中為nan或者nat 缺失時間 在series中為none或者nan df.dropna axis 0,h...

缺失值選擇思想和處理缺失值

import pandas as pd from config import file data pd.read csv file,encoding gbk num data.isna sum print num 部分列如下所示 unnamed 0 0 custid 0 trade no 0 ban...

缺失值處理 缺失值填充方法總結

我們在進行模型訓練時,不可避免的會遇到某些特徵出現空值的情況,下面整理了幾種填充空值的方法 對於特徵值缺失的一種常見的方法就是可以用固定值來填充,例如0,9999,9999,例如下面對灰度分這個特徵缺失值全部填充為 99 data 灰度分 data 灰度分 fillna 99 對於數值型的特徵,其缺...