python 特徵缺失值填充

2022-06-22 16:51:13 字數 900 閱讀 1881

該部落格總結比較詳細,感謝博主。

我們在進行模型訓練時,不可避免的會遇到某些特徵出現空值的情況,下面整理了幾種填充空值的方法

對於特徵值缺失的一種常見的方法就是可以用固定值來填充,例如0,9999, -9999, 例如下面對灰度分這個特徵缺失值全部填充為-99

data['灰度分'] = data['灰度分'].fillna('-99')

對於數值型的特徵,其缺失值也可以用未缺失資料的均值填充,下面對灰度分這個特徵缺失值進行均值填充

data['灰度分'] = data['灰度分'].fillna(data['灰度分'].mean()))

與均值類似,可以用未缺失資料的眾數來填充缺失值

data['灰度分'] = data['灰度分'].fillna(data['灰度分'].mode()))

用前乙個資料進行填充

data['灰度分'] = data['灰度分'].fillna(method='pad')

用後乙個資料進行填充

data['灰度分'] = data['灰度分'].fillna(method='bfill')

data['灰度分'] = data['灰度分'].interpolate()

from fancyimpute import biscaler, knn, nuclearnormminimization, softimpute

dataset = knn(k=3).complete(dataset)

python缺失值填充

對於特徵值缺失的一種常見的方法就是可以用固定值來填充。data 分數 data 分數 fillna 1 對於數值型的特徵,其缺失值也可以用未缺失資料的均值填充。data 分數 data 分數 fillna data 分數 mean 與均值類似,可以用未缺失資料的眾數來填充缺失值。data 分數 da...

缺失值填充 關於年齡特徵

缺失值填充這回事我們第一能想到的就是使用0進行填充,但是如果是年齡的話直接使用0進行填充就有點不太靠譜了,那麼怎麼辦呢?如果整個樣本群體的年齡方差不大,比如整個樣本 於初中生,年齡在13 15歲之間,那麼直接使用全樣本的均值填充即可。但是真實情況往往不會這麼美好,哪怕是初中生也會有急著早讀書的學生和...

pandas 填充缺失值

當資料中存在nan缺失值時,我們可以用其他數值替代nan,主要用到了dataframe.fillna 方法,下面我們來看看具體的用法 1.先來建立乙個帶有缺失值的dataframe 2.使用0替代缺失值 當然你可以用任意乙個數字代替nan df.fillna 0 3.用乙個字串代替缺失值 df.fi...