用fillna 填充眾數

2021-08-21 14:36:07 字數 481 閱讀 9034

今天在做特徵工程時,考慮給某列的缺失值,填充為該列的眾數。按照之前填補均值和最大最小值的方法:

import pandas as pd

df.mer_min_discount.fillna(df.mer_min_discount.mode(), inplace=true)

結果發現缺失值怎麼都填充不上,查閱資料後,恍然大悟,原來由於眾數可能存在多個,所以pandas返回的是乙個series,而不像mean()返回的是乙個值:

in: print(type(df.id.mode()))

in: print(type(df.id.mean()))

解決辦法:

df.mer_min_distance.fillna(df.mer_min_distance.mode()[0], inplace=true)
預設取第乙個眾數。

pandas中使用fillna函式填充NaN值

補充2.例項 2.2 使用inplace引數 2.3 使用method引數 2.4 使用limit引數 2.5 使用axis引數 取值 true false true 直接修改原物件 false 建立乙個副本,修改副本,原物件不變 預設預設 取值 default none pad ffill 用前乙...

fillna填充某一列 第三章 分組

一 sac過程 1.內涵 在該過程中,我們實際往往會遇到四類問題 整合 aggregation 即分組計算統計量 如求均值 求每組元素個數 變換 transformation 即分組對每個單元的資料進行操作 如元素標準化 過濾 filtration 即按照某些規則篩選出一些組 如選出組內某一指標小於...

python用均值填充空值 用平均值填充空值

我得到了乙個包含許多nan值的資料集,我想用每列的平均值填充空值。所以我嘗試了以下 def fill mean m df.columns.get loc c for c in df.columns if c in missing for i in m df df.columns i df df.co...