Panadas對缺失值的處理

2022-06-20 11:57:09 字數 1347 閱讀 8232

# 這個類用來處理預設值

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

from pylab import mpl

# 設定顯示中文字型

mpl.rcparams["font.sans-serif"] = ["simhei"]

# 讀取電影資料

movie = pd.read_csv("../data/imdb-movie-data.csv")

# print(pd.notnull(movie))

# print(np.all(pd.notnull(movie)))

## 1、刪除

# pandas刪除缺失值,使用dropna的前提是,缺失值的型別必須是np.nan

# 不修改原資料 可以定義新的變數接受或者用原來的變數名

data = movie.dropna()

# print(data)

# 替換存在缺失值的樣本的兩列

# 替換填充平均值,中位數

# movie['revenue (millions)'].fillna(movie['revenue (millions)'].mean(), inplace=true)

# 替換所有缺失值:

for i in movie.columns:

if np.all( pd.notnull(movie[i])) == false:

# print(i)

movie[i].fillna(movie[i].mean(), inplace=true)

# 不是缺失值nan,有預設標記的

wis = pd.read_csv("")

# 全域性取消證書驗證

# 先替換『?』為np.nan

## df.replace(to_replace=, value=)

# to_replace:替換前的值

# value:替換後的值

# 把一些其它值標記的缺失值,替換成np.nan

wis = wis.replace(to_replace='?', value=np.nan)

# 刪除

wis = wis.dropna()

dropna刪除np.nan標記的缺失值【知道】

fillna填充缺失值【知道】

replace替換具體某些值【知道】

pandas對缺失值的處理

pandas對缺失值的處理 判斷是否為空 刪除or丟棄 填充空值 pandas使用這些函式處理缺失值 isnull 和 notnull 檢驗是否是空值,可用於series和df dropna 丟棄 刪除缺失值 axis 刪除行還是列,default 0 how 如果等於any則任何值為空都刪除,如果...

缺失值處理

pandas使用nan not a number 表示浮點和非浮點陣列中的缺失資料,python內建的none值也會被當做na處理,pandas物件上的所有描述統計都排除了缺失資料。na處理方法 方法 說明dropna 根據各標籤的值是否存在缺失資料對軸標籤進行過濾,可通過閾值調節對缺失值的容忍度 ...

缺失值處理

之前寫過一篇文章缺失值視覺化處理 missingno 主要介紹了缺失值的檢視,今天聊一下,出現了缺失值後我們要做的後續工作,就是缺失值的處理。首先附上幾個 data資料集 data.isnull 缺失值判斷 是缺失值返回true,否則範圍false data.isnull sum 缺失值計算 返回每...