使用 Modeler 進行缺失值分析

2021-07-30 13:01:33 字數 321 閱讀 1140

使用 modeler 進行缺失值分析

什麼是缺失值?

缺失值就是指資料檔案中的某些資料項是未知的值。幾乎所有的商業資料探勘中,都要遇到缺失值的問題,有可能是資料採集中的失誤,有可能客戶不願意提供某些資訊,面對這樣的資料,我們該如何是好 ? 使用這樣的資料可能會對我們後期的建模產生不可預料的影響。如果丟棄,這些資料中可能包含著寶貴的資訊。下邊我們就來看一下如何利用 modeler 來進行缺失值分析:

缺失值示例

第一步我們需要利用 modeler 來確定資料檔案中缺失值的型別和數量。然後才能做進一步的處理。

首先我們看一下我們例子中需要用到的資料:

資料清洗 利用python進行缺失值處理

處理缺失值的方法有3種 刪除 不處理 資料插補。而資料插補主要有5種 1 利用均值 中位數 眾數插補 2 使用固定值進行插補 3 最近臨插補 4 回歸方法 5 插值法 而主要的插值法分為牛頓插值法 拉格朗日插值法 hermite插值 分段插值 樣條插值法等。對數學好的可以看一下拉格朗日插值法的數學公...

pyhton 使用插值法填充缺失值

import pandas as pd import numpy as np time index pd.date range 01 01 2010 periods 5,freq m 設定索引 dataframe pd.dataframe index time index 建立帶確實資料的特徵 da...

使用Querystring進行頁面傳值

源頁面 protected sub button4 click byval sender as object,byval e as system.eventargs handles button4.click dim url as string url default3.aspx?name text...