python 實現資料集隨機空值

2021-09-25 02:23:14 字數 910 閱讀 9308

任務描述:有乙個完整的資料集,大概30000行,45列,裡面有若干空值,現在要去掉有空值的所有行,篩選非空值行,並隨機將某些值賦值為空。

import numpy as np

import pandas as pd

data = pd.read_csv('user.csv',encoding='gbk')#讀取含有空值的csv檔案

col=data.columns.values.tolist()

data = data.replace(' ', np.nan) #將空值用python能識別的符號替換

data = data.dropna(axis=0)#去掉含空值的所有行

data1= data.iloc[:, 1:].values

for i in range(10000):

data1[np.random.randint(1,30000)][np.random.randint(0,45)]=none #迴圈一萬次,行列在範圍內隨機,讓該值為空

pd.dataframe(data.iloc[:, 1:].values).to_csv('user_test01.csv', encoding='utf-8_sig') #生成大約10000個含有空值的檔案

pd.dataframe(data1).to_csv('user_train01.csv',encoding='utf-8_sig')

# 檢視測試資料每列空值資料個數 m1=pd.dataframe(data_test.iloc[:, 1:].values).isna().sum()

#檢視訓練資料每列空值資料個數 m2=pd.dataframe(data_train).isna().sum()

# print(m1,m2)

思考:為什麼說生成含有空值的總數一定小於等於10000

Python 實現訓練集 測試集隨機劃分

隨機從列表中取出元素 import random dataset 0 1 2 www.cppcns.com,3 4 5 6 7 8 9 10 traindataset random.sample dataset,3 以下函式,使用於我最近的乙個機器學習的專案,將資料集資料按照比例隨機劃分成訓練集資料...

python中隨機打亂資料集

假設我們現在有資料 data,label 方法一 打亂資料順序 import random index i for i in range len data random.shuffle index data data index label label index 打亂後的結果 方法二 data s...

Python 隨機數 隨機值

import random 1 生成m n之間的隨機整數 print random.randint 10,99 75 2 生成m n之間的隨機浮點數 print random.uniform 10,99 98.37125047276466 3 生成0 1之間的隨機浮點數 可用作百分比 print r...