pandas時間序列空值填充

2021-10-06 05:54:19 字數 1250 閱讀 9211

novels_month = pd.read_csv(csv_path)
#2004-12-1是時間序列開始的時間,並以月為間隔

rng = pd.date_range('2004-12-1', periods = int((pd.period(novels_month.iloc[-1,0],'m') - pd.period('2004-12-1','m')).freqstr[0:-1]), freq = 'm') + pd.timedelta('1 day')

s = pd.series(rng)

empty = pd.dataframe(,columns=["update_date","rating_total"])

empty["update_date"] = s

empty

#這裡是使用的臨近值進行填充

c_list = list(novels_month[0]["update_date"]);

counter = 2 #novels_month的第乙個非空值的位置

for i in range(len(empty)):

f_val = str(pd.period(empty.iloc[i,0],'m'))

if f_val in c_list:

val = novels_month[0].iloc[c_list.index(f_val),1]

empty.iloc[i,1] = val

counter = c_list.index(f_val)

else:

#將值填充為最鄰近的乙個值

empty.iloc[i,1] = novels_month[0].iloc[counter,1]

empty.to_csv(os.path.join(novel_path,"test.csv"), index_label="index_label")
使用fillna進行值的填充

# 通過fillna填充缺失值 

# median = housing["total_bedrooms"].median() sample_incomplete_rows["total_bedrooms"].fillna(median, inplace=true) # option 3 sample_incomplete_rows

pandas 填充缺失值

當資料中存在nan缺失值時,我們可以用其他數值替代nan,主要用到了dataframe.fillna 方法,下面我們來看看具體的用法 1.先來建立乙個帶有缺失值的dataframe 2.使用0替代缺失值 當然你可以用任意乙個數字代替nan df.fillna 0 3.用乙個字串代替缺失值 df.fi...

pandas時間序列

import pandas as pd import numpy as np import datetimedf pd.dataframe df 將時間序列轉化為標準的年月日的形式 df date pd.to datetime df date df 生成定頻日期與時間段序列 dt pd.date r...

Pandas 缺失值填充的方法

重新載入原始資料 titanic df pd.read csv titanic.csv 計算所有人年齡的均值 age median1 titanic df.age.median 使用fillna填充缺失值,inplace true表示在原資料titanic df上直接進行修改 titanic df....