資料預處理 時間相關處理總結

2021-10-11 00:26:43 字數 2029 閱讀 7398

3 **耗時

pandas 時間格式

df[

'time'

]= pd.datetime(df[

'time'])

# 方法1

df['time'

]= df[

'time'

].astype(

'datetime64[ns]'

)# 方法2

import datetime

# 今天的日期,獲取當日年月日

today = datetime.datetime.now(

)# 日期格式到天

a1 = today .strftime(

"%y-%m-%d"

)# 2018-10-10

# 日期加減天數,加一天為1,減一天是-1

num =

1a2 =

(a+datetime.timedelta(days=num)

).strftime(

"%y-%m-%d"

)# 2018-09-12

輸入結果如下:

2020-11

-3015:

55:23.929317

2020-11

-302020-12

-01

(1)獲取當前月的日期,指定為當月的1號。獲取月,指定日。

day = datetime.datetime.now(

).replace(day=

1)

(2)獲取年,年月, 季度,月,周,日

df_s[

'year']=

[i.year for i in df_s[

'開始時間']]

df_s[

'year_month']=

[datetime.datetime.strftime(i,

'%y-%m'

)for i in pd.to_datetime(df_s[

"開始時間"])

]df_s[

'quarter']=

[i.quarter for i in pd.to_datetime(df_s[

"開始時間"])

]df_s[

'month']=

[i.month for i in df_s[

'開始時間']]

df_s[

'week']=

[i.weekday(

)for i in df_s[

'開始時間']]

df_s[

'day']=

[i.day for i in df_s[

'開始時間'

]]

(3)獲得當月第幾周

import datetime

defget_week_of_month

(year, month, day)

:""" 獲取指定的某天是某個月中的第幾周 周一作為一周的開始 """

end =

int(datetime.datetime(year, month, day)

.strftime(

"%w"))

begin =

int(datetime.datetime(year, month,1)

.strftime(

"%w"))

return end - begin +

1print

(get_week_of_month(

2019,9

,4))

#  消耗多少秒 

starttime = datetime.datetime.now(

) endtime = datetime.datetime.now(

)print

((endtime - starttime)

.seconds)

持續更新,

資料預處理總結1

使資料服從標準正態分佈,均值為0,方差為1。做資料探勘,pandas和numpy庫肯定是要引入的,這裡就省略了。from sklearn.preprocessing import standardscaler import warnings warnings.filterwarnings ignor...

資料預處理方法總結

資料是什麼?資料就是一組物件及其屬性的集合,其中屬性定義為物件的特徵或性質。真實資料在應用前基本都有經過預處理,以便在機器學習演算法中使用。本次資料預處理方法的總結是基於推薦系統設計進行展開的,其中包括相似度的度量方法 抽樣以及降維技術這三個尤為重要的問題。d x y k 1 n xk yk 2 x...

資料預處理方法總結

資料是機器學習的原料,機器學習是通過對資料的訓練才得到某種特性的。因此正確的預處理資料對模型結果的輸出尤為重要。一 資料可能存在的問題 資料一開始可能有資料重複,資料缺失,資料存在異常值等情況。二 資料預處理的步驟 資料處理主要包括資料的清洗,資料的轉化.資料描述,特徵選擇和特徵抽取這幾個步驟。1 ...