八 時間序列

2021-08-16 10:43:07 字數 1910 閱讀 1780

時間序列:datetime.datetime(2011-02-31),產生乙個datetimeindex物件;

pd.datetimeindex()

時間範圍: pd.date_range(start=『4/1/2012』,periods=20)

時間戳: pd.timestamp(『2011-03-12 04:20』)

datetime以毫秒形式儲存日期和時間,

字串和datetime的相互轉換

(1)字串—>datetime: datetime.strptime(str,』%y-%m-%d』) 知道已知格式進行日期解析

datetime—>字串 : str(datetime) / datetime.strftime(『%y-%m-%d』)

(2)使用dateutil包中的parser.parse方法

from dateutil.parser import parse

(3) #pandas通常是用於處理成組日期的,不管這些日期是dataframe的行還是列。(pd.to_datetime(str))

時間序列基礎

pandas最基本的時間資料型別就是時間戳

(通常以python字串或datetime物件表示)

日期的範圍、頻率以及移動

有時候需要用相對固定的頻率對資料進行分析,比如每月、每天等。

pandas有一整套標準時間序列頻率以及用於重取樣、頻率推斷、生成固定頻率日期範圍的工具。只需呼叫resample.

wom-2fri 每月的第2周的星期五

錨點偏移量:時間序列不是均分分隔的

日期偏移:ts.shift(1/-1.freq=『m』)

錨點滾動:offset=monthend()

offset.rollforward(now) /backward

1. *****->本地化:ts.tz_localize(「 「) ts:時間series序列

一旦時間序列被本地化到乙個特定時區,就可以實現時區轉換:tz_convert

2.時期

p=pd.period(2007,freq=『a-dec』)

period_range()函式用於建立規則的時期範圍

values=[『2000103』,』200202』,』200301』]

index=pd.periodindex(values,freq=』q-dec』) #periodindex類的建構函式可以直接使用一組字串

3.時期的頻率轉換:asfreq()

p=pd.period(『2017』,freq=『a-dec』)

p.asfreq(『m』,how=『end』) :乙個時期period物件

4.timestamp和period的互相轉換:to_period() / to_timestamp(how=『end』)

重取樣(resampling)指的是將時間序列從乙個頻率轉換到另乙個頻率的過程。將高頻率資料聚合到低頻率成為降取樣(downsampling),而將低頻率資料轉換到高頻率成為公升取樣(uosampling)。並不是所有的重取樣都能被劃分到這兩類中,比如將w-wed轉換為w-fri既不是降取樣也不是公升取樣。

降取樣:

在進行降取樣時,應該考慮如下:

1. 各區間那便是閉合的(closed=『right』)

2. 如何標記各個聚合面元,用區間的開頭還是結尾(label=『right』)

ohlc重取樣:包括open,high,low,close四個值

由於時期指的是時間區間,所以公升取樣和降取樣的規則就比較嚴格

在降取樣中,目標頻率必須是原頻率的子時期

在公升取樣中,目標頻率必須是原頻率的超時期

如果不滿足這些條件,就會引發異常,主要影響的是按季、年、周計算的頻率。

例如,由q-mar定義的時間區間只能公升取樣為a-mar、a-jun等

利用python進行資料分析(八) 時間序列

時間的資料分為三種 時間戳,即特定的時刻 固定日期 時間間隔 首先from datetime import datetime from datetime import timedelta from dateutil.parser import parse 1 日期和時間資料型別 datetime.n...

空間複雜度怎麼算 (八)時間複雜度

源於生活,抽象生活。是時候引入時間複雜度這個概念了。好長時間沒有辦法表述這個用來精確衡量乙個演算法在時間上複雜度優劣指標,直到我看到我看到小會的麵包和雞腿的描述。我想,這才是源於生活的演算法。如何衡量乙個演算法的好壞?一般來說,我們從兩個方面來衡量乙個演算法 占用空間我們先按下不表 土豪,有的是硬碟...

AI 08 時間序列分析

一 時間序列預處理 每個統計學問題都需要進行一定的假設,同樣時間序列 也是 一條時間序列裡長期穩定不變的規律,是基本模型 平穩的基本思想 時間序列的行為並不隨時間改變 不常見 嚴平穩 這是一種比較嚴格的定義,認為只有當序列所有的統計性質都不會隨著時間的推移而發生變化時,該序列才能平穩。而在實踐中要獲...