DW資料探勘學習(三)

2021-10-23 19:50:43 字數 549 閱讀 4304

?? —趨勢項  ?? —週期項  ?? —季節項  ??—隨機項

?為延遲運算元,??−1=??×?。

??為差分多項式 ?? = (1 − ?)?

φ(b)為自回歸多項式φ(b)=1−? ? − ⋯ − ? ??

?(?)為滑動平均多項式? ? =1−? ?−⋯−? ?? 1?

模型假定與arma模型一致

提取is特徵包括:

3.2.2.1距離特徵提取

3.2.2.2波峰波谷特徵

繪製購買贖回月時序圖,觀察波峰波谷規律,並確定波峰波谷日期

3.2.2.3加入週期因子特徵

3.2.2.4加入動態時序特徵

按每個weekday來新增動態特徵,包括:

使用方法:

訓練與**流程主要為資料集劃分及生成-訓練模型-模型選擇、引數調優-模型融合-線下驗證-線上**。

引數調優,不建議將精力放在引數調優上;容易過擬合大體的設定引數即可,應將精力重點放在特徵工程;其次是模型融合。

模型引數的設定,不建議將精力放在調參;黔驢技窮時再調參。僅需大體的設定主要引數即可

DW資料探勘學習4

gbdt gradient boosting decision tree 全名叫梯度提公升決策樹,使用的是boosting的思想。boosting方法訓練基分類器時採用序列的方式,各個基分類器之間有依賴。它的基本思路是將基分類器層層疊加,每一層在訓練的時候,對前一層基分類器分錯的樣本,給予更高的權重...

DW學習筆記

1.標題標籤 標題1h1 1通常用於主標題 字型大小逐級變小 它是塊元素會自動換行 標題1h2 標題1h3 標題1h4 標題1h5 標題1h6 2.段落標籤 通常用於乙個段落 它是塊元素 會自動換行 並且存在一定的上邊距屬性 3.換行標籤 這是乙個單標籤 用在乙個段落中換行,另起一行 要注意的是不能...

資料探勘導論 (三)

頻率 分類屬性的眾數 具有最高頻率的值 第1步 以遞增順序排列原始資料 即從小到大排列 第2步 計算指數i np 第3步 l 若 i 不是整數,將 i 向上取整。大於i的毗鄰整數即為第p百分位數的位置。2 若i是整數,則第p百分位數是第i項與第 i l 項資料的平均值。按照上述的計算公式i n p ...