DW資料探勘學習（三）

?? —趨勢項 ?? —週期項 ?? —季節項 ??—隨機項

?為延遲運算元，??−1=??×?。

??為差分多項式 ?? = (1 − ?)?

φ(b)為自回歸多項式φ(b)=1−? ? − ⋯ − ? ??

?(?)為滑動平均多項式? ? =1−? ?−⋯−? ?? 1?

模型假定與arma模型一致

提取is特徵包括：

3.2.2.1距離特徵提取

3.2.2.2波峰波谷特徵

繪製購買贖回月時序圖，觀察波峰波谷規律，並確定波峰波谷日期

3.2.2.3加入週期因子特徵

3.2.2.4加入動態時序特徵

按每個weekday來新增動態特徵，包括：

使用方法：

訓練與**流程主要為資料集劃分及生成-訓練模型-模型選擇、引數調優-模型融合-線下驗證-線上**。

引數調優，不建議將精力放在引數調優上；容易過擬合大體的設定引數即可，應將精力重點放在特徵工程；其次是模型融合。

模型引數的設定，不建議將精力放在調參；黔驢技窮時再調參。僅需大體的設定主要引數即可

DW資料探勘學習4

gbdt gradient boosting decision tree 全名叫梯度提公升決策樹，使用的是boosting的思想。boosting方法訓練基分類器時採用序列的方式，各個基分類器之間有依賴。它的基本思路是將基分類器層層疊加，每一層在訓練的時候，對前一層基分類器分錯的樣本，給予更高的權重...

DW學習筆記

1.標題標籤標題1h1 1通常用於主標題字型大小逐級變小它是塊元素會自動換行標題1h2 標題1h3 標題1h4 標題1h5 標題1h6 2.段落標籤通常用於乙個段落它是塊元素會自動換行並且存在一定的上邊距屬性 3.換行標籤這是乙個單標籤用在乙個段落中換行，另起一行要注意的是不能...

資料探勘導論（三）

頻率分類屬性的眾數具有最高頻率的值第1步以遞增順序排列原始資料即從小到大排列第2步計算指數i np 第3步 l 若 i 不是整數，將 i 向上取整。大於i的毗鄰整數即為第p百分位數的位置。2 若i是整數，則第p百分位數是第i項與第 i l 項資料的平均值。按照上述的計算公式i n p ...

DW資料探勘學習（三）

DW資料探勘學習4

DW學習筆記

資料探勘導論 （三）

相關推薦

資料探勘導論（三）