Task 4 建模與調參

2021-10-04 16:43:02 字數 979 閱讀 4622

在零基礎入門資料探勘的 task4 建模調參部分,我學習了各種模型以及模型的評價和調參策略。在做好前期的準備工作之後,建模是至關重要的一環,需要根據資料的特點擊擇合適的模型,同時調參使得模型的效果更好。

了解常用的機器學習模型,並掌握機器學習模型的建模與調參流程

完成相應學習打卡任務

線性回歸模型:

線性回歸對於特徵的要求;

處理長尾分布;

理解線性回歸模型;

模型效能驗證:

評價函式與目標函式;

交叉驗證方法;

留一驗證方法;

針對時間序列問題的驗證;

繪製學習率曲線;

繪製驗證曲線;

嵌入式特徵選擇:

lasso回歸;

ridge回歸;

決策樹;

模型對比:

常用線性模型;

常用非線性模型;

模型調參:

貪心調參方法;

網格調參方法;

貝葉斯調參方法。

相關演算法原理篇幅較長,故摘錄課件上列出的學習資料,以備後續學習研究查閱。

1 線性回歸模型

link

2 決策樹模型

3 gbdt模型

4 xgboost模型

5 lightgbm模型

6 推薦教材:

《機器學習》

《統計學習方法》

《python大戰機器學習》

《面向機器學習的特徵工程》

《資料科學家訪談錄》

本次task涉及的知識較廣,包含各類經典模型及調參的方法,通過課件學習及**實戰有了乙個初步的感知。如何在乙個具體的實際問題中選擇適當的模型?需要我們對各類模型有充分的的認識,對資料足夠理解。這需要多動手練習。此外調參方法也是因模型而異,需要多多積累。

Task4 建模調參

task4 建模調參 學習材料位址 4.4.1 讀取資料 reduce mem usage函式沒看懂 4.4.2 對標籤進行log x 1 變換,使標籤由原來的長尾分布貼近於正態分佈 選用靠前時間的4 5樣本當作訓練集,靠後時間的1 5當作驗證集 l1正則化與l2正則化的區別 l2正則化在擬合過程中...

Task4 模型和調參

機器學習模型 1.線性回歸 本質上它是一系列特徵的線性組合,在二維空間中,你可以把它視作一條直線,在三維空間中可以視作是乙個平面。為了獲得w和b我們需要制定一定的策略,而這個策略在機器學習的領域中,往往描述為真實值與回歸值的偏差。優化方法 思路是線性代數中的矩陣求導 任務變成了求這個 公式的數學問題...

零基礎入門資料探勘 Task4 建模調參

一 介紹 1 線性回歸模型 線性回歸對於特徵的要求 處理長尾分布 理解線性回歸模型 2 模型效能驗證 評價函式與目標函式 交叉驗證方法 針對事件序列問題的驗證 繪製學習率曲線 繪製驗證曲線 3 嵌入式特徵選擇 lasso回歸 ridge回歸 決策樹4 模型對比 常用線性模型 常用非線性模型 5 模型...