在真實資料集上的隨機森林模型引數調優

2021-10-07 14:43:44 字數 322 閱讀 3119

1.調參優化演算法: 

2.機器學習(整合演算法1:隨機森林分類器-紅酒資料集案例、隨機森林回歸器-波士頓資料集填充缺失值案例)

3.實用kaggle競賽之隨機森林評估及調參

4. 實用隨機森林 - 針對時間序列的kaggle技巧

搞機器學習的人,都會有自己偏愛的某種演算法,有的喜歡支援向量機(svm),因為它公式表達的優雅和可利用方法實現的高質量;有的人喜歡決策樹,因為它的簡潔性和解釋能力;還有人對神經網路非常痴狂,因為它解決問題的靈活性(一般在超大規模的資料集上,使用神經網路,效果會好於其他所有的機器學習演算法)。但是就我本人而言,我最喜歡的演算法是隨機森林,理由如下:

在colab上使用自己的資料集

1 colab 可以非常方便地將ipynb儲存到github上!有趣。2 colab 從github上載入資料集,666,簡直不能更方便啊。使用 git clone 即可將github上的檔案轉殖到colab的當前目錄下,然後就可以愉快地使用自己的資料集了。ls r檢視當前目錄下的檔案及所有的子目錄...

在SeaShips資料集上訓練並測試Yolov3

本文主要記錄我在seaships資料集上訓練yolov3網路進行船隻檢測的簡單過程 對資料集的預處理 修改cfg檔案 修改data資料夾 seaships資料集共有四個資料夾,其中annotations資料夾內是每張的標籤,每個對應乙個xml檔案來儲存標籤,所以要將xml檔案中的內容轉為txt檔案,...

在西瓜資料集上訓練 資料標註是做什麼的?

1.訓練集 用來除錯神經網路 2.驗證集 用來檢視訓練效果 檢視模型訓練的效果,是否朝著壞的方向進行,及時停止訓練 用在訓練的過程中,幾個epoch結束後就要跑一次驗證集看看效果,及時發現模型或者引數的問題。如果模型設計不合理,訓練的時候不容易發現,但是在驗證集中可能會發散 map不增長或者增長很慢...