3 1 3 訓練 開發 測試集的問題以及注意事項

2021-08-19 13:22:42 字數 886 閱讀 5459

開發集我們稱之為development set,有時候也稱之為保留交叉驗證集。機器學習的流程是,你嘗試很多的思想,然後用訓練集訓練不同的模型,使用開發集來評估不同的思路,選擇乙個,之後不斷迭代去改善開發集的效能,直到最後你可以得到乙個令你滿意的成本,之後用測試集去評估。

資料集和測試集的劃分乙個非常非常重要的原則就是一定滿足同一分布。

如圖所示,如果我們要8個不同國家,最好不要四個國家劃分為一組,而是把資料全部打散,均勻的劃分。

不要花很多時間來瞄準乙個目標,針對靶心不斷優化,然後等到測試的時候說,我們用其他靶來測試。

注意這個公式裡面的l表示的是乙個函式,而不是邏輯回歸或者別的。

這個函式寫成類似於1∑

w(i)

1 ∑w

(i)這種形式是為了歸一化處理,這樣能夠保證最終的誤差值在0和之間。

如果你對於演算法的舊誤差指標不滿的話,比如說像上面出現色情,那麼就需要重新設計新的指標。比如說,上面那個5%的誤差率在實際情況中就會更好。

吳教主深度學習和神經網路課程總綱

將資料集劃分為訓練集以及測試集

將資料集簡單地劃分為測試集以及訓練集 import os import random train percent 9 訓練集所佔比例 valid percent 0.1 測試集所佔比例 xmlfilepath data delete 所在地相對路徑 total file os.listdir xml...

神經網路訓練中的訓練集 驗證集以及測試集合

1 在nn訓練中我們很常用的是訓練集合以及測試集合,在訓練集合上訓練模型 我個人認為模型就是訓練的方法以及對應的引數值,更偏重於引數值吧 訓練好之後拿到測試集合上驗證模型的泛華 就是該模型可以拿去實戰的效果 的能力。2 但是對於上述情況,舉個例子,比如是在訓練乙個多層網路,我們用類似minfunc的...

數學理論 訓練集 開發集 測試集

訓練集 用於訓練模型的資料集。開發集 驗證集 在通過訓練集獲得訓練模型後,對訓練模型的引數進行調整的資料集。測試集 用於測試最終生成的模型的資料集。訓練集 開發集 測試集確定 1.傳統的機器學習領域中,由於收集到的資料量往往不多需要將收集到的資料分為三類 訓練集 驗證集 測試集。也可以分為兩類,不需...