深度學習中的訓練集與測試集

2021-08-20 17:35:48 字數 486 閱讀 2726

看上面的圖，這是乙個邏輯回歸演算法的dag(有向無環圖)，它是這個二分類演算法的簡單應用流程的展示。

可以看到我們在採集完資料並做過處理後，會把資料進行拆分。訓練集作用訓練模型，而測試集會被輸入到模型中來評估模型的效能。這是我們測試人工智慧服務的最常用方式，通過這個流程會產生乙個模型的評估報告，如下：

當然這種拆分是有一定的規則的，如果資料集比較小，那麼一般遵循7：3的經驗拆分，7分用來訓練模型，3分用來評估模型效能。測試集不能太少，少了結果不準確，不能太多，太多了會導致訓練集資料不足。但這個規則不是死的。如果資料集本身比較大，例如有100w行資料。那麼我們抽取其中1w行做為測試集也就可以了。

深度學習中驗證集與測試集的區別

驗證集是模型訓練過程中單獨留出的樣本集，它可以用於調整模型的超引數和用於對模型的能力進行初步評估。測試集用來評估模最終模型的泛化能力。但不能作為調參選擇特徵等演算法相關的選擇的依據。訓練集用於模型引數，測試集用於估計模型對樣本的泛化誤差，驗證集用於訓練模型的超引數。我們知道乙個機器學習模型...

機器學習中的訓練集驗證集測試集

訓練集用來訓練模型，即確定模型的權重和偏置這些引數，通常我們稱這些引數為學習引數。而驗證集用於模型的選擇，更具體地來說，驗證集並不參與學習引數的確定，也就是驗證集並沒有參與梯度下降的過程。驗證集只是為了選擇超引數，比如網路層數網路節點數迭代次數學習率這些都叫超引數。比如在k nn演算法中，k值...

機器學習中的訓練集驗證集測試集

用來訓練分類器中的引數，擬合模型。會使用超引數的不同取值，擬合出多個分類器，後續再結合驗證集調整模型的超引數。當通過訓練集訓練出多個模型後，為了能找出效果最佳的模型，使用各個模型對驗證集資料進行並記錄模型準確率。選出效果最佳的模型所對應的超引數，即用來調整模型超參。通過訓練集和驗證集得出最優模型後...