訓練神經網路的處方

翻譯自andrej karpathy blog

處方在實踐中，我們從簡單到複雜構建模型，並且在每一步我們對將要發生的具體事情進行**，通過實驗進行驗證並且通過調查發現問題。一定要防止同時引入許多未經驗證的猜想，否則總是會在查詢問題。一開始，要使用較小的學習率，並每一步都要評估測試集上的表現。

1 不要一開始寫**

我習慣花費很多時間去觀察樣本，了解資料的分布並尋找模式。我們的大腦擅長做這些。我會尋找資料的不平衡和差異，我會注意分類資料的過程，這個過程暗示了各種可能的框架。區域性的特徵是否足夠，我們是否需要全域性的文字呢？有多少變化，採取了什麼樣的形式？什麼變化是虛假的，可以預處理？空間位置是否重要，或者我們是否想要將其平均化？細節有多重要，我們可以多大程度上對資料進行縮減取樣？有多少標籤是雜訊？

此外，由於神經網路是原始資料的壓縮（編譯），因此能夠檢視網路（錯誤）**的並了解他們的**。如果你的網路給你的**看起來與在資料中不一致，那麼就會有所收穫。

一旦從資料中發現規律，可以編寫一些**對他們進行搜尋、過濾、排序。把資料視覺化能幫助我們發現異常值，而異常值總能揭示資料的質量或預處理中的一些錯誤。

2 設定端到端的訓練評估框架

訓練神經網路的處方

神經網路訓練

神經網路的訓練

神經網路訓練技巧

訓練神經網路的處方

神經網路訓練

神經網路的訓練

神經網路訓練技巧

相關推薦