深度學習（十三）

1、嵌入矩陣的設定：一般來說，設定嵌入矩陣要比其基數多乙個，代表未知的參量，確定嵌入矩陣大小的經驗法則是其基數除以2，但不大於50（可以與前文所述rnn那裡一起理解）

2、adamw演算法：

一般來說，我們可以使用l2正則化來防止過擬合的出現，即在損失函式中新增所示權重的平方和組成乘法項，再乘上相應的超引數代表懲罰力度，即：

final_loss = loss + wd * all_weights.pow(2).sum() / 2

在使用原版的隨機梯度下降時，它實際上等價於：

w = w - lr * w.grad - lr * wd * w

然而，在使用其他的優化方法時，比如加入了動量的時候，這兩者是不等價的，當使用adam的時候，我們應該使用的是第二種權重衰減的方式。

3、pca（主成分分析）是現在比較常用的一種降維的方式，可在sklearn庫中直接使用。

4、word2vec：是生成詞嵌入的一種手段，能將one-hot編碼所產生的稀疏向量壓縮到乙個較小的子嵌入空間中，但用來**效能不佳；其將原本輸入句子標記為1，刪除原本句子中間單詞並用隨機單詞代替並標記為0，利用模型訓練找到標記為0的句子，我們要的就是在這個過程中生成的詞嵌入。詞嵌入是一種考慮語義的詞表示方法。

5、無論是學習哪種特徵空間，所必須要做的要麼是對資料進行標記，要麼就創造一些虛假的任務；如果我們不能想出來一些很好的虛假任務，用一些無用的虛假任務可能也很不錯，計算機視覺中採用的資料增強，某種程度上也算一種虛假任務；autoencoder是乙個輸入等於輸出的任務，相當於重構自身，保證中間層的啟用量小於輸入量，可以說是乙個假任務，但取得了不錯的效果。

深度學習（十三）

Python深度學習學習筆記（十三）

第十三次作業深度學習卷積

學習Python 十三

深度學習（十三）

Python深度學習 學習筆記（十三）

第十三次作業 深度學習 卷積

學習Python 十三

相關推薦

Python深度學習學習筆記（十三）

第十三次作業深度學習卷積