pytorch中如何使用預訓練詞向量

不涉及具體**，只是記錄一下自己的疑惑。

我們知道對於在pytorch中，我們通過構建乙個詞向量矩陣物件。這個時候物件矩陣是隨機初始化的，然後我們的輸入是單詞的數值表達，也就是一些索引。那麼我們會根據索引，賦予每個單詞獨一無二的乙個詞向量表達。在其後的神經網路訓練過程中，每個單詞對應獨一無二的索引，從而對應自己的詞向量，詞向量會隨著迭代進行更新。

上面講的這個是使用pytorch詞向量的隨機初始化的流程。

但是我們如果使用預訓練的詞向量怎麼辦呢？很多例子中，直接就給個**是類似這樣的:

self.word_embeds = nn.embedding(vocab_size, embedding_dim)
pretrained_weight = np.array(pretrained_weight)
self.embed.weight.data.copy_(torch.from_numpy(pretrained_weight))

先是進行乙個物件初始化，然後載入預訓練詞向量，然後把預訓練詞向量copy進去。

我們知道預訓練詞向量肯定也是乙個詞向量矩陣物件，這裡是通過單詞獲取詞向量權重。我們要做的就是做到類似pytorch自帶的那種權重初始化，得到乙個單詞-索引-權重對應的關係。預訓練物件得到的是單詞-權重。我們要得到的是索引-權重。

理解了上面這些話，看那些**就比較容易了。這裡還會涉及到乙個處理未登入詞的問題，就是預訓練詞向量中未出現的單詞我們怎麼處理，一般是置為零。

pytorch中如何使用預訓練詞向量

pytorch 使用預訓練層

pytorch 修改預訓練模型

pytorch 載入預訓練模型

pytorch中如何使用預訓練詞向量

pytorch 使用預訓練層

pytorch 修改預訓練模型

pytorch 載入預訓練模型

相關推薦