基於統計的詞向量

glove 的訓練過程

實質上還是監督學習：雖然 glove 不需要人工標註為無監督學習，但實質還是有 label 就是 log(xij) 。

向量 ω 和 ω~ 為學習引數，本質上與監督學習的訓練方法一樣，採用了 adagrad 的梯度下降演算法，對矩陣 x 中的所有非零元素進行隨機取樣，學習曲率（learning rate）設為 0.05，在 vector size 小於 300 的情況下迭代了 50 次，其他大小的 vectors 上迭代了 100 次，直至收斂。

最終學習得到的是兩個詞向量是 ω 和 ω~ ，因為 x 是對稱的（symmetric），所以從原理上講 ω 和 ω~ ，是也是對稱的，他們唯一的區別是初始化的值不一樣，而導致最終的值不一樣。所以這兩者其實是等價的，都可以當成最終的結果來使用。但是為了提高魯棒性，我們最終會選擇兩者之和 ω + ω~ 作為最終的 vector（兩者的初始化不同相當於加了不同的隨機雜訊，所以能提高魯棒性）。

glove 損失函式

詞向量評價與再訓練

內部評價是我們在詞向量訓練技術中的具體的中間子任務上的評價，比如模擬,這些子任務通常畢竟簡單快速，能夠幫助我們理解詞向量，對於詞向量的效能有具體的數值指標。這樣做主要是因為乙個具體的機器學習任務通常需要很多的時間和計算資源來完成，且詞向量的性質會受到機器學習模型的好壞的干擾，所以有時候我們沒有必要去進行乙個具體的任務。

外部評價就是在真實任務上的評價，詞向量的評價依賴於任務的結果，畢竟我們訓練詞向量是為了完成具體任務，所以這也是必不可少的，並且很多時候我們需要根據具體的任務來選擇合適的詞向量訓練方法。然而當某個具體任務的模型表現很差時，我們常常並不能弄清楚到底是那部分有問題，所以還需要內部評價的支撐。

基於統計的詞向量

詞向量如何評價詞向量的好壞

詞向量簡介

詞向量與句向量概述

基於統計的詞向量

詞向量 如何評價詞向量的好壞

詞向量簡介

詞向量與句向量概述

相關推薦

詞向量如何評價詞向量的好壞