NLP各種語言模型的優缺點比較

2021-10-23 18:15:38 字數 1313 閱讀 5322

持續更新中…

n-gram語言模型引入馬爾科夫假設,假設當前單詞出現的概率只與前n-1個單詞有關。常見的unigram、bigram、trigram公式如下:

神經語言模型使用連續表示或詞彙embedding來進行**。

網路包含輸入層、投影層、隱藏層和輸出層。輸入為前n-1個單詞,然後將每個單詞對映成為多維向量,再通過隱層去學習更深層次的表徵,最後輸出層通過softmax輸出詞表中每個單詞出現的概率。

網路的第一層:將前n-1個單詞的向量 c(w

t−n+

1),.

..,c

(wt−

2),c

(wt−

1)c(w_), ..., c(w_),c(w_)

c(wt−n

+1​)

,...

,c(w

t−2​

),c(

wt−1

​)進行拼接成為 (n−

1)∗m

(n-1)*m

(n−1)∗

m 維的向量,記為輸出 xxx。

網路第二層:通過全連線的隱層進行訓練 hx+

dhx+d

hx+d

,其中 h

hh 為權重矩陣,d

dd 為偏置項,最後通過乙個 tan

htanh

tanh

啟用函式。

網路的第三層:輸出層的節點個數為詞表的大小 ∣v∣

|v|∣v

∣, 每個節點 y

iy_i

yi​ 表示單詞 w

iw_i

wi​ **為下個單詞的概率。最終通過softmax進行歸一化輸出。y=b

+wx+

utan

h(d+

hx)p

=sof

tmax

(y)y=b+wx+utanh(d+hx) \\ p=softmax(y)

y=b+wx

+uta

nh(d

+hx)

p=so

ftma

x(y)

c語言的優缺點

1.物件導向程式設計功能 oops 物件導向程式設計的特點是c語言缺少的,你只能使用面向過程的語言來開發程式。c沒有的oops概念,這就是為什麼c 被開發。2.執行時型別檢查是不可用 在c語言沒有規定執行時型別檢查,比如我傳遞浮點值,而接收引數為整數型別那麼值將會被改變,它不會給任何型別的錯誤資訊。...

各種ADC轉換方式的優缺點

1 逐次逼近型 逐次逼近型adc是應用非常廣泛的模 數轉換方法,它包括1個比較器 1個數模轉換器 1個逐 次逼近暫存器 sar 和1個邏輯控制單元。它是將取樣輸入訊號與已知電壓不斷進行比較,1個時鐘週期完成1位轉換,n位轉換需要n個時鐘週期,轉換完 成,輸出二進位制數。這一型別adc的解析度和取樣速...

各種電容器的優缺點

電容器以生產材料可劃分為陶瓷電容器 鉭電解電容器 鋁電解電容器等。種類 優點缺點 應用陶瓷電容 溫度補償型 具有良好的高頻特性,較低的esr及殘餘電感esl 容量變化率小 濾波 高頻電容的耦合,與電感結合使用時,線圈的電感會隨著溫度的上公升而增加,這時則可以利用負溫度係數電容器來進行修正 高誘電型 ...