啟用函式比較

sigmoid 和 relu 比較：

sigmoid 的梯度消失問題，relu 的導數就不存在這樣的問題，它的導數表示式如下：

曲線如圖

對比sigmoid類函式主要變化是：

1）單側抑制

2）相對寬闊的興奮邊界

3）稀疏啟用性。

sigmoid 和 softmax 區別：

softmax is a generalization of logistic function that 「squashes」(maps) a k-dimensional vector z of arbitrary real values to a k-dimensional vector σ(z) of real values in the range (0, 1) that add up to 1.

sigmoid將乙個real value對映到（0,1）的區間，用來做二分類。

而 softmax 把乙個 k 維的real value向量（a1,a2,a3,a4….）對映成乙個（b1,b2,b3,b4….）其中 bi 是乙個 0～1 的常數，輸出神經元之和為 1.0，所以相當於概率值，然後可以根據 bi 的概率大小來進行多分類的任務。

二分類問題時 sigmoid 和 softmax 是一樣的，求的都是 cross entropy loss，而 softmax 可以用於多分類問題

softmax是sigmoid的擴充套件，因為，當類別數 k＝2 時，softmax 回歸退化為 logistic 回歸。具體地說，當 k＝2 時，softmax 回歸的假設函式為：

利用softmax回歸引數冗餘的特點，從兩個引數向量中都減去向量θ1 ，得到:

最後，用 θ′ 來表示 θ2−θ1，上述公式可以表示為 softmax 回歸器**其中乙個類別的概率為

另乙個類別概率的為

這與 logistic回歸是一致的。

softmax建模使用的分布是多項式分布，而logistic則基於伯努利分布

多個logistic回歸通過疊加也同樣可以實現多分類的效果，但是 softmax回歸進行的多分類，類與類之間是互斥的，即乙個輸入只能被歸為一類；多個logistic回歸進行多分類，輸出的類別並不是互斥的，即」蘋果」這個詞語既屬於」水果」類也屬於」3c」類別。

選擇的時候，就是根據各個函式的優缺點來配置，例如：

啟用函式比較

啟用函式的比較

啟用函式的比較，sigmoid，tanh，relu

深度學習啟用函式比較

啟用函式比較

啟用函式的比較

啟用函式的比較，sigmoid，tanh，relu

深度學習啟用函式比較

相關推薦