機器學習基礎概念一

lstm rnn長短期記憶rnn

自編碼autoencoder

生成對抗網路gan

梯度下降 gradient descent

人體900億神經細胞組**體神經網路。

神經網路的構建：

可稱之人工神經元的組合，在外部刺激上不斷改變自身。

人工神經網路可以分為輸入層，隱藏層(資訊的加工處理層)，輸出層。

中間的「黑盒層」做了什麼事呢？輸入資訊從一種特徵(feature)轉換成另外一種特徵，每一層都在做這種事。中間的這些特徵可能是我們無法理解的，但是計算機卻非常容易理解。最終輸出的結果，也是一種「特徵」，只不過是我們需要的那種。

給上千萬個資訊，讓計算機進行學習。最開始部分神經元啟用，進行某種嘗試，得到的結果可能是錯的，但是通過不斷反饋，一些神經元開始變得不活躍，另一些則可能變得活躍起來（神經元的函式引數發生了改變）。迴圈往復下來，計算機的神經反饋網路越來越精準。

convolutional neural networks，用於計算機識別、nlp，藥物發明等。

用途recurrent neural networks，處理序列化資料，比如語音。

現在有這麼些個資料，data0，data1…，這些資料之間是有先後關係的，因此結果也是有先後關係的。rnn要做的就是處理完當前的資料後，帶著結果到下乙個資料分析節點，一起分析下一步要得到的結果。就像下面這張圖顯示的那樣：

應用對於不同的應用，輸入和輸出的個數、位置可能不一樣。

比如描述：給乙個，輸出一段話來描述它。只有乙個輸入，有很多輸出。

翻譯：輸入中文，輸出英文

普通rnn的弊端：

梯度瀰散：誤差反向傳遞的時候每次都要乘以乙個引數w，如果w<1，那麼穿的到初始位置也會是乙個接近0的數。誤差也就相當於消失了。

梯度**：誤差反向傳遞過程中w>1，返回到初始節點就成了無窮大的數字，導致無法處理。正是因此，普通rnn無法回憶長期記憶。

lstm：輸入控制、輸出控制、忘記控制

有主線記憶、分線記憶（long short term memory）。

主線記憶的更新取決於輸入和忘記控制。如果輸入的新記憶對主記憶有很大影響，那麼就會忘記控制會忘記某些主線記憶，按比例替換成新記憶。

最後的輸出，輸出控制根據目前的主線記憶和分線記憶判斷到底要輸出什麼。

就是神經網路的非監督學習。

訓練神經網路需要大量的資料，如果直接讓神經網路處理這些資料，那麼會非常吃力。提取出原始資訊的精髓——資訊量小卻包含了原來所有關鍵資訊的檔案——然後讓神經網路處理，能大大減小神經網路的負擔。

這張裡左邊是原始資料，經過左邊的處理得到了壓縮的資料，也就是編碼；右邊的是解碼，用這些關鍵少量資訊恢復原始資訊。當然，也有誤差在不斷反向傳遞，不斷修改模型以變得更準確。

當然，常見的只有左邊的部分。讓編碼器整理出原始資訊的精髓，交給另外乙個神經網路去學習。這樣能大大減小神經網路的負擔。

用以「憑空」生成有意義的作品。

generator根據隨機數生成有意義的資料，discriminator會學習判斷那些是真實資料，哪些是生成資料，並將學習的經驗反向傳遞給generator，讓generator能根據隨機數生成更接近真實資料的資料。

optimization：優化問題。

假如誤差error的方程中有w1,

w2,.

..w_1,w_2,...

w1,w2

,..

.這些神經網路中的引數，以及x,y

,z,.

..x,y,z,...

x,y,z,

...等資訊的維度。梯度下降，就是沿著梯度下降（數學上就是求導，沿著導函式減小）的方向尋找。

我們往往只能找到區域性最優解，而非全域性最優解。但是也能找到乙個足夠優秀的區域性最優解，代替全域性最優解完成任務。

2019-05-09 17:42:29

機器學習 基礎概念 一

機器學習 一 基礎術語概念

機器學習基礎概念

機器學習基礎概念

相關推薦

機器學習基礎概念一

機器學習一基礎術語概念