模式識別 機器學習 深度學習

2021-09-20 21:13:35 字數 3107 閱讀 5723

如果你想讓自己弄清楚機器學習和深度學習的區別,請閱讀本篇文章,我將用通俗易懂的語言為你介紹他們之間的差別。下文詳細解釋了機器學習和深度學習中的術語。並且,我比較了他們兩者的不同,別說明了他們各自的使用場景。

讓我們從基礎知識開始:什麼是機器學習?和什麼是深度學習?如果你對此已有所了解,隨時可以跳過本部分。

一言以蔽之,由 tom mitchell 給出的被廣泛引用的機器學習的定義給出了最佳解釋。下面是其中的內容:

「電腦程式可以在給定某種類別的任務 t 和效能度量 p 下學習經驗 e ,如果其在任務 t 中的效能恰好可以用 p 度量,則隨著經驗 e 而提高。」

是不是讀起來很繞口呢?讓我們用簡單的例子來分解下這個描述。

示例 1:機器學習和根據人的身高估算體重

假設你想建立乙個能夠根據人的身高估算體重的系統(也許你出自某些理由對這件事情感興趣)。那麼你可以使用機器學習去找出任何可能的錯誤和資料捕獲中的錯誤,首先你需要收集一些資料,讓我們來看看你的資料是什麼樣子的:

圖中的每乙個點對應乙個資料,我們可以畫出一條簡單的斜線來**基於身高的體重。

「深度學習是一種特殊的機器學習,通過學習將世界使用巢狀的概念層次來表示並實現巨大的功能和靈活性,其中每個概念都定義為與簡單概念相關聯,而更為抽象的表示則以較不抽象的方式來計算。」

這也有點讓人混亂。下面使用乙個簡單示例來分解下此概念。

示例: 貓 vs. 狗

我們舉乙個動物辨識的例子,其中我們的系統必須識別給定的影象中的動物是貓還是狗。閱讀下此文,以了解深度學習在解決此類問題上如何比機器學習領先一步。

1.模式識別、機器學習、深度學習的區別與聯絡

模式識別:過去、程式/機器做智慧型的事、決策樹等

機器學習:熱點領域、給資料+學習資料

深度學習:前沿領域、強調模型

2.早年神經網路被淘汰的原因

耗時、區域性最優、競爭對手、over-fitting、引數

3.深度學習的實質 及其 與淺層學習的區別

深度學習實質:多隱層+海量資料——>學習有用特徵—–>提高分類或**準確性

區別:(1)dl強調模型深度 (2)dl突出特徵學習的重要性:特徵變換+非人工

4.神經網路的發展(背景之類的)

mp模型+sgn

—->單層感知機(只能線性)+sgn— minsky 低谷

—>多層感知機+bp+sigmoid—- (低谷)

—>深度學習+pre-training+relu/sigmoid

5.dl解決過擬合的方法

資料擴容、dropout技術

6.介紹dropout技術

修改神經網路本身來避免過擬合、訓練網路的一種trike。

步驟:repeat 為何會避免過擬合:訓練多個「半數網路」,隨著訓練的進行,大部分正確,小部分錯誤(不影響)

7.推導bp演算法

8.bp演算法為什麼不能適應於深度學習

bp為傳統多層感知機的訓練方法,<=5層》

(1)梯度越來越稀疏(梯度擴散<—-非凸目標函式) (2)區域性最小="">

note:解決其中區域性最小值的方法:

(1)多組不同隨機引數,取最好引數 (2)啟發式優化演算法:模擬退火 或 遺傳 (3)隨機梯度下降

9.深度學習與傳統神經網路之間的區別與聯絡

聯絡:分層結構

區別:訓練機制(初始值)

10.介紹dnn(原理和應用)dnn:深度神經網路,廣義上包含cnn,dbn,rnn等 優點:層數多,抽象能力強,模擬更複雜模型 應用:影象處理、語音識別、文字分類。。。

11.什麼是深度學習、深度學習的訓練過程是什麼

無監督預訓練(layerwise pre-training)+有監督微調(fine-tune)

過程:(1)自下而上非監督學習特徵 (2)自頂向下有監督微調

12.深度學習常用方法

全連線dnn(相鄰層相互連線、層內無連線): autoencoder(盡可能還原輸入)、sparse coding(在ae上加入l1規範)、rbm(解決概率問題)—–>特徵探測器——>棧式疊加 貪心訓練 rbm—->dbn 解決全連線dnn的全連線問題—–>cnn 解決全連線dnn的無法對時間序列上變化進行建模的問題—–>rnn—解決時間軸上的梯度消失問題——->lstm

13.rbm用途

(1)編碼、降維 (2)得到權重矩陣和偏移量,供bp網路初始化訓練 (3)可作為生成模型使用 (4)可作為判別模型使用

14.介紹dbn

dbn是乙個概率生成模型。

組成:多個rbm+bp網路

訓練過程:

(1)無監督訓練每一層rbm網路、特徵向量對映到不同特徵空間、盡可能保留特徵資訊(貪心演算法)

(2)dbn最後一層設定為bp網路,有監督微調 rbm訓練可以看作對乙個深層bp網路的網路權值引數的初始化—->克服容易區域性最優+訓練時間長

優點:不用人工選取特徵

缺點:(1)有標籤樣本集 (2)學習過程慢 (3)引數不當可能導致區域性最優

15.介紹cnn

重點:區域性感受域、權值共享

組成:卷基層、子取樣層(池化層)

訓練過程:不同小隨機數初始引數—->repeat

廣義上的優點:

(1)識別位移、縮放及其他形式扭曲不變性的二維圖形

(2)隱式從訓練資料中學習特徵

(3)同一特徵對映面的神經元權值相同—–>課並行學習

(4)區域性權值共享—->在語音識別、影象處理方面有優勢、更接近實際生物神經網路、降低網路複雜性、避免特徵提取和分類過程中的資料重建複雜度

較一般神經網路在影象處理方面的優點:

(1)影象和網路拓撲更好吻合

(2)特徵提取和模式分類同時進行,並同時在訓練中產生

(3)權值共享—–>減少引數、結構簡單、適應性更強

應用:語音分析、影象識別等

深度學習 機器學習 模式識別

摘要 本文我們來關注下三個非常相關的概念 深度學習 機器學習和模式識別 以及他們與2015年最熱門的科技主題 機械人和人工智慧 的聯絡,讓你更好的理解計算機視覺,同時直觀認識機器學習的緩慢發展過程。以下為正文 本文我們來關注下三個非常相關的概念 深度學習 機器學習和模式識別 以及他們與2015年最熱...

深度學習 vs 機器學習 vs 模式識別

本文我們來關注下三個非常相關的概念 深度學習 機器學習和模式識別 以及他們與2015年最熱門的科技主題 機械人和人工智慧 的聯絡。圖1 人工智慧並非將人放入一台計算機中 於 workfusion 的部落格 環繞四周,你會發現不缺乏一些初創的高科技公司招聘機器學習專家的崗位。而其中只有一小部分需要深度...

模式識別 機器學習 深度學習的區別

1 模式識別概念 模式識別是指對表徵事物或現象的各種形式的 數值的 文字的和邏輯關係的 資訊進行處理和分析,以對事物或現象進行描述 辨認 分類和解釋的過程,是資訊科學和人工智慧的重要組成部分。2 機器學習 電腦程式可以在給定某種類別的任務 t 和效能度量 p 下學習經驗 e 如果其在任務 t 中的效...