辨析 深度學習與機器學習的基本區別

2021-09-22 07:00:33 字數 4581 閱讀 2631

◆介紹

機器學習和深度學習現在風靡一時!好像是在一瞬間,每個人都在談論著它們- 無論人們是否理解兩者中間的差異!現在人們無論是否關注資料科學- 都會聽到過這兩個術語。

現在展示一下深度學習和機器學習所獲得的關注度,以下是這些關鍵字的google趨勢:

1.什麼是機器學習和深度學習

讓我們從基礎的知識開始開始說起- 什麼是機器學習和什麼是深度學習。如果你已經知道這一點,那可以跳過這一部分,直接去看第二部分,兩種學習之間的比較。

1.1什麼是機器學習?

tom mitchell廣泛引用的機器學習定義最好地解釋了機器學習。這就是它所說的:

●「據說電腦程式可以從經驗e中學習某些型別的任務t和用來測量的p,如果它在t中的任務中的表現(由p測量)會隨著經驗e的提高而提高」

這聽起來很令人費解或令人困惑對吧?那讓我們用簡單的例子來分析一下。

示例1 - 機器學習- 根據高度**權重

假設現在需要建立乙個系統,該系統根據人的身高來顯示預期的體重。可能有幾個原因會讓人感興趣對這個系統感興趣。我們可以使用它來過濾掉任何可能的欺詐或資料獲取的錯誤。首先要做的第一件事就是收集資料。假設我們現在的資料是這樣子的:

圖表上的每個點代表乙個資料點。首先,我們可以畫一條簡單的線來**基於身高的體重。舉乙個簡單的例子:

●體重(kg)=身高(cm) - 100

這樣可以幫助我們做出**。雖然這條**線做得不錯,但我們需要了解它的表現。在這種情況下,我們可以說我們希望減少**值和實際值之間的差異。這就是衡量績效的方法。

此外,我們收集的資料點越多(經驗),我們的模型就越好。我們還可以通過新增更多變數(例如性別)並為它們建立不同的**線來改進我們的模型。

示例2 - 風暴**系統

讓我們舉乙個稍微複雜一點的例子。假設現在需要構建乙個風暴**系統。通過過去發生的所有風暴的資料,以及這些風暴發生前三個月的天氣狀況。

考慮到這些,如果我們要手動建立乙個風暴**系統,我們需要做什麼?

我們首先必須檢查所有的資料,並找到這些資料中的模式。我們的任務是尋找導致風暴的條件。

我們可以模擬這樣的條件,如果溫度大於40攝氏度,濕度在80到100之間等等。然後手動將這些』條件』輸入到我們的系統。

或者,我們可以讓我們的系統在資料中了解到這些特徵的適當值。

現在要找到這些值,需要瀏覽所有之前的資料,並嘗試**是否會有風暴。根據系統設定的特徵值,我們評估系統的效能,就是系統正確**風暴發生的次數。我們可以對上述步驟進一步多次迭代,將效能作為反饋給我們的系統。

讓我們採用我們的正式定義來嘗試定義我們的風暴**系統:我們的任務「t」是找出引發風暴的大氣條件。效能「p」是在提供給系統的所有條件中,正確**風暴的次數。經驗』e』是我們系統的重複模擬。

1.2什麼是深度學習?

深度學習的概念並不新鮮。它已經存在好幾年了。但是現在隨著不斷的炒作,深度學習越來越受到關注。正如我們在機器學習中所做的那樣,我們先研究深度學習的正式定義,然後通過例子對深度學習分解認識。

●「深度學習是一種特殊的機器學習,它通過學習將世界表示為巢狀的概念層次結構來實現強大的功能和靈活性,每個概念都是根據更簡單的概念進行定義的,而更抽象的表示則用不那麼抽象的概念計算出來。 」

這些概念同樣會讓人困惑不已。現在讓我們用簡單的例子來認識它。

示例1 - 形狀檢測

讓我從乙個簡單的例子開始,它解釋了在概念層面上事情是如何發生的。讓我們試著理解如何識別其他形狀的正方形。

我們眼睛做的第一件事就是檢查是否有4條線與乙個圖形相關聯(簡單概念)。如果我們找到4條線,我們進一步檢查它們是否連線,閉合,垂直以及它們是否相等(概念的巢狀層次結構)。

因此,我們採取了一項複雜的任務(確定乙個正方形)並將其分解為簡單的、不那麼抽象的東西。深度學習在很大程度上就是這麼做的

示例2 - 貓還是狗

讓我們舉乙個動物識別器的例子,我們的系統必須識別給的是貓還是狗。

如果我們將此作為乙個典型的機器學習問題的話,我們必須定義一些特徵,諸如動物是否有鬍鬚,是否有耳朵如果有耳朵,那麼耳朵是尖的還是稍微圓一點的。簡單點說,我們要定義面部特徵,讓系統識別哪些特徵在對特定動物進行分類時比較重要。

現在,深度學習就比機器學習領先一步。深度學習會自動找出對分類很重要的特徵,在機器學習中我們必須手動提供這些特徵。深度學習的工作原理如下:

深度學習的工作原理如下:

①它首先確定那些特徵與找出貓和狗最相關

②然後,它以層次結構為基礎,找到可以找到的特徵的組合。例如,是否存在鬍鬚,或是否存在耳朵等。

③在對複雜概念進行連續層次識別之後,它決定通過哪個特徵負責來找到答案。

2.機器學習與深度學習的比較

既然現在你已經了解了機器學習和深度學習的基本概念,那我們接下來要用一些重要的觀點來比較一下這兩種技術。

2.1資料依賴

深度學習與傳統機器學習之間最重要的區別會隨著資料規模的增大而表現出來。當資料很小時,深度學習演算法表現不佳。這是因為深度學習演算法需要大量資料才能完美理解它。另一方面,傳統的機器學習演算法及其手工製作的規則在這種情況下佔據優勢。下圖總結了這一事實。

2.2硬體依賴性

深度學習演算法在很大程度上依賴於高階機器,這與傳統的機器學習演算法相反,後者可以在低端機器上執行。這是因為深度學習演算法的要求包括gpu,因為gpu是其工作中不可或缺的組成部分。深度學習演算法本質上是做大量的矩陣乘法運算,而使用gpu可以有效的優化這些操作,而這就是使用gpu的目的。

2.3特徵工程

特徵工程是將領域知識放入特徵提取器的建立過程,用來降低資料的複雜性並使特徵對於學習演算法更加可見。就時間和專業知識而言,這個過程是困難而又昂貴的。

在機器學習中,大多數應用的特徵需要由專家識別,然後根據領域和資料型別進行手動編碼。

例如,特徵可以是畫素值,形狀,紋理,位置和方向。大多數機器學習演算法的效能取決於特徵識別和特徵提取的準確程度。

深度學習演算法嘗試從資料中學習高階特徵。這是深度學習乙個非常獨特的部分,也是超越傳統機器學習的重要部分。因此,深度學習減少了為每個問題開發新的特徵提取器的任務。就像,卷積神經網路將嘗試先學習底層特徵,例如早期圖層中的邊緣和線條,然後是人臉的部分面部,最後是高階的面部識別。

2.4問題解決方法

當使用傳統的機器學習演算法解決問題時,通常建議將問題分解為不同的部分,分別解開這些問題,然後將它們組合起來得到結果。相反,深度學習主張從頭到尾的解決問題。

我們舉乙個例子來理解這一點。

假設現在有乙個多個物件檢測的任務。任務是確定物件是什麼以及它在影象中的位置。

在典型的機器學習方法中,可以將問題分為兩個步驟:物件檢測和物件識別。首先,您將使用像grabcut這樣的邊界框檢測演算法來瀏覽影象並查詢所有可能的物件。然後,在所有已識別的物件中,您將使用物件識別演算法(如帶有hog的svm)來識別相關物件。

相反,在深度學習方法中,只需要從頭到尾的完成這個過程。例如,在yolo net(這是一種深度學習演算法)中,傳入這張影象,它將給出物件存在的位置以及物件的名稱。

2.5執行時間

通常,深度學習演算法需要很長時間來訓練。這是因為深度學習演算法中有很多的引數,所以訓練它們需要更長的時間。最先進的深度學習演算法resnet需要大約兩周時間才能完全從0開始的訓練。相比之下,機器學習的訓練時間要短得多,從幾秒鐘到幾小時不等。

測試時間完全顛倒了。在測試時,深度學習演算法執行的時間要少得多。然而,如果把它與k近鄰(一種機器學習演算法)進行比較,則測試時間會隨著資料的增加而增加。雖然這不適用於所有機器學習演算法,因為有些演算法的測試時間也會很短。

2.6可解釋性

最後一點但並非不重要的是,我們將可解釋性作為比較機器學習和深度學習的乙個因素。這個因素是深度學習在用於行業之前仍被反覆思考的主要原因。

我們來舉個例子吧。假設我們使用深度學習自動為**打評分。它在打分方面的表現的非常出色,接近人類的表現。但有乙個問題。它沒有透露出為什麼它給出了這個分數。事實上,你可以通過數學方法找出深層神經網路的哪些節點被啟用,但我們不知道這些神經元是怎麼建模的,以及這些神經元做了什麼。所以我們無法解釋結果。

另一方面,像決策樹這樣的機器學習演算法為我們提供了清晰的規則,解釋了為什麼要選擇這個內容,因此特別容易理解其背後的原理。因此,像決策樹和線性/邏輯回歸等演算法主要用於行業中就是因為其結果的可解釋性。

3.機器學習和深度學習現在在**應用?

①計算機視覺:適用於車牌識別和面部識別等應用。

②資訊檢索:適用於搜尋引擎,文字搜尋和影象搜尋等應用程式。

③營銷:用於自動化的電子郵件營銷,目標識別等應用

④醫療診斷:用於癌症鑑定,異常檢測等應用

上面給出的影象恰當地總結了機器學習的應用領域。雖然它涵蓋了更廣泛的機器智慧型主題。

使用機器學習/深度學習的公司的乙個主要例子是google。

在上圖中,您可以看到google如何在其各種產品中應用機器學習。機器學習/深度學習的應用是無止境的,你只需要看到合適的機會!

4.未來趨勢

上面的文章講述了機器學習和深度學習以及它們之間的區別。在這部分中,我將分享一下我認為的機器學習和深度學習未來發展的觀點。

①首先,看到在行業中使用資料科學和機器學習的日益增長的趨勢,對於每個想要活下來的公司來說,在他們的業務中使用機器學習將變得越來越重要。此外,每個人都應該了解這些基本術語。

②深度學習每天都在給我們帶來驚喜,在未來也還會繼續。這是因為深度學習被證明是最先進的技術之一。

③機器學習和深度學習的研究是不斷的。但不同的是往年研究僅限於學術界,現在機器學習和深度學習的研究在工業界和學術界都在**式增長。隨著可用資金的增加,它更有可能成為整體人類發展的乙個主題。

機器學習與深度學習

機器學習簡介 機器學習是什麼 無序資料轉化為價值的方法 機器學習價值 從資料中抽取規律,並用於 未來。機器學習應用舉例 分類問題 影象識別,垃圾郵件識別 回歸問題 股價 房價 排序問題 點選率預估,推薦 生成問題 影象生成,影象風格轉換,影象文字描述生成。機器學習的應用流程 線下訓練到線上服務 機器...

深度學習基礎(1) 機器學習與深度學習

機器學習 深度學習 通常,在我們接觸深度學習的過程中,經常可以看到機器學習,深度學習,監督學習,無監督學習,神經網路,隱藏層,函式等一系列概念。這些概念之間的相互關係是什麼,分別是什麼意思,有什麼作用,搞清楚這個是非常重要的。在此對其進行一次梳理。所有的概念都可以認為出自 人工智慧 artifici...

機器學習與深度學習的區別

1.特徵提取方面 深度學習演算法試圖從資料中學習高階功能,這是深度學習的乙個非常獨特的部分。因此,減少了為每個問題開發新特徵提取器的任務。適合用在難提取特徵的影象 語音 自然語言處理領域。2.資料量和計算效能要求 機器學習需要的執行時間遠少於深度學習,深度學習引數往往很龐大,需要通過大量資料的多次優...