談談深度學習和機器學習

2021-07-31 03:14:54 字數 1010 閱讀 4521

嚴格意義上講,深度學習屬於機器學習,所以這裡的機器學習嚴格意義上說,應該叫傳統意義的機器學習:基於概率統計的機器學習。

在我讀研的時候,已經判斷機器學習會在後幾年火熱起來,但是,由於alphago的「攪局」,這一時間點提前了,著實讓我有些狼狽的追趕,但是好歹也算是找到了機器學習的工作,雖然其中有一些彎路,還算如願吧。

這一輪人工智慧的熱潮呢,如果不是深度學習,機器學習不會如此火熱。青出於藍,是不是勝於藍,這個可以再說,但是畢竟有其獨特的地方,值得說道說道。而且,就我的感覺,他們的差別還是不小的,而目前,深度學習的潛力還沒有完全釋放出來。

那他們的區別在**呢?

1. 要不要特徵選擇?

傳統的機器學習,有個說法特別有名:特徵工程決定了我們的極限,機器學習演算法不過是逼近這個極限。機器學習在工業界裡,可以說大部分時間都在資料預處理,做特徵工程,演算法花費的精力其實並不多。

一旦解決了資料表達和特徵選擇,很多人工智慧任務也就解決了90%。

而,做過特徵選擇的人都知道,這個事可不是這麼簡單的。

深度學習作為機器學習的組成部分,它的獨特地方在於可以自動的從簡單的特徵中提取更加複雜的特徵。如果詳細說來,傳統機器學習,首先人工特徵提取,然後權重學習,最後**結果。深度學習首先基礎特徵提權,然後多層複雜特徵提取,然後權重學習,最後**。接單總結兩個小點:(1)、自動;(2)、獲得複雜特徵。

2. 屬於哪個門派?

我在看佩德羅的《終極演算法》時,看到裡面對機器學習分為5個學派。我們今天討論的深度學習屬於聯結學派,靈感**於神經科學和物理學;傳統機器學習屬於貝葉斯學派,理論根基在於統計學。從這裡延伸,我們就可以發現,這屬於兩個不同的流派,差別堪比符號學派與機器學習的區別吧。

3. 誰更吃計算資源和資料量?

在90年代末期,傳統的機器學習演算法也有了突破性的進展,代表性的演算法是支援向量機,手寫體識別的錯誤率降低到0.8%。之所以會這樣,主要有兩個原因:(1)、當年的計算資源比較稀缺,訓練深層神經網路比較困難;(2)、資料量比較小,無法滿足需求。

傳統機器學習和深度學習

托馬斯 貝葉斯 thomas bayes 同學的詳細生平在這裡。以下摘一段 wikipedia 上的簡介 所謂的貝葉斯方法源於他生前為解決乙個 逆概 問題寫的一篇文章,而這篇文章是在他死後才由他的一位朋友發表出來的。在貝葉斯寫這篇文章之前,人們已經能夠計算 正向概率 如 假設袋子裡面有n個白球,m個...

機器學習深度學習

機器學習與深度學習,人工智慧 這些領域,如果機器需要向人學習,那麼,人是如何學習的,或者人思維是如何運作的。構 的乙個思維生態 閉環 目前機器學習人工智慧的取得較大發展是依託統計概率論。如果機器需要有自己的ai,那麼是否意味著人在創造生命。因為,生命可以不斷的延續。那麼什麼是生命,生命由那些構成,構...

機器學習 深度學習

深度學習歷程 深度學習是一種機器學習方法,給定一組輸入 值輸入或者傳出計算機資訊 它允許我們訓練人工智慧來 輸出。吳恩達 與深度學習類似的是,火箭發動機是深度學習模型,燃料是我們可以提供給這些演算法的海量資料。神經網路是一組粗略模仿人類大腦,用於模式識別的演算法。1981 年 諾貝爾獎,人的視覺系統...