機器學習,你首先得知道這十個知識點

2021-08-21 23:44:28 字數 1943 閱讀 6535

1.機器學習意味著從資料中學習,而ai呢是乙個比較炫酷時髦的詞。

機器學習基於這樣的假設:我們可以通過將正確的資料放到正確的演算法中去訓練解決一系列複雜的問題。當你需要融資或者發布產品的時候可以毫不猶豫的稱之為人工智慧(ai),但是你心裡需要明白現在ai是乙個幾乎可以代表一切時髦用詞。

2.機器學習包括資料和演算法,但最主要的部分還是資料。

機器學習演算法特別是深度學習近年來取得了極大的成功,但是你需要明白的是資料才是使機器學習成為可能的關鍵因素。你可以使用簡單的演算法實現機器學習,但是沒有好的資料你將寸步難行。

3.如果沒有大量的資料,那麼你還是安心的使用簡單的模型吧。

機器學習的任務是從資料中訓練出一種模式,探索由引數定義的模型空間。如果你的引數空間太大的話,模型就會在訓練資料上出現過擬合,並使得模型失去泛化性。 關於過擬合的詳細解釋需要很多的數學推到的,但是你需要記住的是,模型越簡單越好。

4.機器學習的能力只能到達訓練資料所能提供的水平。

「無用輸入,無用輸出」很好的反映了機器學習的侷限性。機器學習只能在提供的訓練資料中發現模式,不能夠憑空學習出新模式。對於類似分類的監督學習任務來說你需要魯棒的收集正確標註的特徵豐富的資料來作為訓練資料。

5.只要訓練資料具有代表性的情況下機器學習才會有效。

就像教課書中曾經教會我們的一樣「過去的表現並不是未來結果的保障」,機器學習只能在於訓練資料同分布的資料上有效。你需要對訓練資料和實際資料之間統計上的不對稱性保持足夠的警覺,同時需要保持模型不斷地被訓練讓它不落伍。

6.機器學習中最複雜的工作來自於資料轉換。

在閱讀文獻的時候你會看到很多眼花繚亂演算法,你也許認為機器學習最主要的工作便是選擇演算法和調節引數。但真實的情況是:機器學習中需要做的最多的工作就是資料清洗和特徵工程,你需要將資料的原始特徵轉換到能更好的表示其中資訊的新特徵上去。

7. 深度學習是一項革命性的技術,但卻不是包治百病的靈丹妙藥。

近些年來深度學習被捧上神堂,遠遠超過了其他的機器學習演算法。其中的原因之一就是深度學習可以自動完成傳統機器學習演算法中需要特徵工程才能實現的任務,特別是在影象和聲音資料的處理中更是如此。但是我們需要明白深度學習不是萬金油,你只能在一定的範圍內應用這項技術,同時你也需要在資料清洗和變換上花上很多的精力才行。

8.機器學習極易受到誤操作的影響。

「機器學習演算法不會殺人,而人類卻可能會自掘墳墓」。當機器學習演算法失效的時候,很少因為演算法本身的的錯誤,而大多數情況下卻是人為的錯誤造成的。很多情況下你在訓練資料中不小心引入了認為錯誤,或者引入了偏差和其他的系統錯誤。你需要時刻保持懷疑的態度來使用機器學習演算法,並在應用的過程中進行嚴格的檢查。

9.機器學習會在不經意間實現自我預言。

在很多機器學習的應用中,今天的決策會影響未來收集的訓練資料。一旦機器演算法模型引入了一定的模型偏差,那麼它會持續的收集新的資料不斷強化這一偏差。事實上有些這樣的偏差確實會奪取人寶貴的生命。每乙個機器學習從業者都要在心中銘記:不要創造自我實現的預言!

10. ai不會擁有自我意識,也不會崛起摧毀人類的。

令人驚訝的是,在機器學習如此普遍的今天,好多人卻依舊用科幻**和電影中的情節來定義和認識ai。的確,科幻**可以啟發人的創造力,但卻不應該如此輕信科幻**,以致於我們對真實的世界產生誤解。今天的世界已經有很多需要我們去關注的危險,從別有用心的**的人到無辜的被濫用的機器。所以請大家不要再去擔心「天網」和超級人工智慧的出現,而是應該用審慎的心態去看待機器學習,讓它更加健康的發展為人類服務。

關於TCP IP,這十個問題你都知道,就入門了!

巨集碁 本文整理了一些tcp ip協議簇中需要必知必會的十大問題,既是面試高頻問題,又是程式設計師必備基礎素養。1 tcp ip模型 tcp ip協議模型 transmission control protocol internet protocol 包含了一系列構成網際網路基礎的網路協議,是int...

Python開發的十個Tips,你知道幾個?

下面是十個python中很有用的貼士和技巧。其中一些是初學這門語言常常會犯的錯誤。注意 假設我們都用的是python 3 1.列表推導式 你有乙個list bag 1,2,3,4,5 現在你想讓所有元素翻倍,讓它看起來是這個樣子 2,4,6,8,10 大多初學者,根據之前語言的經驗會大概這樣來做 b...

機器學習都有什麼用?十個案例告訴你

機器學習是當前科技行業的一大流行詞,原因很充分 它代表著計算機學習方式的一大躍進。富比士近日盤點了機器學習技術的十大使用案例。從根本上說,機器學習演算法是指機器先獲得一組 教學 資料,然後被要求利用那些資料去回答問題。舉例來說,你給計算機提供一組 的教學資料,當中有的資料說 這是貓 有的則說 這不是...