機器學習是什麼

2021-08-22 04:52:50 字數 1754 閱讀 4556

–本文章是筆者對於高揚、衛崢編著的《白話深度學習與tensorflow》讀後總結

首先簡單介紹一下,這本書是老師所推薦的,就教學意義來講,是一本特別特別通俗易懂的教材,用簡明扼要的理論和文字給讀者講解深度學習的各種理論,對於初學者來說是一本再好不過的教材,強力推薦

從學習的種類來說,機器學習習慣分為兩種。一種叫無監督學習,一種叫有監督學習。

所謂「無監督學習」,是指人們在獲得訓練的向量資料後在沒有標籤的情況下嘗試找出其內部蘊含關係的一種挖掘工作,在這個過程中,不需要對這些樣本做任何的標記或者是干預。」有監督學習「與此不同,每乙個樣本資料都要有標籤,最後我們只要總結出這些訓練樣本與標籤的對映關係。

聚類是一種典型的」無監督學習「,是把物理物件或者抽象物件的集合分組為彼此類似的物件組成的多個類的分析過程。

簡單來說,就是把相似事物歸為一類,面前有一群寵物,經過乙個個觀察後,我們能夠分辨哪些是貓,哪些是狗,而在這些貓狗中,我們又能分辨出它們的不同種類,這就是乙個聚類的過程。

對於計算機來講,在輸入樣本資料後,通過一定的演算法就可以得出不同的聚類結果,這個過程是不需要干預的,所以為」非監督「。

回歸是一種解題方法。

回歸的英文為regression,中文釋義可以理解為」倒推「,即」推導「的意思。就是乙個」由果索因「的過程。可以理解為–當我看到大量的事實所呈現的樣態,我推斷出原因或客觀蘊含的關係。

比如函式 y=wx+b,在給出一些x和y的取值後,我們可以推導出w和b的取值,這就是簡單的乙個回歸。

回歸可分為線性回歸和非線性回歸兩種。

線性回歸就是向量和最終的函式值存在一種線性關係。

非線性回歸在機器學習領域應用最多當屬邏輯回歸,對於任何向量,這裡的函式值可以假設只存在兩種,即0和1,也可認為是「真」和「假」。

分類屬於機器學習中使用最多的一大類演算法,通常這類演算法也叫做「分類器」。

在這裡提一下,在傳統的機器學習中,對於獲取到的資料集一般會分為訓練集和測試集(有叫驗證集,乙個意思)兩種。訓練集用作訓練、歸納關係;測試集用來驗證所得關係的精確度。一般資料集的劃分為三七開或者二八開,實際應用會有不同,反正訓練集一定是用資料多的那部分。

分類演算法就像乙個黑盒子一樣,有乙個輸入也有乙個輸出,我們輸入乙個樣本,它輸出樣本的類別。

我們在編寫**的時候,會教分類器如何建立一種輸入到輸出的對映邏輯,以及讓它自己調整這種邏輯關係,是邏輯更為合理,而合理與否是通過召回率和精確率來衡量。下面通過乙個例子介紹召回率和精確率。

比如我們有1000張**。其中有200張貓,200張狗,600張兔子。把它們輸入到訓練集去訓練,經過多輪訓練後,分類器已經基本獲取了這三類的特徵,然後再用分類器對這些進行分類。

最後得到200張貓有180張正確識別為貓,其餘20張誤判為狗。

200張狗全部判定正確。

600張兔子有550張識別為兔子,其餘30張誤判為貓,20張誤判為狗。

那麼對於這個例子,貓的召回率就是 正確識別的/貓的所有 = 180/200 = 90%,同樣兔子的就是 550/600 ≈ 91.7%。而在這1000張圖中,我們檢索到240張狗,其中200張的確是狗,有20張是被誤判的貓,還有20張是被誤判的兔子,那麼狗的精確率就是 200/240 ≈ 83.3%。這樣就是這兩個概念的意思了。

分類的訓練過程和回歸的一樣,都是極為套路化的程式。

第一,輸入樣本和分類標籤。

第二,建立對映假說的某個 y=f(x) 的模型

第三,求解出全域性的損失函式loss和待定係數w的對映關係。loss=g(w)

第四,通過迭代優化降低loss,最終找到乙個w能使召回率和精確率滿足場景需要。

機器學習是什麼?

機器學習 ml 是一門多領域交叉學科,涉及概率論,統計學,逼近論,凸分析,演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。機器學習是人工智慧的核心,是使計算機具有智慧型的根本途徑,其應用遍人工智慧的各個領域,...

機器學習 TF IDF是什麼

在資訊檢索與文字挖掘中經常遇見單詞的 tf idf term frequency inverse document frequency 這個值的大小能夠體現它在文字集合中的某乙個文件裡的重要性。tf idf是一種統計方法,用以評估一字詞對於乙個檔案集或乙個語料庫中的其中乙份檔案的重要程度。字詞的重要...

機器學習 機器學習是什麼意思

在大學的時候學習了機器視覺的相關知識 但對於機器學習的認知還只停留在感念層次上 現在乘著有時間,把以前的缺漏補上 首先來闡述下本人對於機器學習的理解 機器學習就是使機器通過 學習 也有些書籍成為 訓練 來了解某種事物的特徵,從而在人類輸入乙個未知訊號時可以 推理 有些書籍稱為 演算 出該訊號的特徵這...