機器學習 學習筆記(一)002

2021-09-19 04:27:53 字數 998 閱讀 8196

要進行機器學習,首先就是要有資料,假如說我們現在收集了一批關於餅乾的資料,例如(色澤=金黃,芝麻=烏黑),(味道=賊香,口感=清脆),…,其中每對括號裡是一組資料,意思是「取值為」。

這組記錄的集合稱為乙個「資料集」,其中每條記錄是關於乙個事件或物件(例如這裡的餅乾)的描述,稱為乙個「示例」或「樣本」,反映事件或物件在某方面的表現或性質的事項。屬性上的取值稱為屬性值,屬性張成的空間稱為「屬性空間」、樣本空間或輸入空間。由於空間中的每個點對應乙個座標變數,因此我們也把乙個示例稱為乙個「特徵向量」。

我們來做乙個證明吧。

令d=表示包含m個示例的資料集,每個示例由d個屬性描述,則每個示例xi=是d維樣本空間x中的乙個向量,xi∈x,其中xij是xi在第j個屬性上的取值,d稱為樣本xi的維數。

從資料中學得模型的過程稱為「學習」或「訓練」,這個郭晨通過執行某個學習演算法來完成。訓練過沉重使用的資料稱為訓練資料,其中每個樣本稱為乙個訓練樣本,訓練樣本組成的集合稱為「訓練集」,學習模型對應了關於資料的某種潛在規律,因此亦成為假設,這種潛在規律自身,則稱為真相或真實,學習過程就是為了找出或逼近真相,也稱為學習器,可看做學習演算法在給定資料和引數空間的例項化。

如果希望學得乙個能幫助我們判斷沒刨開的是不是好餅乾的模型,僅有前面的示例資料顯然是不夠的,要建立這樣的關於「**」的模型,我們須獲得訓練樣本的「結果」資訊。

若我們**的是離散值,此類學習任務稱為「分類」,若欲**的事是連續值,此類學習任務稱為「回歸」,對只涉及兩個型別的二分類任務,通常稱其中乙個為正類,另乙個為反類(亦成為反類),涉及多個類別是,則稱為「多分類」任務。一般的,**任務是希望通過對訓練集進行學習,建立乙個從輸入空間到輸出空間的對映。

根據訓練資料是否擁有標記資訊,學習任務可大致劃分為兩大類:監督學習和無監督學習。分類和回歸是前者的代表,而聚類則是後者的代表。

但需要注意的是,機器學習的目標是使學得的模型能很好地適應新樣本,而不是僅僅在訓練樣本上工作的很好,即便對聚類這樣的無監督學習任務,我們也虛妄學得的簇劃分能使用與沒在訓練集**現的樣本。

本系列博文陸續更新中。。。。

Linux學習筆記0 0 2

刪除目錄或檔案的方法,我學習了兩個乙個是使用rmdir命令另乙個是使用rm命令。下面對這兩個命令進行簡要講解。1.1 rmdir 命令 rmdir 命令的作用就是從乙個目錄中刪除乙個或者多個空的子目錄。簡單粗暴的說,你只能刪除你包含的乙個或者多個空資料夾。看下面例項 1rmdir test 刪除 t...

Python學習筆記002

002講2020 7 7 第乙個遊戲程式 print 我愛魚c工作室 temp input 不妨猜一下小甲魚現在心裡想的是哪個數字 guess int temp if guess 8 print 恭喜你,猜對了 print 猜中了也沒有獎勵哦 else print 猜錯啦,我現在小甲魚現在心裡想的是...

機器學習筆記(一) 了解機器學習

1 人工智慧是我們想要達成的目標,機器學習是想要達成目標的手段,深度學習就是機器學習的其中乙個方法。2 機器學習,根據你提供的資料尋找乙個function,如下圖,輸入一段語音知道是 how are you 輸入貓的知道是 貓 怎樣找出這個function呢?第一,要有一系列的function,即模...