機器學習入門知識了解

2021-08-14 08:42:25 字數 1620 閱讀 5580

機器學習是目前大的潮流方向,作為一名非計算機專業的學生,主要從興趣角度出發了解。根據所閱讀的書籍資料進行提煉,也算是對自己所學的乙個小結。主要參考書籍《python機器學習及實踐》

首先從機器學習的定義入手,這裡引用卡內基梅隆大學機器學習領域的著名教授tom mitchell的經典定義:

a program can be said to learn from experienceewith respect to some class of taskstand performance measurep, if its performance at tasks int, as measured byp, improves with experiencee.

翻譯過來就是:如果乙個程式在使用既有的經驗(e)執行某類任務(t)時的過程被認為是具備學習能力的,那麼它一定需要展現出:利用現有的經驗(e),不斷改善其完成既定任務(t)的效能(p)的特質。

任務:機器學習的任務種類有很多,經典任務主要包括兩類:監督學習與無監督學習。監督學習關注對事物未知表現的**,一般包括分類問題和回歸問題。無監督學習傾向於對事物本身特性的分析,常用技術包括資料降維和聚類問題等。

分類問題。即對所在的類別進行**。類別是離散的也是預先知道數量的。

回歸問題。同樣是**問題,只是**目標往往是連續變數。

資料降維。是對事物的特性進行壓縮篩選,較為抽象。舉例:在識別影象中人臉任務中,我們可以讀取到影象的畫素資訊,若直接使用資料維度非常高。因此可以利用資料降維保留最具有區分度的畫素組合。

聚類問題。依賴於資料的相似性,把相似資料樣本劃分為乙個簇。不同於分類問題,在大多數情況下我們不會預先知道簇的數量和每個簇具體含義。

經驗:只有對學習任務有用的特定資訊才為經驗,通常把這些反應資料內在規律的資訊叫做特徵。對於監督學習問題,我們所擁有的經驗包括特徵和標記/目標兩部分。我們一般用乙個特徵向量來描述乙個資料樣本;標記/目標的表現形式取決於監督學習的種類。無監督學習問題自然沒有標記/目標,因此也無法從事**任務,卻更加適合對資料結構的分析。

訓練集:既有特徵,同時也帶有目標/標記的資料集。用於訓練學習系統。

效能:效能是評價所完成任務質量的指標。為評價學習模型完成任務的質量,我們需要具備相同特徵的資料,並將模型的**結果通相對應的正確答案進行比對。我們稱這樣的資料集為測試集。需要注意出現在測試集中的資料樣本一定不能被用於模型訓練。

對待**性質問題,我們關注**的精度。具體來講:分類問題,我們要根據正確類別的百分比來評價其效能,這個指標通常被稱為準確性。回歸問題則無法使用類似指標,我們通常會衡量**值與實際值之間的偏差大小。

機器學習入門了解

根據歷史資料建立靜態的模型,隨著資料的增加隨時間不斷變化的動態模型。用於 未來的資料 模型一種機器學習方法的結果以及該方法採用的演算法。可以在監督學習中用來做 或者在無監督學習中用來檢索聚類。離線訓練 從頭開始建立乙個新模型 監督學習 明確定義要使用的特徵,以及預期的輸出結果 無監督學習 不需要事先...

機器學習了解

機器學習的核心是 使用演算法解析資料,從中學習,然後對世界上的某件事情做出決定或 這意味著,與其顯式地編寫程式來執行某些任務,不如教計算機如何開發乙個演算法來完成任務。有三種主要型別的機器學習 監督學習 非監督學習和強化學習,所有這些都有其特定的優點和缺點。監督學習涉及一組標記資料。計算機可以使用特...

關於機器學習需要了解的知識

當我們要學習人工智慧的時候,我們需要學習很多的知識,比如機器學習 深度學習等。一般來說,機器學習是人工智慧的核心知識,要想學好人工智慧就必須重視機器學習的知識。在這篇文章中我們給大家介紹一下關於機器學習需要了解的知識。當然,說到機器學習就必須要說一下機器學習演算法,在機器學習演算法中,尤其是神經網路...