05 機器學習演算法分類以及開發流程

2021-09-27 06:57:41 字數 1204 閱讀 6536

"""

1. 需要明確:

演算法是核心,資料和計算是基礎

2. 找準定位:

如果只是開發工程師:沒必要把數學的推導搞得特別清楚。僅需要把演算法的原理搞清楚、知道用在哪些方面、該演算法擅長及不擅長的領域即可

重要:特徵工程、調引數、優化

大部分複雜模型的演算法設計都是演算法工程師在做

應該怎麼做?

1. 學會分析問題,使用機器學習演算法的目的,想要演算法完成何種任務

2. 掌握演算法基本思想,並對問題用相應的演算法以及庫和框架去解決問題

3. 機器學習演算法的判別依據

資料型別:

離散型資料,又稱計算資料:全部是整數,不能再細分,也不能再進一步提高其精確度

連續型資料:變數可以在某個範圍內取任一數,如時間、質量等,含有小數部分

僅需記住:離散型區間內不可分,連續型區間內可分

資料型別個不同應用:

離散型:分類

連續型:**

4. 機器學習演算法的分類:

監督學習(**):有特徵值+目標值,即有標準答案

分類:k-近鄰演算法、貝葉斯分類、決策樹與隨機森林、邏輯回歸、神經網路

目標值是離散型資料

概念:分類是監督學習的乙個核心問題,在監督學習中,當輸出變數取有限個離散值時,**問題會變成分類問題。最基礎的便是二分類問題,即判斷是否

回歸:線性回歸、嶺回歸

目標值是連續型資料

用途:用於**輸入變數和輸出變數之間的關係

標註:隱馬爾可夫模型

無監督學習:只有特徵值,即沒有標準答案

聚類:k-means

5. 機器學習的開發流程:

(圍繞)資料:

1. 本身有資料

2. 合作過來資料

3. 購買的資料(很少)

流程:1. 原始資料:明確問題做什麼。即建立模型(到底是分類還是回歸等):根據資料型別(目標值型別),劃分應用種類

2. 資料的基本處理:用pd去處理資料(缺失值、合併表...)

3. 特徵工程:對特徵進行處理(重要環節)

4. 找到合適的演算法去進行**

ps:模型=演算法+資料

5. 模型的評估:判定模型的效果怎麼樣。

如果模型評估沒有合格:

1. 換算法、引數

2. 特徵工程重新處理

6. 上線使用:常以api形式提供

"""

機器學習演算法分類

這些演算法按照學習方式分類的分的話,可以分為一下幾類 1 監督式學習 從給定的訓練資料集中學習出乙個函式,當新的資料到來時,可以根據這個函式 結果。監督學習的訓練集需要包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督式學習演算法包括回歸分析和統計分類。2 非監督式學習 與...

機器學習 分類演算法

最優化理論基礎 分類演算法詳解 簡單例項講解樸素貝葉斯分類演算法 機器學習實戰 樸素貝葉斯 機器學習實戰 python3 基於概率論的分類方法 樸素貝葉斯 機器學習入門之決策樹演算法 決策樹演算法的基本原理 機器學習實戰 python3 決策樹id3 機器學習實戰 基於資訊理論的三種決策樹演算法 i...

機器學習演算法分類

4.了解了機器學習的各種類別,那麼每一種類別有哪些應用呢?機器學習 machine learning 是人工智慧 ai 重要的一部分,是實現人工智慧的乙個途徑。機器學習包含不同種類的演算法,而為了解決不同型別的問題,機器學習演算法可以分為特定的種類,我們要使用最適合的演算法來解決它最擅長的問題。學習...