機器學習（一）簡介

什麼是機器學習？乙個不是很正式的回答是：不直接通過程式設計讓計算機解決問題，而是試著讓計算機自己找到解決方式。

（一）學習過程可以分為：資料輸入，抽象化，一般化。

抽象化：由學習任務和所分析的資料型別來決定學習的模型，用這個模型來擬合資料集（稱之為訓練），然後資料就轉換為乙個彙總了原始資訊的抽象形式。

一般化：把抽象知識轉化為可以應用的行動。

（二）機器學習應用於資料的步驟

1.收集資料

2.探索資料和準備資料

3.基於資料訓練模型。

4.評價模型效能

5.改進模型

案例：分析事物最基本單位的一組資料，如診斷癌症，案例是一些病人的活檢切片。

觀察單位：用來描述被測量者的案例單位

特徵：案例的乙個屬性或特性，一般以矩陣**的形式呈現。特徵分為多種形式，如果特徵用數值衡量，那就是數值型。如果屬性通過一組類別表示，這樣的特徵被稱為分類變數或者名義變數。分類變數中一種特殊型別：有序變數，指分類變數類別落在乙個有序列表，如果衣服分為大中小等。

（三）機器學習演算法分類：監督學習和非監督學習。

監督學習：又稱為建立**模型的過程，目的是發現並建模目標特徵（需要**的特徵）和其他特徵之間的關係。具體來說，給一組資料，學習演算法嘗試最優化乙個函式模型來找出屬性值之間的組合方式，最終給出目標值。常見的任務是**案例屬於哪一型別（稱之為分類）。比如給你一堆房子的面積和**的資料，通過學習能夠再輸入新的面積，**對應的**。也就是說，先告訴你資料的「標準答案」了，讓你在此基礎上**。

非監督學習：又稱為建立描述性模型的過程。學習者沒有特定的學習任務，沒有學習目標（沒有標準答案），識別資料之間的緊密性，常用於資料探勘。例如對交易之間的購買資料進行購物籃分析，游泳褲通常和防曬霜一起買之類的。資料集按照相同型別分組的任務被稱為聚類。

摘自教程：《機器學習與r語言》

機器學習（一）簡介

機器學習一簡介

《機器學習基石》筆記一機器學習簡介

機器學習簡介

機器學習（一） 簡介

機器學習一 簡介

《機器學習基石》筆記一 機器學習簡介

機器學習簡介

相關推薦

機器學習（一）簡介

機器學習一簡介

《機器學習基石》筆記一機器學習簡介