《機器學習》讀書筆記 第1章 緒論

2021-08-27 05:19:25 字數 936 閱讀 1656

1.1引言

機器學習定義:研究如何通過計算的手段,利用經驗(資料)改善系統的效能。

在計算機上從資料中產生模型的演算法,即學習演算法。

假設用p評估電腦程式在某任務類t上的效能,程式利用經驗e,在t上改善了p

1.2基本術語

資料集:記錄的集合

屬性/特徵:事件或物件在某方面的表現或性質的事項

屬性值:屬性的取值

屬性空間/樣本空間/輸入空間:屬性張成的空間

特徵向量:乙個示例

維數:屬性的個數

標記:示例的結果(好瓜、壞瓜)

樣例:有標記資訊的示例

標記空間/輸出空間:所有標記的集合

分類:離散值

回歸:連續值

聚類:將訓練集中的西瓜分成若干組

監督學習:訓練資料有標記資訊,對應分類和回歸

無監督學習:訓練資料沒有標記資訊,對應聚類

泛化能力:學得模型適用於新樣本的能力

1.3假設空間

科學推理的2大基本手段:歸納、演繹

歸納學習:從樣例中學習

概念學習/概念形成:狹義的歸納學習,從訓練資料中學得概念

布林概念學習:可表示為0/1布林值的目標概念的學習

版本空間:多個假設與訓練集一致

1.4歸納偏好

機器學習演算法在學習過程中對某種型別假設的偏好

奧卡姆剃刀:若有多個假設與觀察一致,則選最簡單的那個

沒有免費的午餐:學習演算法的期望效能相同

1.5發展歷程

svm支援向量機

深度學習:狹義,很多層的神經網路

1.6應用現狀

計算機視覺

自然語言處理

生物資訊學

天氣預報、能源勘測、環境檢測

商業營銷

自動駕駛

人類如何學習,sdm(space distributed memory)

《機器學習》周志華讀書筆記(一)緒論

什麼是機器學習?mitchell,1997 假設用p來評估電腦程式在某任務類t上的效能,若乙個程式通過利用經驗e在t中任務上獲得了效能改善,則我們就說關於t和p,該程式對e進行了學習。全文第1章緒論部分重點介紹了機器學習中的基本術語 假設空間 歸納偏好 發展歷程與現狀 基本術語 以一批西瓜為例 估計...

《機器學習實戰》讀書筆記 1

本人開發工具為pycharm,python版本是3.5 第二章 knn 2.1 概述 k 緊鄰演算法的一般流程 收集資料 可以使用任何方法 準備資料 距離計算所需要的數值,最好是結構化的資料格式 分子資料 可以使用任何方法 訓練資料 此步驟不適應於k 緊鄰演算法 測試資料 計算錯誤率 使用演算法 首...

第1章 緒論

1.1空間分析的概念 空間分析是地學領域的重要概念,是gis的核心功能,關於空間分析的定義目前還不夠統一 下面為較為典型的幾種 空間目標是空間分析的具體物件。空間分析目標具有空間位置,分布,形態,空間關係 距離,方位,拓撲,相關場 等基本特徵 空間關係指的是地理實體之間存在的與空間特徵有關的的關係,...