西瓜書讀書筆記(一) 緒論

2021-10-14 22:18:58 字數 831 閱讀 6297

全部筆記的彙總貼:《機器學習》西瓜書-讀書筆記彙總貼

機器學習致力於研究如何通過計算的手段,利用經驗來改善系統自身的效能的學科。

資料集:對單個樣本特徵進行描述的記錄集合。每條記錄時關於乙個事件或物件的描述,稱為「示例」或「樣本」,反映事件或物件在某方面的表現或性質的事項稱為「屬性」或「特徵」。

…(發現這塊兒也沒啥好說的,這些概念用多了就能明白在說啥,實在不懂就看看書吧)

歸納(induction)與演繹(deduction)是科學推理的兩大基本手段。前者是從特殊到一般的 「 泛化 」 generalization)過程,即從具體的事實歸結出一般性規律;後者則是從一般到特殊的 「特化」 (specialization)過程,即從基礎原理推演出具體狀況。

我們可以把學習過程看作乙個在所有假設(hypothesis)組成的空間中進行搜尋的過程,搜尋目標是找到與訓練集 「 匹配」 (fit)的假設,即能夠將訓練集中判斷正確的假設。

對於乙個具體的演算法,我們需要選擇乙個模型,這個時候我們選擇的演算法偏好就會起到關鍵的作用。任何乙個有效的機器學習演算法必有其歸納偏好,否則它將被假設空間中看似在訓練集上 「等效」 的假設所迷惑,而無法產生確定的學習結果。

「奧卡姆剃刀」 (occam』s razor)是一種常用的、 自然科學研究中最基本的原則,即 「若有多個假設與觀察一致,則選最簡單的那個 」 。有利於降低過擬合帶來的模型在訓練集上的效果優於測試集。

資料探勘:發現資料之間的關係

計算機視覺:像人一樣看懂世界

自然語言處理:像人一樣看懂文字

機械人決策:像人一樣具有決策能力

其他的看看課本,擴充套件閱讀一下…

下一章傳送門:西瓜書讀書筆記(二)-模型評估與選擇

機器學習 西瓜書(筆記一) 緒論

在機器學習中常見的基本術語包含 資料集 屬性值 屬性空間 特徵向量 訓練集 測試集等等,各自的英文表示在思維導圖中有提及。假設空間主要提及了兩種方法 歸納法和演繹法。歸納法是從特殊到一般的 泛化 演繹法是從一般到特殊的 特化 歸納偏好指的是總誤差是與學習演算法無關的,任意兩種演算法的誤差都相等。說到...

機器學習(西瓜書) 緒論筆記

正如我們根據過去的經驗來判斷明天的天氣,吃貨們希望從購買經驗中挑選乙個好瓜,那能不能讓計算機幫助人類來實現這個呢?機器學習正是這樣的一門學科,人的 經驗 對應計算機中的 資料 讓計算機來學習這些經驗資料,生成乙個演算法模型,在面對新的情況中,計算機便能作出有效的判斷,這便是機器學習。另一本經典教材的...

西瓜書讀書筆記(三) 線性模型

全部筆記的彙總貼 機器學習 西瓜書 讀書筆記彙總貼 線性模型 linear model 試圖學得乙個通過屬性的線性組合來進行 的函式,我們一般用向量的形式來表示,f x wt x bf x w tx b f x w tx b 因為w ww直觀地表達了各屬性在 中地重要性,因此線性模型有很好地可解釋性...