機器學習 概念學習FIND S演算法C 實現

2021-07-09 14:20:16 字數 2300 閱讀 7357

一、概念

概念學習:是指從有關某個布林函式的輸入輸出訓練樣例中推斷出該布林函式。

二、概念學習任務

任何概念學習任務能被描述為:例項的集合x、例項集合上的目標函式c、候選假設的集合h以及訓練樣例的集合d。

例:目標概念:「aldo進行水上運動的日子」

目標概念enjoysport的正例和反例

example

skyairtemp

humidity

wind

water

forecast

enjoysport

1sunny

warm

normal

strong

warm

same

yes2

sunny

warm

high

strong

warm

same

yes3

rainy

cold

high

strong

warm

changeno4

sunny

warm

high

strong

cool

change

yes

已知:例項集x:可能的日子,每個日子由下面的屬性描述:

sky:(可取值 sunny,cloudy和rainy)

airtemp:(可取值為warm和cold)

humidity:(可取值為normal和high)

wind:(可取值為:strong和weak)

water:(可取值為warm和cold)

forecast:(可取值為same和change)

假設集h:每個假設描述為6個屬性:sky,airtemp,humidity,wind,water和forecast的值約束的合取。約束可以為「?」(表示接受任意值),「ø」(表示拒絕所有值),或一特定值

目標概念c:enjoysport: x->

訓練樣例集d:目標函式的正例和反例

求解:h中的一假設h,使對於x中任意x,h(x)=c(x)

1.術語定義

例項集(x):概念定義的例項集合

目標概念(c):待學習概念或函式

訓練樣例(d):每個樣例為x中的乙個例項x以及它的目標概念值c(x)。c(x)=1的例項被稱為正例(positive example),c(x)=0的例項為反例(negative example),經常用序偶來描述訓練樣例。

h表示所有可能假設的集合。h中每個假設h表示x上定義的布林函式,即h:x->。機器學習的目標就是尋找乙個假設h,使對於x中的所有x,h(x)=c(x)。

歸納學習假設:任一假設如果在足夠大的訓練樣例集中很好地逼近目標函式,它也能在未見例項中很好地逼近目標函式。

2.作為搜尋的概念學習

定義:令hj和hk為在x上定義的布林函式。稱hjmore_general_than_or_equal_tohk(記做hj≥g hk),當且僅當(∨x∈x)[(hk(x)=1)->(hj(x)=1)]

hjmore_specific_thanhk ,當hkmore_general_thanhj

3.find-s:尋找極大特殊假設

從h中最特殊假設開始,然後在該假設覆蓋正例失敗時將其一般化(當一假設能正確地劃分乙個正例時,稱該假設「覆蓋」該正例)。

find-s演算法

1. 將h初始化為h中最特殊假設

2.對每個正例x

對h的每個屬性約束ai

如果x滿足ai

那麼不做任何處理

否則將h中ai替換為x滿足的下乙個更一般的約束

3. 輸出假設h

#include#includeusing namespace std;

string concept[6];

void find_s(string teststate[7],int m,int n)

{ for(int i=0;i"<

機器學習 Bayesian概念學習

這篇文章中我想由beta分布 二項分布這組常用的共軛分布來介紹bayesian概念學習 concept learning 在開始之前,我想先回答兩個問題。第一,機器學習中為什麼要引入概率?在機器學習中,我們通過已知的資訊希望能夠推斷出一些未知的資訊,但在推斷過程中有時並不能唯一確定目標值,這時便可以...

機器學習導論 概念學習

一 概念學習 是指從有關某個布林函式 是或否 的輸入輸出訓練樣例中推斷出該布林函式 二 訓練集 訓練樣例 用來進行訓練,也就是產生模型或演算法的資料集 三 測試集 測試樣例 通常只知道特徵,用來進行 用來專門進行測試已經學習好的模型或演算法的資料集 四 特徵向量 屬性的集合,通常用乙個向量來表示,附...

機器學習相關概念學習記錄一

一 監督學習 從給定的訓練資料集中學習出乙個函式 模型引數 當新的資料到來時,可以根據這個函式 結果。監督學習的訓練集要求包括輸入輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。監督學習就是最常見的分類 注意和聚類區分 問題,通過已有的訓練樣本 即已知資料及其對應的輸出 去訓練得到乙個最優模...