西瓜書 第四章 決策樹總結

2021-09-25 21:19:17 字數 609 閱讀 1864

1、什麼是決策樹;

2、知道決策樹的學習目的和基本策略;(分而治之)

3、掌握決策樹演算法,知道有哪三種情況會導致遞迴返回;

1、掌握基本概念和計算公式:資訊熵,資訊增益(著名的id3);增益率(c4.5演算法);基尼係數(cart演算法);

2、知道該如何去選擇合適的劃分方法;

1、為什麼要進行剪紙處理;(對付「過擬合」)

2、決策樹的剪紙處理有哪些方法,對應的優缺點有哪些;(預剪紙和後剪紙)

3、如何判斷剪紙處理的好壞,衡量標準是什麼;

1、掌握連續屬性的選擇方法;

2、若當前節點已經連續屬性a了,後續判別能否出現判別標準a呢?對於離散屬性是否也一樣?

3、如何在屬性值缺失的情況下進行劃分屬性選擇;(資訊增益計算式推廣)

4、給定劃分屬性,若樣本在該屬性上的缺失,如何對樣本進行劃分;(以不同的概率劃分到不同的屬性中去)

1、決策樹所形成的分類變價有什麼明顯的特點?(軸平行)

2、對變數決策樹出現的背景;(學習任務的真實分類邊界比較複雜)

3、如何解決上述問題:利用多變數決策樹;

4、什麼是多變數決策樹;

5、對賦值的決策問題,如何使用多變數決策樹;(對屬性的線性組合)

打卡西瓜書2 第四章 決策樹

學習目的 產生一棵泛化能力強決策樹 分而治之 演算法思想 1.生成結點node 2,3,4用來確定結點類別 2.if 樣本集中包含樣本全屬於同一類別,node設為此類別 a,b,c,d,e都是好瓜 定此類別 3.if 當前屬性集為空或者樣本在所有屬性上取值相同 a,b,c,d,e都是根蒂卷 色澤綠 ...

第四章 決策樹

一般的,一棵決策樹包含乙個根節點,若干個內部節點和若干個葉節點。決策學習的目的是為了產生一棵泛化能力強,即處理未見示例能力強的決策樹。決策樹學習的關鍵是如何選擇劃分屬性。隨著劃分過程的不斷進行,我們希望決策樹的分支節點所包含的樣本盡可能屬於同一類別,即節點的 純度 越來越高。1 資訊增益 資訊熵是度...

機器學習 第四章 決策樹

決策樹原理介紹 決策樹 decision tree 是一類常見的機器學習方法,目的是為了產生一棵泛化能力強,即處理未見示例能力強的決策樹。劃分選擇 決策樹學習的關鍵在於,在每個 節點處如何選擇最優劃分屬性。一般而言,隨著劃分過程不斷進行,我們希望決策樹的分支節點所包含的樣本盡可能屬於同一類別,即節點...