機器學習實戰 第九章 樹回歸

2021-07-03 13:23:13 字數 897 閱讀 8091

本系列目的在於總結每乙個分類器的特點(優點、缺點、使用資料型別、使用時的注意事項等)。相關**自己搜。

python:建議使用2.7

python常用函式庫:numpy、scikit-learn等

python整合環境:anaconda

畢業季,玩了20天。

為什麼需要樹回歸:當資料擁有眾多特徵並且特徵之間關係十分複雜時,構建全域性模 型的想法就顯得太難了,也略顯笨拙。而且,實際生活中很多問題都是非線性的,不可能使用全域性線性模型來擬合任何資料。一種可行的方法是將資料集切分成很多份易建模的資料,然後利用第8章的線性回歸技術來建模。如果首次切分後仍然難以擬合線性模型就繼續切分。在這種切分方式下,樹結構和回歸法就相當有用。

優點:1、可以對複雜的非線性的模型進行建模。

缺點:1、結果不易理解。

使用資料型別:

1、離散型和標稱型

使用時注意事項:

0、本章將構建兩種樹:第一種是9.4節的回歸樹( regression tree) , 其每個葉節點包含單個值,這本質是構建乙個

分段常數」,;  二種是9.5節的模型樹(model tree),其每個葉節點包含乙個線性方程,這本質是構建乙個「分段線性(piecewise linear)函式」,即模型由多個線性片段組成,一般情況下,模型樹比回歸樹**效果好。

1、後剪枝比預剪枝更常用。如果兩個分支已經不再是子樹(而是葉子節點了),那麼就可以進行合併。具體做法是對合併前後的誤差進行比較。如果合併後的誤差比不合併的誤差小就進行合併操作,反之則不合併直接返回。

2、回歸樹誤差計算:所有樣本點的方差和;模型樹誤差計算:先使用線性模型進行擬合,再計算**值與真實值的差值的平方和。也可以計算回歸樹的**值和真實值的相關係數、模型樹的**值和真實值的相關係數,再比較。

第九章(筆記)

轉移指令是可以修改ip,或同時修改cs和ip的指令 offset 是用於提取標號偏移位址的操作符 jmp在第2章裡說到時用於修改ip或同時修改cs和ip的轉移指令,這章裡單獨的jmp指令是乙個無條件的轉移指令 jmp short 標號 是實現段內短轉移 jmp near ptr 標號 是實現段內近轉...

第九章作業

班級 0401304 學號 2013211526 姓名 鄧小俊 2.身份驗證 依據使用者所提供的身份資訊,來進行登入驗證,可以再細分為使用者是否可以登入sql sever 使用者是否可以登入到指定的目標資料庫等。授權 已通過身份驗證的使用者,檢查其所被賦予的許可權,是否可以訪問或者執行目標的物件 3...

第九章 引用

引用擁有指標的所有功能,只是語法更加的簡單 1 引用就是別名,變數的另外乙個名字,變數和別名它們的位址是一樣的,操作別名就是操作變數 2 引用就是別名常量,一旦引用被初始化就不能再改變了 可以理解為指標常量,指向的值不能改變,能改變的只是它的該位址處的值 3 引用物件huamn mike human...