決策樹技術及當前研究方向

2021-05-25 05:48:25 字數 960 閱讀 5364

資料探勘中可以用「決策樹」技術進行歸納分類。

1.決策樹的構造:

常用的演算法有:id3,c4.5,cart(貪心方法,非回溯的);可伸縮性比較好的有:sliq和sprint,雨林,boat。其中boat是可以增量更新的。

2.決策樹的約簡:

減小錯誤修剪法,悲觀錯誤修剪法,基於代價-複雜度的修剪法,代價敏感的決策樹修剪法......

簡化決策樹的方法絕不止這些,各種不同的方法覺有自己的優點和缺點。實際運用時應根據實際情況進行選擇,當然演算法也是,畢竟演算法也都有各自的應用領域。(所以,如果要進行這方面的理論創新,應該基於實際的應用,有專案的話,更好。)

3.決策樹目前主要的研究方向:

1)與其他技術的結合:

決策樹與神經網路的結合:通過先生產決策樹,然後根據決策樹來重新構造多層神經網路,以加快神經網路的訓練速度。相反,也可以用神經網路來得到所需的決策樹,此法解決了由神經網路得到的知識難於被人們理解的缺點。

決策樹與模糊集合原理的結合   決策樹不穩定,這樣兩者結合,彌補它的不足,(參考軟決策樹)

決策樹與進化演算法,遺傳演算法及遺傳程式設計的結合  可以較好的在並行計算機上執行,提高運算能力,進化演算法為隨機演算法,對同一資料集可以產生不通的決策樹,這樣可以從中選擇乙個最優的。....

決策樹技術與多智慧型體的結合, 不多見,多智慧型體系統比較複雜,但機器學習有潛力提供乙個魯棒性較強的機制來有效協調各智慧型體間的行為,因此對多智慧型體結合機器學習是乙個很有前途的方向(不理解)  

2)尋找新的構造決策樹的方法   與其他技術結合時,可以根據其他技術的特點重新構造適合融合的樹的結構

3)尋找更好的簡化決策樹的方法

4)研究產生決策樹的訓練 和檢驗資料大小及特性與決策樹特性之間的關係    資料預處理技術

5)不確定環境下決策樹研究

6)決策樹時間複雜度與準確性之間的矛盾

7)決策樹技術的軟體實現

當然這些研究也不是孤立的,它們常常相互聯絡,相互結合。

決策樹例項及原理

鐵達尼號 生死 import pandas as pd from sklearn.tree import decisiontreeclassifier 決策樹分類器。from sklearn.feature extraction import dictvectorizer 將特徵值對映列表轉換為向量...

分類決策樹原理及實現 一

決策樹是一種用於基本分類與回歸的演算法,如用於分類,叫分類樹 用於回歸,叫回歸樹。像二叉樹一樣,分類決策樹呈樹狀 結構,基於特徵或屬性對例項進行分類。分類決策樹由結點和有向邊組成,結點有兩種型別 內部結點和葉結點。內部結點表示 乙個特徵或屬性,葉結點表示乙個類。用決策樹進行分類時,從根結點開始,根 ...

決策樹演算法原理及調參

決策樹是通過一系列規則對資料進行分類的過程。它提供一種在什麼條件下會得到什麼值的類似規則的方法。決策樹分為分類樹和回歸樹兩種,分類樹對離散變數做決策樹,回歸樹對連續變數做決策樹。cart和c4.5支援資料特徵為連續分布時的處理,主要通過使用二元切分來處理連續型變數,即求乙個特定的值 值 特徵值大於 ...