python 實戰決策樹之txt資料匯入

首先將txt資料匯入

兩種方法第一

將txt 轉化為csv

注意輸出路徑不能更改這能在根目錄下

否則會報錯

然後再通過np讀取到

第二種直接txt讀取

但是形式不一樣第二種屬於元組

np.loadtxt同樣也能讀取csv檔案

但是直接讀取會發生錯誤

嗯哼錯誤提示說型別轉化出錯不過從上述錯誤可以看出其型別是預設float的查一下 loadtxt函式

loadtxt(fname, dtype=, comments='#', delimiter=none, converters=none, skiprows=0, usecols=none, unpack=false, ndmin=0)

fname要讀取的檔案、檔名、或生成器。

dtype資料型別，預設float。還可以控制每一列的資料型別和精度等資訊。

comments注釋。

delimiter分隔符，預設是空格。

skiprows跳過前幾行讀取，預設是0，必須是int整型。

usecols：要讀取哪些列，0是第一列。例如，usecols = （1,4,5）將提取第2，第5和第6列。預設讀取所有列。

unpack如果為true，將分列讀取。

故我們把型別設定為str

成功但是有點難看，為什麼因為沒有正確分隔

csv檔案預設以英文逗號做為列分隔符,換行符作為行分隔符故我們加了乙個條件

稍微好看一丟丟

機器學習實戰之決策樹

1.熵 entropy h s 用來測量乙個資料集s的不確定程度。h s x x p x log2 p x s 待計算熵的資料集，在id3演算法的每次迭代中會改變 x s中類別的集合 p x 屬於類別x的元素站集合s中總元素的比例 h s 0 集合s 被完全分到乙個類中。在id3中，對每乙個屬性熵，...

機器學習實戰之決策樹

在機器學習實戰決策樹這一章的時候，有些地方的有點看不太懂，看了幾篇部落格，還是未解。最後仔細看書，發現自己不懂資料集的組織方式。希望大家看的時候也注意一下。在決策樹函式呼叫的資料要滿足如下要求 1 資料必須是由列表元素組成的列表，所有的列表元素都要具有相同的資料長度 2 資料也就是資料集中的...

機器學習實戰之決策樹

1 演算法概述 1.1 結構分析決策樹是一種依託決策而建立起來的樹，其中，每乙個內部節點表示乙個屬性上的測試，每乙個分支代表乙個測試的結果輸出，每乙個葉子代表一種類別。如上圖所示就是乙個決策樹，首先分析所給資料集是否為同一類別，如果是，那就不用劃分了，如果不是，就尋找劃分資料集最好的特徵進行劃分 ...

python 實戰決策樹之txt資料匯入

機器學習實戰之決策樹

機器學習實戰之決策樹

機器學習實戰之決策樹

相關推薦