python與資料探勘基礎

2021-09-13 13:41:16 字數 504 閱讀 2198

進行txt檔案資料讀取,資料為uci資料庫的*氣病症**病馬資料,資料見/data/horsecolic.txt.資料有多行,每行有22個資料,前21個為馬的病症資料,最後乙個時該馬的標籤,判斷其患病與否。實驗的要求是將所有行的前21個資料儲存到乙個二維列表dataarr中,而標籤資料單獨儲存在乙個列表labelarr中。

import numpy as np

dataarr=

fr=open('horsecolic.txt')

for line in fr.readlines():

line=line.strip()

line=line.split("\t")

a=np.array(dataarr)

lable=a[:,-1]

data=a[:,[i for i in range(0,21)]]

print(lable)

print(data)

fr.close()

python基礎與資料探勘

資料探勘的流程 明確目標,資料蒐集,資料清洗,構建模型,模型評估,應用部署。正向單索引 如上圖所示,變數list1是乙個含有7個元素的列表,包含字串 字串必須用引號引起來 數值和列表。用print列印,列表中最後乙個元素正好又是乙個列表 巢狀列表 所以需要取出巢狀列表中的元素就需要兩層索引來實現。負...

python資料探勘01 python基礎

1.lambda定義行內函式 f lambda x x 2 定義函式f x x 2 g lambda x,y x y 定義函式g x,y x y 2.資料結構 1 列表和元組 列表方括號 a 1,2,3 元組圓括號b 4,5,6 下標從0開始。注意 列表可修改,元組不可修改。cmp a,b 比較元素...

《資料探勘》基礎

資料探勘 data mining 是發現資料中有用模式的過程,目的在於使用所發現的模式幫助解釋當前的行為或 未來的結果 資料探勘過程涉及幾個方面 1 資料收集和儲存 2 資料選取與準備 3 模型建立與檢驗 4 解釋與驗證結果 5 模型應用 資料探勘是乙個處理過程,它利用一種或多種計算機學習技術,從資...