python基礎與資料探勘

2021-10-22 03:53:17 字數 1328 閱讀 2472

資料探勘的流程:

明確目標,資料蒐集,資料清洗,構建模型,模型評估,應用部署。

正向單索引

如上圖所示,變數list1是乙個含有7個元素的列表,包含字串(字串必須用引號引起來)、數值和列表。用print列印,列表中最後乙個元素正好又是乙個列表(巢狀列表),所以需要取出巢狀列表中的元素就需要兩層索引來實現。

負向單索引

切片索引

按照固定的步長,連續取出多個元素,可以用[start: end: step]表示。start指索引的起始位置,end指索取元素的終止位置(注意,end位置的元素是取不到的!)step指的是索取元素的步長,預設為1。切片是左閉右開的效果。

上圖顯示print(list2[-3:-1])取不到最後一位內蒙古,所以為了解決這個問題需要學習無線索引。

無線索引

無線索引不限制起始和終止元素的位置,可用[::step]表示。第乙個冒號是指從列表的第乙個元素開始獲取,第二個冒號是指到最後乙個元素結束(包括最後乙個元素)

列表元素的增加

列表元素的刪除

python提供三種方法:pop、remove、clear。

pop兩種使用方法,一種是預設刪除列表的末尾元素,另一種是刪除指定位置的列表元素,但只能刪除乙個。

remove是刪除指定值的功能,但只能刪除首次出現的指定值。

clear清空列表中所有元素。

列表元素的修改

count方法是用來對列表中的某個元素進行計數,每次只能往count方法中傳遞乙個值;index方法則返回指定值在列表中的位置,但只返回首次出現該值的位置;reverse方法則是將列表元素全部翻轉。sort方法可以實現列表元素的排序,預設是公升序,可以將reverse引數設定為true,進而調整為降序。注意sort只能對同質資料進行排序,數值或者字串,不可以混合多種資料型別或資料結構。

python與資料探勘基礎

進行txt檔案資料讀取,資料為uci資料庫的 氣病症 病馬資料,資料見 data horsecolic.txt.資料有多行,每行有22個資料,前21個為馬的病症資料,最後乙個時該馬的標籤,判斷其患病與否。實驗的要求是將所有行的前21個資料儲存到乙個二維列表dataarr中,而標籤資料單獨儲存在乙個列...

python資料探勘01 python基礎

1.lambda定義行內函式 f lambda x x 2 定義函式f x x 2 g lambda x,y x y 定義函式g x,y x y 2.資料結構 1 列表和元組 列表方括號 a 1,2,3 元組圓括號b 4,5,6 下標從0開始。注意 列表可修改,元組不可修改。cmp a,b 比較元素...

《資料探勘》基礎

資料探勘 data mining 是發現資料中有用模式的過程,目的在於使用所發現的模式幫助解釋當前的行為或 未來的結果 資料探勘過程涉及幾個方面 1 資料收集和儲存 2 資料選取與準備 3 模型建立與檢驗 4 解釋與驗證結果 5 模型應用 資料探勘是乙個處理過程,它利用一種或多種計算機學習技術,從資...