資料探勘 Chapter 2

2021-09-11 10:24:40 字數 373 閱讀 9306

本章:資料有什麼型別的屬性或字段組成?每個屬性具有何種型別的資料值

屬性

屬性是乙個資料字段,表示資料物件的乙個特徵。機器學習文獻更傾向於使用術語「特徵」,而統計學家更源於使用術語「變數」。資料探勘與資料庫的專業人士一般使用術語「屬性」

屬性的種類

資料的基本統計描述

資料視覺化

層次視覺化

視覺化複雜物件和關係

度量資料的相似性和相異性

序數屬性的鄰近性度量

混合型別資料的相異性

余弦相似性

han j. data mining: concepts and techniques[m]. 2005.

Python資料探勘建模 chapter 2決策樹

2.決策樹演算法分析 id3演算法 在各節點上用資訊增益法作為屬性選擇標準,只適合離散的描述屬性 c4.5演算法 用資訊增益率選擇節點屬性,可處理離散的描述屬性,連續的描述屬性 cart演算法 有效的非引數分類和回歸方法,終結點為連續變數時,為回歸樹,終結點為分類變數,為分類樹 常見的決策樹演算法還...

《程式設計實踐》chapter2

a b c c符號與b相同 若a,b,一正一負,c a b int a b 1 若a,b,同號,c a b a b 17 10 1.7 17 10 7 取模運算 17 10 1.7 17 10 317 10 1.7 17 20 有乙個除數時 17 10 3 運算方法等於 17 10,但結果的符號與1...

Chapter 2 工廠設計模式

和單例設計模式一樣,工廠設計模式也是屬於建立型模式。其主要作用是抽象了物件被建立時的具體細節,對外暴露乙個建立的方法,省去使用者new乙個物件的操作。乍一看,工廠設計模式只是抽象了乙個new物件的操作。其實,實際專案中new乙個物件的邏輯比較複雜,如果這個邏輯以後被修改了,那麼之前new出來的所有物...