資料探勘 模型的衡量標準與建模

2021-10-05 12:53:04 字數 905 閱讀 7457

2、ease of use 是否好用

3、feature selection

二、模型分類:

2、分類問題

3、聚類問題

一般來說,建模是迴圈做的。

準確性accurate

穩定性stable

對同乙個樣本的**值是唯一的,穩定的

推廣性general

建模使用的資料決定了模型的推廣性。

generate a fit

measure accuracy

分類:混淆矩陣,roc、auc;

回歸:均方差;

make predictions

**switch algorithm

神經網路一組模型,可以自己設計出一套模型

share results

模型的可解釋性

變數的篩選,過濾無關變數,保證模型的效果

uncorelated predictor:

corelated predictor:得到乙個數字(x,y)

多元線性回歸

多元非線性回歸

廣義線性回歸模型

(eg 邏輯回歸,不滿足線性回歸條件,但是很解決。y值不連續)

神經網路***

曲線擬合得到乙個類別 (x,y)

神經網路

邏輯回歸

(邏輯回歸得到乙個概率值,可以用作分類。判斷閾值可以根據業務條件進行設定)

判別分析

樸素貝葉斯分類

svm決策樹

組合演算法得到一推樣本 (x) 將樣本聚成幾堆,不清楚什麼是y

k均值聚類

系統聚類

神經網路

模糊c均值聚類

高斯混合演算法

模型效果衡量標準

true positive 真正,tp 被模型 為正樣本,是真的判斷正確。所以就是正樣本,也稱作正的數。true negative 真負 tn 被模型判斷為負樣本,是真的判斷正確。所以就是負樣本,也稱作負的數。false positive 假正,fp 被模型判斷為正樣本,是假的判斷錯誤。所以應該是負...

軟體測試的原則和衡量標準

1 軟體測試的原則 good enough 原則 這是一種權衡投入 產出比的原則,測試既不要不充分,也不要過分,不充分和過分都是一種不負責任的表現,當然zero enough 是一種理想,good enough 是原則 pareto 原則 一般情況 在分析,設計,實驗階段的複審和測試工作能發現80 ...

選擇正確的隱患掃瞄工具的衡量標準

網路安全掃瞄技術是一類重要的網路安全技術。安全掃瞄技術與防火牆 入侵檢測系統互相配合,能夠有效提高網路的安全性。通過對網路的掃瞄,網路管理員可以了解網路的安全配置和執行的應用服務,及時發現安全漏洞,客觀評估網路風險等級。如果說防火牆和網路監控系統是被動的防禦手段,那麼安全掃瞄就是一種主動的防範措施,...