資料探勘之模型初探

2021-08-19 22:18:29 字數 888 閱讀 5477

由於我要打的比賽是做乙個二分類**器,所以就開始找到有關的模型進行了解學習。常見的分類模型如下:

邏輯回歸(logistic regression, lr)

樸素貝葉斯(***** bayes, nb)

k近鄰(k-nearest neighbors, knn)

決策樹(decision tree, dt)

支援向量機(support vector machine, svm)

神經網路(neural network, nn)

k近鄰演算法

機器學習(一)——k-近鄰(knn)演算法

邏輯回歸

機器學習–logistic回歸計算過程的推導

邏輯回歸容易出現過擬合的問題,導致維度災難,參考:分類問題中的維度災難

支援向量機:

支援向量機通俗導論(理解svm的三層境界)

決策樹這塊的知識就比較深了,通過網上查的資料得知樹模型**的精度通常比其他模型高,因此決定這次比賽採用樹模型。當然,最好的情況肯定是試驗各種模型,再挑選最好的模型。

機器學習方法(四):決策樹decision tree原理與實現技巧 隨機森林

gbdt(mart) 迭代決策樹入門教程 | 簡介

adaboost演算法原理分析和例項+**(簡明易懂)

xgboost入門與實戰(原理篇)

機器學習筆記(七)boost演算法(gdbt,adaboost,xgboost)原理及實踐

sk-learn是必須要學的乙個包:sk-learn教程

中文文件

cross-validation(交叉驗證)詳解

【機器學習】模型融合方法概述 棧模型是重點

模型融合

接下來就是要學習xgboost和sklearn的調參方法了。

資料探勘初探

資料探勘技術分類 1 關聯分析 啤酒和尿布,猜你喜歡 用於做關聯分析的演算法有apriori 2 分類分析 事先知道類別和分類標準,使用者信用分層 3 序列模式 訪問路徑 購買路徑 4 聚類分析 分類分析的逆過程,聚類分析之前還不知道類別,從大量資料集合中,自動劃分類別。劃分標準是類內差別最小,類間...

資料探勘 模型融合

在模型調參結束後,我我們就可以進行模型融合了 這是最後也是乙個相當重要的環節,方式大概有有以下幾種 模型融合是比賽後期乙個重要的環節,大體來說有如下的型別方式。簡單加權融合 stacking blending boosting bagging 在xgboost,adaboost,gbdt中已經用到 ...

資料探勘 模型融合

模型融合是比賽後期乙個重要的環節,大體來說有如下的型別方式。簡單加權融合 stacking blending boosting bagging 在xgboost,adaboost,gbdt中已經用到 1 平均融合 對於回歸問題,乙個簡單直接的思路是取平均。也可以採用加權平均,而權值可以用排序的方法確...