logistic演算法使用方法

資料格式：

"x","y","shape","color","k","k0","xx","xy","yy","a","b","c","bias" 0.923307513352484,0.0135197141207755,21,2,4,8,0.852496764213146,0.0124828536260896,0.000182782669907495,0.923406490600458,0.0778750292332978,0.644866125183976,1 0.711011884035543,0.909141522599384,22,2,3,9,0.505537899239772,0.64641042683833,0.826538308114327,1.15415605849213,0.953966686673604,0.46035073663368,1 0.75118898646906,0.836567111080512,23,2,3,9,0.564284893392414,0.62842000028592,0.699844531341594,1.12433510339845,0.872783737128441,0.419968245447719,1 0.308209649519995,0.418023289414123,24,1,5,1,0.094993188057238,0.128838811521522,0.174743470492603,0.519361780024138,0.808280495564412,0.208575453051705,1 0.849057961953804,0.500220163026825,25,1,5,2,0.720899422757147,0.424715912147755,0.250220211498583,0.985454024425153,0.52249756970547,0.349058031386046,1 0.0738831346388906,0.486534863477573,21,2,6,1,0.00545871758406844,0.0359467208248278,0.236716173379140,0.492112681164801,1.04613986717142,0.42632955896436,1

0.612888508243486,0.0204555552918464,22,2,4,10,0.375632323536926,0.0125369747681119,0.000418429742297785,0.613229772009826,0.387651566219268,0.492652707029903,1

資料第一行為每行資料對應值的變數。資料中間用逗號分割。

使用mahout構建訓練模型：

命令：mahout trainlogistic --input 《輸入檔案路徑》 --output 《輸出檔案路徑》 --target 《要進行分類的目標變數名》 --categories 《目標變數類別的個數》 --predictors < **變數的名稱,多個變數時用空格分割》 --type 《**變數的型別列表》 --feature 《設定用於構建模型的內部特徵向量大小》 --passes 《指定在訓練過程中對訓練資料的複核次數》 --rate《設定初始學習率》

其他的一些命令解釋：

--quiet 產生較少的狀態和進度輸出

--lamdba 控制演算法在最終模型中對變數的抑制程度

--nobias 消除模型中截距項

模型的評估：

mahout runlogistic --input《輸入檔案路徑》 --model《模型檔案路徑》 --auc《讀入資料後列印模型在輸入資料上的auc分值》 --confusion《列印某個閥值的混淆矩陣》

其他一些命令：

--scores 列印每個輸入樣本的目標變數值和分數

logistic演算法使用方法

C STL 演算法另類使用方法

Logistic回歸演算法

pythonpip使用方法 pip使用方法整理

logistic演算法使用方法

C STL 演算法另類使用方法

Logistic回歸演算法

pythonpip使用方法 pip使用方法整理

相關推薦