Xgboost的一些坑

2021-07-13 18:28:35 字數 477 閱讀 1666

這兩天做乙個競賽,用xgboost作為工具來做了一些事情。

主要的框架是 xgboost的python擴充套件。

然後這過程中花了不少時間在解決各種xgboost的error上。

大部分的問題都在這個函式裡

dtrain = xgb.dmatrix('train.txt')

dtest = xgb.dmatrix('test.txt')

會出現各種莫名其妙的錯誤,我調了發現了有些神器的事情是,我的某個特徵居然會影響這個函式報錯。

但是完全不是格式上的問題,我檢查過了。

最後總結乙個事情:

直接用numpy或者scipy等現有變數。

可能帶來的乙個不方便的地方是,本來需要用檔案來儲存計算好的特徵資料,需要只呼叫xgboost在兩個檔案上進行調參。

乙個代替的辦法就是用pickle來儲存numpy變數了。

乙個小坑先寫在這類。

關於XGBoost一些淺薄理解

決策樹 分類 靈魂 依靠某種指標進行樹的 達到分類或回歸的目的,總希望是純度越高越好 eg id3演算法就用資訊增益度量屬性選擇標準,選擇 後資訊增益最大的屬性進行 cart,classification and regression tree 分類與回歸分析 相同點 本質都是特徵到結果 標籤的對映...

Cardboard的一些坑

之前用暴風魔鏡做vr移動端的開發,魔鏡的乙個很明顯的優點是它具有搖桿,這個搖桿使用起來很方便 接著就接觸了cardboard的移動端外掛程式,使用起來也是很方便,可以自己寫指令碼做凝視觸發,在開發過程中遇到兩個問題很是頭痛 問題一 網上的版本很多,有的只支援android,有的同時支援android...

python flask mysql的一些坑

最近用flup flask nginx mysql開發後端程式時遇到了不少問題,現在整理一下。flup flask這個組合應該是支援多執行緒併發的,那麼在併發程式中,不可以使用mysql全域性游標cursor。而mysql的錯誤提示壓根看不出問題所在 你的主機中的軟體關閉了乙個已建立的連線。也可能是...