樣本不平衡問題小記

來準備用vgg來做些fine-tuning快速交個差，結果半天卡在0.3公升不上去．入行沒多久，不能肯定是方向有問題，找了個pascal voc跑跑分類．

結果發現總是卡在0.2左右，在metric.py裡改了幾行（草根就該用mxnet），把predict_label和ground truth打出來，發現跑著跑著**值就跑到14上去了（g 的拼音輸入法好像分不清yv這音．．．搜狗輸入法好像又蹦了），一翻doc發現對應的是person…1994 ,第二名dog…632．．．（那個忠誠的什麼來著，，，）．

想想大神們肯定早就為小白們準備好方案了，之前建乙個分割網路的時候也遇到了類似的問題不過用些草根方法糊弄過去了，這次準備走走學術路線高階一把，網上逛了一圈好像也沒什麼意外的收穫（看到一些大神說9:1也不算不平衡的云云，我就在想是不是顯示卡太渣導致batch size太小了，還是其中另有玄機．．．恕小人愚鈍了），想了一下還是老老實實去平衡迭代器的樣本吧．

吃完晚飯回來看看，似乎能夠work了．

貼一行輸出，殺個尾．

[2017-03-20 18:29:14,990]  info - epoch[5] batch [2000] speed: 5.40 samples/sec train-accuracy=0.696000
[2017-03-20 18:29:16,842] info - not equal, argmax_channel: [ 16. 8. 4. 15. 12. 18. 9. 13. 0. 5.]groundtruth: [ 16. 19. 10. 10. 12. 0. 9. 13. 0. 5.]

樣本不平衡問題小記

樣本不平衡問題

機器學習之樣本不平衡

keras中處理樣本不平衡

樣本不平衡問題小記

樣本不平衡問題

機器學習之樣本不平衡

keras中處理樣本不平衡

相關推薦