針對大類別分類實驗的一些記錄

最近在對10750個漢字做分類，使用resnet50為基本框架，分類部分多加了乙個線性層，每個漢字作為1類。損失函式是交叉熵函式。

類別太多的話，網路一開始不易學習到。使用sgd的話好像根本沒法學習。

我使用adadelta (lr=0.01) 從頭開始訓練，雖然結果可以達到92%，但是檢視網路輸出的得分發現值相當異常，全部都是小於-30,000。這也導致了最後的分類層的梯度值相當大，最終導致訓練不好（沒法把loss降到很低）。

目前是先用adadelta從頭訓練，可以選擇當loss降到5一下時，換用adam (lr=1e-3)，這樣網路輸出的分數值就會變得正常了，而且loss下降得很好。

最後也可以用sgd微調引數。

有空一定要好好研究一下這些優化器的原理。

針對UCWEB的一些開發

ucweb瀏覽器，支援viewstate，但裡面的內容不能太長，否則會報錯。imagebutton的話，提交同樣也對應不上它的onclick事件。並且似乎也不能確定是不是它觸發的提交15 08 protected void page load object sender,eventargs e el...

針對VC中的一些基礎知識記錄

1 windows使用訊息機制的原因首先使用訊息機制優於函式呼叫，因為訊息是物理資料，可以很方便的排隊和賦予優先順序。當乙個時間發生時，可以講該事件的訊息放入佇列，使得所有的訊息能以有序的方式進行處理。其次，訊息不依賴於處理器型別。其相容性很好最後，訊息不依賴於特定的程式語言。使用各種語言編寫的...

boost spirit 的一些記錄

最近的工作跟 boost spirit 多一些，本來想整理乙個較為系統的筆記，不過感覺目前思路還比較凌亂，先隨便記錄一些。spirit 是 boost 中的乙個 ll解析器框架，他完成實現乙個 ebnf 語法解析器的功能，但它的輸入為c 語言。ll parser framework represen...

針對大類別分類實驗的一些記錄

針對UCWEB的一些開發

針對VC中的一些基礎知識記錄

boost spirit 的一些記錄

相關推薦