《街景字元編碼識別CV組隊學習》第5次打卡

2021-10-07 01:28:27 字數 484 閱讀 6218

一、學習內容

模型整合

1.整合學習方法

常見的方法包括stacking、bagging、boosting三類,與驗證集的劃分有關。

比如10折交叉驗證。

2.深度學習中的整合方法

a.dropout

一般放在relu之後,用於緩解過擬合,目前已不常用

b.測試集資料擴增(tta)

test time augmentation(tta):在測試時,進行資料擴增,比如對同乙個樣本**3次,然後對3次結果進行平均。

c.snapshot

使用cyclinical learning rate進行訓練,並儲存精度比較好的多個checkpoint,最後將多個checkpoint進行整合。

3.後處理

二、小結

模型整合可以提高精度,但耗費很多訓練時間,所以,先應該提高單模型精度。

通過本次學習,學到了很多有用的技巧,感謝datawhale組織!

《街景字元編碼識別CV組隊學習》第2次打卡

一 資料讀取與資料擴增 影象讀取 pil和opencv img cv2.imread cat.jpg 2.資料擴增 資料擴增是本次比賽的關鍵,在簡單擴增的情況下,訓練非常容易過擬合。嘗試增加更多的合適的擴增方法 3.pytorch 讀取資料 dataset是對資料集的封裝,提供索引讀取資料的方式 c...

《街景字元編碼識別CV組隊學習》第一次打卡

一 賽題理解 1.資料集 訓練集資料報括3w張 驗證集資料報括1w張 每張 包括顏色影象和對應的編碼類別和具體位置 2.資料標籤 標籤檔案是.json格式,top,height,left,width,label 同一張 可能有多個數字,結果需要考慮按x座標公升序排列 4.實踐 json格式資料讀取 ...

零基礎入門CV賽事 街景字元編碼識別

pytorch讀取資料 使用定長字元識別思路構建模型 學習python和pytorch中影象讀取 學會擴增方法和pytorch讀取賽題資料 pillow 匯入 from pil import image 讀取 im image.open jpg opencv 匯入 import cv2 讀取 img...