資料讀取與資料擴增

2021-10-06 10:22:03 字數 318 閱讀 6400

由於每個的字元個數不定,所以將字元識別建模為目標檢測,採用目標檢測模型進行字元的識別。

模型backbone採用encoder-decoder架構的resnet18,在encoder部分採用resnet常規的降取樣步長為8,在decoder部分採用可變性卷積和轉置卷積上取樣到步長為2。

檢測頭採用centernet結構,但是只進行中心點分類,不對box進行回歸。推理階段直接採用maxpooling**nms進行後處理得到所有字元**結果。

資料讀取採用imageio進行讀取image,資料擴增利用imgaug庫實現,改庫包含了多種影象增廣操作,同時支援box和影象的同步變換

街景字元識別 Task2 資料讀取與資料擴增(2)

資料擴增再增加了訓練集樣本的同時,也可以有效地緩解過擬合的情況,使模型具有更強的泛化能力。資料擴增的方法有很多,從顏色空間 尺度空間到樣本空間,根據不同任務,資料擴增都有區別。對於影象分類,資料擴增一般不會改變標籤 對於物體檢測,資料擴增會改變物體座標位置 對於影象分割,資料擴增會改變畫素標籤。方法...

資料擴增與字元識別

資料擴增 在pytorch中資料是通過dataset進行封裝,並通過dataloder進行並行讀取 class svhndataset dataset def init self,img path,img label,transform none self.img path img path sel...

正則化,資料集擴增,Dropout

正則化方法 防止過擬合,提高泛化能力 在訓練資料不夠多時,或者overtraining時,常常會導致overfitting 過擬合 其直觀的表現如下圖所示,隨著訓練過程的進行,模型複雜度增加,在training data上的error漸漸減小,但是在驗證集上的error卻反而漸漸增大 因為訓練出來的...