零基礎入門CV賽事 街景字元編碼識別 01

2021-10-06 08:37:59 字數 859 閱讀 4605

賽題**自google街景影象中的門牌號資料集(the street view house numbers dataset, svhn),並根據一定方式取樣得到比賽資料集。任務鏈結【阿里雲天池大賽】零基礎入門cv賽事-街景字元編碼識別。

需要注意的是此賽題需要選手識別中所有的字元,為了降低比賽難度,提供了訓練集、驗證集和測試集中字元的位置框。

字段表

所有的資料(訓練集、驗證集和測試集)的標註使用json格式,並使用檔名進行索引。如果乙個檔案中包括多個字元,則使用列表將字段進行組合。

評價標準為準確率,選手提交結果與實際的編碼進行對比,以編碼整體識別準確率為評價指標,結果越大越好,具體計算公式如下:

此賽題本質是對門牌號的數字識別,然後並區分是哪個數字,屬於分類問題。但是不同的門牌號,長度不一致。難點是需要對不定長的字元進行識別,與傳統的影象分類任務有所不同。主辦方提供了以下三種思路:

提交前請確保**結果的格式與sample_submit.csv中的格式一致,以及提交檔案字尾名為csv。

零基礎入門CV賽事 街景字元編碼識別

pytorch讀取資料 使用定長字元識別思路構建模型 學習python和pytorch中影象讀取 學會擴增方法和pytorch讀取賽題資料 pillow 匯入 from pil import image 讀取 im image.open jpg opencv 匯入 import cv2 讀取 img...

零基礎入門CV賽事 街景字元編碼識別 TASK1

本次新人賽是datawhale與天池聯合發起的零基礎入門系列賽事第二場 零基礎入門cv賽事之街景字元識別 賽題以計算機視覺中字元識別為背景,要求 真實場景下的字元識別,這是乙個典型的字元識別問題 賽題 自google街景影象中的門牌號資料集 the street view house numbers...

Datawhale 零基礎入門CV賽事

本章將會講解卷積神經網路 convolutional neural network,cnn 的常見層,並從頭搭建乙個字元識別模型。學習cnn基礎和原理 使用pytorch框架構建cnn模型,並完成訓練 卷積神經網路 簡稱cnn 是一類特殊的人工神經網路,是深度學習中重要的乙個分支。cnn在很多領域都...