街景字元編碼識別賽事Task01 賽事理解

2021-10-06 08:44:14 字數 563 閱讀 2909

賽題**自google街景影象中的門牌號資料集(the street view house numbers dataset, svhn),並根據一定方式取樣得到比賽資料集。

訓練集資料報括3w張**,驗證集資料報括1w張**,每張**包括顏色影象和對應的編碼類別和具體位置;為了保證比賽的公平性,測試集a包括4w張**,測試集b包括4w張**。

執行系統要求:python2/3,記憶體4g,有無gpu都可以。用cpu跑的話會比較慢。

具體的流程包含以下幾塊:

1:引入必要的模組 包括pil模組 numpy模組 pytorch模組等

2:定義讀取資料集 主要是利用的是train資料集 test資料集 val資料集中的相關資料

3:定義讀取資料dataloader 這是pytorch中指定的資料儲存格式

4:定義分類模型 這裡使用的主要是resnet網路進行影象特徵的提取

5:訓練與驗證 利用設定的驗證集來測試上面得到的網路層的效能

6:**並生成提交檔案

整個網路的效能可以通過調整網路層的結構和相關超引數來優化 當然資料集本身也是很重要的 可以對資料集進行一些調整

零基礎入門CV賽事 街景字元編碼識別

pytorch讀取資料 使用定長字元識別思路構建模型 學習python和pytorch中影象讀取 學會擴增方法和pytorch讀取賽題資料 pillow 匯入 from pil import image 讀取 im image.open jpg opencv 匯入 import cv2 讀取 img...

街景字元編碼識別 Task05 模型整合

學習目標 模型整合 整合學習 ensemble learning 通過構建並結合多個弱學習器來綜合得到乙個強學習器的方法。機器學習領域的整合方法有bagging boosting stacking。bagging bootstrap aggregating,裝袋 bagging使用裝袋取樣來獲取資料...

街景字元編碼識別 Task5 模型整合

在機器學習中的整合學習可以在一定程度上提高 精度,常見的整合學習方法有stacking bagging和boosting,同時這些整合學習方法與具體驗證集劃分聯絡緊密。由於深度學習模型一般需要較長的訓練週期,如果硬體裝置不允許建議選取留出法,如果需要追求精度可以使用交叉驗證的方法。下面假設構建了10...