街景字元 資料準備

2021-10-06 08:44:14 字數 1590 閱讀 7056

利用json庫讀取json檔案,得到如下結果

with open('./dataset/mchar_val.json','r',encoding='utf8')as fp: 

json_data = json.load(fp) print('這是檔案中的json資料:',json_data)

3.利用opencv庫函式實現資料的視覺化。

全部**如下:

import json

import cv2

img_path="./dataset/mchar_val/"

with open('./dataset/mchar_val.json','r',encoding='utf8')as fp:

json_data = json.load(fp)

print('這是檔案中的json資料:',json_data)

cnt=0

#得到前5條資料並利用matplot視覺化資料集

for tmp in json_data:

if cnt >5:

break;

temp_path=img_path+tmp

img = cv2.imread(temp_path)

cv2.namedwindow('test', cv2.window_normal)

cv2.resizewindow('test', 1000, 1000)

print(json_data[tmp]['label'])

label_len=len(json_data[tmp]['label'])

print("***:",json_data[tmp]['top'][0])

for i in range(0,label_len):

y=int(json_data[tmp]['top'][i])

x=int(json_data[tmp]['left'][i])

w=int(json_data[tmp]['width'][i])

h=int(json_data[tmp]['height'][i])

cv2.rectangle(img, (x,y),(x+w,y+h), (0, 0, 255), 1)

cv2.puttext(img, str(json_data[tmp]['label'][i]), (x-3,y-3), cv2.font_hershey_complex_small, 0.3, (255, 0, 0))

cv2.imshow("test",img)

key = cv2.waitkey(0)

# if key == ord('m'):

# continue

cnt+=1

# train_label = [json_data[x]['label'] for x in json_data]

# print(train_label)

# print('這是讀取到檔案資料的資料型別:', type(json_data))

街景字元編碼識別1

該資料來自真實場景的門牌號。訓練集資料報括 3w 張 驗證集資料報括 1w 張 每張 包括顏色影象和對應的編碼類別和具體位置 為了保證比賽的公平性,測試集a包括 4w 張 測試集b包括 4w 張 相關資料 所有的資料使用 訓練集和驗證集 json格式進行標註,如果乙個檔案中包含多個字元,則使用列表將...

天池 Datawhale 街景字元編碼識別

天池 datawhale 街景字元編碼識別 task1 賽題理解 需要選手 真實場景下的字元識別,這是乙個典型的字元識別問題 分類問題 資料集 自google街景影象中的門牌號資料集 the street view house numbers dataset,svhn 並根據一定方式取樣得到比賽資料...

街景字元識別 模型整合

3.後處理 整合學習方法可以提高 精度,常見的有stacking bagging和boosting。一般利用交叉驗證法提高精度,如下所示。使用10折交叉驗證法,得到10個cnn模型,可通過以下方法進行整合。平均 結果的概率值,然後解碼為具體字元。對 的字元進行投票,得到最終字元。dropout在訓練...