合成中文識別資料集的相關repo

2021-09-26 12:49:42 字數 659 閱讀 3308

介紹合成中文識別資料集的相關repo

修改自synthtext(cvpr2016),用於生成自然場景文字影象。

備註:但**給人的感覺是很混亂,沒有清晰結構,目前作者也停止了維護,**基於opencv2.4,版本過舊無法pip直接安裝或者需要自己改動一些**。

乙個合成資料生成器用於文字識別

備註:**結構清晰,作者一直在維護,有官方文件。

引數說明有官方手冊,這裡不再贅述。說一下實際遇到的幾個問題:

傾斜角度問題:傾斜角不宜過大,過大會導致它為了在指定高度框中容下傾斜文字,將字型縮的很小。建議5度》以內。

模糊問題:模糊引數僅支援整型,設為1合適。

標籤問題:源**中僅有三種標籤,不支援img_id to label_id,可以修改string_generator.py中的create_strings_from_dict,使其同時返回生成字串的對應id。

邊界問題:建議將邊界設為0,字型大一些。

字型問題:直接將你想要的字型丟入fonts的cn資料夾,建議還是新增同時支援簡體和繁體的字型。

準確的說也是生成文字影象用於文字識別

備註:**結構清晰,但很久沒維護了。

中文識別資料集生成指令碼

該指令碼能夠將使用者指定的字元輸出為不同字型的影象檔案,用於訓練文字識別的機器學習模型或用於其他文字識別ocr專案 隨著近幾年來計算機算力的不斷提公升,機器學習也迎來了爆發式的發展,影象識別作為機器學習最典型也是最主要的應用之一,目前應用前景火熱。機器學習最重要的一步就是獲取資料集,沒有乙個堅實的資...

行為識別資料集彙總

工欲善其事,必先利其器 1.the kth dataset 2004 密碼 rfr7 記得點讚 2.the weizmann dataset 2005 3.the ixmas dataset 2006 4.the hollywood dataset 2008 2009 5.the ucf datas...

步態識別資料集整理

按照時間順序,來自 資料集提出時間 資料型別 個體數和序列總數 環境視角數 變化cmu mobo 2001 rgb 輪廓圖 25 600室內6 3個走路速度 攜帶乙個球 soton 2002 rgb 輪廓圖 115 2128 室內 室外 2在treadmill上走路 casia a 2003 rgb...