將jTessBoxEditor訓練的字型檔合併

2021-08-27 21:05:07 字數 1928 閱讀 1829

整合環境:win10,jtessboxeditor-1.7.3

1.需要生成字符集的.tif和.box這倆個檔案。

假設:需要合併三個字典liu.宋體.exp0,liu1.微軟雅黑light.exp0,micrsoft.microsoftyaheiuilight.exp0(注:個人生成的字典有個人的名字,建議用自己的名字)

(1)將這三個字典的.tif和.box檔案拷貝到乙個資料夾下;

2.生成相對應的tr檔案:

(1)生成liu.宋體.exp0的tr檔案

命令:tesseract liu.宋體.exp0.tif liu.宋體.exp0 nobatch box.train(dos下執行)

(2)生成liu1.微軟雅黑light.exp0的tr檔案

命令:tesseract liu1.微軟雅黑light.exp0.tif liu1.微軟雅黑light.exp0 nobatch box.train

(3)生成:micrsoft.microsoftyaheiuilight.exp0的tr檔案

命令:tesseract micrsoft.microsoftyaheiuilight.exp0.tif micrsoft.microsoftyaheiuilight.exp0 nobatch box.train

3.從所有檔案中提取字元

命令:unicharset_extractor liu.宋體.exp0.box liu1.微軟雅黑light.exp0.box micrsoft.microsoftyaheiuilight.exp0.box

4.生成字型特徵檔案

新建font檔案(注檔案字尾沒有.txt),把所有box對應的字型特徵加進去。

fontname為字型名稱,保持和 集檔案 .tif 和.box檔案的字首名一致 ,italic> 、、、、 的取值為1或0,表示字型是否具有這些屬性。

例如我新建了乙個 名為 font,內容 為

然後執行命令:mftraining -f font -u unicharset liu.宋體.exp0.tr liu1.微軟雅黑light.exp0.tr micrsoft.microsoftyaheiuilight.exp0.tr

5.聚合所有的tr檔案:

命令:cntraining liu.宋體.exp0.tr liu1.微軟雅黑light.exp0.tr 

6.重新命名檔案,我把unicharset, inttemp, normproto, pfftable ,shapetable這幾個檔案加了字首why.(注:why.只是我給合成的字典的命名,個人隨意)

7.合併所有檔案,生成乙個大的資庫檔案。

命令:combine_tessdata why.

注:由於花費了好多時間才搞出來的,所以寫的有點囉嗦,望諒解。

怎麼將mysql資料匯出 怎麼將mysql資料匯出

mysql 是最流行的關係型資料庫管理系統之一,mysql中我們可以使用select.into outfile語句來簡單的匯出資料到文字檔案上。使用 select into outfile 語句匯出資料 以下例項中我們將資料表 demo tbl 資料匯出到 tmp demo.txt 檔案中 mysq...

谷歌即時搜尋將推出 SEOer將何去何從

昨天易搜在檢視qq群的時候,發現很多都在討論谷歌的即時搜尋 google instant 功能,本來以為又是谷歌創新的表現,可是這次貌似給大家造成的恐慌是前所未有的,其實大家早已習慣了谷歌的藝術創新,每次的革新都會引起一番轟動。此次即時搜尋指的是 當程式設計客棧使用者在搜尋框中輸入搜尋關鍵詞後,隨著...

函式將返回

你可以在這裡看到,n值超出範圍後,它的位址返回給呼叫者。最終的結果是,對方最終非分配的記憶體位址,它會引起很多問題,如果使用。這是最常見的程式設計錯誤,新的程式設計師。許多新的編譯器會給出乙個警告 不是錯誤 如果程式設計師試圖返回的位址 然而區域性變數,有相當多的方式來欺騙編譯器裡讓你做違法的事情而...