tesseract效能優化

2021-10-02 07:39:01 字數 306 閱讀 6859

最近用到ocr技術,使用了google的tesseract,對於嵌入式裝置來說,不光要實現功能,還要考慮實現功能的代價,也就說實現此功能需要的記憶體、cpu、儲存以及網路資源,tesseract的使用我們需要關心的是cpu和儲存資源。

這裡說的cpu資源翻譯過來就是識別速度,速度越快,說明需要的cpu資源越少,為了提高tesseract的識別速率,最關鍵的就是影象預處理,根據最近的一些經驗,總結如下幾點:

tesseract設定到占用儲存資源的也就是tessdata了,我們可以通過工具減少目前tessdata的內容,然後再重新打包,或者根據使用場景自己訓練data。

mysql效能優化 mysql效能優化

優化方式 1.空間換時間 冗餘 2.時間換空間 字段優先使用型別 int date char varchar text 索引型別 btree索引 hash索引 索引的葉子下,存放乙個資訊指向所在行的資料位址。btree有利於範圍查詢,hash有利於精確查詢。btree用的更多一些。btree索引的常...

Tesseract 資料訓練

1.merge合併樣本檔案生成字尾為.tif格式檔案khm.font.exp0.tif tool merge tiff jtessboxeditor工具 2.生成.box檔案khm.font.exp0.box 注意 l khm psm tesseract khm.font.exp0.tif khm....

效能優化 電量優化

使用battery historian來監測電量的情況,battery historian時google的乙個開源專案 具體安裝過程參見 當出現下列畫面,說明已經開啟 其開啟成功以後,訪問網頁如下所示 說明 這裡使用的是一台國外的vps伺服器,原本是想在本地虛擬機器實驗的,一直連線超時,就換成了vp...