基於tesseract的文字識別

一、tesseract基本操作過程

2. 使用：tesseract使用比較簡單，可以直接採用命令列通過tesseract filename outputname -l 語言名字 -psm 數字（預設是3） config(配置檔案）。預設的語言名字時英語，預設的輸出檔案格式時txt。也可基於python對進行檢測，在使用時除了要安裝pytesseract之外還需要安裝tesseract外掛程式和對應的語言安裝包。另外呼叫介面為pytesseract.image_to_string(image)，返回乙個string型別的結果。python實現方式如下：

tessdata_dir_config = '--tessdata-dir "d:\program files\tesseract-ocr\\tessdata\" ' \

'--psm 6'

pytesseract.pytesseract.tesseract_cmd = 'd:\program files\tesseract-ocr\\tesseract.exe'

card_no = pytesseract.image_to_string(image, lang="chi_sim", config=tessdata_dir_config)

其中返回的card_no即為tesseract檢測的結果。

3. 提高準確度：tesseract在識別一些背景比較趕緊的乾淨，文字和背景比較分明的文字，例如白底黑字或者黑底白字。在輸入時，內部系統也會對進行二值化處理，但是處理方式往往比較統一不能涵蓋說有。所以為例提高準確度可以在輸入之前首先對進行二值化處理。初次之外也可以採用裁剪的方式將中的文字裁剪切來，這樣可以進一步去除背景的干擾。

4. 可採用east模型對文字進行檢測，對檢測出來的文字進行裁剪最後在將裁剪後的進行二值化進而進使用tesseract進行檢測，該方法的好處就是包含文字的區域較小，便於二值化的處理。

基於tesseract的文字識別

Python 文字識別 Tesseract

python識別文字tesseract

tesseract 識別中文字元

基於tesseract的文字識別

Python 文字識別 Tesseract

python識別文字tesseract

tesseract 識別中文字元

相關推薦