基於tesseract的文字識別

2021-09-26 18:19:55 字數 908 閱讀 1511

一、tesseract基本操作過程

2. 使用:tesseract使用比較簡單,可以直接採用命令列通過tesseract  filename  outputname  -l 語言名字 -psm 數字(預設是3) config(配置檔案)。預設的語言名字時英語,預設的輸出檔案格式時txt。也可基於python對進行檢測,在使用時除了要安裝pytesseract之外還需要安裝tesseract外掛程式和對應的語言安裝包。另外呼叫介面為pytesseract.image_to_string(image),返回乙個string型別的結果。python實現方式如下:

tessdata_dir_config = '--tessdata-dir "d:\program files\tesseract-ocr\\tessdata\" ' \

'--psm 6'

pytesseract.pytesseract.tesseract_cmd = 'd:\program files\tesseract-ocr\\tesseract.exe'

card_no = pytesseract.image_to_string(image, lang="chi_sim", config=tessdata_dir_config)
其中返回的card_no即為tesseract檢測的結果。

3. 提高準確度:tesseract在識別一些背景比較趕緊的乾淨,文字和背景比較分明的文字,例如白底黑字或者黑底白字。在輸入時,內部系統也會對進行二值化處理,但是處理方式往往比較統一不能涵蓋說有。所以為例提高準確度可以在輸入之前首先對進行二值化處理。初次之外也可以採用裁剪的方式將中的文字裁剪切來,這樣可以進一步去除背景的干擾。

4. 可採用east模型對文字進行檢測,對檢測出來的文字進行裁剪最後在將裁剪後的進行二值化進而進使用tesseract進行檢測,該方法的好處就是包含文字的區域較小,便於二值化的處理。

Python 文字識別 Tesseract

tesseract 是乙個 ocr 庫,目前由 google 贊助 google 也是一家以 ocr 和機器學習技術聞名於世的公司 tesseract 是目前公認最優秀 最精確的開源 ocr 系統。除了極高的精確度,tesseract 也具有很高的靈活性。它可以通過訓練識別出任何字型,也可以識別出任...

python識別文字tesseract

ubuntu版本 1.tesseract ocr安裝 sudo apt get install tesseract ocr 2.pytesseract安裝 sudo pip install pytesseract 3.pillow 安裝 sudo pip install pillow 開始寫 fro...

tesseract 識別中文字元

在tesseract目錄下,有個tesseract.exe檔案,主要呼叫這個執行檔案,用cmd執行到這個目錄下,在這個目錄下同時放置一張需要識別的,這裡是123.jpg 然後執行 tesseract 123.jpg result 會把123.jpg自動識別並轉換為txt檔案到result.txt 然...