Tesseract 安裝和使用簡介

2021-08-26 02:15:58 字數 1029 閱讀 5028

tesseract 是乙個 ocr 庫,目前由 google 贊助(google 也是一家以 ocr 和機器學習技術聞名於世的公司)。tesseract 是目前公認最優秀、最精確的開源 ocr 系統,除了極高的精確度,tesseract 也具有很高的靈活性。它可以通過訓練識別出任何字型,也可以識別出任何 unicode 字元。

apt-get install tesseract-ocr   (如果出現許可權不夠,可以命令前面加上sudo)
brew install tesseract
pip install pytesseract
新增環境變數

export tessdata_prefix=/usr/local/share/tesseract
新增環境變數

# c:\program files\tesseract ocr\tesseract 為語言訓練庫路徑

setx tessdata_prefix c:\program files\tesseract ocr\tesseract

顯示幫助

tesseract --help
顯示當前訓練語言列表

tesseract --list-langs
識別

tesseract  輸出路徑 -l 訓練庫名稱
# 匯入模組

import pytesseract

# 導入庫 【注意】需要安裝庫: pip install pillow

# 導入庫

from pil import image

# 建立物件

image = image.open("路徑")

# 識別

pytesseract.image_to_string(numimage, config="-psm 7"))

Linux下安裝tesseract教程

一 依賴安裝 1 檢視centos版本 cat etc redhat release centos release 6.5 final 2 檢查yum的repo庫 yum repolist all 檢查是否有如下的repo庫 centos sclo rh,centos sclo sclo 如果沒有則...

筆記 tesseract編譯及使用

編譯leptonica編譯tesseractlib lept vers ion lib libt if f liblept version lib libtiff lible ptv ersi on libl ibti ff libtiff version static mtdll.lib 2 de...

使用C 版Tesseract庫

開啟nuget,搜尋tesseract,點安裝即可。原始碼是vs2015編譯的,需要安裝vs2015以上版本。開啟專案後如 我們再新增乙個winform專案,畫介面如 選並呼叫ocr識別方法 private void btnrec click object sender,eventargs e el...