Google開源OCR識別Tesseract介紹

2021-10-23 09:45:24 字數 767 閱讀 8325

ocr是什麼

ocr,即 optical character recognition,光學字元識別,是指通過掃瞄字元,然後通過其形狀將其翻譯成電子文字的過程。通常技術中廣泛流傳的 ocr 指的就是「將轉成文字」的智慧型技術。

tesseract介紹

tesseract是谷歌開發並開源的影象文字識別引擎,使用python開發。

tesseract的安裝

可以使用預編譯(pre-built)的二進位制版本或者從源**安裝,在ubuntu系統下執行

sudo add-apt-repository ppa:alex-p/tesseract-ocr

sudo apt-get update

sudo apt-get install tesseract-ocr

sudo apt-get install libtesseract-dev

sudo apt-get install tesseract-ocr-chi-sim

驗證tesseract是否正確安裝,可以使用命令列來進行驗證是否安裝成功。

$ tesseract --version

tesseract的使用

識別的基本用法是「imagename outputbase [options…]」,4.1的版本options只能通過「-l」選擇語言。

比如對test.png進行ocr,然後把識別結果儲存在test.txt裡

tesseract test.png test -l chi_sim

更多的使用命令和方法,可以參照官方教程。

OCR識別的開源分析

ocr軟體主要是由下面幾個部分組成。1.影象輸入 預處理 2.影象輸入 對於不同的影象格式,有著不同的儲存格式,不同的壓縮方式。預處理 主要包括二值化,雜訊去除,傾斜較正等 3.二值化 對攝像頭拍攝的,大多數是彩色影象,彩色影象所含資訊量巨大,對於的內容,我們可以簡單的分為前景與背景,為了讓計算機更...

開源OCR光學字元識別

優秀的開源ocr軟體包括 tesseract 原本由惠普開發的影象識別類庫tesseract ocr已經更新到2.04,就是最近google支援的那個ocr。原先是惠普寫的,現在open source了。ocropus ocropus的 tm 是乙個先進的檔案分析和ocr系統,採用可插入的布局分析,...

開源OCR光學字元識別

優秀的開源ocr軟體包括 tesseract 原本由惠普開發的影象識別類庫tesseract ocr已經更新到2.04,就是最近google支援的那個ocr。原先是惠普寫的,現在open source了。ocropus ocropus的 tm 是乙個先進的檔案分析和ocr系統,採用可插入的布局分析,...