Google開源OCR識別Tesseract介紹

ocr是什麼

ocr，即 optical character recognition，光學字元識別，是指通過掃瞄字元，然後通過其形狀將其翻譯成電子文字的過程。通常技術中廣泛流傳的 ocr 指的就是「將轉成文字」的智慧型技術。

tesseract介紹

tesseract是谷歌開發並開源的影象文字識別引擎，使用python開發。

tesseract的安裝

可以使用預編譯(pre-built)的二進位制版本或者從源**安裝，在ubuntu系統下執行

sudo add-apt-repository ppa:alex-p/tesseract-ocr

sudo apt-get update

sudo apt-get install tesseract-ocr

sudo apt-get install libtesseract-dev

sudo apt-get install tesseract-ocr-chi-sim

驗證tesseract是否正確安裝，可以使用命令列來進行驗證是否安裝成功。

$ tesseract --version

tesseract的使用

識別的基本用法是「imagename outputbase [options…]」，4.1的版本options只能通過「-l」選擇語言。

比如對test.png進行ocr，然後把識別結果儲存在test.txt裡

tesseract test.png test -l chi_sim

更多的使用命令和方法，可以參照官方教程。

OCR識別的開源分析

ocr軟體主要是由下面幾個部分組成。1.影象輸入預處理 2.影象輸入對於不同的影象格式，有著不同的儲存格式，不同的壓縮方式。預處理主要包括二值化，雜訊去除，傾斜較正等 3.二值化對攝像頭拍攝的，大多數是彩色影象，彩色影象所含資訊量巨大，對於的內容，我們可以簡單的分為前景與背景，為了讓計算機更...

開源OCR光學字元識別

優秀的開源ocr軟體包括 tesseract 原本由惠普開發的影象識別類庫tesseract ocr已經更新到2.04，就是最近google支援的那個ocr。原先是惠普寫的，現在open source了。ocropus ocropus的 tm 是乙個先進的檔案分析和ocr系統，採用可插入的布局分析，...

Google開源OCR識別Tesseract介紹

OCR識別的開源分析

開源OCR光學字元識別

開源OCR光學字元識別

相關推薦