開源OCR光學字元識別

2021-09-08 11:15:38 字數 676 閱讀 1415

優秀的開源ocr軟體包括:

tesseract

原本由惠普開發的影象識別類庫tesseract-ocr已經更新到2.04, 就是最近google支援的那個ocr。原先是惠普寫的,現在open source了。

ocropus

ocropus的(tm)是乙個先進的檔案分析和ocr系統,採用可插入的布局分析,可插入的字元識別,自然語言統計建模和多語言支援功能。

cuneiform

cuneiform 是乙個 ocr 文字識別系統的商標,最開始是由cognitive 技術所開發的執行在 windows 下的軟體。而這個專案是該軟體在 linux 系統下的移植版本。

gocr

gocr 是乙個開源的ocr光學識別程式。

ocrfeeder 是 gnome 桌面下的乙個開源 ocr 套件。可將紙質或者圖形文件轉成電子文件。

開源OCR光學字元識別

優秀的開源ocr軟體包括 tesseract 原本由惠普開發的影象識別類庫tesseract ocr已經更新到2.04,就是最近google支援的那個ocr。原先是惠普寫的,現在open source了。ocropus ocropus的 tm 是乙個先進的檔案分析和ocr系統,採用可插入的布局分析,...

OCR光學字元識別

沒搞過計算機視覺,只好拿來主義了 根據網上的推薦 1.google vision,識別效果還不錯,收費,而且對於複雜文字也不是很理想,所以繼續尋找開源 2.tesseract,最負盛名的開源識別軟體,據說google vision內部也是基於此。就我們公司的需求來說 提取中嵌入的文字 tessera...

光學字元識別OCR 4

經過第一部分,我們已經較好地提取了影象的文字特徵,下面進行文字定位。主要過程分兩步 1 鄰近搜尋,目的是圈出單行文字 2 文字切割,目的是將單行文字切割為單字。鄰近搜尋 我們可以對提取的特徵圖進行連通區域搜尋,得到的每個連通區域視為乙個漢字。這對於大多數漢字來說是適用,但是對於一些比較簡單的漢字卻不...