OCR文字技術與行業應用

2021-08-20 10:47:01 字數 1419 閱讀 6333

數字原生類:

**商品圖是最具有代表性的數字原生類文字圖。

特點:1)最複雜多樣:各種字型、背景、排列、組合等(mtwi挑戰賽-最大的ocr競賽)。

2)最有價值:商品資訊載體

3)量最大:千億,每日不停更新。

文件類:

文件類ocr需求非常廣,涉及各種公務場景。

特點:1)100%識別率:人的輸入準確率為98%,探索ai知識的極限;2)產品易用性:完善的功能,貼近業務需求;3)商業應用:文件類商業成熟。

拍照表單類:拍照表單類ocr價值非常大,非常有挑戰性。

特點:1)場景&資料:資料具有私隱性,典型應用場景沉澱技術能力;2)產品通用性:專家知識+模板=文字理解,一套方案解決上百種型別。3)商業價值:和行業場景深度接入,ai能力改善行業資料流程。(提供定製的拍照**識別和結構化雲服務)

自然場景類:ocr學術研究的重點方向。

特點:1)資料:無具體資料型別定義,比如街拍資料;2)技術難點:不確定性,複雜環境干擾本質難點是定位和識別;3)商業價值:市場潛力巨大,如:車牌識別、攝像監控、自動駕駛。(技術能力領先,行業落地中)

演算法能力:

兩種核心演算法能力:1)通用文字識別;2)通用結構化(文字識別是結構化的基礎)

基礎演算法:文字定位、文字識別

1.文字定位:定位文字在影象中的位置表徵成行。

特徵問題:背景等特徵干擾問題,深度學習可以較好的解決特徵問題。

scale問題:物體定位的共性問題,字高範圍8-300個畫素

成行問題:文字定位特有問題。

(1)scale問題:物體定位的共性問題

(2)成行問題:文字定位特有問題

2.文字識別

在文字定位的基礎上,識別文字內容,同時,輸出單字位置和識別率用於文字理解。

兩大識別難題:1)相似字;2)生僻字

OCR文字識別SDK應用

ocr識別技術現已相當的成熟,故其應用也變得普遍起來。今天以ocr sdk為例,詳細了解下其應用場景。我們的ocr sdk可以提供api介面,方便整合掛接,且效果良好。比如,ocr sdk可以用於檔案管理系統,oa系統等。下面就來看下oa系統中的ocr sdk作用。現在ocr sdk已經被應用在oa...

身份證識別OCR行業技術

某近日去了一趟國家圖書館,體驗了一把身份證識別。話說來也是很巧,自動辦讀書卡的地方人很多,我想蒙混進到圖書室內,怎麼也是漫無目的的看書唄。自信滿滿地就進去了,果斷地被攔住了 刷卡!沒有怎麼辦,刷臉行不?現在不也流行人臉識別嗎!刷身份證!恰巧帶了身份證,放在他那個身份證讀卡器上,滴滴兩聲,進去吧!可以...

OCR技術的發展及應用

一 ocr技術的發展歷程 ocr optical character recognition 的概念誕生於1929年,由德國的科學家tausheck首先提出,並且申請了專利。幾年後,美國科學家handel也提出了對文字進行識別的想法,但這種夢想直到計算機誕生後才變成為現實。現在這一技術已經由計算機來...