基於深度學習的OCR識別服務

2021-08-28 06:48:31 字數 514 閱讀 9245

1、支援對二代居民身份證正反面的關鍵字段識別,包括姓名、性別、民族、出生日期、住址、身份證號、簽發機關、有效期限,識別準確率可達98%以上。

2、支援對營業執照關鍵字段的識別,包括單位名稱、法人、位址、有效期、證件編號、社會信用**等,準確率達94%以上。

整套ocr服務可以分為服務端與客戶端。服務端搭建在私人雲伺服器上(當前配置為1核cpu,2gb記憶體,0gpu),使用流行的darknet模型對目標區域進行識別標記而後通過迴圈卷積神經網路進行文字識別。服務端對輸入資料進行預處理(對於超大進行降取樣、base64編碼等操作),通過系列的預處理操作降低伺服器的壓力,最後對於不同版面的識別,開發了對應的文字優化。核心服務端使用:tensorflow/ pytorch/ opencv等擼碼。客戶端借助hutool工具類解析和編碼。

1、完美封裝、真正的一行**就可以呼叫高大上的服務(相比「某du」要方便些)。

ocrtask.run("front","d:\\temp\\dataset\\idcard\

基於深度學習(端到端)的OCR文字識別

開發環境 anaconda python3.6 tensorflow keras pytorch 該模型使用了 opencv 模組。依賴包版本需求 你可以使用 pip install 包名 conda install 包名 安裝依賴 easydict 1.7tensorflow gpu 1.3.0 ...

OCR深度學習應用

ocr技術識別文件的概括 我們常說的ocr 文字識別 ocr技術識別文件是指通過電子裝置等將紙質上的文字識別出來,形成可編輯的文字。ocr技術識別文件的流程 常規的ocr文字識別處理的過程包括 3 設定語種 選擇需要什麼ocr語種的引擎程式 4 輸出結果 輸出ocr識別結果為原版原樣的優質檔案 oc...

OCR深度學習應用

ocr技術識別文件的概括 我們常說的ocr 文字識別 ocr技術識別文件是指通過電子裝置等將紙質上的文字識別出來,形成可編輯的文字。ocr技術識別文件的流程 常規的ocr文字識別處理的過程包括 3 設定語種 選擇需要什麼ocr語種的引擎程式 4 輸出結果 輸出ocr識別結果為原版原樣的優質檔案 oc...