基於本地文字提取的有效的定位和識別場景文字

2022-07-25 11:06:28 字數 720 閱讀 2696

一種無約束的端到端的文字定位和識別方法。首先用乙個基於區域的方法對文字區域檢測,然後更新文字區域用更加健壯(迭代)的方法。並且介紹一種基於筆畫的方法,該方法有效的應對字元的大小變化, 旋轉,即使只捕捉到文字的小片段。

場景識別又被稱為是ocr。現在的滑窗技術的乙個缺點是:視窗數會隨著文字的不同大小旋轉方向等因素急速增長。而基於連通域的方法對於乙個連通域是乙個單獨字元還是乙個字元的一部分處理的不好,而且對於若干字元粘連不可行。本文提出一種新方法,受啟發於:任意的字元都是有一些筆畫組成。因此,我們的方法無論是一組連通域,或者是字元的一部分,都可以有效識別。

本篇**主要內容:

0.介紹一種新的端到端的字元定位和檢測的方法。

1.介紹一種新的基於字元筆畫面積估計的特點,該特點可以從乙個區域距離圖中計算出來。對於字元大小和旋轉具有不變性。

方法:0.初始候選者利用mser方法檢測出來。

1.字元/多字元/背景的分類,字元和多字元被用來初始化乙個本地文字模型,背景分類丟棄。用svm進行分類,核函式取適用於線性不可分的rbf核函式,而不選擇適用於線性可分的linear核函式。

2.文字線假設

3.迭代分割

4.文字識別

結論:0.ssps方法在icdar2013上 icdar2013 包含1189個單詞,6393個字元在255張中,77.1%的f-measure的準確率, 72.4%的召回率,81.8%的精確率。

1.在乙個2.7ghz的電腦上,每張平均800ms

利用投影法基於Opencv的文字定位

針對發票識別之類的自然環境中文字識別,對結果影響最大的應該是文字定位的問題。下面本人參考 boytnt 的基於opencv進行文字分塊切割 c 本人寫了乙份c 的 僅供參考 因為有一些干擾,所以文字定位並不是很完美,可以通過二值化的方法去掉一些干擾,以後再改進。include include inc...

iOS 8 基於定位的本地通知

ios 8在推送通知的方式上做了些許改動,特別是對於推送的認證和本地通知更是改得不少。本地通知可以通過乙個定時器觸發,並且比較新鮮的功能就是通過定位資訊來觸發本地通知。在ios 7上,根據使用者的地理資訊在特定的區域給其傳送通知理論上是可以實現的,但是離真的實現相去甚遠。而這些功能在ios 8裡面都...

基於眼睛和面板的定位

原文 本文提出了一種基於膚色資訊和眼睛粗略定位的人臉檢測演算法。該演算法先對 anil k.jain 的 cb cr 橢圓聚類方法進行了改進,用改進的演算法進行膚色提取,經過膚色區域的分析,對人臉區域進行預檢測,確定人臉可能區域,然後再根據眼睛的粗略定位進一步確定人臉區域。一 膚色分析 skin.m...