字元定位與字元分割

2021-08-02 04:00:11 字數 978 閱讀 5021

**發的這篇文章,關注的重點是字元定位的思路,具體**實現,基本就好辦了)

abstract:字串識別最重要的是字串定位以及字串分割。例如做車牌識別,車牌字元定位和分割是最難的部分。對於一張字串的影象,首先必須要定位出字串的邊界,然後分別對字串進行單個切割,單個分割出來的字元再做識別。 下面就介紹字串定位和字串分割的方法。

1. 字串定位

下面先看一幅手寫字 

我們需要做的是找出整個字元的邊界然後對進行切割。 

對於一張m×

n 大小的i,我們先對進行二值化處理。一張可以看成乙個矩陣,這樣這個矩陣裡面的數字不是1就是0。我們需要對這個矩陣進行行掃瞄和列掃瞄。對於列掃瞄和行掃瞄統計一行或者一列中1的個數分別有如下公式: 

cola=∑

mj=1

ijrowa=∑

ni=1

ii這樣就統計出每一列或者每一行的1的個數。下圖為統計圖: 

這下我們可以定義出左邊界、右邊界、上邊界、下邊界。這樣就可以切割出字串的邊界如下圖所示: 

2. 字元分割

對於字元分割我們只看x方向,對於x我們可以看到很多斷點,如下所示 

我們可以統計出斷點的位置來對不同字元進行分割,兩個段點之間能進行確定乙個字元。當然這個只是針對未粘連的字元,但是對於粘連字元斷點可以設定乙個小的閾值來當做斷點。這個需要根據實際處理的字串來判斷。下面給出結果和**: 

halcon粘連字元分割 粘連字元分割初探

學習驗證碼快乙個星期了,終於把樣本集切出來了,現在問題是如何切粘連字元,現在將自己的學習過程記錄下來 第一部分 我們知道,對於不黏連的字元,直接用掃瞄線分割法就可以,就是看哪乙個豎條上沒有文字畫素,則這個豎條就是兩個字元間的空白部分 當然,對於不黏連的字元,cfs演算法效果也很好,它主要是利用連通域...

字元分割函式

1.function split split str string line str string tstrings 2.字串分割 分割用字元 原始字串,3.var 4.posi integer 5.str tstringlist 6.l str string 7.begin 8.str tstri...

linux shell substr(分割字串)

原來在shell中如果遇到要擷取字串的情況,就呼叫awk中的substr來實現。今天了解到一種新的方法,原來shell中本身就支援這種用法。如,有一字串 12345678 現在要擷取第三個到第六個字元的字串區間。則可以 xok.la export str 123456789 xok.la echo ...