OCR 基本知識

2021-09-07 14:11:47 字數 546 閱讀 3977

ocr,optical character recognition 的簡稱,也就是光學識別系統,屬於圖形識別的乙個分支,ocr是針對印刷體字元,採用光學的方式將文件資料轉換成原始資料黑白點陣的影象檔案,通過識別軟體將影象中的文字識別成中文和英文內碼,然後轉換成文字格式。這樣計算機就能夠通過ocr識別系統。能夠清楚自己看到了什麼,讀到了什麼,尤其是文字資料。

(1)處理過程:

影像輸入->影像前處理->文字特徵的提取->對照識別->最後通過人工矯正將誤判的文字更正,最後將結果輸出。

(2)詳細流程

1、影像輸入:目標檔案經過光學儀器後生成位圖儲存在計算機。

2、影像預處理:包含二值化、腐蝕與膨脹、中值濾波等。

影象二值化:影象顯示的時候僅僅能看到兩種顏色(常常是黑白兩色)。

3、文字特徵的提取:依據字元本身特點,在不同區域採集資料。

4、對照資料庫:通過畫板製作對應的字母和數字模板作為對照的標準。

5、對照識別:依據不用區域的特徵比較,找出最相近的字元。

6、輸出結果:將最相近的字元作為識別的結果輸出。即識別碼輸出。

Oracle 基本知識

乙個表空間只能屬於乙個資料庫 每個資料庫最少有乙個控制檔案 建議3個,分別放在不同的磁碟上 每個資料庫最少有乙個表空間 system表空間 建立system表空間的目的是盡量將目的相同的表存放在一起,以提高使用效率,只應存放資料字典 每個資料庫最少有兩個聯機日誌組,每組最少乙個聯機日誌檔案 乙個資料...

Oracle 基本知識

乙個表空間只能屬於乙個資料庫 每個資料庫最少有乙個控制檔案 建議3個,分別放在不同的磁碟上 每個資料庫最少有乙個表空間 system表空間 建立system表空間的目的是盡量將目的相同的表存放在一起,以提高使用效率 每個資料庫最少有兩個聯機日誌檔案 乙個資料檔案只能屬於乙個表空間 乙個資料檔案一旦被...

Oracle 基本知識

oracle 文章摘要 oracle 基本知識。正文 oracle 基本知識 乙個表空間只能屬於乙個資料庫 每個資料庫最少有乙個控制檔案 建議3個,分別放在不同的磁碟上 每個資料庫最少有乙個表空間 system表空間 建立system表空間的目的是盡量將目的相同的表存放在一起,以提高使用效率 每個資...