關於PGM在OCR方面的應用

2022-07-24 05:12:10 字數 1021 閱讀 4000

本文僅僅是乙個簡單的pgm在ocr方面的應用的實踐。

僅此記錄下來實現的思路。

ocr(optical character recognition)即是將手寫的文字用計算機自動的識別出來,然後輸送到計算機裡。

ocr目前仍然沒有完全成功的產品。但是不論ocr再進行優化,他的基本思路都是相同的。

在此,我僅僅使用到了兩個比較通用的ocr方面的優化方法進行說明。

首先最基本的,就是直接通過採集到的手寫體問題進行識別,我們假定前後的letters之間沒有任何的關聯。

使用softmax,dl或者任何一種你認為可行的分類演算法都可以,這個分類演算法的目的就是根據拿到的資訊給單詞表中的

每乙個備選letters進行打分(score),可能性高的letter的分高,反之則分低。

當然我們的假設是錯誤的,因為不論是在英文單詞裡還是在這世界上的任何一種語言,letters之間肯定是相關的,而且有些letters

本來外形就十分的相似,如果僅僅是建立letters之間不相關的模型進行ocr恐怕識別率不會很高。

鑑於此,對模型進行了優化,建立了乙個markov network,這裡假定了相鄰的letters之間是有關聯的,然後我們建立乙個表,

列出各種letters同時出現的概率的大小。

由於僅僅相鄰兩個letters的約束不夠強,於是再多加乙個聯絡,引入三個letters同時出現的score

有了基本思路和模型就可以來實現啦!

在實現的時候用到了python的乙個開源庫:pgmpy  

具體安裝和使用文件在他們的官網上都有,真的挺好用。

如果有朋友發現不足的地方歡迎指正!

VR技術在展示方面的應用

在企業的展示中,產品的展示主要是為了向消費者傳遞商品的資訊,讓消費者更加直觀全面的來哦接商品,加深消費者的認知和了解,vr技術可以通過文字 等各種方式展示商品資訊,突破常規的侷限性,是消費者了解的更加全面,且讓消費者可以和商品建立良好的互動交流,有效解決商品展示真實感不足的問題。在房地產等建築的展示...

cookie在爬蟲方面的應用 模擬登入

cookies在爬蟲方面最典型的應用是判定註冊使用者是否已經登入 在下一次進入此 時保留使用者資訊,可以簡化登入或其他驗證過程。在模擬登入 時 需要傳送乙個post請求去獲取有登入資訊的cookie 登入頁面跳轉到使用者頁面的時候,抓包此時的cookie是乙個儲存了使用者登入狀態的cookie 需要...

計算機在軍事方面的應用

在現代化戰爭當中,誰掌握了高新技術,誰就掌握了戰爭的主動權。無論是在資訊獲取 資訊傳遞 資訊處理和利用這三個基本環節,還是 在偵察反偵察 干擾反干擾 破壞反破壞 摧毀反摧毀 控制反控制五種基本手段當中,計算機技術都發揮了不可替代的作用。雲計算 雲計算是平行計算 分布式計算 網格計算 網路儲存 虛擬化...