開啟OCR的部落格共享世界

人工智慧

正在向縱深發展，所有的

ai人都在努力的讓計算機、機器解決人類生活和工作中的問題。而在這過程中，深度學習演算法讓計算機、機械人有了自我學習的能力。海量的資料輸入為深度學習大腦，深度學習大腦從資料中大量汲取養分。

作為深度學習的代表作，目前的智力已經可以達到

2-3歲孩子的水平，甚至在某些方面的能力已經超越人類。前不久的利用

谷歌大腦

開發的alphago

與李世石的圍棋大戰讓越來越多的人了解了深度學習，了解了人工智慧技術的進步。

海量的網路資源終究無法替代現實生活場景，如何讓深度學習大腦更懂這個世界？

答案就是

——讓深度學習的大腦到生活中去。在生活中探索和學習。作為計算機，它要怎麼才能進入人類的世界呢？入口在**？機器視覺、語音輸入

……機器視覺和語音輸入等方面都為計算機提供了有效的資料入口，這也是為何目前

人臉識別

、ocr

識別

、語音識別

等領域在深度學習領域走在技術最前沿的重要原因。入口很重要。

從出生到死亡，在這短暫又漫長的週期裡人類要經歷包括生活技能的學習，書本知識的學習，經驗的積累等等。計算機在深度學習的幫助下，有了自己的思維能力，它掌握了一定的生活技能，現在它已經進入了

2.0的階段。快速的書本學習和經驗積累。

書本知識的學習

什麼是

ocr，即

光學字元識別

技術。人類社會經過幾千年的經驗積累，並將這些經驗大量的編纂在書籍。要讓計算機從這些書籍中獲取到資訊，關鍵的一步就是資訊文字化。

ocr技術就是完成這一步驟的工作。通過掃瞄或拍照的方式，將書本資訊採集成，利用

ocr識別出書本資訊，最後將這些資訊輸入到深度學習大腦中。

現實生活經驗積累

在現實生活中，馬路上、走道，大量的廣告牌、路標、指引資訊等。這些自然場景下的字元要讓計算機進行學習同樣需要用到

ocr技術。自然場景下的

ocr技術目前還處於較為初級的階段。如何在自然場景下有效的定位到文字資訊。如何對複雜環境下，將定位到的文字向文字文字轉化。作為科技的巨頭

——微軟，一直致力於

自然場景下的

ocr識別

，並取得了較大的突破。

ocr識別現狀

當前，ocr

主要應用還集中在書本或證件等層面，這些材料具有文字清晰、字型統一等諸多特點。但是，卻是日常生活中最常使用到的。市場上身份證識別、駕駛證識別、行駛證識別、銀行卡識別、文件識別、票據識別等這些都是

ocr帶來的生活和工作便捷的重要體現。

相信，隨著行業發展的不斷深入。

ocr一定會為人們帶來越來越多的驚喜。

開啟神秘程式設計世界的大門

從 2000 年畢業，我做這行已經超過十二年了。最初接觸電腦程式，還是 dos 下的 qbasic 那已經離現在有接近二十年了。最初，我只是會照貓畫虎，按照老師的程式抄個素數數列，或者列印個三角形什麼的。初步理解程式的結構和意義，要等到讀大學以後了。那個時候在老師的鼓勵下，自己買書學習 delphi...

開啟C世界的大門（二）

資料的屬性及組合前面說到了c世界中的最小單元是資料，而資料又有各種不同的屬性。這節，又又將針對資料的屬性進行詳細的介紹。01 資料的屬性還引用現實中的例子，人有不同的語言，而不同的語言又有不同的使用範圍，正如大家所知道的，英語的範圍最為廣泛，一些方言使用的範圍很小。c世界中也一樣，資料的屬性也可...

開啟我的部落格之旅

從考完專案管理工程師，心就開始有些浮躁。既然選擇了技術這條不歸的道路，就應該勇往直前的走下去。程式設計師的修真，最終還是修自身！下定決心寫部落格也是有原因的，早就想把自己工作的一些感悟寫下來，由於懶散成性，又因為工作沒有網路，所以也一直耽擱了，今天重返論壇，發現平時乙個特別不善言談的同事，寫的部落格...

開啟OCR的部落格共享世界

開啟神秘程式設計世界的大門

開啟C世界的大門（二）

開啟我的部落格之旅

相關推薦