開啟OCR的部落格共享世界

2021-07-24 19:42:58 字數 1358 閱讀 2685

人工智慧

正在向縱深發展,所有的

ai人都在努力的讓計算機、機器解決人類生活和工作中的問題。而在這過程中,深度學習演算法讓計算機、機械人有了自我學習的能力。海量的資料輸入為深度學習大腦,深度學習大腦從資料中大量汲取養分。

作為深度學習的代表作,目前的智力已經可以達到

2-3歲孩子的水平,甚至在某些方面的能力已經超越人類。前不久的利用

谷歌大腦

開發的alphago

與李世石的圍棋大戰讓越來越多的人了解了深度學習,了解了人工智慧技術的進步。

海量的網路資源終究無法替代現實生活場景,如何讓深度學習大腦更懂這個世界?

答案就是

——讓深度學習的大腦到生活中去。在生活中探索和學習。作為計算機,它要怎麼才能進入人類的世界呢?入口在**?機器視覺、語音輸入

……機器視覺和語音輸入等方面都為計算機提供了有效的資料入口,這也是為何目前

人臉識別

ocr

識別

、語音識別

等領域在深度學習領域走在技術最前沿的重要原因。入口很重要。

從出生到死亡,在這短暫又漫長的週期裡人類要經歷包括生活技能的學習,書本知識的學習,經驗的積累等等。計算機在深度學習的幫助下,有了自己的思維能力,它掌握了一定的生活技能,現在它已經進入了

2.0的階段。快速的書本學習和經驗積累。

書本知識的學習

什麼是

ocr,即

光學字元識別

技術。人類社會經過幾千年的經驗積累,並將這些經驗大量的編纂在書籍。要讓計算機從這些書籍中獲取到資訊,關鍵的一步就是資訊文字化。

ocr技術就是完成這一步驟的工作。通過掃瞄或拍照的方式,將書本資訊採集成,利用

ocr識別出書本資訊,最後將這些資訊輸入到深度學習大腦中。

現實生活經驗積累

在現實生活中,馬路上、走道,大量的廣告牌、路標、指引資訊等。這些自然場景下的字元要讓計算機進行學習同樣需要用到

ocr技術。自然場景下的

ocr技術目前還處於較為初級的階段。如何在自然場景下有效的定位到文字資訊。如何對複雜環境下,將定位到的文字向文字文字轉化。作為科技的巨頭

——微軟,一直致力於

自然場景下的

ocr識別

,並取得了較大的突破。

ocr識別現狀

當前,ocr

主要應用還集中在書本或證件等層面,這些材料具有文字清晰、字型統一等諸多特點。但是,卻是日常生活中最常使用到的。市場上身份證識別、駕駛證識別、行駛證識別、銀行卡識別、文件識別、票據識別等這些都是

ocr帶來的生活和工作便捷的重要體現。

相信,隨著行業發展的不斷深入。

ocr一定會為人們帶來越來越多的驚喜。

開啟神秘程式設計世界的大門

從 2000 年畢業,我做這行已經超過十二年了。最初接觸電腦程式,還是 dos 下的 qbasic 那已經離現在有接近二十年了。最初,我只是會照貓畫虎,按照老師的程式抄個素數數列,或者列印個三角形什麼的。初步理解程式的結構和意義,要等到讀大學以後了。那個時候在老師的鼓勵下,自己買書學習 delphi...

開啟C世界的大門(二)

資料的屬性及組合 前面說到了c世界中的最小單元是資料,而資料又有各種不同的屬性。這節,又又將針對資料的屬性進行詳細的介紹。01 資料的屬性 還引用現實中的例子,人有不同的語言,而不同的語言又有不同的使用範圍,正如大家所知道的,英語的範圍最為廣泛,一些方言使用的範圍很小。c世界中也一樣,資料的屬性也可...

開啟我的部落格之旅

從考完專案管理工程師,心就開始有些浮躁。既然選擇了技術這條不歸的道路,就應該勇往直前的走下去。程式設計師的修真,最終還是修自身!下定決心寫部落格也是有原因的,早就想把自己工作的一些感悟寫下來,由於懶散成性,又因為工作沒有網路,所以也一直耽擱了,今天重返論壇,發現平時乙個特別不善言談的同事,寫的部落格...