人臉識別 文字識別背後的方法,以及研究的熱點和難點

2021-09-10 14:45:20 字數 1509 閱讀 4907

模式識別是什麼?

作為人工智慧的乙個重要方向,模式識別的主要任務是模擬人的感知能力,如通過視覺和聽覺資訊去識別理解環境,又被稱為「機器感知」或「智慧型感知」。

人們在觀察事物或現象的時候,常常要尋找它與其他事物或現象的不同之處,並根據一定目的把相似、但又細節不同的事物或現象組成一類。字元識別就是乙個典型的例子,如數字「4」可以有各種寫法,但都屬於同一類別。人腦具有很強的模式識別和推廣能力,即使對於某種不同寫法的「4」,以前雖未見過,也能把它分到「4」所屬的這一類別。人腦的這種對模式(事物、現象等)進行歸類和分類的能力,就是模式識別,也就是感知能力。

隨著20世紀40年代電子計算機出現,50年代人工智慧興起,模式識別在20世紀60年代初迅速發展成為一門新學科。21世紀以來,模式識別又逐漸與深度學習融合。近年來,深度學習和大資料的出現推動了模式識別的快速發展。

模式識別是乙個智慧型任務,是人工智慧的一種形式。機器學習,包括深度學習是模式識別背後的基本方法,通過學習(訓練)使機器具備識別模式的能力。當前,用深度學習的方法來實現模式識別,能更好的解決問題。

深度學習作為機器學習的一種,是對生物神經網路結構和資訊處理機制的簡單模擬。人工神經網路早在上世紀40年代就有人研究,50年代和80年代都曾產生較大的影響。近年來,隨著計算能力的提公升,可以訓練層數較多的神經網路(稱為深度神經網路)來提公升資料擬合和識別能力,有的甚至達到了1000多層。深度學習一般就是指利用深度神經網路來進行學習。

複雜條件下,人臉識別的正確率不到50%

得益於深度學習,目前人臉識別和文字識別都是人工智慧領域應用比較成功的方向,可以算是模式識別借助深度學習形成的主要研究成果之一。

目前人臉識別、文字識別雖然已應用得較為廣泛,但還不能算「應用得很好」。人臉識別目前應用得比較成熟的是門禁、通關等領域,原因在於被識別的物件能主動配合,距離攝像頭較近,能拍攝到比較清楚的影象。很多廠商在使用者配合、光照可控的場景下人臉識別正確率能達到99%以上。但在更加複雜的情況下,如在室外光照不均、距離遠、人臉視角多變情況下,用監控攝像頭進行人臉識別,識別正確率就會明顯降低。

目前在計算機前端加入ai模組,只能起輔助作用,複雜條件下的人臉識別依舊難以達到成熟應用的程度。劉成林表示,室外自然光照條件下,「人臉識別正確率還達不到50%」。

文字識別領域也是如此。文字識別目前主要應用在書籍和報紙等的數位化上。報紙、金融機構、保險機構以及快遞行業的的大量單據,都需要電子化後才能方便檢索、管理和進行大資料分析。司法界推行智慧型法務,辦案的文書(有印刷體,也有手寫體)需要電子化。醫院的病例、教育領域的作業題、考試答卷等,也都有很大的電子化需求。

同人臉識別一樣,影象清晰度和光照等問題也是文字識別的一大難點。平板掃瞄器由於光照均勻,對紙質材料掃瞄得到的影象清晰度高,文字識別率較高。而拍照的識別率則會降低,室外自然場景中的文字檢測和識別更是當今研究的熱點和難點問題。

1.人工智慧時代,ai人才都有哪些特徵?

2.大資料攜手人工智慧,高校人才培養面臨新挑戰

3.人工智慧,機器學習和深度學習之間,主要有什麼差異

人臉識別 文字識別背後的方法,模式識別是什麼?

人臉識別 文字識別背後的方法,模式識別是什麼?模式識別是什麼?作為人工智慧的乙個重要方向,模式識別的主要任務是模擬人的感知能力,如通過視覺和聽覺資訊去識別理解環境,又被稱為 機器感知 或 智慧型感知 人們在觀察事物或現象的時候,常常要尋找它與其他事物或現象的不同之處,並根據一定目的把相似 但又細節不...

人臉識別方法簡述

基於 子空間變換的方法 基於子空間變換的方法首先對訓練影象進行代數變換,求得乙個由基影象張成的子空間,然後計算每個影象在該子空間中的投影係數,作為影象的特徵。基於機器學習 的方法 基於機器學習的方法包括神經元網路 artificial neural nctwork,ann 方法和支援向量機 s up...

人臉識別Face Recognition的安裝

face recognition是世界上最簡潔的人臉識別庫,你可以使用python和命令列工具提取 識別 操作人臉。face recognition的人臉識別是基於業內領先的c 開源庫 dlib中的深度學習模型,用labeled faces in the wild人臉資料集進行測試,有高達99.38...