語音識別技術竟然發展如此迅速

2021-10-25 07:33:04 字數 1408 閱讀 2414

語音識別是指機器/程式接收、解釋聲音,或理解和執行口頭命令的能力。隨著人工智慧和智慧型助手的崛起,語音識別已經得到了廣泛應用。

語音識別系統使消費者只需通過與之交談即可與技術進行互動,從而實現擴音請求、提醒和其他簡單任務。

語音識別的工作原理

計算機上的語音識別軟體要求將模擬音訊轉換為數碼訊號,稱為模數轉換。計算機如要解密訊號,必須具有單詞或音節的電子資料庫或詞彙表,以及用於將該資料與訊號進行比較的快速手段。語音模式儲存在硬碟上,並在程式執行時載入到記憶體中。比較器依據a/d轉換器的輸出檢查這些儲存的模式,是模式識別的動作。

實際上,語音識別程式的有效詞彙量的大小與安裝它的計算機的隨機訪問儲存器容量直接相關。如果將整個詞彙表載入到ram中,與搜尋硬碟驅動器中的某些匹配項相比,語音識別程式的執行速度要快許多倍。處理速度也很關鍵,因為它會影響計算機在ram中搜尋匹配的速度。

雖然語音識別技術起源於個人電腦,但它在移動裝置和智慧型家產品的商業領域都獲得了認可。智慧型手機的普及開啟了向消費者口袋新增語音識別技術的機會,而家庭裝置,如google home和amazon echo,將語音識別技術帶入了客廳和廚房。語音識別與日益穩定的物聯網感測器相結合,為以前缺乏智慧型功能的許多消費產品增加了技術優勢。

隨著語音識別技術的使用變得更頻繁,以及更多使用者與之互動,有語音識別軟體的公司將擁有更多的資料和資訊,以供給支援語音識別系統的神經網路,從而提高語音識別產品的功能和準確性。

怎樣使用語音識別

語音識別的優缺點

語音識別使消費者可以通過直接與他們的google home,amazon alexa或其他語音識別技術工具交談,以實現多工。通過使用機器學習和複雜的演算法,語音識別技術可以快速將您的口語轉換為書面文字。

雖然準確率正在提高,但所有語音識別系統和程式都會出錯。背景噪音可能產生錯誤輸入,可以通過在安靜的房間中使用該系統來避免。單詞聽起來也有問題,但拼寫不同,含義不同-例如,「hear」和「here」。有一天,使用儲存的上下文資訊可以在很大程度上克服這個問題。但是,這將需要比個人計算機中更多的ram和更快的處理器。

語音識別的歷史

在過去的五十年中,語音識別技術呈指數級增長。最早可以追溯到2023年,那時計算機只能理解1000多個單詞。隨著ibm繼續開發語音識別技術,在20世紀80年代單詞理解量躍公升至大約20,000。

消費者適用的第一款揚聲器識別產品於2023年由dragon推出,名為dragondictate。2023年,ibm推出了第一款可識別連續語音的語音識別產品。

語音識別技術

中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...

語音識別技術

雖然人從外部獲取資訊,絕大部分來自來自視覺,可是語音的地位一直很高的,它很好的表表達了人的特徵和清晰的收入方式。其中語音識別技術的地位又是很高的,可以讓機器在字面上明白你在說什麼,這是自然的人機互動的基礎。現在走在語音識別技術前沿的公司有科大訊飛,google 微軟。在我們的前面幾篇 blog 中已...

語音識別發展現狀

語音識別屬於感知智慧型,而讓機器從簡單的識別語音到理解語音,則上公升到了認知智慧型層面,機器的自然語言理解能力如何,也成為了其是否有智慧型的標誌,而自然語言理解正是目前難點。那麼,語音識別發展現狀如何呢?下面就由筆者給您細細道來。語音識別發展現狀 中國我國語音識別研究工作起步於五十年代,但近年來發展...