語音識別技術竟然發展如此迅速

語音識別是指機器/程式接收、解釋聲音，或理解和執行口頭命令的能力。隨著人工智慧和智慧型助手的崛起，語音識別已經得到了廣泛應用。

語音識別系統使消費者只需通過與之交談即可與技術進行互動，從而實現擴音請求、提醒和其他簡單任務。

語音識別的工作原理

計算機上的語音識別軟體要求將模擬音訊轉換為數碼訊號，稱為模數轉換。計算機如要解密訊號，必須具有單詞或音節的電子資料庫或詞彙表，以及用於將該資料與訊號進行比較的快速手段。語音模式儲存在硬碟上，並在程式執行時載入到記憶體中。比較器依據a/d轉換器的輸出檢查這些儲存的模式，是模式識別的動作。

實際上，語音識別程式的有效詞彙量的大小與安裝它的計算機的隨機訪問儲存器容量直接相關。如果將整個詞彙表載入到ram中，與搜尋硬碟驅動器中的某些匹配項相比，語音識別程式的執行速度要快許多倍。處理速度也很關鍵，因為它會影響計算機在ram中搜尋匹配的速度。

雖然語音識別技術起源於個人電腦，但它在移動裝置和智慧型家產品的商業領域都獲得了認可。智慧型手機的普及開啟了向消費者口袋新增語音識別技術的機會，而家庭裝置，如google home和amazon echo，將語音識別技術帶入了客廳和廚房。語音識別與日益穩定的物聯網感測器相結合，為以前缺乏智慧型功能的許多消費產品增加了技術優勢。

隨著語音識別技術的使用變得更頻繁，以及更多使用者與之互動，有語音識別軟體的公司將擁有更多的資料和資訊，以供給支援語音識別系統的神經網路，從而提高語音識別產品的功能和準確性。

怎樣使用語音識別

語音識別的優缺點

語音識別使消費者可以通過直接與他們的google home，amazon alexa或其他語音識別技術工具交談，以實現多工。通過使用機器學習和複雜的演算法，語音識別技術可以快速將您的口語轉換為書面文字。

雖然準確率正在提高，但所有語音識別系統和程式都會出錯。背景噪音可能產生錯誤輸入，可以通過在安靜的房間中使用該系統來避免。單詞聽起來也有問題，但拼寫不同，含義不同-例如，「hear」和「here」。有一天，使用儲存的上下文資訊可以在很大程度上克服這個問題。但是，這將需要比個人計算機中更多的ram和更快的處理器。

語音識別的歷史

在過去的五十年中，語音識別技術呈指數級增長。最早可以追溯到2023年，那時計算機只能理解1000多個單詞。隨著ibm繼續開發語音識別技術，在20世紀80年代單詞理解量躍公升至大約20,000。

消費者適用的第一款揚聲器識別產品於2023年由dragon推出，名為dragondictate。2023年，ibm推出了第一款可識別連續語音的語音識別產品。

語音識別技術竟然發展如此迅速

語音識別技術

語音識別技術

語音識別發展現狀

相關推薦