你了解語音識別技術嗎?

2021-10-25 07:33:04 字數 1307 閱讀 2377

語言是人與人傳達和獲取資訊的重要工具。隨著社會的發展,讓機器聽懂人的語言已從夢想變成了現實。我們知道當聲音通過媒介傳到人的耳朵裡,大腦會對語音進行處理並形成自己的理解,然後用語言或者行動應答。那麼計算機是如何聽懂人類語言的?這就要靠人機互動的重要技術——語音識別技術。

語音識別技術就是讓機器把語音頻號轉變為相應的文字或命令。人與人之間的語言溝通會因為雙方背景、文化程度、經驗範圍的不同,造成資訊溝通不暢,讓機器準確識別語音並理解則更加複雜。機器識別語音需要應對不同的聲音、不同的語速、不同的內容以及不同的環境。語音頻號具有多變性、動態性、瞬時性和連續性等特點,這些原因都是語音識別發展的制約條件。

20世紀50年代,at&t貝爾實驗室研發的audry系統是世界上第乙個可以識別10個英文數字的語音識別系統。20世紀80年代末,語音識別研究取得了重大突破,解決了大詞彙量、連續語音和非特定人這三大障礙,首次把這三個特性都整合在乙個系統中,比較有代表性的是卡耐基梅隆大學研發的sphinx系統。20世紀90年代前期,各大公司都斥巨資進行語音識別系統的實用化研究。

目前的語音識別技術主要包括特徵引數提取技術、模式匹配及模型訓練技術。特徵提取技術是將語音頻號中有用的特徵引數資訊從所有資訊中提取出來的技術。通過分析處理,刪除冗餘資訊,留下關鍵資訊。模式匹配則是根據一定準則,使未知模式與模型庫中的某乙個模型獲得最佳匹配。模型訓練是指按照一定的準則,從大量已知模式中獲取表徵該模式本質特徵的模型引數。

語音識別技術發展至今,在識別精度上已經達到了相當高的水平。尤其是中小詞彙量對非特定人語音識別系統識別精度已經大於98%,而對特定人語音識別精度更高。現如今的語音識別準確度已經能夠滿足人們日常應用的需求,很多手機、智慧型音箱、電腦都已經帶有語音識別功能,十分便利。

按照目前語音識別技術的發展勢頭,未來是否可以實現人類和機械人之間無障礙交談,就像在科技電影中看到的情景一樣呢?儘管語音識別研究機構花了幾十年的時間去研究如何實現語音識別準確率的「人類對等」,但目前在某些方面還無法達到高水平,比如在嘈雜環境下較遠的麥克風的語音識別、方言識別或較少人使用的語言的語音識別等情況。

語音識別技術的發展為人們的工作和生活都提供了便利,很多繁瑣步驟依靠一條語音指令即可完成。現如今智慧型家居處於發展初期,但依靠語音識別技術已經能夠完整搭建一套智慧型家居系統。未來,語音識別技術會在各個方面展現出更多可能性。

語音識別技術

中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...

語音識別技術

雖然人從外部獲取資訊,絕大部分來自來自視覺,可是語音的地位一直很高的,它很好的表表達了人的特徵和清晰的收入方式。其中語音識別技術的地位又是很高的,可以讓機器在字面上明白你在說什麼,這是自然的人機互動的基礎。現在走在語音識別技術前沿的公司有科大訊飛,google 微軟。在我們的前面幾篇 blog 中已...

你了解行為生物識別嗎?

生物識別讓使用者身份驗證變得十分便利,這也是很多原始裝置製造商 oem 開始將各種生物識別技術整合到其裝置的主要原因之一。現在人們已經慢慢熟悉使用指紋或面部來解鎖自己的電腦和移動裝置,畢竟這種方法要比記住並輸入密碼或pin更加使用者友好。指紋 面部 手和視網膜等生理特徵只是一種生物識別符號,而另一種...