Unity語音識別專案續字串匹配演算法

上次寫了個語音識別的部落格，能夠識別錄製的音訊檔案並轉成乙個字串。效果很好，而且還是識別的中文。不過很快又意識到幾個問題：

1.你不能指望每次翻譯的都那麼準確，或者說，一字不差。

2.口語化的表達使得往往一大堆的語句其實是乙個意思。

所以我們不難發現乙個事實，如果語音識別要拿來用的話，這種對應最好不要是一一對映的，就比如，如果我只識別到了玩家說了「攻擊」，才讓我們的遊戲物體做出相應的操作的話，那麼問題來了，萬一玩家實際說的是「進攻」，抑或是更口語化的表達，又或者說是說了攻擊但被識別成了「公雞」,那怎麼辦呢？難道就不執行這種操作了嗎？這顯然是不行的。

於是便有了兩個想法：建立一張等價表，這是一張多對一的對映表，多種輸入可以達成同一種輸出，其次，對於乙個字串，只需要字元相似度達到一定的時候，就認為是同乙個句子。

思路有了，很快就能擼出乙個字串配對的小系統，以下是**：

using unityengine;
using system.collections;
using system.collections.generic;
namespace stringtoinstruct
public int find(string s,ref float pairrate)
}if (temp_max_pairrate >= endurewrongrate)
else
}public int insertinstruct()
public void insert_index(int instruct,string word)
private float pair(string str1,string str2)
{ int len1 = str1.length;
int len2 = str2.length;
int[,] dif = new int[len1+1, len2+1];
for(int i=0;i
其本質上是通過計算有多少不同的字元和總字元的比值算出的相似性。
最開始維護乙個二維陣列，這個二維陣列是有意義的索引為[i][j]的資料存的是字串1前i個和字串2的前j個中字元的差異個數。
所以在初始化的時候，我們能確定的是d[0][i]=i;d[i][0]=i;
接著乙個雙層迴圈就是乙個很簡單的動態規劃了，狀態轉移方程是
dif [i, j] = min (dif[i-1,j-1]+temp,dif[i,j-1]+1,dif[i-1,j]+1);

很容易理解，dif[i][j]的值有且只有三種**，dif[i-1][j-1]加上第i是不是等於第j,或者[i-1][j]+1(因為多出的那乙個必然是不一樣的，沒字元和他配對啊)，或者[i][j-1]+1（同理了）

最後就是輸出一下dif[len1][len2]即可了。

下面是一些測試字串配對系統的結果：

沒截圖完，反正大概就是輸出了一下配對相似性的結果。

Unity語音識別專案續字串匹配演算法

語音識別專案報告 pdf

字串操作續

imx6ul藍芽語音識別專案之1 硬體準備

Unity語音識別專案續 字串匹配演算法

語音識別專案報告 pdf

字串操作 續

imx6ul藍芽語音識別專案之1 硬體準備

相關推薦

Unity語音識別專案續字串匹配演算法

字串操作續