Viterbi Algorithm（維特比）演算法

csdn部落格：皮乾東

知乎：htrying

微博：htring的微博

viterbi-algorithm演算法

維特比演算法是乙個特殊但應用最廣的動態規劃演算法。利用動態規劃，可以解決任何乙個圖中的最短路徑問題。而維特比演算法是針對乙個特殊的圖-籬笆網了（lattice）的有向圖最短路徑問題而提出來的。它之所以重要，是因為凡是使用隱馬爾科夫模型描述的問題都可以用它解碼，包括當前的數字通訊、語音識別、機器翻譯、拼音轉漢字、分詞等。

背景假定使用者（盲打時）輸入的拼音時y1,y2,...,yny1,y2,...,yn，對應的漢字是x1,x2,...,xnx1,x2,...,xn（雖然真正的輸入法產品都是以詞作為輸入單位的，為了便於說明問題及簡單起見，以字為單位來解釋維特比演算法），那麼根據當前介紹的工具：

輸入的可見序列為y1,y2,...,yny1,y2,...,yn,而產生他們的隱含序列是x1,x2,...,xnx1,x2,...,xn。可以用下圖描述這樣乙個過程：

這是乙個相對簡單的隱馬爾科夫鏈，沒用狀態跳躍，也沒有自環。p(xi|xi−1)p(xi|xi−1)是狀態之間的轉移概率，p(yi|xi)p(yi|xi)是每個狀態的產生概率。現在，這個馬爾科夫鏈的每個狀態的輸出是固定，但是每個狀態的值可以變化。比如輸出讀音」zhong」的字可以是」中」、」種「等多個字。我們不妨抽象一點，用符號xijxij表示狀態xixi的第jj個可能的值。如果把每個狀態按照不同的值展開，就得到下面這個籬笆網路(lattice):

在上圖中，每個狀態有3個或4個值，當然時間中它們可以有任意個值。

那麼從第乙個狀態到最後乙個狀態的任何一條路徑（path）都可能產生我們觀察到的輸出序列y。當然這些路徑的可能性不一樣，而我們要做的就是找到最可能的這條路徑，並不是很難。但麻煩的是這樣的路徑組合數非常多，會讓序列狀態數的增長呈指數式增長。漢語中每個無聲調的拼音對應13個左右的國標漢字，假定句子長為10個字，那麼這個組合數為1310∼5×10141310∼5×1014這個計算量就相當的大了。因此，需要乙個最好能和狀態數目成正比的演算法，而這個演算法在2023年首次提出，即維特比演算法。

主要內容

維特比演算法基礎

1.如果概率最大的路徑p（或者說是最短路徑）經過某個點，比如下圖中的x22x22，那麼這條路徑上從起始點s到x22x22的這一段路徑q，一定是s到x22x22之間的最短路徑。否則，用s到x22x22的最短路徑r代替q，便構成了一條比p更短的路徑，這就和之前的假設矛盾了。

2.從s到e路徑必定經過第i時刻的某個狀態，假定第i時刻有k個狀態，那麼如果記錄了從s到i個狀態的所有k個節點（所有時刻的所有狀態）的最短路徑，最終的最短路徑必經過其中的一條。這樣，在任何時刻，只要考慮非常有限條候選路徑即可。

3.結合以上兩點，假定當我們從狀態i進入到i+1時，從s到i上各個節點的最短路徑已經找到，並且記錄到這些節點上，那麼在計算出從起點s到第i+1狀態的某個結點的最短路徑時，只要考慮從s到前乙個狀態i所有的k個節點的最短路徑，以及從這k個節點到xi+1,jxi+1,j的距離即可。

維特比演算法

1.從點s觸發，對於第乙個狀態x1x1的各個節點，不妨假定有n1n1個，計算出s到它們的距離d(s,x1i)d(s,x1i)，這裡的x1ix1i表示的是狀態1的節點，因為只有一步，所以這些都是s到它們各自的最短路徑。

2.（演算法的關鍵）對於第二個狀態x2x2的所有節點，要計算s到它們的最短距離，我們知道，對於特定的節點x2ix2i，可以經過狀態1的n1n1中的任何乙個節點x1ix1i，當然，對應的路徑長度就是d(s,x2i)=d(s,x1j)+d(x1j,x2i)d(s,x2i)=d(s,x1j)+d(x1j,x2i)。由於j有n1n1種可能性，我們要一一計算，然後找出最小值。即

d(s,x2i)=mini=1,n1d(s,x1j)+d(x1j,x2i)d(s,x2i)=mini=1,n1d(s,x1j)+d(x1j,x2i)

這樣對於第二個狀態的每個節點，需要進行n1n1次乘法計算。假定這個狀態有n2n2個節點，把s這些節點的距離都計算一遍，就有o(n1⋅n2)o(n1⋅n2)次計算。

接下來，類似地按照上述方法從第二個狀態走到第三個狀態，一直走到最好乙個狀態，就得到了整個網格從頭到尾的最短路徑。每一步計算的複雜度都和相鄰兩個狀態sisi和si+1si+1各自的節點數目ni,ni+1ni,ni+1的乘積成正比，即o(ni⋅ni+1)o(ni⋅ni+1)。如果假定這個在這個隱含馬爾可夫鏈中節點最多的狀態有d個節點，也就是說整個網格的寬度為d，那麼任何一步的複雜度不超過o(d2)o(d2)，由於網格長度是n，所以整個維特比演算法的複雜度是o(n⋅d2)o(n⋅d2).

回到最初的問題中，計算量基本上是13×13×10=1690≈10313×13×10=1690≈103,這樣就降低了很大的計算量。

總的來說，無論在語音識別、輸入法打字中，輸入都是按照流(stream)的方式進行的，只要處理每個狀態的時間比講話，或者打字速度，那麼無論輸入有多長，解碼過程永遠就是實時的。

---------------------

原文：

Viterbi Algorithm（維特比）演算法

維特比演算法

維特比演算法

維特比演算法 python 維特比演算法實現分詞

相關推薦