概率機械人第二章遞迴狀態估計（貝葉斯濾波）

學完了高博的《slam十四講》，基本了解了slam的框架結構，然後看了一些orb-slam的**，跑了幾個模型，看了幾篇**，感覺還是有很多關於狀態估計的問題不是很清楚，然後在知乎看到了關於slam推薦書籍，有一本狀態估計和概率機械人，但是狀態估計目前只有英文版，發現概率機械人有中文版，所以就買了一本概率機械人。雖然翻譯質量可能不是太好，但是還是能讀，有些地方還是要看英文才行！感謝翻譯概率機械人的作者，節省了時間！最近一口氣把整個概率機械人的第一部分看完了，自己做了一點筆記，還是貼出來吧！做筆記只是為了加深自己理解，可能有些地方理解不到位，歡迎各位批評指正！

整本書分為4部分，分別是基礎知識、定位、地圖構建和規劃與控制。基礎知識一共6章。第一章緒論就不說了，其餘五章分別是遞迴狀態估計（貝葉斯濾波）、高斯濾波、非引數濾波、機械人運動（狀態方程）、機械人感知（觀測方程）。接下來我會把這六章的筆記都貼出來，加深自己理解！

接下來就開始貼第二章的筆記吧！

本章主要介紹的是機械人中貝葉斯濾波演算法的基本思想。本章為機械人及其環境的互動建立了乙個耦合的動態系統模型，也就是建立了兩個方程，觀測方程和控制方程。機械人通過控制方程來影響環境，觀測方程僅僅觀測環境變化，而不會對其產生影響。

在概率機械人中，機械人和環境通過上述兩個方程聯絡在一起，這兩個方程也可以看做是兩個分布，即狀態轉移分布和觀測分布。狀態轉移分布描述了狀態如何隨時間的變化而變化的特徵（控制方程）。觀測分布則是描述測量狀態的特徵（由控制方程引起的狀態改變）。因為這兩個都是以概率形式來描述的，所以就形成了概率機械人的基石。

機械人置信度是對給定所有過去感測器測量和所有過去控制的環境狀態的乙個後驗分布。貝葉斯濾波是計算機械人置信度的基本演算法，它是乙個遞迴的，t時刻的置信度由t-1時刻的置信度來計算。置信度反應的是機械人有關環境狀態的內部資訊，比如機械人位姿，一般而言機械人是不知道自己的位姿的，它必須通過外部觀測資料來推測出自己的位姿，也就是從內部置信度識別出自己的真實狀態。在概率機械人當中是通過條件概率分布來表示置信度。對於真實的狀態置信度分布可以為每乙個可能的假設分配乙個概率。置信度分布是以已經獲得的觀測資料為條件的關於狀態變數的乙個後驗概率。

在還沒有進行t時時刻的測量之前，僅僅基於t-1時刻之前的測量和t時刻之前的控制，我們可以得到乙個**概率，即：

它是乙個基於之前狀態的後驗，在綜合時刻t的測量之前，**了t時刻的狀態。由該**計算bel(x_t )被稱為測量更新。

貝葉斯濾波有乙個非常重要的假設，就是馬爾科夫假設，它假設當前狀態是所有過去狀態的總結，也就是說，下乙個狀態僅僅由當前狀態決定，與之前的狀態都無關。

貝葉斯濾波演算法

貝葉斯演算法有兩個基本步驟組成：

1. 計算**，也就是根據上乙個狀態和當前的控制**當前的狀態。

2. 測量更新，根據當前的測量結果去修正上一步的**結果。這一步主要是根據貝葉斯法則來實現的,也就是條件概率。

整個演算法如下：

這就是貝葉斯濾波演算法了，現在先打算把筆記做完，然後過段時間盡量把每個演算法的**都寫一下！

概率機械人第二章遞迴狀態估計（貝葉斯濾波）

機械人技術第二章運動學

概率論第二章

第二章機器學習基礎

概率機械人 第二章 遞迴狀態估計（貝葉斯濾波）

機械人技術第二章運動學

概率論 第二章

第二章 機器學習基礎

相關推薦

概率機械人第二章遞迴狀態估計（貝葉斯濾波）

概率論第二章

第二章機器學習基礎