概率機械人 第二章 遞迴狀態估計(貝葉斯濾波)

2021-08-07 11:49:15 字數 1506 閱讀 1759

學完了高博的《slam十四講》,基本了解了slam的框架結構,然後看了一些orb-slam的**,跑了幾個模型,看了幾篇**,感覺還是有很多關於狀態估計的問題不是很清楚,然後在知乎看到了關於slam推薦書籍,有一本狀態估計和概率機械人,但是狀態估計目前只有英文版,發現概率機械人有中文版,所以就買了一本概率機械人。雖然翻譯質量可能不是太好,但是還是能讀,有些地方還是要看英文才行!感謝翻譯概率機械人的作者,節省了時間!最近一口氣把整個概率機械人的第一部分看完了,自己做了一點筆記,還是貼出來吧!做筆記只是為了加深自己理解,可能有些地方理解不到位,歡迎各位批評指正!

整本書分為4部分,分別是基礎知識、定位、地圖構建和規劃與控制。基礎知識一共6章。第一章緒論就不說了,其餘五章分別是遞迴狀態估計(貝葉斯濾波)、高斯濾波、非引數濾波、機械人運動(狀態方程)、機械人感知(觀測方程)。接下來我會把這六章的筆記都貼出來,加深自己理解!

接下來就開始貼第二章的筆記吧!

本章主要介紹的是機械人中貝葉斯濾波演算法的基本思想。本章為機械人及其環境的互動建立了乙個耦合的動態系統模型,也就是建立了兩個方程,觀測方程和控制方程。機械人通過控制方程來影響環境,觀測方程僅僅觀測環境變化,而不會對其產生影響。

在概率機械人中,機械人和環境通過上述兩個方程聯絡在一起,這兩個方程也可以看做是兩個分布,即狀態轉移分布和觀測分布。狀態轉移分布描述了狀態如何隨時間的變化而變化的特徵(控制方程)。觀測分布則是描述測量狀態的特徵(由控制方程引起的狀態改變)。因為這兩個都是以概率形式來描述的,所以就形成了概率機械人的基石。

機械人置信度是對給定所有過去感測器測量和所有過去控制的環境狀態的乙個後驗分布。貝葉斯濾波是計算機械人置信度的基本演算法,它是乙個遞迴的,t時刻的置信度由t-1時刻的置信度來計算。置信度反應的是機械人有關環境狀態的內部資訊,比如機械人位姿,一般而言機械人是不知道自己的位姿的,它必須通過外部觀測資料來推測出自己的位姿,也就是從內部置信度識別出自己的真實狀態。在概率機械人當中是通過條件概率分布來表示置信度。對於真實的狀態置信度分布可以為每乙個可能的假設分配乙個概率。置信度分布是以已經獲得的觀測資料為條件的關於狀態變數的乙個後驗概率。

在還沒有進行t時時刻的測量之前,僅僅基於t-1時刻之前的測量和t時刻之前的控制,我們可以得到乙個**概率,即:

它是乙個基於之前狀態的後驗,在綜合時刻t的測量之前,**了t時刻的狀態。由該**計算bel(x_t )被稱為測量更新。

貝葉斯濾波有乙個非常重要的假設,就是馬爾科夫假設,它假設當前狀態是所有過去狀態的總結,也就是說,下乙個狀態僅僅由當前狀態決定,與之前的狀態都無關。

貝葉斯濾波演算法

貝葉斯演算法有兩個基本步驟組成:

1. 計算**,也就是根據上乙個狀態和當前的控制**當前的狀態。

2. 測量更新,根據當前的測量結果去修正上一步的**結果。這一步主要是根據貝葉斯法則來實現的,也就是條件概率。

整個演算法如下:

這就是貝葉斯濾波演算法了,現在先打算把筆記做完,然後過段時間盡量把每個演算法的**都寫一下!

機械人技術第二章運動學

degree of freedom自由度 manipulator操縱者 feedback反饋 orientation方向 rotation旋轉 arbitrary任意的 segment段,部分 parallel平行 perpendicular垂直線的 相似矩陣 a是線性變換 l 在基底下的表示矩陣 ...

概率論 第二章

2.1 隨機變數及其分布函式 一 隨機變數 二 分布函式 例1 拋一枚硬幣,觀察正面 1,反面 2出 現的情況 隨機變數常用x y 或 等表示 定義了隨機變數後,就可以用隨機變數的取值情況來刻劃隨機事件 有了隨機變數,隨機試驗中的各種事件,就可以通過隨機變數的關係式表達出來.二 分布函式 對隨機變數...

第二章 機器學習基礎

資料 外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接上傳 img wmztjylh 1604898572231 mgs 1.png 特徵空間 feature space 分類任務本質就是在特徵空間切分 在高維空間同理 特徵可以很抽象 分類 多標籤分類 回歸 監督 學習 非監督學習 輔助監督學...