語義分割模型優化

improving semantic segmentation via video propagation and label relaxation

面前在kitti資料集畫素級語義分割中排名第一

摘要1. kitti上測試

這是kitti提供所選方法的詳細結果。

對於前20個測試影象，顯示原始影象、彩色編碼結果和錯誤影象。

錯誤影象包含4種顏色：

紅色：畫素有錯誤的標籤和錯誤的類別

黃色：畫素的標籤不正確，但類別正確

綠色：畫素有正確的標籤

黑色：groundtruth標籤不用於評估

•引入了聯合影象標籤傳播來緩解錯誤對齊問題。

•建議通過最大化沿邊界的類概率聯合的可能性來鬆弛乙個熱標籤訓練。這將產生更精確的模型，並允許執行更長的距離傳播。

聯合傳播方法可以看作是一種特殊型別的資料增強，因為幀和標籤都是通過使用相同的學習轉換引數（u，v）來轉換過去的幀和相應的標籤來合成的。這是一種類似於標準資料增強技術的方法，如隨機旋轉、隨機尺度或隨機flip。聯合傳播使用了乙個更基本的轉換，該轉換被訓練用於精確的下一幀**任務。

提出了一種僅在訓練期間應用的類標籤空間的修改，它允許在乙個邊界畫素處**多個類。將邊界畫素定義為具有不同標記鄰居的任何畫素。為了簡單起見，沿著類a和類b的邊界對畫素進行分類。建議最大化p（a∪b）的可能性，而不是最大化注釋提供的目標標籤的可能性。由於a類和b類是互斥的，目標是使a和b的並集最大化：