語義分割模型優化

2022-02-04 08:39:23 字數 1739 閱讀 3684

語義分割模型優化

improving semantic segmentation via video propagation and label relaxation

面前在kitti資料集畫素級語義分割中排名第一

摘要1.       kitti上測試

這是kitti提供所選方法的詳細結果。

對於前20個測試影象,顯示原始影象、彩色編碼結果和錯誤影象。

錯誤影象包含4種顏色:

紅色:畫素有錯誤的標籤和錯誤的類別

黃色:畫素的標籤不正確,但類別正確

綠色:畫素有正確的標籤

黑色:groundtruth標籤不用於評估

•引入了聯合影象標籤傳播來緩解錯誤對齊問題。

•建議通過最大化沿邊界的類概率聯合的可能性來鬆弛乙個熱標籤訓練。這將產生更精確的模型,並允許執行更長的距離傳播。

聯合傳播方法可以看作是一種特殊型別的資料增強,因為幀和標籤都是通過使用相同的學習轉換引數(u,v)來轉換過去的幀和相應的標籤來合成的。這是一種類似於標準資料增強技術的方法,如隨機旋轉、隨機尺度或隨機flip。聯合傳播使用了乙個更基本的轉換,該轉換被訓練用於精確的下一幀**任務。

提出了一種僅在訓練期間應用的類標籤空間的修改,它允許在乙個邊界畫素處**多個類。將邊界畫素定義為具有不同標記鄰居的任何畫素。為了簡單起見,沿著類a和類b的邊界對畫素進行分類。建議最大化p(a∪b)的可能性,而不是最大化注釋提供的目標標籤的可能性。由於a類和b類是互斥的,目標是使a和b的並集最大化:

語義分割綜述

目前語義分割的流行框架可以分為前端 後端。前端採用fcn定位不同類別的物體,後端採用rf crf mrf 精確定位物體邊界。也就是說,前端解決 是什麼 what 後端解決 在 where 可以把語義分割網路分為兩類 以fcn為代表的編解碼器 encode decode 網路 以deeplab為代表的...

語義分割概述

影象語義分割 一 影象語義分割含義及原理 含義 對分割後的影象加上語義標籤 用不同的顏色代表不同類別的物體 就是給分割後影象中的每一類物體加上標籤,輸入一般是彩色深度 rgb d 影象。要求 1 分割得到的不同區域內部平整,其紋理和灰度有相似性 2 相鄰語義分割區域對分割所依據的性質有明顯的差異 3...

語義分割概述

本文大多來自方便讀 使用 影象語義分割 semantic segmentation 從字面意思上理解就是讓計算機根據影象的語義來進行分割,例如讓計算機在輸入下面左圖的情況下,能夠輸出右圖。語義在語音識別中指的是語音的意思,在影象領域,語義指的是影象的內容,對意思的理解,並對不同部分進行標註,圖中紅色...