語義分割綜述

2021-09-02 17:58:57 字數 604 閱讀 7311

目前語義分割的流行框架可以分為前端、後端。前端採用fcn定位不同類別的物體,後端採用rf(crf、mrf)精確定位物體邊界。也就是說,前端解決「是什麼(what)」,後端解決「在**(where)」。

可以把語義分割網路分為兩類:以fcn為代表的編解碼器(encode-decode)網路;以deeplab為代表的空洞卷積(dilate convolution)網路。[參考]

去掉全連線層的理論依據:

全連線層引數矩陣的大小限制了輸入資料的維度(對影象來說,輸入必須是固定解析度大小)。

全連線層的密集連線方式使它包含了網路的大部分引數。

全連線層和卷積層沒有本質區別。

全卷積網路。matan(1991)第一次把卷積網路擴充套件成能接受任意輸入,他們擴充套件lenet用於識別數字串。全卷積計算被諸如滑動視窗檢測、語義分割、eigen的影象復原等廣泛採用。用全卷積訓練的卻很少,在tompson的人體位姿估計中效果很好,但作者並沒有解釋、分析這種方法。

無監督域適應(unsupervised domain adaptation)是遷移學習的一種。

參考[1] 影象語義分割之fcn和crf,知乎

[2] fcn1,fcn2,csdn部落格

語義分割之損失函式綜述

來自cvpr2020,a survey of loss functions for semantic segmentation code 作者彙總了在語義分割領域中常用的幾種損失函式,並列出其適用場景。同時,作者也剔除了一種新的損失函式 log cosh dice loss function a b...

語義分割 常見方法 綜述

背景 語義分割,就是將影象中感興趣的目標進行識別,並將其標記出來 involves partitioning images or video frames into multiple segments or objects 的過程,隨著影象處理和計算機視覺的大熱,對語義分割的準確率和速度要求也不斷提...

語義分割概述

影象語義分割 一 影象語義分割含義及原理 含義 對分割後的影象加上語義標籤 用不同的顏色代表不同類別的物體 就是給分割後影象中的每一類物體加上標籤,輸入一般是彩色深度 rgb d 影象。要求 1 分割得到的不同區域內部平整,其紋理和灰度有相似性 2 相鄰語義分割區域對分割所依據的性質有明顯的差異 3...