person re id一點瑣碎知識

2021-08-18 21:15:14 字數 1637 閱讀 8404

前者是指gallery中每個人的影象為一張(n=1),而後者是指gallery中每個人的影象為n>1張影象,同樣的rank-1下,一般n越大,得到的識別率越高。

2.gallery、probe和cmc

gallery是候選行人庫,probe是待查詢輸入,也叫查詢影象(query),cmc是一種reid的效能評價方法,即cumulative match characteristic。cmc將再識別問題看成是一種排序問題,cmc 曲線的具體含義是指在候選行人庫(gallery)中檢索待查詢(probe)的行人,前 r 個檢索結果中包含正確匹配結果的比率。其中,第 1 匹配率 r=1 指標rank-1反映了最匹配候選目標剛好為待查詢目標的概率,即該指標為真正的識別能力,因此很重要。但是當 r 值很小但大於1時,由於可以通過人眼進行輔助識別查詢目標,因此也很有現實意義,如第 5 匹配率 r=5 指標反映前 5 個匹配候選目標中存在待查詢目標的概率,如下圖:橫座標表示排名等級,縱座標表示再識別的準確率。 

3.可考慮的特徵優化方法及優缺點:

顏色資訊:

紋理資訊:

顯著性資訊: 

一般是基於塊顯著特徵匹配。涉及水平方向的塊匹配來對齊,查詢影象與候選行人影象庫中每一幅影象之間都實現了特徵塊的對齊,可減少了由於視角、位姿變化而引起的空間錯位。匹配塊的顯著性外觀特徵空間分布不一致。

空間資訊:

資訊融合方法:

深度資訊:

4.行人再識別演算法的分類

基於特徵設計的方法: 

主要包括顏色、紋理、邊緣、形狀、全域性特徵、區域特徵和基於塊的特徵等基本特徵 

基於機器學習的方法:

5.reid訓練的loss類別:

見今年aaai的那篇multi-task的思路。用softmax做classification,contrastive loss或者image pair融合做identification,triplet loss做ranking,這個幾乎已經是標準架構了,無非在裡面再做細緻調整。其他的就是各種trick了,影象增強,資料擴充,增加標籤語意監督,以及各種各樣的reranking技巧。 

總結一下常見loss:contrastive loss,triplet loss,center loss,coupled clusters loss,structured loss,quadruplet loss,以及對應的改進版,基本已經差不多了,而且都是行人,車輛,人臉,例項等檢索識別任務通用的損失函式。 

另外: 

image pairs融合這一部分有相當多的工作可以考慮,卷積層融合,還是全連線相減,依然還有不少東西可以挖。 

多標籤學習,是單純的大量softmax呢,還是多重交叉熵,也有一些東西可以做。 

part model,包括單純切割,或者是用pose定位切塊,也是能顯著提公升效能的。 

其他的其實單從效能上的話,transfer learning,cross domain,gan模型資料擴增,以及reranking。 

基本上以上這些工作都是對實際效能提公升會有一些幫助的,基本上我復現之後,都能在我原模型基礎上好2到5個點之間。

一點一點進步

requestparam,是獲取前端傳遞給後端的引數,可以使get方式,也可以是post方式。若前端傳遞的引數和後端接收的引數名稱不一致,則必須要標註。pathvariable,是獲取get方式,url後面引數,進行引數繫結。1.裝箱就是講基本資料型別轉換為包裝類,拆箱就是自動將包裝類轉換為基本資料...

妙語連珠 記錄瑣碎(每天一點點,就有積累,沉澱)

說明 以下摘錄網上或者書籍,都簡單標識了出處,持續更新 4.我們不妨分析一下亞馬遜和國內電商的一點區別。如果留心亞馬遜的首頁和國內其他電商,比如京東,的首頁的話,你可以看出明顯的不同。亞馬遜應該是自動化營銷的鼻祖,他總是在嘗試分析客戶的喜好,推薦給客戶喜歡的東西。比如,你登陸亞馬遜的首頁一次之後他會...

Oracle SQL 優化(一點一點來)

為了提高 sql的執行效率,在任何可能的時候使用等值連線 在索引列上使用表示式 包括函式 將會導致優化器忽略該列上的索引,除非該列上定義的為基於函式的索引,所以應該將函式寫在相對的位置上 e.empno 為數值索引列 select from emp e where e.empno 1001 使用索引...