人臉識別系列(十五) COCO Loss

2021-08-17 04:45:55 字數 1765 閱讀 6073

這篇文章其實和normface原理完全相同,只是推理的切入點稍微有點不同。兩篇**發表的時間也相近。因此博主就不再詳細寫分析了,如果有看得不太懂的可以參考我的normface閱讀筆記。

人臉識別系列(十四):normface

值得一提的是,這篇文章有乙個亮點就是在lfw上刷到了99.86%的成績,十分驚豔,讓人不得不佩服商湯科技的調參能力。

下面進入正題。

1.***** loss

假設 是樣本i,j的標籤,用c(x,y)表示x,y的余弦距離

為了提高類間差距,減小類內差距,先提出***** loss

文章中說理論上可以用,但是實際上計算複雜度是o(m2)所以用不了,但是我感覺理論上也不行,因為對於不同標籤的樣本損失直接歸零了

2.revised loss

假設 即ck是某個類的中心,那麼可以使用下面的revised loss

exp的作用是將余弦距離轉化為規範的概率輸出

3.進行特徵和類心的歸一化:

為什麼要歸一化:見normface一文

此處類心也不像上面寫的由統計得出,而是成為乙個可訓練的引數(這就變得和normface的softmax層一樣了)

損失函式寫為

還是原來的交叉熵

定理

假設我們要使總損失l不大於乙個數ε,網路共有k個類,那麼α必有下界

(絕了,和normface的公式一模一樣)

在minist和cifar-10上的錯誤率

網路結構:inception resnet網路,最後一層接128維的全連線層

訓練集:microsoft-1m 的乙個子集,一共越8w人 3m影象

訓練過程

a表示mnist,b表示ms-1m

lfw得分

順帶提一下

lfw test集合 6000 中只有10個樣本標錯了。

也就是說理論上最高accuracy是 1-(10/6000)=99.83%

也就是說有些方法已經超過了理論上的極限了

megaface

成績也不錯

人臉識別系列(八) VGGFace

本文主要內容有二 1 從零開始構建乙個人臉識別資料庫,一共 2.6m images,over 2.6k people,構建過 程主要是程式實現的,少量人工參與。2 通過對比各種cnn網路,提出了乙個簡單有效的cnn網路,在各種公開的人臉識別資料庫上得到很好的效果。構建過程主要分為5個階段 1階段在i...

人臉識別系列(二) DeepID1

其實deepid特徵就是乙個由連線第三層與第四層組成的全連線層特徵。第四層的特徵更加全域性化 global 第三層的特徵更加細節 因此deepid連線了兩者,以求同時包含全域性,細節資訊。通過5個landmarks將每張人臉劃分成10regions 每張提取60patches 10regions 3...

人臉識別 人臉庫

1.mit 影象集 美國,麻省理工學院 包括 16 人,每個人有不同光照 不同尺寸 不同角度的 27 張 2.feret 影象集 美 方 此影象集包含大量的人臉影象,並且每幅圖中均只有乙個人臉。該集中,同乙個人的 有不同表情,光照,姿態和年齡的變化。3.umist 影象集 英國,曼切斯特大學 20 ...