人臉識別之資料 網路結構 損失函式

2021-08-27 02:59:30 字數 1363 閱讀 3973

基於深度學習的人臉識別發展,已經基本趨於成熟,業界比較成熟的人臉1:n應用總結如下:

凡是基於識別的,總是離不開三個東西:資料,網路,以及loss。

資料方面

目前的公開資料集中有主打類別數的ms_celeb_1m,有主打各種姿態角與年齡的vggface2;也有一些主打高質量的資料集,像webface,ms-20k。除了公開資料集之外,生成領域也有不錯的成果,例如基於三維人臉模型生成不同姿態角的人臉,利用gan生成不同人臉角度或者屬性的(stargan,tpgan)。

網路結構方面

從最開始的淺層網路lightcnn到後面的resnet,inception-resnet,resnext以、senet以及mobilenet,都是針對識別而設計的網路,而並非針對人臉識別設計的網路,所以一些網路在人臉識別裡帶來的提公升沒有imagenet那麼明顯。

由於人臉識別相對於一般的識別問題,存在人臉對比這樣乙個需求,這就將人臉識別的主要方向變成了metric learning問題而並非簡簡單單的分類問題。而近幾年學術上的發展也基本是圍繞loss function展開,除了像google,baidu這些擁有海量人臉資料的**,focus點基本都在乙個問題上:如何在有限的資料集上得到更高的精度。

loss function,

如果光看loss function,從softmax,contrastive loss,triplet loss,center loss,normface,large margin loss , asoftmax loss , coco loss,以及今年的am,aam,insightface。

這些在聚類上大致上可以分為下面兩個類:

1.單純聚類:contrasitve loss,center loss,normface, coco loss

2.加margin聚類:triplet loss,large margin loss,asoftmax loss,am,aam,insightface

在距離度量上可以分為下面兩個類:

1.歐式距離:contrastive loss,center loss,normface,triplet loss

2.cosine距離/角度距離:large margin loss,asoftmax loss,coco loss,am,aam,insightface

可以看到,目前的主要方向,在從euler距離往cosine距離發展的同時中間出現了像normface,sphereface,coco loss這些進行了feature normalization,weight normalization操作的loss,但是這幾篇**,除了sphereface稍稍介紹了緣由之外,其餘的更像是乙個實驗性的結果,沒有辦法從理論上來說明。

移動通訊之蜂窩資料網路

移動通訊的種類有很多,如蜂窩移動通訊 衛星移動通訊 集群移動通訊 無繩 通訊 無線lan等。目前使用最多的是蜂窩移動通訊,它又稱為小區制移動通訊。這種通訊的特點是把整個的網路服務區劃分成許多小區 cell,也就是 蜂窩 每個小區設定乙個基站,負責本小區各個移動站的聯絡與控制。移動站的傳送或接收都必須...

網路資料流分析 四層網路結構

本文內容不全,分析其中包含部分結構內容資訊 資料鏈路層結構 ethernet ii 總位元組數為14byte 目的mac 6 byte 源mac 6 byte type 2 byte 對於ipv6 的type ox86dd ip 層 資料段的總大小為40bytes 其中,version 佔1 byt...

人臉識別之演算法理論 雙層異構深度神經網路

無論我們處理何種ai的問題,資料是根本,資料是ai之源。對於人臉的場景,乙個大規模人臉資訊庫可以定義為 對於一張人臉元素而言,具有以下內容的部分標籤或全資訊 人臉檢測資訊 人臉數量 人臉 座標 人臉空間資訊 俯仰角 旋轉角 偏航角 人臉關鍵點資訊 眼睛 鼻子 嘴 臉部 輪廓座標 人臉屬性資訊 年齡 ...