triple loss 讀書筆記

2021-10-09 06:59:17 字數 917 閱讀 4177

在** dynamic graph attention for referring expression comprehension 中 matching部分用的loss是triple loss,那麼到底這個triple loss代表什麼含義呢?

這篇triple loss方法是引用 facenet: a unified embedding for face recognition and clustering **中的方法。而這篇文章中他們提出了乙個方法系統叫作facenet,它直接學習影象到歐式空間上點的對映,其中呢,兩張影象所對應的特徵的歐式空間上的點的距離直接對應著兩個影象是否相似。意思就是說通過學習,使得類間的距離要大於類內的距離。

舉個例子:

可以通過閾值1.1來區分人臉是不是屬於同樣乙個人。

訓練的目的是將anchor與positive 差距變小,和negative距離拉大,也就是達到類內距離小於類間的距離,用公式來表示就是:

轉換一下,它的損失函式就變為上式所示:即最小化 (類內距離-類間距離+邊際)

但是這樣子處理資料的非常大,比如有n個人,每個人有m個,那麼比較計算次數:t=mn(m-1)*n, o(t)大約為n^2, 所以選取部分進行訓練比較重要,重點是如何選取類內距離和類間的距離,給定一張人臉,我們要挑選其中的一張hard positive:即另外m-1 張影象中,跟它最不相似的。

同時選擇一張hard negative:即在n(m-1)影象中,跟它最為相似的。

mysql運維 讀書筆記 Mysql 讀書筆記

mysql儲存時間有兩種型別 datetime和timestamp。分別說一下兩者的區別。datetime,以8位元組儲存時間,理論上可以從0000年儲存到9999年。並且沒有時區的概念,它儲存的就是乙個時間點的概念。timestamp和datetime最主要的不同就是,它是以4個位元組儲存,由19...

struts in action讀書筆記

struts in action 學習筆記 一 struts的控制流 因為web 應用是動態的,所以很難表現 乙個真正固定的控制流 取決於環境,不同的方式下有很多不同的事情發生 特別是在web 應用中。但是事情仍然有乙個通用的秩序。如果你是個struts,應用框架,甚至web 應用的新手,這些流程剛...

中 斷(讀書筆記)

裝置的中斷會打斷核心中程序的正常排程和執行,系統對更高吞吐率的追求勢必要求中斷服務程式盡可能地短小精悍。但是這個良好的願望往往與現實並不吻合。在大多數的系統中,當中斷到來時,要完成的工作往往並不是短小的,它可能要求進行較大量的耗時處理。為了在中斷執行時間盡可能短和中斷處理需要完成大量工作之前找乙個平...