新手入門 深度學習常見術語解釋 彙總

2021-10-22 16:28:51 字數 849 閱讀 6744

主幹網路-提取特徵,是之後完成目標檢測等一系列任務的基礎。

e.g. vgg、resnet、densenet……

backbone之後連線的網路層。

head是獲取網路輸出內容的網路,利用之前提取的特徵,做出**。比如獲得影象分類、目標檢測(分類+定位)等任務的結果。

e.g.

[dense prediction / one stage] - rpn、ssd、yolo、retinanet

[sparse prediction / two stage] - faster r-cnn、r-fcn、mask r-cnn

處於backbone和head之間,為了更好的利用backbone提取的特徵。

e.g.

[additional blocks] - spp、aspp、sam……

[path-aggregation blocks] - fpn、fully-connected fpn、bifpn……

detector = backbone+neck+head

瓶頸的意思,通常指的是網路輸入的資料維度和輸出的維度不同,輸出的維度比輸入的小了許多,就像脖子一樣,變細了。經常設定的引數 bottle_num=256,指的是網路輸出的資料的維度是256 ,可是輸入進來的可能是1024維度的。

warm up指的是用乙個小的學習率先訓練幾個epoch,這是因為網路的引數是隨機初始化的,一開始就採用較大的學習率容易數值不穩定。

參考博文:

backbone、head、neck等深度學習中的術語解釋;

目標檢測 backbone、neck、detection head;

彙總|目標檢測中的資料增強、backbone、head、neck、損失函式

Python新手入門之直譯器的安裝

1.python介紹 python由荷蘭數學和電腦科學研究學會的guido van rossum 於1990 年代初設計,作為一門叫做abc語言的替代品。1 python提供了高效的高階資料結構,還能簡單有效地物件導向程式設計。python語法和動態型別,以及解釋型語言的本質,使它成為多數平台上寫指...

新手入門深度學習做語音識別?谷歌AIY也是開源

為解決這一問題,谷歌的tensorflow 和 aiy 團隊建立了tensorflow 和 aiy 團隊建立了speech commands dataset,即 語音命令資料集 據了解,谷歌也開源該資料集。tensorflow和aiy團隊開源的資料集包含65000個錄音,每個錄音時長幾秒鐘,包含30...

TCP IP協議新手入門學習二

表5.從a到b的ip包 在這種情況下,使用ip是多餘的,因為它根本沒有起到什麼作用,用ip只能增加多餘的處理時間,占用了多餘的傳輸頻寬。b接收到這個包後,ip層檢查這個包內的目的位址是不是和自己的ip位址一致,如果一致則將資料返回給上層協議。這稱為直接路由。5.2 間接路由 下面這個示意圖更接近in...