機器學習樣本資料集,訓練正負樣本

2021-09-24 12:43:11 字數 656 閱讀 5266

1、caltech-101 資料庫:該資料庫在2023年被發布,包括101類目標影象和1類背景影象,共102類,彩色影象較多,有部分灰度影象。總共影象數為9145(除去背景後總數為8677),每類影象數大約在31~800之間,影象大小為300×200。此資料庫的特點是:每個影象只含有乙個目標,且目標大都處於影象中間位置,基本上佔據整個影象區域,背景相對比較簡單。

2、caltech-256 資料庫:該資料庫在2023年被發布,包括256類目標影象和1類背景影象,共257類。與caltech101相比主要變化表現在,影象總數達到30608,且每類最少含有80幅影象。

3、pascal voc 資料庫:pascal voc challenge(pascal是pattern analysis, statistical modeling andcomputational learnin的縮寫)是非常著名的視覺目標分類、檢測及分割等任務比賽。從2023年到2023年,每年舉行一屆比賽並公布相應的資料庫,該資料

庫中每幅影象含有多個類的目標,從2023年開始,每年的資料庫均含有20類目標,但具體的目標數不一樣。

該資料庫有三個顯著的特點,每張可能含有多類目標且每類目標可能具有多個例項;目標的大小形狀位置相差非常大;影象的背景比較複雜。這些特點給識別任務帶來了非常大的困難。

4、行人檢測資料庫:

大小970m

機器學習中的正負樣本

在機器學習中經常會遇到正負樣本的問題,花了一點時間查詢資料,基本上弄明白了一點到底是怎麼回事,記錄在這裡以便以後檢視,也希望能夠幫助到有疑惑的人,當然也希望理解的比較透徹的人看到之後對於理解的不對的地方能夠予以指點。首先我將這個問題分為分類問題與檢測問題兩個方面進行理解。在分類問題中,這個問題相對好...

機器學習中的正負樣本

本文 在機器學習中經常會遇到正負樣本的問題,花了一點時間查詢資料,基本上弄明白了一點到底是怎麼回事,記錄在這裡以便以後檢視,也希望能夠幫助到有疑惑的人,當然也希望理解的比較透徹的人看到之後對於理解的不對的地方能夠予以指點。首先我將這個問題分為分類問題與檢測問題兩個方面進行理解。在分類問題中,這個問題...

機器學習中的正負樣本

對於機器學習中的正負樣本問題,之前思考過一次,但是後來又有些迷惑,又看了些網上的總結,記錄在這裡。我們經常涉及到的任務有檢測以及分類。針對與分類問題,正樣本則是我們想要正確分類出的類別所對應的樣本,例如,我們要對一張進行分類,以確定其是否屬於汽車,那麼在訓練的時候,汽車的則為正樣本,負樣本原則上可以...