機器學習資料集

2021-08-04 10:07:07 字數 236 閱讀 4560

ucl機器學習知識庫:包括近300個不同大小和型別的資料集,可用於分類、回歸、聚類和推薦系統任務。資料集列表位於:

amazon aws公開資料集:包含的通常是大型資料集,可通過amazon s3訪問。這些資料集包括人類基因組專案、common crawl網頁語料庫、維基百科資料和google booksngrams。相關資訊可參見:

kdnuggets:這裡包含乙個詳細的公開資料集列表,其中一些上面提到過的。該列表位於:

機器學習資料集 Dataset 彙總

cifar 10包含10個類別,50,000個訓練影象,彩色影象大小 32x32,10,000個測試影象。類別 airplane,automobile,bird,cat,deer,dog,frog,horse,ship,truck 資料格式 python版本 matlab版本 二進位制版本 cifa...

機器學習iris資料集匯入

iris資料集在模式識別研究領域應該是最知名的資料集了,有很多文章都用到這個資料集。這個資料集裡一共包括150行記錄,其中前四列為花萼長度,花萼寬度,花瓣長度,花瓣寬度等4個用於識別鳶尾花的屬性,第5列為鳶尾花的類別 包括setosa,versicolour,virginica三類 也即通過判定花萼...

機器學習資料集 Dataset 彙總

cifar 10包含10個類別,50,000個訓練影象,彩色影象大小 32x32,10,000個測試影象。類別 airplane,automobile,bird,cat,deer,dog,frog,horse,ship,truck 資料格式 python版本 matlab版本 二進位制版本 cifa...