深度學習 資料集 HDF5資料格式

2021-10-08 09:27:22 字數 1026 閱讀 1458

hdf 是用於儲存和分發科學資料的一種自我描述、多物件檔案格式,是一種儲存相同型別數值的大陣列的機制。hdf 是由美國國家超級計算應用中心(ncsa)建立的,以滿足不同群體的科學家在不同工程專案領域之需要。hdf 可以表示出科學資料儲存和分布的許多必要條件。hdf 被設計為:

乙個hdf5檔案就是乙個由兩種基本資料物件(groups and datasets)存放多種科學資料的容器:

python應用h5py庫實現對hdf5格式的資料檔案(.h5)進行操作。

import h5py  #匯入工具包  

import numpy as np

#hdf5的寫入:

imgdata = np.zeros((30

,3,128

,256

))

f = h5py.file(

'file.h5'

,'w'

)#建立乙個h5檔案,檔案指標是f

f['data'

]= imgdata #將資料寫入檔案的主鍵data下面

f['labels']=

range

(100

)#將資料寫入檔案的主鍵labels下面

f.close(

)#關閉檔案

#hdf5的讀取:

f = h5py.file(

'file.h5'

,'r'

)#開啟h5檔案

f.keys(

)#可以檢視所有的主鍵

a = f[

'data'][

:]#取出主鍵為data的所有的鍵值

f.close(

)

Matlab建立HDF5資料集 壓縮

建立hdf5資料集必須先後使用h5create h5write命令 h5create官方鏈結 h5write官方鏈結 我創造的資料集大小是256x256x3x50000 每個256x256x3是rgb樣本。如果在matlab裡將rgb三維矩陣存成jpg,大小只有6kb 但是我把三維矩陣存入到hdf5...

Caffe中使用HDF5製作多標籤資料

在caffe中,如果使用lmdb資料格式的話,預設是只支援 影象 整數單標籤 這種形式的資料的。如果訓練網路需要一些其他形式的資料或標籤 如浮點資料,多標籤等等 可以將其製作成hdf5格式。ps hdf5資料格式比較靈活,但缺點是占用空間較大。筆者曾經試著把229多張512x512的影象製作成乙個h...

《Python和HDF 5大資料應用》 導讀

過去的幾年裡,python已經和idl或matlab一樣,成為科學分析領域值得信賴的選擇。它擁有穩健的核心模組,可用於處理數值陣列 numpy 分析 scipy 以及繪圖 matplotlib 同時還擁有十分豐富的專用模組。它能幫助人們減少編寫科學 的工作量,同時還能提高計算結果的質量。本書向所有有...