Albumentations資料增強庫

2022-06-19 06:39:12 字數 983 閱讀 6212

通常我們訓練乙個深度卷積神經網路需要足夠多的資料來防止模型過擬合,然而收集任務所需的資料往往代價較大。因此我們需要另闢蹊徑,而影象增強就是另一種簡單可行的防止過擬合的方法。

本質上,影象增強就是乙個從已有的訓練樣本中建立新的訓練樣本的過程。要製作乙個新樣本,可以對原始影象進行輕微的更改。例如,你可以讓乙個新影象更亮一點;你可以從原始影象上切下一塊;你可以通過映象原來的影象來建立乙個新的影象等等。

現在影象增強(包含在廣義的資料增強中)已經成為深度學習訓練過程的標配,下面介紹今天的主角:又快又強的影象增強庫——albumentations

pip install albumentations
給出乙個簡單的使用示例:

transformed_image = transform(image=image)["image"]注意影象需要先轉化成numpy陣列,針對opencv還需要將bgr格式轉化為rgb格式。

資料增強需要同時對影象和標籤進行相同的操作,考慮到不同任務的標籤不同,有以下幾種使用物件:

這個庫支援的操作太多了,這裡列出我個人常用的且實驗確實有效的:

訓練時目標的大小(scale)很影響模型的泛化效能,增加scale上的資料增強有一定作用。

這裡的目標大小指的是:模型輸入的影象目標相對於卷積核的大小,影響因素有輸入影象尺寸及目標相對影象尺寸的大小。

Catalan數(卡特蘭數)

卡特蘭數 規定h 0 1,而h 1 1,h 2 2,h 3 5,h 4 14,h 5 42,h 6 132,h 7 429,h 8 1430,h 9 4862,h 10 16796,h 11 58786,h 12 208012,h 13 742900,h 14 2674440,h 15 969484...

卡特蘭數 Catalan數

卡特蘭數 規定h 0 1,而h 1 1,h 2 2,h 3 5,h 4 14,h 5 42,h 6 132,h 7 429,h 8 1430,h 9 4862,h 10 16796,h 11 58786,h 12 208012,h 13 742900,h 14 2674440,h 15 969484...

Catalan數(卡特蘭數)

2012 04 12 21 08 13 標籤 卡特蘭數 原始出處 作者資訊和本宣告。否則將追究法律責任。卡特蘭數 規定h 0 1,而h 1 1,h 2 2,h 3 5,h 4 14,h 5 42,h 6 132,h 7 429,h 8 1430,h 9 4862,h 10 16796,h 11 58...