1 1 計算機視覺

計算機視覺時要面臨乙個挑戰，就是資料的輸入可能會非常大。

假設操作的都是 64×64 的小，實際上，它的資料量是 64×64×3，因為每張都有 3 個顏色通道。如果計算一下的話，可得知資料量為 12288，所以我們的特徵向量維度為 12288。這其實還好，因為 64×64 真的是很小的一張。

如果你要操作更大的，比如一張 1000×1000 的，它足有 1 兆那麼大，但是特徵向量的維度達到了 1000×1000×3，因為有 3 個 rgb 通道，所以數字將會是 300 萬。

如果你要輸入 300 萬的資料量，這就意味著，特徵向量x的維度高達 300 萬。所以在第一隱藏層中，你也許會有1000個隱藏單元，而所有的權值組成了矩陣$}^}$。如果你使用了標準的全連線網路，就像我們在第一門和第二門的課程裡說的，這個矩陣的大小將會是1000×300 萬。因為現在x的維度為3m, 3m通常用來表示 300 萬。這意味著矩陣$}^}$會有 30億個引數，這是個非常巨大的數字。在引數如此大量的情況下，難以獲得足夠的資料來防止神經網路發生過擬合和競爭需求，要處理包含 30 億引數的神經網路，巨大的記憶體需求讓人不太能接受。

但對於計算機視覺應用來說，你肯定不想它只處理小，你希望它同時也要能處理大圖。為此，你需要進行卷積計算，它是卷積神經網路中非常重要的一塊。

1 1 計算機視覺

（計算機視覺）計算機視覺基礎

計算機視覺

計算機視覺

相關推薦