paddlepaddle百度飛槳學習心得

還有詳細的安裝模組講解，簡單案例，經典案例，高階內容等等

然後是專案裡自己最近嘗試修改過的部分

1.資料打亂

老師提供的案例是先得到訓練集資料的索引，然後將索引打亂，從而達到打亂訓練集資料的目的。打亂訓練集資料的原因是：網路對最近得到的資料的印象較深，除非特殊任務本身對日期等有限制，都會事先打亂訓練集，增加資料的隨機性，使網路訓練效果更好（泛化能力，不打亂，如果最後的乙個batch裡的資料有較相似的特徵，網路可能比較偏）

此處是通過索引來亂序的**：

事先得到資料集train_set,包含和標籤：

imgs, labels = train_set[0], train_set[1]
#獲得資料集長度
imgs_length = len(imgs)
#定義資料集每個資料的序號，根據序號讀取資料
index_list = list(range(imgs_length))
#讀入資料時用到的批次大小
batchsize = 100
#隨機打亂訓練資料的索引序號
random.shuffle(index_list)

或者可以直接用shuffle打亂資料：

np.random.shuffle(training_data)

我當時交作業好像用了其他的，找不到這兩種方法寫哪個課件裡了

作業是這樣寫的：

#亂序
train_reader = fluid.io.shuffle(train_reader, 8)

train_reader是讀取的訓練資料集，buffer_size為8，用的是飛槳的api

2.資料歸一化問題

一開始的案例是房價**，用的是全連線層來解決，其中乙個步驟是，將輸入資料歸一化，（大概）是有平移偏移的0-1分布，然後我總記得有個啟用函式來著，裡面有乙個sigmoid，就一直以為啟用函式不僅是有非線性功能，還提供網路某一層輸出的歸一化的作用

所以當時聽課的時候對於「只有對輸入資料進行歸一化」，有一點疑惑，

後來想想relu並不是只介於0-1的，所以啟用函式主要還是提供非線性功能吧，不知道網路具體怎麼計算，才能得出，全連線層之後不需要跟乙個歸一化的過程的，

現在想一想，我當時疑惑的應該是輸入歸一化，網路輸出後跟標籤做計算，loss會不會太大

先寫兩點吧~

paddlepaddle百度飛槳學習心得

百度深度框架PaddlePaddle小結

百度發布PaddlePaddle新API

百度訓練營 paddlepaddle學習筆記

paddlepaddle百度飛槳學習心得

百度深度框架PaddlePaddle小結

百度發布PaddlePaddle新API

百度訓練營 paddlepaddle學習筆記

相關推薦