transformer資料彙總

transformer是google提出的一種新的網路結構，其最大的特點是它的self-attention模組，相比於rnn和cnn，self-attention可以直接捕獲整個序列的全域性資訊，同時可以平行計算，速度要快很多。了解該模型最直接的方式就是閱讀**原文：attention is all you need。

網上關於該模型解讀的文章非常多，自己覺得講解的比較清楚的是這篇文章：bert大火卻不懂transformer？讀這一篇就夠了。英文比較好的同學，可以閱讀對應的英文文章：the illustrated transformer。

由於google的開源專案tensor2tensor包含了transformer模型，因此最簡單的方式是通過該專案使用transformer。網上比較好的demo演示是transformer demo1和transformer demo2。親測這些demo都是可以跑通的，需要相關**的同學可以聯絡原博文作者或者聯絡我。

網上關於transformer有不同版本的**實現方式，比較好的方式是google開源的tensor2tensor專案：tensor2tensor原始碼。個人比較推薦方式是先閱讀tensorflow專案裡面transformer**樣例，**結構比較清晰：transformer**樣例。

transformer資料彙總

學習筆記 Transformer

Transformer個人詳細總結

Transformer的殘差連線

transformer資料彙總

學習筆記 Transformer

Transformer個人詳細總結

Transformer的殘差連線

相關推薦