NLP相關概念總結

2021-10-21 22:53:09 字數 494 閱讀 6084

attention機制的實質其實就是乙個定址(addressing)的過程,如上圖所示:給定乙個和任務相關的查詢query向量 q,通過計算與key的注意力分布並附加在value上,從而計算attention value,這個過程實際上是attention機制緩解神經網路模型複雜度的體現:不需要將所有的n個輸入資訊都輸入到神經網路進行計算,只需要從x中選擇一些和任務相關的資訊輸入給神經網路。

注意力機制可以分為三步:一是資訊輸入;二是計算注意力分布α;三是根據注意力分布α 來計算輸入資訊的加權平均。

nlp中的attention注意力機制+transformer詳解

深度學習中的注意力模型(2017版)

雲計算相關概念總結

1 什麼是雲計算?為什麼使用雲計算?提供資源的網路被稱為 雲 雲 中的資源在使用者看來是可以無限擴充套件的,並且可以隨時獲取,按需使用,隨時擴充套件,按使用付費。雲計算就是對使用者提供租賃服務的一種計算方式,由於採用網際網路技術 使用者應該在任何地方都能得到服務。雲計算的核心在於資源的管理與運用。虛...

HDFS篇 HDFS相關概念總結

簡介 儲存模型為 位元組,以檔案切割成塊,單一檔案大小一致,檔案與檔案間可以不一致。其可以設定副本數,副本數不可超過節點數量。只支援一次寫入多次讀取,可追加資料。架構模型 namenode節點儲存檔案的元資料 單節點 datanode節點儲存檔案block資料 多節點 datanode與nameno...

c 中引用相關概念總結

1 先從下面這兩段 的執行結果開始看起 int a 10 在記憶體上開闢4個位元組,a就代表這個4個位元組記憶體 int p a 讓乙個指標 指向這個4個位元組的空間 p 20 cout a a endl 20int b a 定義乙個引用b 指向a,b此時就是變數的a的別名 b 40 cout a ...