向量化矩陣轉置演算法

2021-07-17 03:29:20 字數 1189 閱讀 6830

在不少高效能計算中，矩陣轉置扮演了乙個使用比較頻繁的角色。因此如果在某個處理過程中，矩陣轉置佔的比重比較大，且演算法沒設計好的話就可能會成為該處理過程的計算瓶頸。這裡我將介紹向量化矩陣轉置的演算法過程。

為了簡單、清晰地介紹如何向量化矩陣轉置，我們這裡使用4x4、以行為主的矩陣作為例子進行講解。我們假設有這麼乙個矩陣：

[ a b c d

e f g h

i j k l

m n o p ]

那麼這個矩陣轉置後的形式應該是：

[ a e i m

b f j n

c g k o

d h l p ]

我們在處理過程中，往往先用四個向量暫存器將每一行的四個元素資料先讀取出來。我們這裡就假設vec1讀取(a, b, c, d)這一向量；vec2讀取(e, f, g, h)這一向量；vec3讀取(i, j, k, l)這一向量；vec4讀取(m, n, o, p)這一向量。然後，我們需要將這四個向量中的資料元素做相應整理，然後再寫回相應的儲存位址中。

我們可以先觀察源矩陣與目的矩陣之間的關係，然後再結合vec1到vec4這四個向量暫存器中的資料元素的排布，可以先發現，目的矩陣的第一行頭兩個元素分別是vec1的第乙個元素和vec2的第乙個元素；目的矩陣第二行的頭兩個元素分別是vec1的第二個元素和vec2的第二個元素。目的矩陣的第

三、第四行的頭兩個元素也可以此類推，這樣我們可以先對vec1與vec2做轉置操作，可得到——vec1 = (a, e, b, f)；vec2 = (c, g, d, h)。

而目的矩陣第一行的後兩個元素分別是vec3的第乙個元素與vec4的第乙個元素，我們可以跟上面一樣，以此類推，將vec3與vec4做一次轉置操作，得到——vec3 = (i, m, j, n); vec4 = (k, o, l, p)。這樣，矩陣轉置的第一步就完成了。

我們接下去再看vec1與vec3的關係，可以得出vec1的頭兩個元素與vec3頭兩個元素結合在一起就能直接得到目的矩陣的第一行元素，而後面的也同樣如此。所以我們對vec1與vec3做一次雙元素的轉置操作，可以得到——vec1 = (a, e, i, m); vec3 = (b, f, j, n)。同樣，vec2與vec4也執行一次雙元素的轉置，最終獲得vec2 = (c, g, k, o); vec4 = (d, h, l, p)。最後，我們再依次將vec1、vec3、vec2、vec4向量暫存器寫入相應的儲存位址即大功完成。

矩陣的向量化及內積

定義1.設矩陣a aij rm n，把矩陣 a 的元素按行的順序排列成乙個列向量 ve ca a11,a 12,a1n,a21,a 22,a2n,am 1,am 2,amn t則稱向量ve ca為矩陣 a 按行展開的列向量。定義2.設矩陣a aij rm n，把矩陣 a 的元素按行的順序排列成乙個列...

文字向量化

table of contents概述 word2vec nnlm c wcbow and skip gram doc2vec str2vec 文字表示是自然語言處理中的基礎工作，文字表示的好壞直接影響到整個自然語言處理系統的效能。文字向量化就是將文字表示成一系列能夠表達文字語義的向量，是文字表示的...

文字向量化

文字向量化，就是把文字轉化為向量形式。這裡用兩種方式實現本文向量，一種是tf方式，一種是tf idf方式，且這裡向量的長度就是字典的長度。計算兩個向量余弦相似度import math defcount cos similarity vec 1,vec 2 if len vec 1 len vec 2...