ARM指令中如何判斷乙個立即數是有效立即數

2021-07-11 22:17:34 字數 3775 閱讀 8189

在arm處理器的組合語言中,對指令語法格式中的的常數表示式有這樣的規定:「該常數必須對應8位位圖,即常數是由乙個8位的常數迴圈移位偶數字得到的。」<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

首先從arm指令系統的語法格式說起。

一條arm指令語法格式分為如下幾個部分:

{} ,

其中,<>內的項是必須的,{}內的項是可選的,如是指令助記符,是必須的,而{}為指令執行條件,是可選的,如果不寫則使用預設條件al(無條件執行)。

opcode 

指令助記符,如ldr,str 等

cond 

執行條件,如eq,ne 等

s 是否影響cpsr 暫存器的值,書寫時影響cpsr,否則不影響

rd 目標暫存器

rn 第乙個運算元的暫存器

shifter_operand 

第二個運算元

其指令編碼格式如下:

31-28

27-25

24-21

20 19-16

15-12

11-0 (12位)

cond

001opcode s

rn rd

shifter_operand

當第2 個運算元的形式為:#immed_8r常數表示式時「該常數必須對應8位位圖,即常數是由乙個8位的常數迴圈移位偶數字得到的。」

其意思是這樣:

#immed_8r在晶元處理時表示乙個32位數,但是它是由乙個8位數(比如:01011010,即0x5a)通過迴圈移位偶數字得到(1000 0000 0000 0000 0000 0000 0001 0110,就是0x5a通過迴圈右移2位(偶數字)的到的)。

而1010 0000 0000 0000 0000 0000 0001 0110,就不符合這樣的規定,編譯時一定出錯。因為你可能通過將1011 0101迴圈右移位得到它,但是不可能通過迴圈移位偶數字得到。1011 0000 0000 0000 0000 0000 0001 0110,也不符合這樣的規定,很明顯:1 0110 1011 有9位。

為什麼要有這樣的規定?

要從指令編碼格式來解釋(這就是我為什麼一開始講的是指令編碼格式),仔細看**中的shifter_operand所佔的位數:12位。要用乙個12位的編碼來表示任意的32位數是絕對不可能的(12位數有2^12種可能,而32位數有2^32種)。

但是又要用12位的編碼來表示32位數,怎麼辦?

只有在表示數的數量上做限制。通過編碼來實現用12位的編碼來表示32位數。

在12位的shifter_operand中:8位存資料,4位存移位的次數。

8位存資料:解釋了「該常數必須對應8位位圖」。

4位存移位的次數:解釋了為什麼只能移偶數字。4位只有16種可能值,而32位數可以迴圈移位32次(32種可能),那就只好限制:只能移偶數字(兩位兩位地移,好像乙個16位數在移位,16種移位可能)。這樣就解決了能表示的情況是實際情況一半的矛盾。

所以對#immed_8r常數表示式的限制是解決指令編碼的第二個運算元位數不足以表示32位運算元的無奈之舉,但在我看來:這個可以說是聰明的做法。因為如果直接用12位數來表示32位運算元,只能表示0 到(2^12-1)。大於(2^12-1)的數就沒辦法表示了。而且細細想來「8位存資料,4位存移位的次數」,應該是最好的組合了(我並未想過所有的組合,只是順便試了幾個)。

arm指令第二運算元#immed_8r詳解

大多數arm通用資料處理指令有乙個靈活的第2運算元(flexible second operand),這裡這解釋一下其中的一種格式,#immed_8r常量的表示式。常量必須對應於8位位圖(pattern)。該位圖在32位字中,被迴圈移位偶數字(0,2,4,...28,30)。合法常量0xff,0xff000,0xf000000f。非法常量:0x101,0xff04

arm 在32位模式下,一條指令長度為32位,在上述資料處理指令中,運算元2為12位。所以像0x7f02這樣的數,要兩條指令才能完成。

mov 

r3, #0x7f00 

;e3 a0 3c 7f 該指令自己完成0x7f移位

orr 

r1, r3, #2

所以直接是找不到0x7f02的

關於迴圈移位,其實arm中只有迴圈右移(ror)。0x7f到0x7f00是通過迴圈右移24次才實現的,這裡每次移動2位所以是12次(0xc)

在 arm 資料處理指令中, 當參與操作的第二運算元為立即數時, 每個立即數都是採用乙個8位的常數迴圈右移偶數字而間接得到, 其中迴圈右移的位數有乙個4位二進位制的2倍表示. 則有效立即數可表示為::= immed_8; 迴圈右移(2×rotate_imm). 其中:代表立即數,immed_8代表8位常數,  即所謂的"8點陣圖",rotate_imm代表4位的迴圈右移值. 這樣一來出現了乙個問題: 儘管表示的範圍變大了, 但是12位所能表現的數字的個數是一定的. 因此, arm 規定並不是所有的32位常數都是合法的立即數, 只有通過上面的構造方法得到的才是合法的立即數, 編譯的時候才不會報錯.

舉個例子吧.

0x3fc(0000 0000 0000 0000 0000 0011 1111 1100) 是由 0xff 迴圈右移 2 位得到的;

200(0000 0000 0000 0000 0000 0000 1100 1000) 是由 0xc8 迴圈右移 2 位得到的, 它們都是合法的.

而 0x1fe(0000 0000 0000 0000 0000 0001 1111 1110) 和

511(0000 0000 0000 0000 0000 0001 1111 1111) 無法看成是8位的常數迴圈右移偶數位而得到的, 因此是非法的.

指令運算元立即數時候,每個立即數由乙個8位的常數迴圈右移偶數字得到。

= immed_8 迴圈右移( 2*rotate_imm)

打個比如:

1.立即數0xf200是由0xcf2間接表示的,即是由8位的0xf2迴圈右移24(2*12)得到的

immed_8 == 0xf2; 

rotate_imm == 0xc

2.立即數0x3f0是由0xe3f間接表示的,即是由8位的0x3f迴圈右移28(2*14)得到的

immed_8 == 0x3f; 

rotate_imm == 0xe

或者立即數0x3f0是由0xffc間接表示的,即是由8位的0xfc迴圈右移30(2*15)得到的

immed_8 == 0xfc; 

rotate_imm == 0xf

表示方法有好幾種

ps:其實你沒必要乙個乙個的算,只要利用ldr偽指令就可以了,例如:

ldr r1, =12345678

編譯器自然會給你做工作,現實的程式設計中應該也是這個居多吧

比較下來, 我們可以這樣總結:

判斷乙個數是否符合8位位圖的原則, 首先看這個數的二進位制表示中1的個數是否不超過8個. 如果不超過8個, 再看這n個1(n<=8)是否能同時放到8個二進位制位中, 如果可以放進去, 再看這八個二進位制位是否可以迴圈右移偶數字得到我們欲使用的數. 如果可以, 則此數符合8位位圖原理, 是合法的立即數. 否則, 不符合.

無法表示的32位數, 只有通過邏輯或算術運算等其它途徑獲得了. 比如0xffffff00, 可以通過0x000000ff按位取反得到.

因此以後的程式設計中, 時刻檢查用到的第二運算元是否符合8位位圖是一件千萬不能疏忽的事. 至於為什麼要將這12位operand2"八四開", 這個問題就要請教大牛了.

ARM指令中如何判斷乙個立即數是有效立即數

在arm處理器的組合語言中,對指令語法格式中的的常數表示式有這樣的規定 該常數必須對應8位位圖,即常數是由乙個8位的常數迴圈移位偶數字得到的。首先從arm指令系統的語法格式說起。一條arm指令語法格式分為如下幾個部分 其中,內的項是必須的,內的項是可選的,如是指令助記符,是必須的,而 為指令執行條件...

ARM中判斷立即數是否有效

在arm立即數定址中,指令中的立即數是有乙個8位的常熟和移動的4 位偶數字得到的,所以每一條指令都包含乙個常數x和移位值y,得到的立即數 x迴圈右移 2 y 給定乙個立即數,判斷其是否合法可以分三步 首先將給定的立即數寫成32位二進位制的形式 然後看能不能用乙個8位的二進位制數包括所有含1的部分,如...

用C語言判斷乙個數能不能當作ARM的立即數

在arm立即數定址中,指令中的立即數是有乙個8位的常數 和移動的4 位偶數字得到的,所以每一條指令都包含乙個常數x和移位值y,得到的立即數 x迴圈右移 2 y 給定乙個立即數,判斷其是否合法可以分三步 首先將給定的立即數寫成32位二進位制的形式 然後看能不能用乙個8位的二進位制數包括所有含1的部分,...