浮點數的二進位制

2021-06-10 08:08:05 字數 2429 閱讀 2019

1.前幾天,我在讀一本c語言教材,有一道例題:

#include

void main(void)

在我的編譯器下 編譯是會發生錯誤的。錯誤**:cannot convert from 'int *' to 'float *'。win7+vc6.0(sp6)

執行結果如下:

num的值為:9

*pfloat的值為:0.000000

num的值為:1091567616

*pfloat的值為:9.000000

我很驚訝,num和*pfloat在記憶體中明明是同乙個數,為什麼浮點數和整數的解讀結果會差別這麼大?

要理解這個結果,一定要搞懂浮點數在計算機內部的表示方法。我讀了一些資料,下面就是我的筆記。

2.在討論浮點數之前,先看一下整數在計算機內部是怎樣表示的。

int num=9;

上面這條命令,宣告了乙個整數變數,型別為int,值為9(二進位制寫法為1001)。普通的32位計算機,用4個位元組表示int變數,所以9就被儲存為00000000 00000000 00000000 00001001,寫成16進製制就是0x00000009。

那麼,我們的問題就簡化成:為什麼0x00000009還原成浮點數,就成了0.000000?

3.根據國際標準ieee 754,任意乙個二進位制浮點數v可以表示成下面的形式:

v = (-1)^s×m×2^e

(1)(-1)^s表示符號位,當s=0,v為正數;當s=1,v為負數。

(2)m表示有效數字,大於等於1,小於2。

(3)2^e表示指數字。

舉例來說,十進位制的5.0,寫成二進位制是101.0,相當於1.01×2^2。那麼,按照上面v的格式,可以得出s=0,m=1.01,e=2。

十進位制的-5.0,寫成二進位制是-101.0,相當於-1.01×2^2。那麼,s=1,m=1.01,e=2。

ieee 754規定,對於32位的浮點數,最高的1位是符號位s,接著的8位是指數e,剩下的23位為有效數字m。

對於64位的浮點數,最高的1位是符號位s,接著的11位是指數e,剩下的52位為有效數字m。

5.ieee 754對有效數字m和指數e,還有一些特別規定。

前面說過,1≤m<2,也就是說,m可以寫成1.******的形式,其中******表示小數部分。ieee 754規定,在計算機內部儲存m時,預設這個數的第一位總是1,因此可以被捨去,只儲存後面的******部分。比如儲存1.01的時候,只儲存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給m只有23位,將第一位的1捨去以後,等於可以儲存24位有效數字。

至於指數e,情況就比較複雜。

首先,e為乙個無符號整數(unsigned int)。這意味著,如果e為8位,它的取值範圍為0~255;如果e為11位,它的取值範圍為0~2047。但是,我們知道,科學計數法中的e是可以出現負數的,所以ieee 754規定,e的真實值必須再減去乙個中間數,對於8位的e,這個中間數是127;對於11位的e,這個中間數是1023。

比如,2^10的e是10,所以儲存成32位浮點數時,必須儲存成10+127=137,即10001001。

然後,指數e還可以再分成三種情況:

(1)e不全為0或不全為1。這時,浮點數就採用上面的規則表示,即指數e的計算值減去127(或1023),得到真實值,再將有效數字m前加上第一位的1。

(2)e全為0。這時,浮點數的指數e等於1-127(或者1-1023),有效數字m不再加上第一位的1,而是還原為0.******的小數。這樣做是為了表示±0,以及接近於0的很小的數字。

(3)e全為1。這時,如果有效數字m全為0,表示±無窮大(正負取決於符號位s);如果有效數字m不全為0,表示這個數不是乙個數(nan)。

6.好了,關於浮點數的表示規則,就說到這裡。

下面,讓我們回到一開始的問題:為什麼0x00000009還原成浮點數,就成了0.000000?

首先,將0x00000009拆分,得到第一位符號位s=0,後面8位的指數e=00000000,最後23位的有效數字m=000 0000 0000 0000 0000 1001。

由於指數e全為0,所以符合上一節的第二種情況。因此,浮點數v就寫成:

v=(-1)^0×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

顯然,v是乙個很小的接近於0的正數,所以用十進位制小數表示就是0.000000。

7.再看例題的第二部分。

請問浮點數9.0,如何用二進位制表示?還原成十進位制又是多少?

首先,浮點數9.0等於二進位制的1001.0,即1.001×2^3。

那麼,第一位的符號位s=0,有效數字m等於001後面再加20個0,湊滿23位,指數e等於3+127=130,即10000010。

所以,寫成二進位制形式,應該是s+e+m,即0 10000010 001 0000 0000 0000 0000 0000。這個32位的二進位制數,還原成十進位制,正是1091567616。

浮點數轉化二進位制

乙個int型別表示的整數值是 2 31 2 31 1 32位二進位制表示 1111111111111111 11111111 11111111 011111111 11111111 11111111 1111111 類似整數聯想到浮點數是怎麼表示的呢?最初正常人可能為這樣想的 但是這樣好像表示的數也...

了解二進位制浮點數運算

所有的浮點數值計算都遵循ieee 754規範。ieee 754規定了四種表示浮點數值的方式 單精確度 32位 雙精確度 64位 延伸單精確度 43位以上,很少使用 與延伸雙精確度 79位元以上,通常以80位元實做 只有32位模式有強制要求,其他都是選擇性的。大部分程式語言都有提供ieee格式與算術,...

浮點數轉化為二進位制整型

任何資料在記憶體中都是以二進位制的形式儲存的,例如乙個short型資料1156,其二進位制表示形式為00000100 10000100。則在intel cpu架構的系統中,存放方式為 10000100 低位址單元 00000100 高位址單元 因為intel cpu的架構是小端模式。但是對於浮點數在...