深入理解計算機系統之整型與浮點型

2021-07-27 11:10:35 字數 2941 閱讀 1855

在計算機儲存系統裡面,算術型別可以分為兩類:整型(intergral type,包括字元和布林型別在內)和浮點型。在看簡單地看了深入理解計算機系統的第二章後,有了稍微深刻但是有非常淺顯的理解,然後又看了阮師兄的一篇博文,所以做了一點筆記。

下面先來看乙個例子程式:

#include void main(void)
執行結果如下:

num的值為:9

*pfloat的值為:0.000000

num的值為:1091567616

*pfloat的值為:9.000000

這個例子是乙個吧整數數值換成浮點形式的經典例子,理解了這個例子,可以讓我們對整型和浮點型的儲存方式都有乙個更深刻的理解。

在討論浮點數之前,先看一下整數在計算機內部是怎樣表示的:

int num=9;
上面這條命令,宣告了乙個整數變數,型別為int(預設為signed,有符號的),值為9(二進位制寫法為1001)。在普通的用4個位元組表示int變數。所以9就被儲存為00000000 00000000 00000000 00001001。如果要儲存乙個有符號的整型,我們一般採用補碼編碼的形式。在這個定義中,將字的最高有效位解釋為負權, 最高有效位也成為符號位。也就是說,如果符號位是0,則這是乙個非負數(包括0),如果符號位是1,則這是乙個負數。

3.直到20世紀80年代,每個計算機製造商都設計了自己的表示浮點數的規則,但這是對應用程式可移植性的巨大挑戰,所以制定了國際標準ieee 754,任意乙個二進位制浮點數v可以表示成下面的形式:

#v=(−1

)s∗m

∗2e(-1)^s*m*2^e

(−1)s∗

m∗2e

(1)(-1)^s表示符號位(術語:符號),當s=0,v為正數;當s=1,v為負數。

(2)m(位數)表示有效數字,大於等於1,小於2。

(3)2^e表示指數字,e叫階碼

舉例來說,十進位制的5.0,寫成二進位制是101.0,相當於1.01×2^2。那麼,按照上面v的格式,可以得出s=0,m=1.01,e=2。

十進位制的-5.0,寫成二進位制是-101.0,相當於-1.01×2^2。那麼,s=1,m=1.01,e=2。

ieee 754規定,對於32位的浮點數,最高的1位是符號位s,接著的8位是指數e,剩下的23位為有效數字m:

對於64位的浮點數,最高的1位是符號位s,接著的11位是指數e,剩下的52位為有效數字m:

ieee 754對有效數字m和指數e,還有一些特別規定。

前面說過,1≤m<2,也就是說,m可以寫成1.******的形式,其中******表示小數部分。ieee 754規定,在計算機內部儲存m時,預設這個數的第一位總是1,因此可以被捨去,只儲存後面的******部分。比如儲存1.01的時候,只儲存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給m只有23位,將第一位的1捨去以後,等於可以儲存24位有效數字。

至於指數e,情況就比較複雜。

首先,e為乙個無符號整數(unsigned int)。這意味著,如果e為8位,它的取值範圍為0255;如果e為11位,它的取值範圍為02047。但是,我們知道,科學計數法中的e是可以出現負數的,所以ieee 754規定,e的真實值必須再減去乙個中間數(偏置),才會得到我們科學計數法中的e。對於8位的e,這個中間數是127;對於11位的e,這個中間數是1023。

比如,2^10的e是10,所以儲存成32位浮點數時,必須儲存成10+127=137,即10001001。

然後,指數e還可以再分成三種情況:

(1)e不全為0或不全為1。這時,浮點數就採用上面的規則表示,即指數e的計算值減去127(或1023),得到真實值,再將有效數字m前加上第一位的1。

(2)e全為0。這時,浮點數的指數e等於1-127(或者1-1023),有效數字m不再加上第一位的1,而是還原為0.******的小數。這樣做是為了表示±0,以及接近於0的很小的數字。

(3)e全為1。這時,如果有效數字m全為0,表示±無窮大(正負取決於符號位s);如果有效數字m不全為0,表示這個數不是乙個數(nan)。

好了,關於浮點數的表示規則,就說到這裡。

下面,讓我們回到一開始的問題:

首先,將0x00000009拆分,得到第一位符號位s=0,後面8位的指數e=00000000,最後23位的有效數字m=000 0000 0000 0000 0000 1001。

由於指數e全為0,所以符合上一節的第二種情況。因此,浮點數v就寫成:

v=(-1)0×0.00000000000000000001001×2(-126)=1.001×2^(-146)

顯然,v是乙個很小的接近於0的正數,所以用十進位制小數表示就是0.000000。

再看例題的第二部分:

請問浮點數9.0,如何用二進位制表示?還原成十進位制又是多少?

首先,浮點數9.0等於二進位制的1001.0,即1.001×2^3。

那麼,第一位的符號位s=0,有效數字m等於001後面再加20個0,湊滿23位,指數e等於3+127=130,即10000010。

所以,寫成二進位制形式,應該是s+e+m,即0 10000010 001 0000 0000 0000 0000 0000。這個32位的二進位制數,還原成十進位制,正是1091567616。

在理解了單精度和雙精度制度之後,我又產生了乙個疑問。 那就是c語言的printf輸出浮點數的一些問題,就是當printf列印*pfloat時為什麼會顯示小數點後六位,這裡貌似牽涉到計算機系統的堆疊問題,後面再慢慢梳理。

深入理解計算機系統

關鍵路徑是在迴圈的反覆執行中形成的資料相關鏈。迴圈展開是一種程式變換,通過增加每次迭代計算的元素的數量,減少迴圈的迭代次數。重新結合變換能夠減少計算中關鍵路徑上操作的數量,通過更好地利用功能單元的流水線能力得到更好的效能。浮點運算不保證是可結合的,通常迴圈展開和並行地累積在多個值中,是提高程式效能的...

《深入理解計算機系統》

知乎 深入理解計算機系統 這本書需要什麼水平能看懂?15 213 18 218 15 513 introduction to computer systems schedule fall 2016 鏈結失效則 cmu15 213的課程主頁,有ppt,還有錄影,主講人就是這本書的作者。備註 備註 詳細...

深入理解計算機系統

系統的硬體組成 快取記憶體 作業系統管理硬體 程序虛擬記憶體 檔案amdahl定律 併發和並行 0和1組成的位序列,又稱為位元序列,8個位被組織成一組,成為位元組。每個位元組表示程式中的某些文字字元。系統中的所有資訊 包括磁碟檔案 記憶體中的程式 記憶體中存放的的使用者資料以及網路上傳送的資料,都是...