float h浮點型範圍和精度

2021-07-11 16:41:35 字數 1935 閱讀 3728

c 標準庫的float.h標頭檔案包含了一組與浮點值相關的依賴於平台的常量。這些常量是由 ansi c 提出的,這讓程式更具有可移植性。在講解這些常量之前,最好先弄清楚浮點數是由下面四個元素組成的:

元件元件描述

s符號 ( +/- )

b指數表示的基數,2 表示二進位制,10 表示十進位制,16 表示十六進製制,等等...

e指數,乙個介於最小值emin和最大值emax之間的整數。

p精度,基數 b 的有效位數

基於以上 4 個組成部分,乙個浮點數的值如下:

floating-point = ( s ) p x be

floating-point = (+/-) precision x baseexponent

下面的值是特定實現的,且是通過 #define 指令來定義的,這些值都不得低於下邊所給出的值。請注意,所有的例項 flt 是指型別 float,dbl 是指型別 double,ldbl 是指型別 long double。巨集描述

flt_rounds

定義浮點加法的捨入模式,它可以是下列任何乙個值:

flt_radix 2

這個巨集定義了指數表示的基數。基數 2 表示二進位制,基數 10 表示十進位制,基數 16 表示十六進製制。

flt_mant_dig

dbl_mant_dig

ldbl_mant_dig

這些巨集定義了 flt_radix 基數中的位數。

flt_dig 6

dbl_dig 10

ldbl_dig 10

這些巨集定義了捨入後不會改變表示的十進位制數字的最大值(基數 10)。

flt_min_exp

dbl_min_exp

ldbl_min_exp

這些巨集定義了基數為 flt_radix 時的指數的最小負整數值。

flt_min_10_exp -37

dbl_min_10_exp -37

ldbl_min_10_exp -37

這些巨集定義了基數為 10 時的指數的最小負整數值。

flt_max_exp

dbl_max_exp

ldbl_max_exp

這些巨集定義了基數為 flt_radix 時的指數的最大整數值。

flt_max_10_exp +37

dbl_max_10_exp +37

ldbl_max_10_exp +37

這些巨集定義了基數為 10 時的指數的最大整數值。

flt_max 1e+37

dbl_max 1e+37

ldbl_max 1e+37

這些巨集定義最大的有限浮點值。

flt_epsilon 1e-5

dbl_epsilon 1e-9

ldbl_epsilon 1e-9

這些巨集定義了可表示的最小有效數字。

flt_min 1e-37

dbl_min 1e-37

ldbl_min 1e-37

這些巨集定義了最小的浮點值。

下面的例項演示了 float.h 檔案中定義的一些常量的使用。

#include

#include

intmain

()

讓我們編譯和執行上面的程式,這將產生下列結果:

the

maximum value of

float

=3.4028234664e+38

theminimum value of

float

=1.1754943508e-38

thenumber of digits

inthe number

=7.2996655210e-312

浮點數的範圍和精度

無論是單精度還是雙精度在儲存中都分為三個部分 符號位 sign 0代表正,1代表為負 指數字 exponent 用於儲存科學計數法中的指數資料,並且採用移位儲存 尾數部分 mantissa 尾數部分1範圍 float 和double 的範圍是由指數的位數來決定的。float 的指數字有 8位,而 d...

float double精度和範圍

1.範圍 float和double的範圍是由指數的位數來決定的。float的指數字有8位,而double的指數字有11位,分布如下 float 1bit 符號位 8bits 指數字 23bits 尾數字 double 1bit 符號位 11bits 指數字 52bits 尾數字 於是,float的指...

float,double範圍和精度

今天遇到一題zoj 1128,資料範圍是 0 x1下面引用 1.範圍 float和double的範圍是由指數的位數來決定的。float的指數字有8位,而double的指數字有11位,分布如下 float 1bit 符號位 8bits 指數字 23bits 尾數字 double 1bit 符號位 11...