浮點數相關

浮點數(float,double) 精度問題與巨集定義(#define)

float（單精度） double（雙精度）

位元組 4 8

32位 64位

float型別所占用4個位元組則會有32位，而在儲存時，系統會將實型資料分成小數部分和指數二個部分來儲存。由於小數也存在正負，最前面的單獨一位來表示符號位。0表示正數。1表示負數。當然，這種時採取的時十進位制儲存資料。

我們知道9的二進位制表示為1001，所以4bit能精確十進位制中的1位小數點，24bit就能使float能精確到小數點後6位，同理：double型別資料能精確到小數點後15位。對於指數部分，因為指數可正可負，8位的指數字能表示的指數範圍就應該為:-127-128了，所以指數部分的儲存採用移位儲存，儲存的資料為元資料+127

在計算機中使用二進位制的方法來儲存資料：怎麼表示呢？將十進位制的資料轉化為二進位制儲存

符號位+指數字+尾數字

float 1 8 23

double 1 11 52

符號位依然為 0表示正數 1表示負數

8.25，用二進位制的科學計數法表示為:1000.1->1.0001*2^3

符號位為:0，表示為正，指數字為:3+127=130 ,位數部分為,故8.25的儲存方式如下圖所示:

精度問題：可以巨集定義的方式來定義精度,

表示誤差時，比如誤差範圍+-0.01,真實的距離x，合理的範圍是y

x-0.01<=y&&y<=x+0.01

巨集定義(#define)：我們在書寫長長的程式時，當我們要對其中的乙個數進行修改時，我們不可能把程式中的此資料逐個找出來進行修改，這時候，便有了巨集定義（#define）

例：求ax^2+bx+c=0的解的情況

因為浮點數的表示會存在一些誤差，所以應該用eps來定義誤差的範圍，使得結果較為準確

#include

#define eps 0.000001

void fun(double a,double b,double c)

double x1;

double x2;

double d = b*b - 4*a*c;

//if(a == 0)//error

if(-eps<=a &&ax1 = x2 = -c/b;

printf("x1=%f,x2=%f\n",x1,x2);

else //a != 0

if(-eps<=d&& d<=eps)//d==0

x1=x2=-b/(2*a);

printf("x1=%f,x2=%f\n",x1,x2);

else

if(d > eps)

x1 =(-b+sqrt(d))/(2*a);

x2 =(-b-sqrt(d))/(2*a);

printf("x1=%f,x2=%f\n",x1,x2);

else //d<0

printf("無實根\n");

int main()

fun(0,1,2);

fun(1,2,1);

fun(1,4,2);

fun(1,1,1);

return 0;

浮點數相關

浮點數相關

浮點數相關

浮點數 儲存

相關推薦

浮點數儲存