字元和位元組

2021-08-08 20:19:06 字數 611 閱讀 7762

(一)「位元組」的定義

位元組(byte)是一種計量單位,表示資料量多少,它是計算機資訊技術用於計量儲存容量的一種計量單位。

(二)「字元」的定義

字元是指計算機中使用的文字和符號,比如1、2、3、a、b、c、~!·#¥%……—*()——+、等等。

(三)「位元組」與「字元」

它們完全不是乙個位面的概念,所以兩者之間沒有「區別」這個說法。不同編碼裡,字元和位元組的對應關係不同:

①ascii碼中,乙個英文本母(不分大小寫)佔乙個位元組的空間,乙個中文漢字佔兩個位元組的空間。乙個二進位制數字序列,在計算機中作為乙個數字單元,一般為8位二進位制數,換算為十進位制。最小值0,最大值255。

②utf-8編碼中,乙個英文本元等於乙個位元組,乙個中文(含繁體)等於三個位元組。

③unicode編碼中,乙個英文等於兩個位元組,乙個中文(含繁體)等於兩個位元組。

符號:英文標點佔乙個位元組,中文標點佔兩個位元組。舉例:英文句號「.」佔1個位元組的大小,中文句號「。」佔2個位元組的大小。

④utf-16編碼中,乙個英文本母字元或乙個漢字字元儲存都需要2個位元組(unicode擴充套件區的一些漢字儲存需要4個位元組)。

⑤utf-32編碼中,世界上任何字元的儲存都需要4個位元組。

字元和位元組

不同的字元所佔的位元組是不同的。ascii碼 乙個英文本母 不分大小寫 佔乙個位元組的空間,乙個中文漢字佔兩個位元組的空間。乙個二進位制數字序列,在計算機中作為乙個數字單元,一般為8位二進位制數,換算為十進位制。最小值0,最大值255。如乙個ascii碼就是乙個位元組。utf 8編碼 乙個英文本元等...

php 字元和位元組

字元的簡介 在js中,中文佔兩個字元,英文佔乙個字元 在php中,不同編碼下不相同,在gbk gb2312編碼下乙個中文佔2個字元,utf 8 unicode編碼下乙個中文佔3個字元 php在utf 8編碼下,乙個漢字佔3個位元組,gbk編碼下只佔2個位元組。z f 字元是可使用多種不同字元方案或 ...

位元組和字元關係

ascii碼 乙個英文本母 不分大小寫 佔乙個位元組的空間,乙個中文漢字佔兩個位元組的空間。乙個二進位制數字序列,在計算機中作為乙個數字單元,一般為8位二進位制數,換算為十進位制。最小值0,最大值255。如乙個ascii碼就是乙個位元組。utf 8編碼 乙個英文本元等於乙個位元組,乙個中文 含繁體 ...