常用編碼方式的轉換

2021-08-26 09:03:44 字數 850 閱讀 3886

雖說有多種編碼方式,實際上除ascii碼外,其它區位碼、國標碼基本上都是一回事,只是其編碼的方式不同、對漢字的訪問方式不同。機內碼是機器語言編碼,它包括有語言的解釋、各類字元的機器編碼等。ascii碼是常用的字元、符號,為1到255,十六進製制01到ff。區位碼是包括漢字在內的特殊字符集,共分87區,94位,其基數都是從0開始。國標碼實際上是區位碼的字符集,只是其編碼的基數與區位碼有所區別,一般用十六進製制表示,區數從21到79,位數從21到7e。機內碼的字符集編碼是區碼從a1到f7,位碼是從a1到fe。

區位碼

01 01

03 04

05 06

07 08

國標碼

21 22

23 24

25 26

27 28

機內碼

a1 a2

a3 a4

a5 a6

a7 a8

16 30

啊 阿

埃 挨

哎 唉

哀 皚

b0 1.ascii碼:

ascii碼0至32一般為功能控制,48至57為0到9數字,58至90為大寫字母,97至122為小寫字母,其它為常用符號。

2.區位碼:

區位碼的1區是常用圖案符號,2區是序數標數,3區是與ascii相近的常用符號,4、5區日文片假名,6區是拉丁文,7區是俄文,8區是漢語拼音,9區是製表符,16區以後是漢字區。10區至15區為空區。

3.國標碼:

國標碼的推算公式:國標碼=區位碼+20

4.機內碼:

機內碼的推算公式:

機內碼=區位碼+a0

編碼技術:

編碼方式及轉換

ascii碼 用八位二進位制表示乙個英文 乙個位元組 unicode 中英文均用32位二進位制表示 四個位元組 utf 8 英 8位 乙個位元組 中 24位 三個位元組 gbk 英 8位 乙個位元組 中 16位 兩個位元組 1 各個編碼之間的二進位制不能相互識別 2 檔案的儲存,傳輸不能是unico...

mysql 轉換編碼方式

vim etc my.cnf 在 mysqld 標籤下加上三行 default character set utf8 character set server utf8 在 mysql 標籤下加上一行 default character set utf8 在 mysql.server 標籤下加上一行...

計算機常用編碼方式

常用編碼方式 標準ascii碼 擴充套件ascii碼 utf 8 utf 16。用乙個位元組大小表示常用的字元,最開始ascii碼只表示128個字元,只需要7位表示,最高位統一用0表示。ascii碼編碼方式通過大端方式對齊。不同國家,使用的字元不一致,僅僅128個字元不夠使用,所以針對本國字元特點,...