字符集和字元編碼學習

2021-06-19 05:26:32 字數 589 閱讀 3253

做嵌入式應用軟體開發,總是少不了要跟字符集和字元編碼打交道。

字符集是各種文字和符號的總稱。

常見的字符集有ascii字符集、gb2312字符集、big5字符集、unicode字符集等,

每一種字符集支援的字元個數並不相同。

因為計算機無法像人類一樣識別自然界中的具體事物,它只能識別0和1這兩個二進位制數字。

所以在向計算機輸入資料時,計算機必須要有一套編碼系統,將資料編碼成0/1這樣的計算機識別的資料;

計算機輸出時,也必須有一套解碼系統,將編碼後的資料還原成原始的具體資訊,這樣人類才能容易識別。

字元編碼正是這樣的一套系統,它將具體的字符集按照一定的編碼規則轉換成一套計算機可識別的數字集。

所以通常對於一套具體的字符集都有一套對應的字元編碼方式,比如ascii字符集有ascii編碼方式、

unicode字符集有unicode字元編碼方式等。

unicode是一種字符集。

utf-16是unicode編碼的一種實現方式,是雙位元組編碼;

utf-8是一種ascii相容的可變長編碼方式。

所以對於和ascii字符集中相同的字元編碼成utf-16字元的,可以很容易實現轉換。

字符集和字符集編碼詳解

gb2312 gbk ascii asni unicode utf 8等等,這些字眼非常常見,同時帶來許多的問題。本文只是從理解的角度,說明以上內容的不同含義從而達到區分其用法的目的是夠了的。至於實現方式,可以查閱各自的詳細標準官方文件。先解釋乙個概念,什麼是字符集,嗯,不解釋了,我弄乙個吧 從今以...

字符集和字元編碼

字符集和字元編碼不錯的部落格 字符集 是乙個系統支援的所有抽象字元的集合。字元是各種文字和符號的總稱,包括各國家文字 標點符號 圖形符號 數字等。asicc,unicode,gbk,gb2312等 字元編碼 是一套法則,使用該法則能夠對自然語言的字元的乙個集合 如字母表或音節表 與其他東西的乙個集合...

字符集和字元編碼

字符集 建立文字檔案預設使用ansi,就是系統預設編碼方式,中文window系統預設使用gbk編碼方式 位元組 這是最基本的概念,位元組是計算儲存容量的一種計量單位,我們知道計算機只能識別1和0組成的二進位制位,乙個數就是1位 bit 為了方便計算,我們規定8位就是乙個位元組 字元 字元和位元組不太...