字符集與字元編碼

2021-09-10 02:14:24 字數 699 閱讀 2799

字符集(charset):是乙個系統支援的所有抽象字元的集合。字元是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。

常用字符集

ascii:英語字符集,1位元組,前127是英文+數字,127-255是特殊符號

gb***x(gb2312,gb18030):**字符集,2位元組,包含ascii前127位

big5:**繁體字符集

gbk:中文字符集(編碼與gb***x不同),2位元組,包含ascii前127位

unicode:統一碼,4位元組(對應編碼utf-32/utf-16/utf-8),包含ascii前127位,漢字在unicode中的範圍0x4e00到0x9fa5

字元編碼(character encoding):字符集與數字系統的對應關係

常用編碼

iso-8859-1單位元組編碼

gbk雙位元組編碼

utf-8變長位元組編碼方式

utf-32(unicode)固定四位元組

posted @

2013-02-27 23:39

00000000o 閱讀(

...)

編輯收藏

字符集與字元編碼

字符集 字符集是各種文字和符號的總稱,也就是多個字元的集合,而常見的字符集有 ascii字符集 iso 8859字符集 gb 2312字符集 big 5字符集 gbi 8030字符集 unicode字符集等。計算機要能夠識別和儲存各種字元,就要對各種字符集進行字元編碼。字元編碼 編碼和字符集不同,字...

字符集與字元編碼

目錄 字符集和字元編碼 unicode字符集 utf 8 utf 16 ascii碼 中文字符集 gbk gb2312 gb18030 字符集 字符集只是乙個規則集合的名字,字符集 字型檔表 character repertoire 編碼字符集 coded character set 字元編碼 ch...

字符集與編碼

前言 今天notepad 檢視測試傳過來的乙個log,開啟後竟然有部分亂碼,無法檢視完整資訊,嘗試更改編碼後仍未能解決,同事告知使用瀏覽器開啟或許可以,於是搗鼓一下,使用瀏覽器開啟並選擇編碼unicode utf 8 後終於正常顯示,順利解決問題。亂碼顯示的問題以前也經常遇到,從未認真對待過,剛好稱...