字符集和編碼

2021-06-09 00:02:22 字數 529 閱讀 9181

什麼是字元?

字元就是文字和符號的統稱,

字符集就是多個字元的集合,字符集有很多種,常見的有ascii,gb2312,unicode字符集。

什麼是編碼?

計算機要準確的處理字符集中的文字,就需要對字元進行編碼。

對unicode字符集編碼的叫做unicode編碼,

對ascii字符集編碼叫做ascii編碼。

ascii編碼

它只有七位,能夠表示128個字元。由於只支援128個字元,所以ascii有擴充套件的字符集,擴充套件的字符集用8位來表示,能夠表示256個字元。

ansi編碼

ansi編碼是一種特殊的編碼方式,當乙個字元在0x00~0x7f之間的時候,用乙個1個位元組來表示,當在0x80~0xff時候,需要用兩個位元組來儲存

比如:"12我們"  就需要用6個位元組來儲存

更多詳細介紹:

unicode編碼

unicode碼也是一種國際標準編碼,採用二個位元組編碼,與ansi碼不相容。目前,在網路、windows系統和很多大型軟體中得到應用。

字符集和字符集編碼詳解

gb2312 gbk ascii asni unicode utf 8等等,這些字眼非常常見,同時帶來許多的問題。本文只是從理解的角度,說明以上內容的不同含義從而達到區分其用法的目的是夠了的。至於實現方式,可以查閱各自的詳細標準官方文件。先解釋乙個概念,什麼是字符集,嗯,不解釋了,我弄乙個吧 從今以...

編碼和字符集

ascii unicode gb2312等都是字符集,用於定義編號指代的字元。utf 8,utf 16則是unicode的編碼格式。ascii ascii只有128個,能表示英文 數字 常用符號。gb2312 gb2312是中文特有的字符集,有2萬多個字元,前128個和ascii保持一致,因此能相容...

字符集和編碼

今天被乙個python編碼問題折騰了半下午。編碼問題一直是個讓人比較糾結的問題,寫這篇文章想簡單的總結下python中一些常見的編碼問題以及解決方式。這是第一篇,先總結下字符集和編碼的一些基本概念和內容。當中ascii標準本身就規定了字元和字元編碼方式,採用單位元組編碼,總共能夠編碼128個字元,如...