常用的編碼

2021-08-14 10:20:25 字數 530 閱讀 3883

ascii碼是標準化字符集,使用7個二進位制位編碼,可以表示128個字元,通常ascii表示的是英文本母的二進位制編碼,

例如大寫字母'a'的二進位制編碼為65,python**如下:

>>> ord('a')

65>>> chr(65)

'a'

unicode是另外一種編碼方式,是為了解決傳統編碼方式的侷限而產生的,它為每種語言中的每個字元設定了統一並且唯一的二進位制編碼,以滿足跨語言、跨平台進行文字轉化的要求。對每種語言的每個字元用兩個位元組長的id號進行編碼,從而規定出乙個多達65536個字元的編碼空間。

utf-8編碼是一種可變長度的unicode的實現方法,是乙個多位元組的編碼體系,英文對應unicode的單位元組,中文、日韓文對應unicode的三位元組。我們可以看出utf-8與unicode編碼方式的區別是,編碼長度的不同。unicode採用固定長度的兩個位元組來表示,而utf-8可以採用一到四個位元組,不同的長度來表示。

常用的編碼簡介

分類編碼標準說明 單位元組字元編碼 iso 8859 1 最簡單的編碼規則,每乙個位元組直接作為乙個 unicode 字元。比如,0xd6,0xd0 這兩個位元組,通過 iso 8859 1 轉化為字串時,將直接得到 0x00d6,0x00d0 兩個 unicode 字元,即 反之,將 unicod...

常用編碼演算法

b 1.base64 b 每6個bit位在高位添2個0形成乙個可讀的8位,這樣3個原始8位變成4個編碼8位,3 8 4 6 編碼後的8位值從0 63依次對映為大小寫字母52個,數字10個,然後 b b 和 b b 共64個字元.如果原始字元數不是3的倍數,用值0位元組填充,用字元 b b 的個數表示...

常用編碼格式

rust實現 目錄const base64 std u8 64 b a b b b c b d b e b f b g b h b i b j b k b l b m b n b o b p b q b r b s b t b u b v b w b x b y b z b a b b b c b ...