Python學習筆記(二)字元編碼轉化

2021-08-14 16:15:48 字數 445 閱讀 6917

python剛開始出來時只支援ascii,到後來逐漸支援unicode和utf-8。如何將unicode和utf-8轉化了?就要用到「encode( )和decode( )『』。將unicode轉化為utf-8,例如:

『』'中文'.encode('utf-8') 『』-> 『』b'\xe4 \xb8 \xad \xe6 \x96 \x87'『』

是將這個字元用utf-8的規則編碼為位元組。而變回來則是:

「 b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')」->" '中文' "。

將這些位元組用utf-8的規則解碼回去。如果有一部分有誤的話,我們可以在decode( )這個函式中加乙個引數,將錯誤的位元組傳入'ignore'中。

「 b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')  」->「 '中' 」。

Python自學筆記 3 字元編碼

可變長編碼 utf 8編碼可根據內容改變位元組數,ascii編碼實際上可以被看成是utf 8編碼的一部分 python提供了ord 函式獲取字元的整數表示,chr 函式把編碼轉換為對應的字元 ord a 65 ord 中 20013 chr 66 b chr 25991 文 如果知道字元的整數編碼,...

Python(二)學習筆記 一 字符集和編碼

1.計算機存的是二進位制,我們平時使用的漢字都不是二進位制,存在計算機裡用的是字元編碼。2.字符集就是一套文字元號及其編碼的描述。字符集有很多種。3.概念 a.位 計算機中的最小單位,二進位制中的一位,用0 1表示。位元 b.位元組 八位組成乙個位元組。乙個漢字可以是兩個或三個位元組 c.字元 我們...

python學習之路 三 字元編碼

本節重點 補充知識點 三元運算 三元運算又稱為三目運算,是對簡單的條件語句的簡寫,如 if 條件成立 val 1 else val 2 改寫成三元運算 val 1 if 條件成立 else 2 c 中的寫法 int i 條件成立?1 2 由於每個國家都有自己的字元編碼方式,所以其對應關係也覆蓋了自己...