python 3字元編碼

2022-03-17 02:58:17 字數 955 閱讀 5926

在python2中預設是ascii編碼,python3是utf-8編碼

在python 的源**檔案中經常會看到:

>>> a='中文'

>>>type(a)

'str

'>

>>> b=bytes(a,encoding='

utf-8')

>>>bb'

\xe4\xb8\xad\xe6\x96\x87

'>>>type(b)

'bytes

'>

>>>

以上的**都在python 的記憶體中,可以看到將a 轉換為二進位制資料,佔了6個位元組,  在計算機中為了方便顯示,通常用16進製制來表示2進製資料

因為乙個16進製制位可以用4個二進位制位來表示。

e4實際上乙個位元組大小,e 1110 4 0100 e4 用二進位制就是11100100

>>> c=bytes(a,encoding='

gbk'

)>>>cb'

\xd6\xd0\xce\xc4

'>>>

當用gbk 編碼去轉換為二進位制的時候,就成了4個位元組,在gbk 中,乙個中文字元用2個位元組來表示

一般在乙個字元前面加u 表示是unicode 字元, 0x是十六進製制數,0x 是八進位制數。0b 是二進位制數

用內建函式bin() oct() hex() 可以進行各進製的轉換

>>> d=0xe4

>>>bin(d)

'0b11100100

'>>> d=0b11100100

>>>hex(d)

'0xe4

'>>>

>>> chr(65)'a

'>>> ord('a'

)65>>>

Python 3「字串和編碼「

python3 字串是以unicode編碼 字元的表示轉換函式 str變為bytes方法 bytes變為str方法 注意!中文不能轉為ascii編碼 len 函式 儲存源 時,通常要在檔案開頭加上兩行 usr bin env python3 coding utf 8 格式化 小明的成績從去年的72分...

python3 字串編碼相關

編碼型別很多,常見的例如 ascii碼 最早被編入計算機中的,長度是128,主要是為了解決英文本元 gb2312 中國人編碼的,為了解決中文 unicode 統一多種編碼方式,降低亂碼 utf 8 unicode的改進版,節省編碼長度 python3預設編碼方式是 utf 8 編碼方式相互轉換 de...

python3字串相等 python3 字串

1 拼接 1 多個字串進行連線 連線符,必須左右資料型別一致 例 print hello world 結果 helloworld 例 print 5 world 結果 typeerror unsupported operand type s for int and str 2 多個相同字串連線 字串...