python中bytes和str型別的區別

經過一上午的查詢資料。大概理清楚了bytes型別和str型別的區別。

bytes型別和str型別在呈現形式有相同之處，如果你print乙個bytes型別的變數，會列印乙個用b開頭，用單引號括起來的序列。比如:　　

>>> c = b'\x80abc'

>>> twww.cppcns.comype(c)

bytes

我們看到c = b'\x80abc'表示的就是乙個bytes型別。是不是和字串很像？只是前面多出來乙個b。那b'\x80abc的含義是什麼呢？\x80即16進製制的兩位數，代表十進位制的0-255，同時也代表乙個位元組，8個bit。abc，即英文本母abc，為什麼這裡不是\x...的形式呢。因為在utf-8裡，乙個ascii碼的儲存形式完程式設計客棧全不變，乙個a也就用乙個位元組來儲存。

那麼b'\x80abc'的儲存情況就完全明白了，一共四個位元組，每個位元組值的情況一目了然。下面再做乙個實驗。

>>> a = bngezn'\xe5\x9d\x8fhello'.decode("utf-8","strict")

>>> a

'壞hello'

>>> type(a)

str首先要知道utf-8是可變長編碼。中文字元佔3個位元組，『壞'字的utf-8碼為\xe5\x9d\x8f 。那麼給定乙個bytes序列 b'\xe5\x9d\x8fhello'，用utf-8解碼，顯然能得到壞hello。並且我們看到，解碼之後，a已經變成了str型別，和預想一模一樣。

假如python無法將乙個二進位制解碼成utf-8碼，則會報錯。比如程式設計客棧解碼b'\xwww.cppcns.com80abc'則會報錯：

'utf-8' codec can't decode byte 0x80 in position 0:invalid start byte

本文標題: python中bytes和str型別的區別

本文位址:

python中bytes和str型別的區別

python中string和bytes互轉

Python3中bytes和HexStr之間的轉換

python3 中bytes和str型別

python中bytes和str型別的區別

python中string和bytes互轉

Python3中bytes和HexStr之間的轉換

python3 中bytes和str型別

相關推薦