Python 字串編碼

2022-09-18 20:57:10 字數 1187 閱讀 5566

'''

對於單個字元的編碼,python提供了ord()函式獲取字元的整數表示,chr()函式把編碼轉換為對應的字元

'''print(ord('a')) # 97

print(ord('a')) # 65

print(ord('0')) # 48

print(chr(97)) # 'a'

print(chr(65)) # 'a'

print(chr(48)) # '0'

# 計算 str 的字元數

print(len('acb')) # 3

print(len('中國')) # 2

# 計算 bytes 的位元組數

print(len('abc'.encode('utf-8'))) # 3,經過utf-8編碼後,1個英文本元占用1個位元組

print(len('中文'.encode('utf-8'))) # 6,經過utf-8編碼後,1個中文字元占用3個位元組

'''

以unicode表示的str通過encode()方法可以編碼為指定的bytes

-- 純英文的str可以用ascii或者utf-8編碼為bytes,結果是一樣的,因為utf-8相容ascii

-- 含有中文的str可以用utf-8編碼為bytes

-- 含有中文的str不可以用ascii編碼,因為中文編碼的範圍超過了ascii編碼的範圍,python會報錯

'''s1 = 'abc'

s2 = '大中國'

s1.encode('utf-8')

s1.encode('ascii')

s2.encode('utf-8')

# s2.encode('ascii') # 報錯

'''

bytes.decode('utf-8')

'''s1 = 'abc'

s2 = '大中國'

b1 = s1.encode('utf-8')

b2 = s1.encode('ascii')

b3 = s2.encode('utf-8')

s1 = b1.decode('utf-8')

s2 = b2.decode('ascii')

s3 = b3.decode('utf-8')

Python字串編碼

在python中有些特殊的地方是存在兩種字串,分別為str和unicode字串,他們都繼承自basestring。如 s hello world s為str us u hello world us為unicode。使用help str 和help unicode 可以檢視各自說明,他們都有decod...

python字串編碼

常見字元編碼型別 ascii 美國資訊交換標準碼,是目前計算機中最廣泛使用的字符集編碼。每個 ascii 碼以 1 個位元組 儲存,例如數字字元 0 的 ascii 碼是 0110000,十進位制表示為 48。unicode 為解決世界上上百種語言帶來混合 衝突,各國有各國的標準,顯示很容易出現亂碼...

Python字串 編碼

字串str 作用 用來記錄文字資訊 字面值表示方法 用引號括起來的部分都是字串 單引號 雙引號 三單引號 三雙引號 空字串 字串的字面值表示方式 hello hello hello hello 單引號和雙引號的區別 單引號內的雙引號不算結束符 雙引號內的單引號不算結束符 三引號的作用 三引號內可以包...