Python編碼問題

2021-08-15 17:21:47 字數 650 閱讀 2503

在用python的過程中,有個很蛋疼的問題就是python有python 2.x和python3.x,現在基本上2.x已經不更新了,所有後面學習的直接學3.x就可以了,但是以前一些專案是2.x的,搞清楚裡面的編碼還是很有必要的。

python 2.x預設是ascii編碼的,而python 3.x預設是utf-8。字串在2.x有二種型別(str()和unicode()):

s1="str"

s1=u"unicode"

3.x裡面的字串只有一種str()型別,這裡的str()型別等價於py3裡面的unicode型別:

s1="str"

s1=u"str"

在3.x也新增了bytes型別:

s3= b'bytes'
這個bytes主要處理二進位制資料。str物件和bytes物件可以使用encode()/decode()方法相互轉化。

b=b'python'

s = b.decode()

print (type(s))

b2=s.encode()

print (type(b2))

'str'>

'bytes'>

Python編碼問題

tag python,encoding,unicode 現有的字元編碼 ascii,gbk,gb2312,utf 8,unicode.unicode可以用來表示所有語言的字元,而且是定長雙位元組 也有四位元組的 編碼,包括英文本母在內。python中定義乙個unicode字串和定義乙個普通字串一樣簡...

python編碼問題

python裡面基本上要考慮三種編碼格式 1 原始檔編碼 在檔案頭部使用coding宣告。告訴python直譯器該 檔案所使用的字符集。usr bin python coding utf8 2 內部編碼 檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u uni...

Python編碼問題

python裡面基本上要考慮三種編碼格式 1 原始檔編碼 在檔案頭部使用coding宣告。告訴python直譯器該 檔案所使用的字符集。usr bin python coding utf8 2 內部編碼 檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u uni...