Python編碼問題

2021-09-08 07:44:39 字數 327 閱讀 5600

從python2.7公升級到python 3.2,發現郵件接收也改變了.

hdr,message,octet=popclient.retr(1)

原來返回的message是字串列表,現在返回的是bytes列表.

如果想以字串來處理的話,需要對bytes進行解碼,可郵件的編碼實在是太多了,測試發現:

上的chardet非常好用:

import chardet

cd=chardet.detect(astr)

然後會返回乙個字典:

直接使用cd['encoding']就知道是什麼編碼了.

唉,自己還要做許多任務作.

Python編碼問題

tag python,encoding,unicode 現有的字元編碼 ascii,gbk,gb2312,utf 8,unicode.unicode可以用來表示所有語言的字元,而且是定長雙位元組 也有四位元組的 編碼,包括英文本母在內。python中定義乙個unicode字串和定義乙個普通字串一樣簡...

python編碼問題

python裡面基本上要考慮三種編碼格式 1 原始檔編碼 在檔案頭部使用coding宣告。告訴python直譯器該 檔案所使用的字符集。usr bin python coding utf8 2 內部編碼 檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u uni...

Python編碼問題

python裡面基本上要考慮三種編碼格式 1 原始檔編碼 在檔案頭部使用coding宣告。告訴python直譯器該 檔案所使用的字符集。usr bin python coding utf8 2 內部編碼 檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u uni...