python2 編碼問題

2021-10-05 18:24:54 字數 315 閱讀 5386

# -*- coding: utf-8 -*-

import sys

reload(sys)

sys.setdefaultencoding('utf8')

第一行是讓**以utf8格式解析

後面三行是讓python直譯器在decode時候用utf8進行decode

這樣所有字串都是utf8的了,如果遇到非utf8字串可以用decode轉化為unicode,然後在用encode將unicode轉化為utf8字串就可以了

另外 乙個字串前面帶u 就是直接是定義為unicode了

Python2編碼問題

以下內容說的都是 python 2.x 版本 我們看到的輸入輸出都是 字元 characters 計算機 程式 並不能直接處理,需要轉化成位元組資料 bytes 因為程式只能處理 bytes 資料。例如 檔案 網路傳輸等,處理的都是 bytes 資料 二進位制數字。孤立的 byte 是毫無意義的,所...

Python2編碼問題

以下內容說的都是 python 2.x 版本 我們看到的輸入輸出都是 字元 characters 計算機 程式 並不能直接處理,需要轉化成位元組資料 bytes 因為程式只能處理 bytes 資料。例如 檔案 網路傳輸等,處理的都是 bytes 資料 二進位制數字。孤立的 byte 是毫無意義的,所...

Python2 的編碼問題

比如這樣乙個字串 u6768 u777f 無論怎麼print它都是這個形式因為它是文字,不是編碼,那麼怎麼轉為中文呢,則需要用如下命令 print text.decode unicode escape 就代表著乙個字 對於這些字元,只需要使用如下命令即可從文字轉為編碼字串 print text.de...