Python編碼問題

2021-04-26 18:50:20 字數 602 閱讀 9981

tag:python,encoding,unicode

現有的字元編碼:ascii,gbk,gb2312,utf-8,unicode......unicode可以用來表示所有語言的字元,而且是定長雙位元組(也有四位元組的)編碼,包括英文本母在內。

python中定義乙個unicode字串和定義乙個普通字串一樣簡單,引號前小寫的「u」表示這裡建立的是乙個unicode字串。

>>> s=u'hello world !'

**檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u'*'。unicode資料可以使用encode函式,再自由轉換為其他格式的資料,相當於乙個統一的平台。

將輸入的gb2312格式的資料解碼為unicode

>>> '你好'.decode('gb2312')

u'/u4f60/u597d'

輸入資料的格式取決於所用shell終端的編碼設定。

解碼同時轉換為utf8

>>> '你好'.decode('gb2312').encode('utf8')

'/xe4/xbd/xa0/xe5/xa5/xbd'

python編碼問題

python裡面基本上要考慮三種編碼格式 1 原始檔編碼 在檔案頭部使用coding宣告。告訴python直譯器該 檔案所使用的字符集。usr bin python coding utf8 2 內部編碼 檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u uni...

Python編碼問題

python裡面基本上要考慮三種編碼格式 1 原始檔編碼 在檔案頭部使用coding宣告。告訴python直譯器該 檔案所使用的字符集。usr bin python coding utf8 2 內部編碼 檔案中的字串,經過decode以後,被轉換為統一的unicode格式的內部資料,類似於u uni...

Python編碼問題

實現過程如下 import sys 獲取現在系統的編碼格式 type sys.getfilesystemencoding file r h musicpack 004.奈落 花 今日的 5年2班.轉換成現在系統的編碼 file file.decode utf 8 encode type 解決問題。在...