python 學習 unicode 編碼

2021-06-14 04:11:17 字數 1051 閱讀 5614

如果**檔案需要制定編碼格式如utf-8:

1.要在檔案開始時寫如下注釋

# coding=utf-8 

2.或則 使用以下**

import sys

reload sys

sys.setdefaultencoding('utf-8')

說明:unicode支援不同的編碼方式,最著名的的是utf-8.  ascii字元 的utf-8 編碼 與ascii編碼完全一致。

此外,在程式中不要使用string模組,使用unicode()和unichar()函式代替str()和chr() 函式  (python 3.x 中 str() chr() 預設支援unicode)

一般對檔案操作、socket操作,需要把內容轉換為utf-8,處理完後再轉換回來。

如 以utf-8編碼格式 寫入檔案,  讀檔案後 可進行解碼

# coding=utf-8

def toutf_8(s):

if type(s).__name__=='unicode':

return s.encode('utf-8')

else:

return s

def tounicode(s):

if type(s).__name__!='unicode':

return s.decode('utf-8')

else:

return s

codec = 'utf-8'

file = 'unicode.txt'

hello_out = u"世界\n"

bytes_out = toutf_8(hello_out)

f = open(file, "w")

f.write(bytes_out)

f.close()

f = open(file, "r")

bytes_in = f.read()

f.close()

hello_in = tounicode(bytes_in)

print hello_in

Python學習筆記 Unicode

這裡簡單的說一下。下面內容基本上時從 python.core.programming.2ed 上摘的 unicode是計算機可以支援這個星球上的多種語言的秘密 在unicode之前,用的都是ascii,ascii嗎非常簡單,每個英文本元都用7位二進位制數的方式儲存在計算機內,其範圍是32到126.它...

Python學習筆記 Unicode

內容摘自 python核心程式設計 unicode是計算機可以支援這個星球上的多種語言的秘密 在unicode之前,用的都是ascii,ascii嗎非常簡單,每個英文本元都用7位二進位制數的方式儲存在計算機內,其範圍是32到126.它的實現原理這裡也不說了。但是ascii碼只能表示95個可列印的字元...

Python學習筆記 Unicode

普通字串可以用多種方式編碼成unicode字串,具體要看你究竟選擇了哪種編碼 unicodestring u hello world 將unicode轉化為普通python字串 encode utf8string unicodestring.encode utf 8 asciistring unic...