改變 Python 原始檔的編碼格式

2021-09-10 12:43:48 字數 599 閱讀 8798

建議在python2.x中嘗試:

# -*- coding: utf-8 -*-

# 使用python2.x直譯器,可以看出源**不同編碼的時的區別

s0 = '中文'

print (repr(s0))

# 若是 coding:gbk 則輸出 '\xd6\xd0\xce\xc4'

# 若是 coding:utf-8 則輸出 '\xe4\xb8\xad\xe6\x96\x87'

若是在 python3.x中嘗試:

# -*- coding: utf-8 -*-

# 使用python2.x直譯器,可以看出源**不同編碼的時的區別

s0 = '中文'

print (repr(s0))

# 若是 coding:gbk 則輸出 '中文'

# 若是 coding:utf-8 則輸出 '中文'

看不出明顯的區別;

注:改變源**編碼格式的語句,與正規表示式有關,有時間再看;

改變源**編碼格式的語句必須寫在原始檔的第一行或者第二行;

寫源**的編碼格式語句有助於程式的可移植性

Python原始檔的字元編碼

預設情況下,python 原始碼檔案以 utf 8 編碼方式處理。在這種編碼方式中,世界上大多數語言的字元都可以同時用於字串字面值 變數或函式名稱以及注釋中 儘管標準庫中只用常規的 ascii 字元作為變數或函式名,而且任何可移植的 都應該遵守此約定。要正確顯示這些字元,你的編輯器必須能識別 utf...

python改變檔案的編碼格式

1 defchange file code coding,files name 2try 3 cache data linecache.getlines files name 4 with open files name,wb as out file 5for line in range len c...

原始檔編碼方式

漢字 gbk編碼 ba ba d7 d6 utf 8編碼 e6 b1 89,e5 ad 97 utf 16be編碼 6c 49,5b 57 兩種常用編譯器gcc,cl中對unicode字面值的實現 gcc中跟編碼方式轉換有關的三個編譯選項 有了以上鋪墊,下面兩條語句的意義就很清楚了 注1 gcc在4...