python中的編碼處理

2021-06-05 11:33:14 字數 616 閱讀 1884

#!/usr/bin/env python

#-*- coding: cp936 -*-

import codecs

import sys

if __name__ == '__main__':

if len(sys.argv) != 5:

print 'python %s infile decodetype outfile encodetype' % sys.argv[0]

sys.exit(1)

fin = codecs.open(sys.argv[1],'r',sys.argv[2])

fout = codecs.open(sys.argv[3],'w',sys.argv[4])

fout.write(''.join(fin.readlines()))

str = '中國人'

coco = codecs.lookup('gbk')

b = coco.decode(str)

print b[1],b[0],type(b[0])

b2 = coco.encode(b[0])

print b2[1],b2[0],type(b2[0])

Python編碼中的坑及處理方法

python虐我千百遍,我待python如初戀。使用python編寫模型指令碼,其中python的編碼讓我一路採坑。首先報的乙個錯誤就是 traceback most recent call last file line 1,in unicodedecodeerror ascii codec can...

python 中文編碼的處理

在win下寫點python的 對utf 8 老是處理不過來,並且解析一點漢字總會遇到一些漢字的編碼問題。下決心把它解決掉。1 嘗試第一種方式 utf8string utf8string.decode utf 8 utf8string utf8string.encode gbk 這個時候顯示基本上是正...

python處理檔案編碼

對於儲存自然語言的檔案,有可能採用了不同的編碼,例如漢字的編碼就有多種,utf 8,gb2312,gb18030,iso 8859等字元編碼格式。當處理各種檔案的時候,就需要在各種檔案格式之間轉換,由於utf 8字元編碼格式相容於ascii,且多位元組編碼,不存在大小端的問題,可以使用已有的c語言庫...