python亂碼解決

2021-08-29 02:27:48 字數 639 閱讀 4903

利用chardet.detect 解析字串的格式先,然後將其轉碼unicode,然後再轉為utf-8

# coding=utf-8

import sys

import chardet

import codecs

import os

reload

(sys)

sys.setdefaultencoding(

'utf-8'

)filet = codecs.

open

(r'c:\users\gekl\desktop\sogouc.reduced\reduced\c000010\1032.txt'

,'r'

)fencoding=chardet.detect(filet.read())

print fencoding

# 結果為乙個概率型別, 百分之96的可能性為gb2312

# 那麼就將字串現由gb2312變成unicode,利用decode。再將unicode變成utf-8.利用encode完成

print filet.decode(

'gb2312'

).encode(

'utf-8'

)

python 亂碼轉碼 Python解決亂碼問題

解決python亂碼問題 字串在python的內部採用unicode的編碼方式,因此,在做編碼轉換時,通常需要以unicode作為中間編碼,即先將其他編碼的字串解碼 decode 成unicode,再從unicode編碼 encode 成另一種編碼。編碼是一種用二進位制資料表示抽象字元的方式,utf...

python 亂碼解決

方法一 直接引入sys,設定全域性編碼,有時候不太好用。import sys reload sys sys.setdefaultencoding utf 8 方法二 讀取檔案到時候,decode設定一下編碼,有時候不太好用。with open d test.html rb as f html f.r...

python解決mysql亂碼問題

encoding utf 8 created on 2012 4 6 author yajunzhang import mysqldb import sys print sys.getdefaultencoding conn mysqldb.connect host user zhang passw...