Python中解決中文亂碼問題

2022-07-20 05:33:09 字數 392 閱讀 3606

亂碼原因:

因為你的檔案宣告為utf-8,並且也應該是用utf-8的編碼儲存的原始檔。但是windows的本地預設編碼是cp936,也就是gbk編碼,所以在控制台直接列印utf-8的字串當然是亂碼了。 

解決方法:

在控制台列印的地方用乙個轉碼就ok了,列印的時候這麼寫:

print myname.decode('utf-8').encode('gbk') 

比較通用的方法應該是:

import sys

type = sys.getfilesystemencoding()

print myname.decode('utf-8').encode(type)

文章**自 

Python解決中文亂碼問題

如果你從hdfs上匯出csv檔案,可能存在中文亂碼問題。用多個編輯器 工具都不能解決,可以用如下python 輕鬆搞定。匯出語句 hive e select from xx.table data tmp abc.csv python importpandasaspd dat pd.read tabl...

解決python爬蟲中文亂碼問題

首先網頁時可能採用不同編碼的,類似這個我爬取的網頁 當我直接使用.text函式列印時會出現如下亂碼 嘗試編碼結果 print strhtml.text.encode utf8 但發現明顯中文被變成了位元組 可以明顯的發現此處用於解碼的encoding是繼承自父類strhtml的,而沒有設定過的話父類...

servlet中解決中文亂碼問題

最早的http協議中,並沒有附加的資料型別資訊,所有傳送的資料都被客戶程式解釋為超文字標記語言html 文件,而為了支援多 資料型別,http協議中就使用了附加在文件之前的mime資料型別資訊來標識資料型別。常用的mime型別由兩部分組成 前面是資料的大類別,例如聲音audio 圖象image等,後...