python3 中文亂碼與預設編碼格式設定方法

2022-09-29 13:30:12 字數 743 閱讀 7945

python預設編碼格式是utf-8。在python2.7中,可以通過sys.setdefaultencoding('gbk')設定預設編碼格式,而hniagcez在python3.3中sys.setdefaultencoding()這個函式已經沒有了。在python3.3中該如何設定內建的預設編碼格式啊!急求!!!

(類似於「#coding:gbk」這種就不必來說了。能讓import sys print(sys.getdefaultencoding())hniagcez輸出www.cppcns.com「gbk「的大神請進!!!)

python 3和2很大區別就是python本身改為預設用unicode編碼。

字串不再區分"abc"和u"abc", 字串"abc"預設就是unicode,不再代表本地編碼、

由於有這種內部編碼,像c#和j**a類似,再沒有必要在語言環境內做類似設定編碼,比如「sys.setdefaultencoding」;

也因此也python 3的**和包管理上打破了和2.x的相容。2.x的擴充套件包要適應這種情況改寫。

另乙個問題是語言環境內只有unicode怎麼輸出gbk之類的本地編碼。

答按慣例都在(序列化)輸出時才轉換成本地編碼。

比如file.write("gbk的中文".encode("gbk"))

python環境內字串用str.encode("gbk")方法輸出成位元組串用於和其他環境交流。

本文標題: python3 中文亂碼與預設編碼格式設定方法

本文位址:

Python3 中文使用以及中文亂碼問題

python3中預設的字元編碼格式即utf 8,python2中採用u 中文 的方式,不再支援。字串轉碼方法 str.encode 轉碼的格式 例如str.encode gbk 其他格式的位元組流轉碼成str utf 8 bytes.decode utf 8 python一直沒有方便的ide,但是微...

python3中文長度 python3獲得漢字長度

import string def str count str 找出字串中的中英文 空格 數字 標點符號個數 count en count dg count sp count zh count pu 0 for s in str 英文 if s in string.ascii letters cou...

Python3 中文與url格式編碼的轉換

我們在爬蟲時,url鏈結中含有中文時,會自動被編碼為特殊符號,因此我們需要對中文進行編碼操作,同時也有可能涉及到對url編碼後的中文進行解碼操作。from urllib.request import quote x 角色扮演 print quote 角色扮演 輸出結果為 e8 a7 92 e8 89...