Python中文編碼過程中遇到的一些問題

2022-09-17 11:33:14 字數 1252 閱讀 1471

首先,要明確encode()和decode()的差別

encode()的作用是將unicode編碼的字串轉換為其它編碼格式。

比如:

st1.encode("utf-8")  這句話的作用是將unicode編碼的st1編碼為utf-8編碼的字串

decode()的作用是把其它編碼格式的字串轉換成unicode編碼的字串。

比如:

st2.decode("utf-8") 這句話的作用是將utf-8編碼的字串st2解碼為unicode編碼的字串

第二,除unicode編碼的字串以外,不論什麼一種編碼的字串要想轉換為其它編碼格式,必須先解碼後編碼

非unicode編碼--> unicode編碼-->非unicode編碼

比如。utf-8編碼的字串st想要轉換為gbk編碼的字串。必須經過下面步驟:

st=st.decode("utf-8")#解碼為unicode編碼

st=st.encode("gbk") #從unicode編碼編碼為gbk編碼

第三。我們常常使用的utf-8編碼還分為有bom的和無bom的。

能夠參考這篇文章:

第四:關於json檔案的中文編碼。

用python讀取json檔案時經經常使用到json.load()函式,該函式對json檔案的格式是有要求的

1)json檔案是utf-8 without bom編碼的,那麼能夠直接用json.load(filename)函式讀取json檔案的內容

2)json檔案是utf-8 with bom編碼的,不能用json.load()函式讀取。json.load()不能正確識別

3)json檔案時其它編碼的,比方gbk, 要把json檔案的編碼格式作為乙個引數傳給json.load():

eg. json.load(filename,"gbk")

第五,怎麼檢視而且設定自己檔案的編碼呢?

介紹乙個個人比較喜歡的工具"nodtepad++",隨便乙個軟體管家裡就與一鍵安裝。

用這個工具你能夠方便的檢視自己的檔案的當前編碼。並能夠輕鬆轉換成隨意其它編碼格式

wordpress安裝過程中遇到中文亂碼的處理方法

在安裝wordpress的時候,按照裡面的readme.html的步驟進行安裝,但是在訪問wp admin install.php的時候就出現了一行亂碼 複製 如下 鎮 殑 php 浼間箮娌 湁瀹夎榪愯 wordpress 蹇呴 鐨 mysql 鎷撳睍銆 從這www.cppcns.com行亂碼中可以...

iis執行siteserver過程中遇到的問題

問題一 system.web.hosting.hostingenvironmentexception 訪問 iis 元資料庫失敗。解決辦法 1 開啟cmd,進入 c windows microsoft.net framework v2.0.50727 2 輸入 aspnet regiis.exe i...

MySQL過程中遇到的問題

my.ini檔案中搜尋mysqld關鍵字,在下面新增skip grant tables 我的my.ini配置如下 client 設定客戶端埠號 port 3306 設定預設資料編碼格式 default character set utf8 mysqld skip grant tables 設定為自己...