python 編碼解碼

2022-06-20 19:24:10 字數 949 閱讀 6709

一種編碼想要轉成另一種編碼,需要先解碼成萬國碼:unicode,然後再從unicode轉成其他編碼。

例如gbk格式想要轉成utf-8,需要先按照 gbk 的格式 decode 成 unicode,再從 unicode 格式 encode 成utf-8

#

python3預設使用utf-8編碼,故不用宣告:#-*- coding:utf-8 -*-

import

sys#

檢視當前預設編碼

print

(sys.getdefaultencoding())

name = '你好'

#utf-8格式,是unicode型別,這是python3預設的型別

name_utf8 = name.encode('

utf-8

') #

編碼成utf-8

name_gbk = name.encode('

gbk') #

編碼成gbk; utf-8也是unicode,可以直接編碼成其他型別:gbk

print

(name_utf8)

print

(name_gbk)

print(name_gbk.decode('

gbk')) #

gbk先按照gbk的格式解碼成unicode,然後才能編碼成其他型別

print(name_gbk.decode('

gbk').encode('

utf-8

')) #

gbk轉utf-8,過程: gbk->unicode->utf-8

編碼 解碼 python

之前一直對python檔案中編碼解碼糊里糊塗,今天看到一篇文章,覺得把我講的有點明白了。寫個心得吧。1 編碼解碼是怎麼一回事?python 裡面的編碼和解碼也就是 unicode 和 str 這兩種形式的相互轉化。編碼是 unicode str,相反的,解碼就是 str unicode。str形式,...

PYTHON編碼和解碼

從第一天接觸python就對解碼和編碼的問題很困惑,最近在學習網路資料爬蟲,又遇到了一系列的解碼和編碼問題,處理中文編碼問題真的好麻煩,這次真的需要好好填坑了。詳細內容下面的文章 python字串的編碼與解碼 encode與decode 字串在python內部的表示是unicode編碼,因此,在做編...

python 檔案編碼 解碼

ascii ascii碼是西歐編碼的方式,採取7位編碼,所以是2 7 128,共可以表示128個字元,包括34個字元,如換行lf,回車cr等 其餘94位為英文本母和標點符號及運算符號等。gb2321 gb2312 是對 ascii 的中文擴充套件。相容ascii。編碼規定 編碼小於127的字元與as...