python字元轉碼的理解

2021-09-04 04:30:44 字數 693 閱讀 9966

encode:字元編碼

decode:字元解碼

有些文件可能採用的是某種編碼方式(如utf-8)來儲存文字,但如果我們展現的工具是另外一種編碼方式(如gb2312),若我們不做些轉碼的工作,我相信你在此工具中顯示的將會是亂碼.

因為,我們的文字採用utf-8方式來儲存的,那麼它儲存在硬碟或者記憶體的位元組是以utf-8規定來儲存的,而gb2312是另外一種儲存規定,所以使用gb2312的工具無法正確讀取,此時需要我們將utf-8儲存轉變為gb2312儲存,故我們需要先用decode('utf-8')來解碼,再將encode('gb2312')來編碼,這樣,我們的工具便可以正確顯示內容了.

如**:

#!/usr/bin/env python

#coding=utf8

print "中國".decode('utf-8').encode('gb2312')

首先,「中國」這個字串是以utf-8儲存的,我們要在crt上列印出來,此時的crt是以gb2312編碼的,那麼我們需要將"中國"這個儲存編碼方式更改為crt軟體編碼一樣的,方可以在crt正確顯示。

類似的,還有我們從資料庫裡讀出的資料,可能是一種編碼,我們需要展示的平台是另一種編碼,這時候我們就需要進行這方面的轉換,以確保能正確列印文字.

python字元轉碼的理解

encode 字元編碼 decode 字元解碼 有些文件可能採用的是某種編碼方式 如utf 8 來儲存文字,但如果我們展現的工具是另外一種編碼方式 如gb2312 若我們不做些轉碼的工作,我相信你在此工具中顯示的將會是亂碼.因為,我們的文字採用utf 8方式來儲存的,那麼它儲存在硬碟或者記憶體的位元...

python字元編碼與轉碼

詳細文章 需知 1.在python2預設編碼是ascii,python3裡預設是unicode 2.unicode 分為 utf 32 佔4個位元組 utf 16 佔兩個位元組 utf 8 佔1 4個位元組 so utf 16就是現在最常用的unicode版本,不過在檔案裡存的還是utf 8,因為u...

python(字元編碼與轉碼)

一 字元編碼演變史 二 轉碼 1 python2.x 轉碼和解碼 獲取預設編碼格式 msg 我愛北京天安門 msg gb2312 msg.decode utf 8 encode gb2312 gb2312 to gbk msg gb2312.decode gbk encode gbk print m...