Windows下Python字串編碼問題

2021-07-04 04:06:03 字數 1066 閱讀 2063

python語言實際上有三種字串,通常意義的字串(str),unicode字串(unicode)和抽象類basestring,其中basestring不可例項化。

在windows系統下的cpython直譯器輸入**:

>>> st1 = '中文'

>>> st1

'\xd6\xd0\xce\xc4'

>>> type(st1)

'str'>

>>> st2 = st1.decode('gbk')

>>> st2

u'\u4e2d\u6587'

>>> type(st2)

'unicode'>

>>> st3 = st2.encode('utf-8')

>>> st3

'\xe4\xb8\xad\xe6\x96\x87'

>>> type(st3)

'str'>

>>> st4 = st2.encode('gbk')

>>> st4

'\xd6\xd0\xce\xc4'

>>> type(st4)

'str'>

如果在**中加入一句:

>>> st5 = st1.decode('utf-8')
則會報錯

從上面的**和輸出我們可以得到如下結論:

1、windows命令列輸入的預設中文編碼格式是gbk,輸入的中文字串型別為str

2、使用decode函式可以將乙個str型別的中文字串轉成unicode型別

3、使用encode函式可以將乙個unicode型別的中文字串轉成str型別

所以我們一般在進行python指令碼編寫的時候,需要在指令碼的開頭加上如下**:

#-*- coding:utf-8 -*-
也可以匯入模組sys,設定預設編碼格式:

import sys

sys.setdefaultencoding('utf-8')

ps: python版本為python2.7

筆記 ubuntu下新增windows的字型

方法如下 第一步 將windows下喜歡的字型檔案copy到乙個資料夾中,例如將xp裡windows fonts中的字型檔案 本人比較貪心,把整個資料夾copy了過來 在linux中命名為xpfonts 第二步 將copy到的字型資料夾copy到系統字型資料夾中並且修改許可權 sudo cp xpf...

Windows下Python的安裝

python語言對於windows並不算很友好,因為如果初學者,windows環境下安裝,簡直是折磨人,會遇到各種蛋疼的情況。本文記錄下安裝我在64位win7下的安裝步驟,希望能夠令讀者成功安裝python和pip以及計算機視覺處理所需要的pil,matlotlib,numpy,scipy的安裝。現...

windows下python自動補齊

windows下使用python2.7,控制台下無法無法自動補齊 參照1.安裝pyreadline pip install pyreadline 2.啟用tab鍵自動補齊 try import readline except importerror import pyreadline as read...