python中各種編譯碼彙總

2021-10-02 08:22:44 字數 2152 閱讀 7763

s1 =

'\\u9500\\u552e'

s2 = u'\\u9500\\u552e'

s3 =

'\u9500\u552e'

s4 = u'\u9500\u552e'

print s1,s2,s3,s4

print s1.decode(

'unicode_escape'

),s2.decode(

'unicode_escape'

),s3.decode(

'unicode_escape'

),s4.decode(

'unicode_escape'

)print

'""'

.format

(s1)

,'""'

.format

(s2)

,'""'

.format

(s3)

print json.loads(

'""'

.format

(s1)

),json.loads(

'""'

.format

(s2)

),json.loads(

'""'

.format

(s3)

)>>

\u9500\u552e \u9500\u552e \u9500\u552e 銷售

銷售 銷售 銷售 (error)

"\u9500\u552e"

"\u9500\u552e"

"\u9500\u552e"

(error)

銷售 銷售 銷售 (error)

s =

'\\xe7\\xbb\\x87\\xe7\\x89\\xa9'

s1 =

'\xe7\xbb\x87\xe7\x89\xa9'

l =[

'織物'

]l1 =

[u'織物'

]l2 =

str(l)

.decode(

'string-escape'

)l3 =

str(l1)

.decode(

'unicode-escape'

)print s,s1,l,l1,l2,l3

print s.decode(

'string-escape'

)>>

\xe7\xbb\x87\xe7\x89\xa9 織物 [

'\xe7\xbb\x87\xe7\x89\xa9'

][u'\u7ec7\u7269'][

'織物'

][u'織物'

]織物

gbk 編碼乙個漢字兩個位元組,utf-8 乙個漢字通常3個位元組。

解碼:從其它編碼變成unicode,用的方法是decode(param),第乙個引數為被解碼的字串原始編碼格式

編碼:從utf-8轉換為gbk,必須經過unicode中間轉換,被編碼的字串必須為unicode

g =

'\xd6\xd0\xce\xc4'

# gbk 中文

u ='\xe4\xb8\xad\xe6\x96\x87'

# unicode 中文

print

type

(g)print g

print

type

(u)print u

gg = g.decode(

'gbk'

)uu = u.decode(

'utf-8'

)print

type

(gg)

print gg

print

type

(uu)

print uu

>>

<

type

'str'

>

����

<

type

'str'

>

中文<

type

'unicode'

>

中文<

type

'unicode'

>

中文

Python 編譯碼 初探

編碼是為了相容字符集之間的通用性,通常可以編碼的地方有 1 系統預設編碼 2 程式執行環境的編碼 3 原始碼檔案自身的編碼 4 程式中的字串編碼 對於python也是一樣的 通常中文作業系統的編碼都是gbk python執行環境預設的編碼是ascii 原始檔的編碼可以自己確定 coding gbk ...

iOS 各種編譯錯誤彙總

1 error macro names must be identifiers yourproject prefix.pch 原因 因為你弄髒了預處理器巨集,在它處於的時候修改了它 解決方法 configiration選擇all configirations,清空它 然後分別重新定義你的debug,...

python編譯碼的那些事兒

在python程式設計尤其是處理web應用時,遇到編譯碼問題的概率較大,通常這種問題也比較繁瑣,記下自己的理解,以備不時之需。編譯碼存在的意義主要是由於各種不同編碼方式的存在,有gbk啦,也有utf 8啦,還有gb2312等等。python中的decode和encode的引數意義是一樣的,即deco...