Python的編碼問題

2022-07-11 10:09:16 字數 1120 閱讀 3438

unicode

什麼是unicode:unicode 是計算機可以支援這個星球上多種語言的秘密**。unicode使用乙個或多個位元組來表示乙個字元。

unicodedecodeerror: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128) 問題的解決方法及原理:

該問題是在python2中將中文進行編碼時報的錯,意思是ascii編碼的最大長度為128,對中文進行解碼時超出了這個範圍。因為程式要對中文進行編碼時首先要將中文解碼成unicode(系統預設設定是ascii)。

解決方法:

一、在指令碼前面設定檔案的預設編碼方式為utf8

1

#-*- coding: utf-8 -*-2#

!/usr/bin/env python

3import

sys4 reload(sys) #

重新匯入

5 sys.setdefaultencoding('

utf8

') #

設定預設編碼方式為utf8

二、在對中文進行編碼前向解碼為utf8 格式    

1

#報錯的**

2 str = "

中文字串

"3 str_out = str.encode('

utf8

')

1

#正常的**

2 str = "

中文字串

"3 str = str.decode('

utf8')

4 str_out = str.encode('

utf8

')

三、在定義中文字串之前先指定字串的格式,比如:

1

#定義時指定字串編碼格式

2 str = u"

中文字串

"3 str_out = str.encode('

utf8

')

Python 的編碼問題

我在爬取網頁解析的過程中出現了網頁內容解析不了的問題,雖然用記事本開啟是顯示正常的漢字和符號,但用winhex開啟就會出現亂碼的問題 把它放到cmd中也顯示亂碼 這個一般就是編碼問題,這種 編碼應該很可能是 utf 8 能在winhex中正常顯示漢字的應該是gb2312或者gbk編碼,所以用正規表示...

python的編碼問題

今天學習了python,作為乙個新手,對python的編碼問題仔細研究了一番,自己的理解如下 1 python 的檔案是以ascii編碼儲存,所以當python 檔案中有中文時 包括注釋 檔案開頭都要加 coding utf 8 或 coding gbk。2 python內部使用的都是unicode...

Python的編碼問題

python的編碼問題一般在有中文的情況下會出現。這裡的python檔案在windows環境下執行的。當python檔案不含中文時,無論.py檔案是anic ascii格式還是utf 8格式,在cmd中執行時都能得到正常的結果,但是.py檔案裡含中文時,直接編譯就會出現問題了。這裡主要有兩種情況 1...