python中的字元編碼 一

2021-09-25 23:40:06 字數 1147 閱讀 3258

在notepad++中新建乙個檔案命名為str_encode.py,我們想寫像這樣的**:

print("

你好,祝你學習愉快!

")

會發現,notepad裡出現亂碼不能正確顯示漢字,這是為什麼呢?

print("

雿末")

原來notepad++預設python的原始碼檔案是ansi編碼的,需要在notepad++中設定:編碼==>編譯成utf-8編碼。

在python中可以放置一條注釋,表示這個檔案是utf-8編碼的。

#

-*- coding: utf-8 -*-

#str_encode.py

print("

你好,祝你學習愉快!

")

但是當我們在cmd裡執行str_encode.py時,又輸出了亂碼(我當前的學習環境是繁體xp所以上面的漢字是繁體字)。

這又是什麼情況呢?看樣子我們的**還需要修改。把我們的**修訂如下:

#

-*- coding: utf-8 -*-

#str_encode.py

msg = "

你好,祝你學習愉快!

msg是unicode編碼的需要decode("utf-8")解碼為utf-8的編碼後使用encode(「950」)編碼為950**也就是繁體big5編碼。

在cmd邊框右鍵==>屬性,檢視cmd的編碼方式。

檢視預設編碼方式

>>>import sys

>>>sys.getdefaultencoding()

ascii

>>>sys.stdout.encoding

cp950

Python 中的字元編碼

1 str型別可以理解為乙個二進位制block,或multibyte 2 multibyte str.decode unicode 3 unicode str.encode multibyte str binary block 4 unicode str 的操作引數也應為unicode,如 unic...

Python中的字元編碼

cpu 記憶體 硬碟是計算機的三大核心硬體。1.任何軟體在執行之前,都是以二進位制的格式儲存在硬碟當中的。2.當軟體被開啟時,硬碟將資料載入到記憶體中,cpu再從記憶體中讀取資料被執行。3.軟體在執行過程中產生的資料都是存放於記憶體中,若想永久儲存資料,則得轉移到硬碟中 有的小夥伴可能會想到 那在電...

python 中字元編碼

背景 在跑hadoop是python指令碼經常要處理不同的格式的編碼資料,主要字元編碼 ascii,gb18030,unicode,utf 8等 python有兩種字串 bytestring hello world in my default locale unicodestring u hello...