python3編碼解碼

2021-08-03 12:30:59 字數 870 閱讀 9196

****************************************=== 輸入編碼

輸入編碼需要由二進位制轉為unicode,輸入介質:原始碼檔案、終端、檔案、網路等

python3預設是使用utf-8編碼對輸入的二進位制值轉為unicode。 也就是說如果輸入介質沒有指定編碼,python3直譯器就預設把你的原始檔看成是utf-8編碼。

呼叫sys.getdefaultencoding()可以檢視到是utf-8編碼。

輸入介質指定編碼的方法:

1、原始碼檔案:在原始檔第二行指定:# -*- coding: utf-8 -*-

2、檔案:f = open("e:\\python\\zw.txt", "r", encoding = "utf-8")

3、終端:export lang="en_us.utf-8"或者sys.stdin= open(sys.stdin.fileno(), mode='w', encoding='utf8', buffering=1)

4、。。。

****************************************=== 輸出編碼

輸出編碼需要由unicode轉為二進位制,輸出介質:終端、檔案、網路等

***********************************=== 檢視unicode

>>> s = '\u7f51\u7edc\u7c7b\u578b'

>>> s

'網路型別'

>>> print(s.encode("unicode_escape").decode("u8"))

\u7f51\u7edc\u7c7b\u578b

>>> 

python3 編碼解碼

位元 bit 計算機最小的儲存單位 位元組 byte 1 bit 1 位 8 bit 1 byte 1024 bytes 1 kb 1024 kb 1 mb 1024 mb 1 gb 只支援英文和拉丁文 七位ascii碼有128個。八位ascii碼有256個 佔乙個位元組 byte 1980 gb2...

Python3的URL編碼解碼

前言 最近在用python3練習一些爬蟲指令碼的時候,發現一些url的編碼問題,在瀏覽器提交請求api時,如果url中包含漢子,就會被自動編碼掉。呈現的結果是 xx xx xx。如果出現3個百分號為乙個原字元則為utf8編碼,如果2個百分號則為gb2312編碼。下面為大家演示編碼和解碼的 from ...

python3編碼宣告 python3編碼問題彙總

這兩天寫了個監測網頁的爬蟲,作用是跟蹤乙個網頁的變化,但執行了一晚出現了乙個問題。希望大家不吝賜教!我用的是python3,錯誤在對html response的decode時丟擲,原樣為 response urllib.urlopen dsturl content response.read dec...