python3 編碼解碼

2022-06-17 15:06:10 字數 510 閱讀 8010

位元(bit) 計算機最小的儲存單位

位元組(byte)

1 bit = 1 位

8 bit = 1 byte

1024 bytes = 1 kb

1024 kb = 1 mb

1024 mb = 1 gb 

只支援英文和拉丁文(七位ascii碼有128個。八位ascii碼有256個)

佔乙個位元組(byte)

1980  gb2312

1995  gbk1.0

2000  gb18030

unicode:utf-32  統一使用4個位元組

unicode:utf-16  2個位元組或2個位元組以上

unicode:utf-8  可變長的字元,英文1個位元組,中文3個位元組

encode()

在編碼的同時,將資料轉換為bytes型別

decode()

在解碼的同時,將bytes型別轉換為字串

b = byte = 位元組型別 = [0-255]

python3編碼解碼

輸入編碼 輸入編碼需要由二進位制轉為unicode,輸入介質 原始碼檔案 終端 檔案 網路等 python3預設是使用utf 8編碼對輸入的二進位制值轉為unicode。也就是說如果輸入介質沒有指定編碼,python3直譯器就預設把你的原始檔看成是utf 8編碼。呼叫sys.getdefaulten...

Python3的URL編碼解碼

前言 最近在用python3練習一些爬蟲指令碼的時候,發現一些url的編碼問題,在瀏覽器提交請求api時,如果url中包含漢子,就會被自動編碼掉。呈現的結果是 xx xx xx。如果出現3個百分號為乙個原字元則為utf8編碼,如果2個百分號則為gb2312編碼。下面為大家演示編碼和解碼的 from ...

python3編碼宣告 python3編碼問題彙總

這兩天寫了個監測網頁的爬蟲,作用是跟蹤乙個網頁的變化,但執行了一晚出現了乙個問題。希望大家不吝賜教!我用的是python3,錯誤在對html response的decode時丟擲,原樣為 response urllib.urlopen dsturl content response.read dec...