Python3的URL編碼解碼

2022-06-08 09:27:09 字數 973 閱讀 7580

前言

最近在用python3練習一些爬蟲指令碼的時候,發現一些url的編碼問題,在瀏覽器提交請求api時,如果url中包含漢子,就會被自動編碼掉。呈現的結果是 ==> %xx%xx%xx。如果出現3個百分號為乙個原字元則為utf8編碼,如果2個百分號則為gb2312編碼。下面為大家演示編碼和解碼的**。

from urllib.parse import

quote,unquote

text = "麗江"

print(quote(text,'

utf-8'))

str = "

%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98

"print(unquote(str,'

utf-8

'))

執行以上**可以得到如下結果:

%e4%b8%bd%e6%b1%9f

資料探勘

原文:前言

最近在用python3練習一些爬蟲指令碼的時候,發現一些url的編碼問題,在瀏覽器提交請求api時,如果url中包含漢子,就會被自動編碼掉。呈現的結果是 ==> %xx%xx%xx。如果出現3個百分號為乙個原字元則為utf8編碼,如果2個百分號則為gb2312編碼。下面為大家演示編碼和解碼的**。

from urllib.parse import

quote,unquote

text = "麗江"

print(quote(text,'

utf-8'))

str = "

%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98

"print(unquote(str,'

utf-8

'))

執行以上**可以得到如下結果:

%e4%b8%bd%e6%b1%9f

資料探勘

原文:

python3中的url編碼和解碼

在用python進行web開發的時候,當url中含有中文,那麼傳遞到後台伺服器的會是編碼過的url,我們可以用python3把編碼後的文字轉化成我們可以識別的內容。如下操作 import urllib test str 哈哈哈 print test str new urllib.parse.quot...

python3編碼解碼

輸入編碼 輸入編碼需要由二進位制轉為unicode,輸入介質 原始碼檔案 終端 檔案 網路等 python3預設是使用utf 8編碼對輸入的二進位制值轉為unicode。也就是說如果輸入介質沒有指定編碼,python3直譯器就預設把你的原始檔看成是utf 8編碼。呼叫sys.getdefaulten...

python3 編碼解碼

位元 bit 計算機最小的儲存單位 位元組 byte 1 bit 1 位 8 bit 1 byte 1024 bytes 1 kb 1024 kb 1 mb 1024 mb 1 gb 只支援英文和拉丁文 七位ascii碼有128個。八位ascii碼有256個 佔乙個位元組 byte 1980 gb2...