03urllib請求帶中文的路徑處理

2021-09-24 04:14:27 字數 816 閱讀 5582

小新主要是對「小新的處理」

from urllib import request,parse

def keyword(kw):

qs =

qs = parse.urlencode(qs)

base_url = ''+qs

# req = request.request(base_url)

response = request.urlopen(base_url)

html = response.read()

print(html.decode('utf-8'))

if __name__=='__main__':

while 1:

kw = input('請輸入貼吧關鍵字:')

if kw == 'q':

break

keyword(kw)

這裡是寫了乙個迴圈輸入貼吧的**,

parse.urlencode()是把key-value這樣的鍵值對轉換成我們想要的格式,返回的是a=1&b=2這樣的字串

urllib庫parse下的函式補充:

parse.quote():只對字串轉換

parse.unquote():轉為中文

03 urllib庫的高階用法

有些 不會同意程式直接用上面的方式進行訪問,如果識別有問題,那麼站點根本不會響應,所以為了完全模擬瀏覽器的工作 1.1 設定請求頭 其中user agent代表用的哪個請求的瀏覽器 如下 from urllib.request import urlopen from urllib.request i...

url請求位址帶中文引數的亂碼處理

一 需求 在web開發過程中,通常我們會遇到請求url位址帶有中文引數,這些中文引數一到後端就變成亂碼。這時我們需要進行處理。二 問題原因 出現亂碼的原因,很明顯是編碼不對。原因在於tomcat聯結器預設的編碼是 iso8859 1 而中文需要 用unicode gbk或gb2312才能正確顯示。三...

有道翻譯傳送帶中文的get請求時亂碼問題

有道翻譯的api介面說明 版本 1.1,請求方式 get,編碼方式 utf 8 主要功能 中英互譯,同時獲得有道翻譯結果和有道詞典結果 可能沒有 引數說明 type 返回結果的型別,固定為data doctype 返回結果的資料格式,xml或json或jsonp version 版本,當前最新版本為...