python 解決requests中文亂碼

2021-10-07 13:38:58 字數 1696 閱讀 9454

import requests

# 爬取陽光電影

html = requests.get(

"")print

(html.text)

執行發現,列印亂碼

href

='/html/gndy/jddy/20160320/50541.html'

>

imdbæà·ö8·ö×óóòó°æ¬400óಿa

>

/>

href

='/html/gndy/jddy/20200627/60172.html'

>

2020äêﲾ硶ôã¸â×éñ¯/²»á¼âéa

>

/>

href

='/html/gndy/dyzz/20200627/60171.html'

>

2019äê»ñ½±¾ççéòôàö¡¶ãû·äóëa

>

/>

href

='/html/gndy/dyzz/20200627/60170.html'

>

2019ä궯×÷ôöäñ¡¶¼«ïþìóéú¡·ba

>

/>

href

='/html/gndy/jddy/20200627/60169.html'

>

2008äê¸ß·öðüò顶ïóòéèëxµäï×a

>

/>

href

='/html/gndy/jddy/20200627/60168.html'

>

2020äê¿æ»ãðüò顶»ú𵻭椡·ha

>

/>

href

='/html/gndy/jddy/20200627/60167.html'

>

2020äê¿æ»ãðüò顶»ú𵻭椡·ha

>

/>

href

='/html/gndy/jddy/20200627/60166.html'

>

2020äêææ»ã¡¶ïéêéææì·/×½ïé¼ça

>

/>

href

='/html/gndy/jddy/20200626/60164.html'

>

2020äê¾ççé·¸×¶ñãû/äï·½ö®a

>

/>

怎麼解決呢?網上答案很多,很容易誤導有說設定utf-8的;這裡我要跟大家講的是方法,首先我們需要檢視**是什麼編碼,這個時候用會用到charset我們發現charset=gb2312

這個時候我們只需要新增一行html.encoding = "gb2312"即可

import requests

# 爬取陽光電影

html = requests.get(

"")html.encoding =

"gb2312"

print

(html.text)

解決request亂碼的方法

第一種直接在web.xml加上過濾器,簡單粗暴 characterencodingfilter org.springframework.web.filter.characterencodingfilter encoding utf 8 forceencoding true 第二種用 1實現handl...

Python爬蟲 Request模組

文章說明了request模組的意義,且強調了request模組使用更加方便。接下來介紹幾種常用的request操作,並且會在後續補充說明一些特定用法。匯入檔案 import requests一 請求 右邊為請求語句,返回值為response回應 r requests.get r requests.p...

解決request中文亂碼的問題

解決request中文亂碼的問題 request.setcharacterencoding charset 必須寫在第一次使用request.getparameter 之前,這樣才能保證引數是按照已經設定的字元編碼來獲取。response.setcharacterencoding charset 必...