Python爬蟲系列解決編碼格式問題

2021-09-22 10:35:37 字數 826 閱讀 4639

1.顯示編碼問題

有時候當我們使用爬蟲爬取網頁源**時,因為編碼格式的不同導致亂碼

例如 www.4399.com

網頁源**

我們可以看出4399的編碼格式指定為 gb2312

而 pycharm 預設的編碼格式是 utf-8

所以當我們獲取源**時,漢字就會出現亂碼

import requests

url=''

response=requests.get(url)

print(response.text)

輸出結果如下

出現亂碼

2.解決問題

只需要指定 pycharm 改變當前編碼格式

**如下

import  requests

url=''

response=requests.get(url)

response.encoding='gb2312'

print(response.text)

輸出結果如下

亂碼問題解決了

Python爬蟲系列

部落格 python,爬蟲 由於近來學 lan 業 ai 繁 fa 忙 zuo 快乙個月沒有更新部落格了。這周完成了兩門課的結課考試,現下時間開始變得充裕。準備梳理一下前段時間學習的關於python爬蟲的內容,權當複習鞏固知識。而初次學習時遇到的疑難雜症,那時候的應對策略是抓大放下,在這梳理過程會下...

格雷編碼(python實現)

題目描述 格雷編碼是乙個二進位制數字系統,在該系統中,兩個連續的數值僅有乙個位數的差異。給定乙個代表編碼總位數的非負整數 n,列印其格雷編碼序列。格雷編碼序列必須以 0 開頭。示例 1 輸入 2 輸出 0,1,3,2 解釋 00 0 01 1 11 3 10 2 對於給定的 n,其格雷編碼序列並不唯...

格雷編碼python實現

格雷編碼是乙個二進位制數字系統,在該系統中,兩個連續的數值僅有乙個位數的差異。給定乙個代表編碼總位數的非負整數 n,列印其格雷編碼序列。格雷編碼序列必須以 0 開頭。示例 1 from typing import list class solution def graycode self,n int...