python爬網頁小案例

2021-08-04 22:00:34 字數 897 閱讀 8839

普通人:計畫失敗 -> 沮喪 -> 罵自己一頓 -> 制訂新計畫 -> 繼續失敗

學霸:計畫失敗 -> 沮喪 -> 罵自己一頓 -> 深度思考計畫為啥失敗 -> 改善問題 -> 制訂

新計畫

案例:

#!/usr/bin/env python3

# -*- coding: utf-8 -*-

import urllib.request

import sys

import io

print(sys.getdefaultencoding())

print('a'=='\u2022')

#**

url = ""

#請求

request = urllib.request.request(url)

#爬取結果

response = urllib.request.urlopen(request)

data = response.read()

#設定解碼方式

data = data.decode('utf-8')

#列印結果

print(data)

#列印爬取網頁的各類資訊

print(type(response))

print(response.geturl())

print(response.info())

print(response.getcode())

有興趣的童鞋,可以**交流交流:

python爬網頁亂碼

最近搞爬蟲網頁經常亂碼,查了很多終於整出來了。關於解碼編碼decode和encode 首先要搞清楚,字串在python內部的表示是unicode編碼,因此,在做編碼轉換時,通常需要以unicode作為中間編碼,即先將其他編碼的字串解碼 decode 成unicode,再從unicode編碼 enco...

Python 爬取網頁

先謝郭嘉 以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預爬網頁資訊 1 網頁url 3.下面就可以爬取網頁了 以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預...

python爬拉鉤案例 爬蟲

直接上 這裡拉勾網做了cookie的反扒機制,所以用 requests.utils.dict from cookiejar這個方法去獲取cookie然後賦值import requests url headers 或者response從而獲取cookie response requests.get h...