爬取網頁文字資料 Python

2021-10-11 17:50:50 字數 675 閱讀 2261

最近在研究爬蟲相關的內容,作為記錄方便使用是查閱。

本文爬取的**是長沙市統計局望城區2023年國民經濟和社會發展統計公報

step1: 匯入需要用到的庫包

import requests  #爬取網頁的庫

from bs4 import beautifulsoup #用於解析網頁的庫

headers =

# 構造請求頭

url =

''response = requests.request(

"get"

, url, headers=headers)

# 獲取網頁資料

soup = beautifulsoup(response.text,

'html.parser'

)bf = soup.find(

'div'

, class_=

'view trs_ueditor trs_*****_default trs_web'

)

部分結果展示如下:

注:後續會把標題加上在補充上

Python 爬取網頁

先謝郭嘉 以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預爬網頁資訊 1 網頁url 3.下面就可以爬取網頁了 以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預...

python爬取網頁資料

import refrom urllib.request import urlopen 爬取網頁資料資訊 def getpage url response urlopen url return response.read decode utf 8 defparsepage s ret re.find...

python簡單爬取網頁文字操作體會

簡單的實現爬蟲爬取網頁文字和 以python3為背景,這裡還是先定義乙個讀取html頁面資訊的函式 import urllib.request defgethtml url page urllib.request.urlopen url 開啟url位址 html page.read decode u...