python小爬蟲(抓取桌布並儲存到本地)

2021-10-04 10:11:16 字數 1031 閱讀 9321

** 樓主也才學習python半年,寫下在這個部落格算是對自己成長的記錄和提高吧,歡迎小夥伴們一起**,共同提高。**

** 話不多說,這個爬蟲的目的是將某桌布**上的爬取下來,並儲存在本地。所以我們需要beautifulsoup庫和os庫,以及requests庫**

首先桌布**url = 『

url = ''

urls = [url+str(x)+'.html'for x in range(7)]

root = 'd://pics//自然風光//'

hrefs =

for url in urls:

r = requests.get(url)

r.raise_for_status()

html = r.text

#利用beautifulsoup庫解析頁面

soup = beautifulsoup(html,'html.parser')

#找到div class=main-wrap標籤

im = soup.find('div',attrs=)

#在div class=main-wrap標籤找到img標籤

imgs = im.find('img')

#把新增進hrefs列表

for href in hrefs:

path = root+href.split('/')[-1]

try:

if not os.path.exists(root):

os.makedirs(root)

if not os.path.exists(path):

r = requests.get(href)

with open(path,'wb')as f:

f.write(r.content)

f.close()

print('done')

else:

print('already got')

except:

print('error')

python抓取zol付費桌布

僅限技術交流,禁止任何商業用途 學習了jack cui的爬蟲文章,頗有收穫。拿來練練手。點開第一張桌布 用到的兩個重要庫 selenium 和beautifulsoup,對庫不熟悉的,建議看學習一下。當乙個圖集結束時,再點下一張是會異常的,因為此時,控制項是不可見狀態的。這時候,繼續分析網頁 可以發...

python 爬蟲 基本抓取

首先,python中自帶urllib及urllib2這兩個模組,基本上能滿足一般的頁面抓取,另外,requests 也是非常有用的。對於帶有查詢欄位的url,get請求一般會將來請求的資料附在url之後,以?分割url和傳輸資料,多個引數用 連線。data requests data為dict,js...

python 爬蟲,抓取小說

coding utf 8 from bs4 import beautifulsoup from urllib import request import re import os,time 訪問url,返回html頁面 defget html url req request.request url ...