python實現的入門級別死爬蟲

2021-08-04 01:42:30 字數 832 閱讀 3430

學習使我快樂。

這幾天學了python基本語法,網易雲+慕課網,總之就是挑著不要錢的上2333

炮姐曾經說過:

def gethtml(url): #獲取網頁源**

web = urllib.request.urlopen(url)

html = web.read()

return html

def getpng(html):

reg = r'src="(' #正規表示式

re1 = re.compile(reg,re.i)

x = 1

imglist = re1.findall(html)

for imgurl in imglist:

urllib.request.urlretrieve(imgurl,'%s.png' %x) #預設儲存路徑在程式所在位置

x += 1

return imglist

website = ''  #這是第5頁的

html = str(gethtml(str(website)))

getpng(html)

python入門級別小程式 二

1.輸出當前計算機的日期和時間 from datetime import datetime 引用datetime庫 now datetime.now 獲得當前日期和時間資訊 print now now.strftime x 輸出其中日期部分 now.strftime x 輸出其中時間部分字串拼接。接...

線段樹的簡單操作(入門級別)

一些線段數的基本操作 比如建樹,單點修改,單點查詢,單點修改和區間查詢 區間和 區間修改和區間查詢,甚至 單點詢問,區間修改。這些操作都是有著差異性。尤其是區間修改,需要用到llazy標記。另外,建樹也分為很多種 取決於每個父結點的意義 比如以最大或最小值建樹 有的題還讓你求乙個區間內最大與最小值之...

Python入門級爬取百度百科詞條

爬取 angelababy詞條歷史版本 中的value值。coding utf 8 import urllib import urllib2 import re page 1 url str page try request urllib2.request url response urllib2....