python3 x 紀念寫的第乙個爬蟲

2021-08-11 04:56:51 字數 775 閱讀 4672

#之前是urllib,3之後是urllib.request

import urllib.request

import re

#得到html頁面的所有資料

def gethtml(url):

page = urllib.request.urlopen(url)

html = page.read()

return html;

#獲取得到的html頁面裡面的

#re.compile 將正規表示式轉換為模式物件,可以實現更有效率的匹配。

imgre = re.compile(reg)

imglist = re.findall(imgre,html)

#將頁面篩選的資料儲存到本地

#原因為python3 findall資料型別用bytes型別,因此在正規表示式前應新增html = html.decode('utf-8')

html = gethtml("").decode('utf-8')

print(getimg(html))

使用python3 x寫乙個基於udp通訊的小例子

啟動服務 抓包看看內容確實是伺服器返回的 一段時client端,另一段是server端 from socket import servername hostname 這裡替換為你的伺服器位址 serverport 12000 我們使用12000埠進行通訊 clientsocket socket af...

python寫第乙個網頁

1 安裝django見別的部落格 2 執行開發伺服器 在命令提示符裡進入目錄mytest cd mytest 注 我的放在e盤根目錄下 輸入執行開發命令 python manage.py runserver 輸出結果 e mysite python manage.py runserver perfo...

紀念第乙個線段樹

我的 file main.cpp author mtttt created on 2010年3月14日,下午3 11 include include include using namespace std typedef struct node node int a 50001 char ch 10...