自學Python 3網路爬蟲(二)

2021-08-14 20:43:26 字數 795 閱讀 7891

import urllib

import urllib.request

data = {}

data['word'] = '廣東珠海'

url_values = urllib.parse.urlencode(data)

url = ""

full_url = url + url_values

print(full_url)

data = urllib.request.urlopen(full_url).read()

data = data.decode("utf-8")

print(data)

urllib.parse.urlencode(data)是將data裡的key-value這樣的鍵值對轉換成word=%e5%b9%bf%e4%b8%9c%e7%8f%a0%e6%b5%b7

生成的full_url是:word=%e5%b9%bf%e4%b8%9c%e7%8f%a0%e6%b5%b7

檢視該頁面的源**(擷取一段):

再看看我們通過urllib庫搜尋出來的**片段(同樣擷取一段):

Python 3 網路爬蟲

python 原來還可以這樣玩 python爬蟲,破解有道翻譯介面引數 破解有道翻譯反爬蟲機制 python3網路爬蟲快速入門實戰解析 article details 78123502 python3網路爬蟲 五 python3安裝scrapy article details 60156205 py...

Python3 網路爬蟲 1

準備開始寫一些python3關於爬蟲相關的東西,主要是一些簡單的網頁爬取,給身邊的同學入門看。首先我們向網路伺服器傳送get請求以獲取具體的網頁,再從網頁中讀取html內容。python view plain copy print?coding utf 8 from urllib.request i...

初識Python3網路爬蟲

定義 網路爬蟲 web spider 又被稱為網頁蜘蛛,是一種按照一定的規則,自動地抓取 資訊的程式或者指令碼。爬蟲其實是通過編寫程式,模擬瀏覽器上網,然後讓其去網際網路上抓取資料的過程。爬蟲的價值 抓取網際網路上的資料,為我所用,有了大量的資料,就如同有了乙個資料銀行一樣,下一步就是如何將這些資料...