urllib簡單介紹

2022-07-25 02:57:10 字數 982 閱讀 1220

#

urllib簡介:

1.urllib模組是python的乙個請求模組

2.python2中是urllib和urllib2相結合實現請求的傳送. python3中統一為urllib庫

3.urllib是python內建的請求庫, 其包含4個模組:

(1).request模組: 模擬傳送請求

(2).error模組: 異常處理模組

(3).parse模組: 工具模組, 提供關於url的處理方法, 如拆分, 解析, 合併等

(4).robotparser模組: 識別robots協議

#部分方法使用介紹:

#urlopen方法實現get請求:

from urllib import

request

url = '

'res =request.urlopen(url)

print

(res.read())

with open(

'python.html

', 'w'

) as f:

f.write(res.read().decode(

'utf-8'))

#post請求:

urllib簡單使用

urllib簡介 爬取網頁 讀取內容常見的有3種方式 import urllib.request html urllib.request.urlopen html.readline html.read 4096 html.readlines 有些檔案比較大,需要像讀取檔案一樣,每次讀取一部分資料 i...

urllib簡單網頁抓取

urllib包 抓取網頁,處理url,包含模組 用urllib實現簡單的網頁抓取 coding utf 8 from urllib import request import chardet if name main response request.urlopen html response.re...

urllib實現簡單的爬蟲

url就是 的意思,而urllib是python自帶的用於操作 的標準庫,其中有request parse error robotsparser四個模組,request用於開啟和讀取網頁,parse用於解析url,error用於處理異常 只有urlerror和httperror兩個函式 robots...