5 簡單python爬蟲 爬取新聞頁

2021-09-20 05:29:25 字數 628 閱讀 7915

#python爬蟲例項   爬取新聞

#實現過程,先爬首頁,通過正規表示式獲取所有新聞鏈結,然後依次爬各新聞,並儲存到本地

import urllib.request

import re

data=urllib.request.urlopen("").read()

data2=data.decode("utf-8","ignore")

pat='href="(.*?)"'

allurl=re.compile(pat).findall(data2)

for i in range(0,10):

try:

print("第"+str(i)+"次爬取")

thisurl=allurl[i]

urllib.request.urlretrieve(thisurl,file)

print("------成功-------")

except urllib.error.urlerror as e:

if hasattr(e,"code"):

print(e.code)

if hasattr(e,"reason"):

print(e.reason)

Python 爬蟲例項(4) 爬取網易新聞

自己閒來無聊,就爬取了網易資訊,重點是分析網頁,使用抓包工具詳細的分析網頁的每個鏈結,資料儲存在sqllite中,這裡只是簡單的解析了新聞頁面的文字資訊,並未對資訊進行解析 僅供參考,不足之處請指正 coding utf 8 import random,re import sqlite3 impor...

python爬取學校新聞

這是我做的第乙個python爬蟲專案,在這裡與大家分享出來 目標 下面展示一下我的 import requests from bs4 import beautifulsoup sessions requests.session i 1 對應第1頁資訊 page str i if i 1 newsma...

Python簡單爬蟲(爬取天氣資訊)

初學python,學到python爬蟲時在網上找資料,發現找到的大部分都是前部分內容對運作方式介紹,然後就直接上 了,這樣對像我一樣的小白來說比較困難,的注釋較少,部分 塊沒有詳細說明運作方式和具體作用,所以寫此筆記方便別人和自己以後進行學習檢視。作業系統window python2.7.10 wi...