python簡單爬蟲(pycharm) 二

2021-09-24 21:45:35 字數 1125 閱讀 2904

python簡單爬蟲(pycharm)(二)

我們來把他的文字,也就是

標籤下的東西給爬出來。

比如這一段,注意那句:

這裡選用beautifulsoup包。

首先開啟cmd,進入安裝python的資料夾下的script資料夾:

然後正常的安裝:

pip install beautifulsoup4
裝完長這樣:

url = '' #這裡的url就是通過開發者工具找到的網頁的請求資訊裡的request url

res = requests.get(url) #requests後面的方法要根據網頁的請求資訊來判斷

res.encoding='utf-8' #可加可不加,爬蟲結果亂碼,可以用這個**更正

soup = beautifulsoup(res.text) #利用beautifulsoup對爬到的資料進行分析

for item in soup.select('p'): #選出所有標籤

try:

print(item) #列印所有標籤

except oserror:

pass

continu

執行結果:

注意那句:

「to build gem5,we will use scons.」

乙個小的python爬蟲就做好了。

python爬蟲簡單 python爬蟲 簡單版

學過python的帥哥都知道,爬蟲是python的非常好玩的東西,而且python自帶urllib urllib2 requests等的庫,為爬蟲的開發提供大大的方便。這次我要用urllib2,爬一堆風景。先上重點 1 response urllib2.urlopen url read 2 soup...

簡單python爬蟲

一段簡單的 python 爬蟲程式,用來練習挺不錯的。讀出乙個url下的a標籤裡href位址為.html的所有位址 一段簡單的 python 爬蟲程式,用來練習挺不錯的。讀出乙個url下的a標籤裡href位址為.html的所有位址 usr bin python filename test.py im...

Python簡單爬蟲

一.獲取整個頁面的資料 coding utf 8 import urllib defgethtml url page urllib.urlopen url html page.read return html html gethtml print html 二.篩選需要的資料 利用正規表示式來獲取想...