Python 簡單爬取網頁資料

爬取我的csdn網頁：

import requests 時出現紅線，這時候，我們將游標對準requests，按快捷鍵：alt + enter，pycharm會給出解決之道，這時候，選擇install package requests，pycharm就會自動為我們安裝了，我們只需要稍等片刻，這個庫就安裝好了。lxml的安裝方式同理

import requests
from lxml import etree
header =
html = requests.get(
"",headers=header)
etree_html = etree.html(html.text)
content = etree_html.xpath(
'//*[@id="articlemelist-blog"]/div[2]/div/h4/a/text()'
)for each in content:
replace = each.replace(
'\n',''
).replace(
' ','')
if replace ==
'\n'
or replace =='':
continue
else
:print
(replace)

擷取了部分結果：

找出列表list中的重複元素 python列表去重的多種方法 python+selenium滾動條/內嵌滾動條迴圈下滑，判斷是否滑到最底部 python特殊函式lambdamapfilter python巢狀函式和裝飾器 python正序迴圈使用remove和delect刪除報index溢位錯誤 decimal報錯：decimal.invalidoperation:

[＜class『decimal.conversionsyntax『＞]

參考：

Python 簡單爬取網頁資料

python爬取網頁資料

java網頁資料爬取

nodeJs爬取網頁資料

Python 簡單爬取網頁資料

python爬取網頁資料

java網頁資料爬取

nodeJs爬取網頁資料

相關推薦