爬蟲入門(一)爬自己的CSDN部落格

2021-10-06 01:43:20 字數 582 閱讀 3363

今天本來在搞人體識別模型的,emmm後來想搞一直想試的爬蟲,於是我就來了!

我是用的軟體是pycharm,這個軟體是jetbrains開發的,我最近使用的連線資料庫的軟體datagrip也是jetbrains公司了,只不過我認為datagrip對新使用者不太友好,很多功能都隱藏起來了,還要你自己去發現emmm。

pycharm簡稱pc;

然後就是建立自己的乙個專案。

首先會讓你把自己的專案放在哪個位置(這個位置你自己選擇了)

注意:pc是建立在python直譯器基礎上的,所以你首先應該安裝的是python

之後就是新建乙個.py的file。

比如我本來想爬cf的,後來爬爬自己的部落格。

輸入以上**:首先需要匯入我們的requests包,然後爬取的**。然後輸出爬取的內容即可。

我得執行結果大致就是這樣。

爬取成功~

csdn搜自己的部落格

不得不說,csdn部落格的搜尋功能是在太弱了。而且一直都很弱,以至於我每次想在自己部落格上找自己發的文章都變得那麼難。做乙個搜尋部落格內文章的功能沒有那麼難吧?還是說csdn已經放棄了部落格這一塊了?我發現我的部落格排名好像靠前了,難道是csdn的部落格沒落了?既然如此,也是無可奈何的事情,不過終歸...

爬取自己的csdn目錄

csdn目錄的分頁 後面是幾就是幾個分頁,簡單點,直接遍歷增加就好了,導包就不細說了 解析html org.jsoup groupid jsoup artifactid 1.11 3 version dependency fr.opensagres.xdocreport groupid fr.ope...

爬蟲抓取自己csdn部落格點讚數

檢視自己文章的點讚數 瀏覽量。import requests,re,math url r requests.get url,headers text articles re.search d s 原創 r group 1 pages int math.ceil int articles 20 art...