Python網路爬蟲實戰專案大全！

**：

doubanspider - 豆瓣讀書爬蟲。可以爬下豆瓣讀書標籤下的所有圖書，按評分排名依次儲存，儲存到excel中，可方便大家篩選蒐羅，比如篩選評價人數》1000的高分書籍；可依據不同的主題儲存到excel不同的sheet ，採用user agent偽裝為瀏覽器進行爬取，並加入隨機延時來更好的模仿瀏覽器行為，避免爬蟲被封。

**：zhihu_spider - 知乎爬蟲。此專案的功能是爬取知乎使用者資訊以及人際拓撲關係，爬蟲框架使用scrapy，資料儲存使用mongo

**：bilibili-user - bilibili使用者爬蟲。總資料數：20119918，抓取字段：使用者id，暱稱，性別，頭像，等級，經驗值，粉絲數，生日，位址，註冊時間，簽名，等級與經驗值等。抓取之後生成b站使用者資料報告。

**：cnkispider - 中國知網爬蟲。設定檢索條件後，執行src/cnkispider.py抓取資料，抓取資料儲存在/data目錄下，每個資料檔案的第一行為欄位名稱。

**：lianjiaspider - 鏈家網爬蟲。爬取北京地區鏈家歷年二手房成交記錄。涵蓋鏈家爬蟲一文的全部**，包括鏈家模擬登入**。

**：scrapy_jingdong - 京東爬蟲。基於scrapy的京東**爬蟲，儲存格式為csv。

**：qq-groups-spider - qq 群爬蟲。批量抓取 qq 群資訊，包括群名稱、群號、群人數、群主、群簡介等內容，最終生成 xls(x) / csv 結果檔案。

**：qqspider - qq空間爬蟲，包括日誌、說說、個人資訊等，一天可抓取 400 萬條資料。

**：推薦文章：

Python網路爬蟲實戰專案大全！

python實戰網路爬蟲

python爬蟲實戰

python2 7爬蟲實戰小專案

Python網路爬蟲實戰專案大全！

python實戰 網路爬蟲

python爬蟲實戰

python2 7爬蟲實戰小專案

相關推薦

python實戰網路爬蟲