Scrapy庫的介紹和結構

（2）scheduler----engine----**********----endine----spiders

engine模組從scheduler模組獲得下乙個要怕爬取的網路請求，engine獲得請求後通過中介軟體傳送給**********模組，**********模組拿到請求後真實的連線網際網路並且爬取相關的網頁，爬取到網頁後，**********模組將爬取的內容形成乙個物件，即響應（response），將所有的內容封裝成乙個response之後，將這個響應再通過中介軟體交給engine,最終在傳送給spiders

在這個框架中，入口是spiders,出口是item pipelines，這兩個需要使用者自己編寫配置，而engine,**********,scheduler都是已有功能的實現，spiders模組向框架提供要訪問的url鏈結，同時要解析從頁面上獲得的內容，item pipelines負責對提取的資訊進行後處理

在這個框架中使用者僅對spiders模組和item pipelines模組進行編寫，即使用者在scrapy框架下經過簡單的配置就可以實現執行的功能，最終實現爬蟲需求

Scrapy庫的介紹和結構

requests庫和Scrapy比較

Scrapy基本介紹的學習（一）

3 B S結構和C S結構的介紹

Scrapy庫的介紹和結構

requests庫和Scrapy比較

Scrapy基本介紹的學習（一）

3 B S結構和C S結構的介紹

相關推薦