scrapy框架的安裝和初使用

一開始直接用pip install scrapy 安裝，結果如圖

然後在群裡各種問，最後群友們推薦anaconda下安裝，關於這個可以參考anaconda 環境下安裝 scrapy。總之也是乙個辛酸的故事~~~。安裝好了在命令提示符下面輸入scrapy，終於不是「scrapy不是內部或外部命令，也不是可執行的程式或批處理檔案。」這個東西了-^-。

首先要先建立乙個工程

你會發現目錄下面有這個東西

介紹如下：

- 在工程中生成乙個spider：scrapy genspider demo python123.io。 demo表示爬蟲名字， pyhton123.io表示要爬取**網域名稱

- 生成的spider相關資訊如圖：

- spider的名字可以隨便取，但是這個class必須繼承scrapy.spider - name：spider名字 - allowed_domains：爬取網頁的網域名稱 - start_urls：爬取網頁的初始頁面 - parse方法：解析網頁的方法 - 接下來就是完成這個.yp檔案了。

- 執行這個爬蟲：在工程下面執行scrapy crawl demo。 demo為spider名字。就可以執行了

簡單的總結一下

部分內容參考自：