scrapy環境搭建

在spiders目錄下建立」doubanspider.py」檔案，內容如下：

# -*- coding: utf-8 -*-
import scrapy
class
firstspider
(scrapy.spider):
name = "douban"
# 爬蟲的名字，執行時候使用
start_urls = [
""#需要爬去的url
]def
parse
(self, response):
bodycontent = response.body # response獲取**的返回內容
filename = response.url.split("/")[-1] + ".html"
# 將bodycontent寫入檔案
print
'curent url => ', filename
file = open(filename, "w")
file.write(bodycontent)
file.close()

在scrapy.cfg的同級目錄下建立main.py,用來執行該scrapy專案，內容如下：

# coding:utf-8
from scrapy import cmdline
cmdline.execute("scrapy crawl douban".split())

在pycharm中執行main.py，此時控制台輸出如下：

好了，搭建好scrapy環境之後，就可以正式考試我們的爬蟲之旅了。好運，好運，好運

Scrapy環境搭建

win7系統下搭建scrapy環境以我電腦f盤建立的venv為例 1.cd venv 2.cd scripts 3.activte deactivate 進入退出虛擬環境 4.cd 5.pip install c users administrator desktop twisted 18.4...

Scrapy環境搭建

建立乙個新的專案 scrapy startproject 專案名 2.生成爬蟲 scrapy genspider 檔名 3.執行 crawl scrapy crawl 爬蟲名稱 scrapy crawl 爬蟲名 o zufang.json o output scrapy crawl 爬蟲名 o zu...

ubutun 搭建scrapy環境

scrapy官方文件本人ubutun系統只有python3，無python2 可以了解python。2020不在更新python兩年前的了解，目前不知道可以跳過安裝python3 一安裝以下依賴項 sudo apt get install python3 dev python3 pip lib...

scrapy環境搭建

Scrapy環境搭建

Scrapy環境搭建

ubutun 搭建scrapy環境

相關推薦