scrapy環境搭建

2021-08-01 01:21:08 字數 1319 閱讀 4498

在spiders目錄下建立」doubanspider.py」檔案,內容如下:

# -*- coding: utf-8 -*-

import scrapy

class

firstspider

(scrapy.spider):

name = "douban"

# 爬蟲的名字,執行時候使用

start_urls = [

""#需要爬去的url

]def

parse

(self, response):

bodycontent = response.body # response獲取**的返回內容

filename = response.url.split("/")[-1] + ".html"

# 將bodycontent寫入檔案

print

'curent url => ', filename

file = open(filename, "w")

file.write(bodycontent)

file.close()

在scrapy.cfg的同級目錄下建立main.py,用來執行該scrapy專案,內容如下:

# coding:utf-8

from scrapy import cmdline

cmdline.execute("scrapy crawl douban".split())

在pycharm中執行main.py,此時控制台輸出如下:

好了,搭建好scrapy環境之後,就可以正式考試我們的爬蟲之旅了。 好運,好運,好運

Scrapy環境搭建

win7系統下搭建scrapy環境 以我電腦f盤建立的venv為例 1.cd venv 2.cd scripts 3.activte deactivate 進入 退出 虛擬環境 4.cd 5.pip install c users administrator desktop twisted 18.4...

Scrapy環境搭建

建立乙個新的專案 scrapy startproject 專案名 2.生成爬蟲 scrapy genspider 檔名 3.執行 crawl scrapy crawl 爬蟲名稱 scrapy crawl 爬蟲名 o zufang.json o output scrapy crawl 爬蟲名 o zu...

ubutun 搭建scrapy環境

scrapy官方文件 本人ubutun系統只有python3,無python2 可以了解python。2020不在更新python兩年前的了解,目前不知道 可以跳過安裝python3 一 安裝以下依賴項 sudo apt get install python3 dev python3 pip lib...