scrapy使用筆記

2021-10-14 07:17:25 字數 1062 閱讀 7084

1.先裝python環境

2.安裝pip

3.使用pip安裝

pip install lxml==3.4.2 // 有報錯提示

考慮到是網路不穩定的問題,這時我們用國內的映象源來加速

用pip安裝依賴包時預設訪問,但是經常出現不穩定以及訪問速度非常慢的情況,國內廠商提供的pipy映象目前可用的有:

參考文章

安裝好scrapy後可以在控制台直接新建專案了

cd到你定義好的目錄

scrapy startproject ***x //新建乙個***x的專案,然後再目錄下會生成乙個***x的資料夾,裡面有items,settings等檔案,爬蟲程式再spider資料夾下

進入專案的根目錄,執行下列命令啟動spider:

scrapy crawl ***x
//參考文章:

scrapy使用筆記

我是用anaconda安裝的scrapy 安裝完成,使用scrapy 建立爬蟲工程,之後把工程資料夾整個移動到ecipse,配置下run configure就可以執行了 初步了解了下xpath語法,會簡單地使用xpath摳取網頁裡面的內容 例子 td class hello 選取所有class標籤為...

Scrapy框架 使用筆記

本文記錄scrapy基本使用方法,不涉及框架底層原理說明。建立專案 scrapy startproject 進入專案 cd 建立爬蟲 scrapy genspider 爬蟲名 com 爬取域 生成檔案 scrapy crawl o json 生成某種型別的檔案 執行爬蟲 scrapy crawl 列...

Vim 使用筆記

set hlsearch set nohlsearch 搜尋後清除上次的加亮 nohl nohlsearch 拷貝 很有用的一句話,規定了格式選項,讓它換行不自動空格 set formatoptions tcrqn set fo r set noautoindent 再 shift insert 正...