定時爬蟲部署到ubuntu16 4

2021-08-14 08:23:29 字數 475 閱讀 7270

把你的scrapy爬蟲寫好後,我們就可以寫指令碼來執行爬蟲

指令碼的邏輯就是先進去到爬蟲所在的資料夾然後執行scrapy crawl yourspider(你的爬蟲的名稱)

有個注意點就是scrapy在指令碼中要寫它的絕對路徑,通過命令which scrapy來獲取路徑

指令碼內容

#!/bin/sh

cd /spider #此處寫你爬蟲的資料夾

/usr/local/bin/scrapy crawl yourspider(你的爬蟲的名稱)

然後通過crontab -e命令去編輯

* 

*/1 *

* * sh (你指令碼的絕對路徑)

linux的crontab命令可以讓指令碼定時執行,命令的詳細介紹在我的另乙個部落格裡crontab命令詳解

關閉儲存後就會開始執行了,可以在爬蟲中列印日誌來關注執**況

ubuntu16啟用daytime服務

1.安裝xinted 先用cat etc services grep daytime 看一下是否有daytime服務,如果沒有的話需要安裝xinted 因為daytime服務包含在xinetd服務中。直接輸入命令 sudo apt get install xinetd 2.修改配置檔案 修改xine...

Window遠端登入Ubuntu16

wget unzip tigervncserver 1.6.80 4 amd64.zip dpkg i tigervncserver 1.6.80 4 amd64.deb 如果安裝出錯可執行 apt get install f 修復依賴關係 安裝 apt get install xrdp y 配置 ...

ubuntu16搭建redis集群

兩台ubuntu16雲伺服器上搭建redis集群,redis六個節點,三主三從 集群主節點數量最好為奇數,因為redis的投票選舉 一台伺服器上搭建redis埠號分別為7001,7002,7003,另一台伺服器上搭建redis埠號分別為7004,7005,7006。此時需要放開7001,7002,7...