centos7快速安全部署爬蟲執行環境

2021-10-19 12:54:46 字數 4220 閱讀 7724

centos快速部署爬蟲所需的環境, 避免走彎路! 以下所涉及其他部落格的鏈結, 都是作者親身測試有效的, 特此彙總

linux 系統掛載資料盤

# 注意事項

echo

'/dev/vdb1 /mnt ext4 defaults 0 0'

>> /etc/fstab

mount -a

新裝的centos 7安裝python3

pip3安裝

pip3 install -i -r requirements.txt

command

'gcc' failed with exit status 1報錯解決方法

yum install python3-devel

最好不要用預設的埠27017, 並且一定要設定密碼, 密碼生成器, 防止被暴力破解

mongo.conf, 修改處僅供參考

dbpath

=/mnt/mongodb/data

logpath

=/mnt/mongodb/logs/mongo.log #事先建立該檔案

=true

journal

=true

quiet

=true

port

=5010

fork

=true #後台執行

bind_ip

=0.0.0.0 #允許任何ip進行連線

wiredtigercachesizegb=2

# 這個最好設定下, 防止記憶體一直增長

auth

=true

注意事項

資料目錄換成硬碟所在目錄

啟動:cd /usr/local/mongodb/mongodb-linux-x86_64-3.6.13/bin

mongod -f /mnt/mongodb/mongo.conf

設定使用者名稱, 密碼

use admin

db.createuser(

)配置檔案加上:auth=true

登入use admin

db.auth(

'admin','123456'

)第二種登入方法

mongo --port 5010 -u "admin" -p "123456" --authenticationdatabase "admin"

mongodb匯出/備份命令

mongoexport -h localhost --port 5010 -u "admin" -p "123456" -d test_db -c test_col -o /mnt/test.json --authenticationdatabase admin

mongodump -h localhost --port 5010 -u "admin" -p "123456" -d test_db -o /mnt --authenticationdatabase admin

視覺化工具建議使用: robo 3t

centos安裝redis+三種啟動方式

centos7安裝redis4.0.2

redis允許遠端訪問並設定密碼

密碼和埠建議更改設定

redis.conf 修改處僅供參考

protected-mode no

port 5009

daemonize yes

requirepass your_password

進入src目錄, 啟動redis

cd /mnt/redis/redis-5.0.8/src

./redis-server /mnt/redis/redis-5.0.8/redis.conf

redis-cli命令全域性使用

ln -s /mnt/redis/redis-5.0.8/src/redis-cli /usr/bin/redis-cli

auth "password"

scrapy-redis配置格式

redis_url =

'redis://:password@ip:port/0'

視覺化工具推薦使用: redisdesktopmanager

scrapyd使用詳解

scrapyd 的安裝和啟動

default_scrapyd.conf 僅供參考

啟動:nohup scrapyd &

每次啟動確保在scrapyd目錄內執行該命令gerapy 使用詳解

預設是本地化啟動,如果埠被占用請自行更改

nohup gerapy runserver 0.0.0.0:5007 &

推薦專案 proxy_pool

1

) helper --> scheduler.py中設定獲取及檢查**ip頻率

scheduler.add_job(runproxyfetch, 'interval', seconds

=15, id

="proxy_fetch", name

="proxy採集"

)scheduler.add_job(runproxycheck, 'interval', minutes

=1, id

="proxy_check", name

="proxy檢查"

)檢查**可能會阻塞採集**任務, 需要合理設定檢查**頻率或併發

檢查**併發設定地方: helper --> check.py, 預設為20個執行緒

檢視採集**間隔時間是否按照設定的15s, 可以在proxyfetch.py中列印日誌進行確認, 從而調整上述引數

2) fetcher --> proxyfetcher.py設定擴充套件**

返回格式: host:ip

3) setting.py 檢查**可用性

verify_url =

""verify_timeout =

5max_fail_count =

0 設定失敗次數, 超過後從資料庫進行刪除(實際情況設定)

4) 程式啟動

# 啟動排程程式

nohup python proxypool.py schedule &

# 啟動webapi服務

nohup python proxypool.py server &

或者sh start.sh

圖形化管理工具ossbrowser

上傳檔案

nohup ./ossutil64 cp /mnt/youfile oss://youpath &

上傳資料夾

nohup ./ossutil64 cp -r /mnt/youfolder oss://youpath &

nohup ./ossutil64 cp oss://youpath/youfile /mnt/ &

webservices安全部署

問題提出 為了構建乙個安全的web服務,需要對呼叫方進行身份驗證,只讓通過審核的使用者呼叫web服務。軟體環境 web服務程式部署在分布於各地的工廠伺服器,這些伺服器位於內網之中,沒有固定外網ip,且不能通過外網進行訪問。呼叫這些web服務的是一台連線至internet的web伺服器,該web伺服器...

安全部署與優化

安全部署與優化 safe mode 簡單例子 設定指令碼訪問目錄 open basedir d www 設定禁用函式 disable functions system shell exec exec popen phpinfo passthru 設定register globals 設定magic ...

sshd服務安全部署

systemd 系統初始化程序 pstree 顯示系統樹程序 1,程序控制命令 ssh sshd systemctl status sshd 檢視服務狀態,inactive 不可用 active 可用 systemctl start sshd 開啟服務 systemctl stop sshd 關閉服...