nodejs爬蟲獲取漫威超級英雄電影海報

2021-09-20 05:00:30 字數 872 閱讀 9459

昨天去看了《復聯3》的首映,當我提前15分鐘進入影院的時候, 看到了粉絲們取票的長隊, 頓時有一種跨年夜的感覺...

最近看了node爬蟲的一些知識, 這裡用node爬取一下漫威官網的電影海報!

marvel

// 

const request = require('superagent')

const cheerio = require('cheerio')

const fs = require('fs-extra')

const path = require('path')

let url = ''

// 獲取url和名字

async function geturlandname())

return imgaddrarray

}async function download(imgandname)

// 建立資料夾, 控制整體流程

async function init()

catch(err)

// 獲取資源

for (let imgaddr of imgaddrarray)

}init()

執行結果

直觀感受, node爬蟲並沒有python好用, 而且由於瀏覽器的同源限制, 在瀏覽器端跑node爬蟲也會有些麻煩;node爬蟲的優勢:理論上講,node預設的非同步玩法, 能達到python的多執行緒爬蟲的效果.

寫爬蟲,還是老老實實用python吧!

nodejs爬蟲獲取漫威超級英雄電影海報

昨天去看了 復聯3 的首映,當我提前15分鐘進入影院的時候,看到了粉絲們取票的長隊,頓時有一種跨年夜的感覺.最近看了node爬蟲的一些知識,這裡用node爬取一下漫威官網的電影海報 獲取url和名字 async function geturlandname return imgaddrarray a...

scrapy漫畫爬蟲 漫客棧

爬取漫客棧上的免費漫畫 每個漫畫的資訊都儲存在了div中,先獲取乙個div list,然後再遍歷進行需要的資訊的收集。div list response.xpath div class cate comic list clearfix div for div in div list item ite...

nodejs簡易爬蟲

我的爬蟲程式是用nodejs寫的,因為最近在學這個東西,其中使用了express框架,以及cheerio和superagent兩個模組。cheerio模組是nodejs處理html內容的神器,例如var cheerio.load html 將頁面的html內容載入下來後,便可使用jquery語法進行...