nodejs爬取豆瓣影評

2021-10-18 01:37:51 字數 1254 閱讀 9045

//爬取豆瓣心靈奇旅影評,包括使用者主頁頭像

let request =

require

('request'

)let fs =

require

('fs'

)const path =

require

('path');

var startnum =

0//起始爬取位置

//傳送請求

function

reqdata

(url)

else)}

});}

);}//請求處理

async

function

req(url)

=await

reqdata

(url)

let reg1 =

/="short"

>(.*?)

/igs

//爬取使用者資訊的正則

let reg2 =

/"(.*?)" href=

"(.*?)".*

?"(.*?)".*

?/igs

let users =

let res1

let res2

let id = startnum

while

((res1 = reg1.

exec

(body))&&

(res2 = reg2.

exec

(body)))

users.

push

(user)

}return

newpromise

((resolve, reject)

=>

else})

}async

function

scrapycomments()

console.

log(

"爬取成功!");

}scrapycomments()

//寫入資料

function

writedata

(filename, data))}

}); fs.

open

(filepath,

'wx'

,(err, fd)

=>

, err =>})})}

注:**小白,寫的不好,多指教。

python爬取豆瓣影評

看的別人的 爬取某部影片的影評 沒有模擬登入只能爬6頁 encoding utf 8 import requests from bs4 import beautifulsoup import re import random import io import sys import time 使用se...

豆瓣影評爬取 中國機長

10月大火的中國機長相信大家都看過了吧 悄悄的說,我還有二刷?超級超級超級超級喜歡袁泉姐姐,溫柔又堅定,真誠又勇敢!import requests from bs4 import beautifulsoup import time import pandas as pd import os def ...

python爬蟲實戰 爬取豆瓣影評資料

爬取豆瓣影評資料步驟 1 獲取網頁請求 2 解析獲取的網頁 3 提速資料 4 儲存檔案 1 匯入需要的庫 import urllib.request from bs4 import beautifulsoup 隨機數的庫 import random 時間庫 import time 庫 import ...