//爬取豆瓣心靈奇旅影評,包括使用者主頁頭像
let request =
require
('request'
)let fs =
require
('fs'
)const path =
require
('path');
var startnum =
0//起始爬取位置
//傳送請求
function
reqdata
(url)
else)}
});}
);}//請求處理
async
function
req(url)
=await
reqdata
(url)
let reg1 =
/="short"
>(.*?)
/igs
//爬取使用者資訊的正則
let reg2 =
/"(.*?)" href=
"(.*?)".*
?"(.*?)".*
?/igs
let users =
let res1
let res2
let id = startnum
while
((res1 = reg1.
exec
(body))&&
(res2 = reg2.
exec
(body)))
users.
push
(user)
}return
newpromise
((resolve, reject)
=>
else})
}async
function
scrapycomments()
console.
log(
"爬取成功!");
}scrapycomments()
//寫入資料
function
writedata
(filename, data))}
}); fs.
open
(filepath,
'wx'
,(err, fd)
=>
, err =>})})}
注:**小白,寫的不好,多指教。
python爬取豆瓣影評
看的別人的 爬取某部影片的影評 沒有模擬登入只能爬6頁 encoding utf 8 import requests from bs4 import beautifulsoup import re import random import io import sys import time 使用se...
豆瓣影評爬取 中國機長
10月大火的中國機長相信大家都看過了吧 悄悄的說,我還有二刷?超級超級超級超級喜歡袁泉姐姐,溫柔又堅定,真誠又勇敢!import requests from bs4 import beautifulsoup import time import pandas as pd import os def ...
python爬蟲實戰 爬取豆瓣影評資料
爬取豆瓣影評資料步驟 1 獲取網頁請求 2 解析獲取的網頁 3 提速資料 4 儲存檔案 1 匯入需要的庫 import urllib.request from bs4 import beautifulsoup 隨機數的庫 import random 時間庫 import time 庫 import ...