爬蟲 之 抓取嗶哩嗶哩彈幕

2021-08-20 18:12:31 字數 920 閱讀 5077

第三步:擼**:

# coding: utf-8

from parsel import selector

import requests

def get(url):

headers =

body = requests.get(url, headers=headers).content

# 我擦, 居然出現亂碼;

xbody = selector(text=str(body, encoding='utf-8'))

lists = xbody.xpath("//d")

count = xbody.xpath("//maxlimit/text()").extract_first()

print("共有%s條彈幕" % count)

for li in lists:

content = li.xpath("./text()").extract_first()

par = li.xpath("./@p").extract_first()

print(content, ":::::", par)

if __name__ == '__main__':

url = ""

get(url)

結果:

數字的含義,我也不懂 就知道乙個時間戳和 乙個使用者名稱;其他的自行查詢

嗶哩嗶哩 嗶哩嗶哩,危!!!

以前的時候,唧唧down很好用,不管是網頁還是客戶端,都能滿足要求。最近在用的時候,網頁端老是出問題 用客戶端吧,也感覺沒有以前順手了。兩者都是便攜版,解壓後直接執行主程式,無需安裝。不過唧唧有安裝版,多乙個選擇吧,問題不大,因為我更喜歡便攜版。檔案大小350mb,相比1080p畫質,位元速率提公升...

20190910嗶哩嗶哩

給定乙個陣列,這些數連在一起可以組成乙個大數,求能組成最大數。如 3,30,34,5,9 能組成的最大數為 9534330。由於組成的數可能非常大,用字串返回。include include include include include include include include includ...

嗶哩嗶哩彈幕處理 情感傾向分析

將xml彈幕解析,並寫入csv檔案 部分 import xml.etree.elementtree as et import csv import time tree et.elementtree file test.xml root tree.getroot print root.tag,root...