Python簡易爬蟲,爬取鬥魚顏值美女!!

2021-08-01 12:18:17 字數 1916 閱讀 2405

jackchiang

<1>版本1,效果如,存在問題不能給加自己的名字,**不夠靈活。版本2解決這個問題

#coding=utf-8

#爬取鬥魚顏值妹子

import re

import urllib

import time

#定義為方法

效果圖~~~

<2>版本2更靈活一些

#coding=utf-8

#爬取鬥魚顏值妹子

import re

import urllib.request

import time

from bs4 import beautifulsoup

#定義為方法

defgethtml

(url):

page = urllib.request.urlopen(url)

html=page.read()

return html

defgetimage

(html):

#建立物件,傳入網頁資料

soup1 = beautifulsoup(html)

soupl = soup1.select('#live-list-contentbox')

print(str(soupl))

strone = str(soupl)

soup2 = beautifulsoup(strone)

soupli = soup2.select('li')

for souplione in soupli:

#獲取單個li標籤獲取資料

**執行狀態

後續版本會有更好效果!!

爬取小說的簡易python爬蟲

學習一段時間的python之後決定寫些東西 剛好自己喜歡看 就像寫一段爬取 的爬蟲,這裡以筆趣閣的 為例。我發現筆趣閣的每個 的目錄源 基本都包含其所有的章節的url,所以這段 是先獲取所有的url然後逐頁獲取其文字 import requests 這裡以 天地霸氣訣為例 import re imp...

Python實時爬取鬥魚彈幕

輸入鬥魚房間號實時獲取彈幕資訊,實現效果如下 建立連線 通過tcp協議連線到彈幕伺服器 向彈幕伺服器傳送登入請求,登入彈幕伺服器,訊息格式type loginreq roomid 房間號 不需要賬號密碼 登陸成功之後伺服器會給你返回乙個登入成功資訊,這部分不用管,繼續向伺服器傳送乙個進入彈幕分組請求...

鬥魚彈幕資料爬取

主要參考鬥魚的文件 dev bbs.douyutv.com forum.php?m 通過socket與彈幕伺服器建立連線 第三方接入彈幕伺服器列表 複製 協議組成 訊息長度 4 位元組小端整數,表示整條訊息 包括自身 長度 位元組數 訊息長度出現兩遍,二者相同 訊息型別 2 位元組小端整數,表示訊息...