python爬蟲 爬取英雄聯盟全英雄面板

2021-10-04 05:25:11 字數 1750 閱讀 1035

import requests

import re

#1、分析目標網頁,確定爬取的url路徑,headers引數

base_url=

''headers=

#2、傳送請求

response=requests.get(base_url,headers=headers)

base_data=response.json(

)#3、抓取資訊

base_data=

str(base_data)

#抓取英雄id

data_id=re.findall(r"heroid': '(.*?)', 'name"

,base_data)

for i in

range

(len

(data_id)):

item=data_id[i]

#經分析,英雄的**url位於id.js,因此構造以下**

hero_url=

''.format

(item)

response_hero=requests.get(hero_url,headers=headers)

data_hero_detail=response_hero.json(

)#print(data_hero_detail)

data_hero_detail=

str(data_hero_detail)

#抓取**的url

skin_url=re.findall(r"mainimg': '(.*?)', 'iconimg"

,data_hero_detail)

#print(skin_url)

#抓取**的id及英雄的名字

skin_id=re.findall(r"skinid': '(.*?)', 'heroid"

,data_hero_detail)

skin_name=re.findall(r"heroname': '(.*?)', 'herotitle"

,data_hero_detail)

#print(skin_id,skin_name)

#遍歷所有的**url

for skin_num in

range

(len

(skin_url)):

skin_no=skin_url[skin_num]

#因為id.js檔案內有空的**url,導致提取出來的**存在空的,獲取**的時候會報錯,所以用如下方式,跳過空的url

Python爬英雄聯盟lol全英雄面板

1.匯入所需模組 import requests import os 建立lol資料夾 os.mkdir lol 2.讀取js檔案,獲取英雄id hero id url response requests.get url,headers headers json list response.json...

python爬蟲 爬取王者榮耀全英雄面板

爬取王者榮耀全英雄 import requests import re 1 分析目標網頁,確定爬取的url路徑,headers引數 base url headers 2 傳送請求 response requests.get base url,headers headers base data res...

Python爬取英雄聯盟職業比賽資料

英雄聯盟全球總決賽的腳步近了,代表lpl出征s9的三支戰隊也已蓄勢待發,經常看英雄聯盟比賽的我也是非常期待 fpx rng ig 的精彩表現。我想找找網上有沒有公開的比賽資料,興許還能分析一波,看看這s9冠軍最有可能花落誰家。功夫不負有心人,我很快就通過搜尋引擎找到了含有國內外英雄聯盟賽事的 喏,就...