python爬蟲 dota2上分ing

2021-08-26 15:18:54 字數 1370 閱讀 4922

這是max+上一張英雄勝率圖

那麼我們怎麼獲取中的資訊並加以利用呢?

1.編輯定向獲取該網頁的爬蟲,獲得上面的「姓名」「勝率」「使用次數」的資訊

新建爬蟲專案dotaitems:

新建後的scrapy基本框架就是這樣子

分別說一下幾個部分:

item.py相當於爬取到資料的容器;

name=scrapy.field()

frequency=scrapy.field()

wr=scrapy.field()#win rate

settings是配置檔案,需要修改的地方不多;(pipelines預設是關閉的,要開啟)

item_pipelines =

maxsearch是爬蟲的核心部分,因為只對單個網頁操作,所以主要是正規表示式的書寫;

item[「name」]=response.xpath(「//span[@class=』hero-name-list』]/text()」).extract()

item[「frequency」]=response.xpath(「//td[@style=』width: 40%』]/div[@style=』height: 10px』]/text()」).extract()

item[「wr」]=response.xpath(「//td[@style=』width: 30%』]/div[@style=』height: 10px』]/text()」).extract()

這樣可以分別獲取到中需要扣下來的東西,並將它存下來;

pipelines是對爬取資料進一步處理的方法;

在pipelines中我把獲取的資料儲存在dotaitems.json中;

開啟後如下;

以上就獲取了資料並儲存了下來;下一步是看看勝率和出場次數有沒有關係呢?

經過一系列處理。。。。。。

橫座標是出場次數,縱座標是勝率。。。

哈哈,好像沒什麼關係,只是玩tf的人特別多

總的來說,勝率高的英雄,大家玩的就多;同時也有人喜歡『秀』而選擇像tf這樣的英雄。。。

Dota2遊戲布局

現在離dota 2限號測試已經快兩周年,我們感覺我們已經準備好讓任何想要嘗試dota 2的人都能玩到這個遊戲了。對dota 2而言,或者說對所有大規模後端支援的遊戲而言,這不僅僅是直接發布並坐享其成那麼簡單,因為這些遊戲的基礎配套設施非常龐大。於是,我們將會對dota 2的開放採取不同的方式。我們的...

Dota2實時比賽資料結構

datamapliveteamdetails 雙方隊伍對戰資訊 radiantplayers radiant選手資訊列表 direplayers dire選手資訊列表 附 liveteamdetasils duration 持續時間 radiantteamid radiant隊伍id diretea...

DOTA2攻速計算公式研究

常見的遊戲中都有屬於自己的一套傷害機制,最近發現dota2中攻速計算公式與明日方舟中的幾乎一致,因此在學習之餘記錄下來。在介紹計算公式前,先引入幾個基本概念 基礎攻擊間隔bat base attack time 最核心的資料,所有的計算都必須依賴基礎攻擊間隔,是乙個與模型 英雄單位 有關的常量,各個...