Python爬取英雄聯盟職業比賽資料

英雄聯盟全球總決賽的腳步近了，代表lpl出征s9的三支戰隊也已蓄勢待發，經常看英雄聯盟比賽的我也是非常期待 fpx、rng、ig 的精彩表現。我想找找網上有沒有公開的比賽資料，興許還能分析一波，看看這s9冠軍最有可能花落誰家。

功夫不負有心人，我很快就通過搜尋引擎找到了含有國內外英雄聯盟賽事的**，喏，就是下面這個。

在這個**上，我們能夠看到不同賽區的不同賽季的比賽資訊，以及各種世界賽的資料資訊，包含選手資料和隊伍資料。

開啟開發者工具，觀察一下這個**，很容易就發現了包含職業選手資訊的頁面。

觀察其headers，發現是get請求，requests url 如下，

，訪問該鏈結需要攜帶引數 tour 和 patch 。從命名就可以看出，tour 是tournament的簡寫，patch 是版本號，版本號可以不加入引數，以抓取所有版本的聯賽資料。

那麼這個 tour 引數如何獲得呢？繼續觀察 network ,發現了下圖這個 tournament_list 。

各個聯賽的id號資料可以通過這個頁面來獲取，而這個id號正是我們需要的 tour 引數。

得到了所有的引數資訊後，我們便可以使用 requests 來模擬瀏覽器發出請求，並獲取頁面的json資料，並一一提取存入mongodb資料庫。運用同樣的方法，我們也可以獲得各個職業戰隊的資料。

總的來說這是乙個入門級別的爬蟲，**沒有採取反爬措施，對新手相當友好。職業選手的資料報含26個資料維度，包含擊殺、出場次數、場均參戰率、傷害轉化率等一系列資料；職業戰隊的資料報含血腥程度、分均傷害、場均時長、一血率等25個資料維度。想必會是非常不錯的資料分析素材。