《R語言遊戲資料分析與挖掘》新書推薦

2021-08-17 03:10:31 字數 1157 閱讀 3340

歡迎關注天善智慧型hellobi.com,我們是專注於商業智慧型bi,大資料,資料分析領域的垂直社群,學習、問答、求職,一站式搞定!

《r語言遊戲資料分析與挖掘》新書上市已經有乙個多月,各大**均有銷售。這是一部從大資料技術和遊戲業務雙重維度講解如何利用結果資料指導商業決策的實戰性著作,樂逗遊戲高階資料分析師撰寫,是他近10年資料探勘與分析經驗的總結。資料是無價的,只有當資料被挖掘分析並幫助到企業的時候才是有價值的。傳統的資料分析類圖書重技術而輕業務,本書二者並重:技術方面,以遊戲資料的挖掘與分析為核心,輻射遊戲資料處理的各個環節,系統講解遊戲資料探勘與分析的技術、方**和工具;業務方面,所有案例的講解過程中都對相關業務進行了重點解讀,旨在加深資料分析師對遊戲業務的理解和思考,從而更好地利用r語言技術解決遊戲資料處理中的各種複雜問題。

實戰篇包括資料處理技巧、路徑行為分析、付費偏好深度挖掘已經各種分類演算法的原理及r實現(knn近鄰、樸素貝葉斯、決策樹、bagging、boosting、隨機森林、人工神經網路以及支援向量機等演算法),並利用caret包進行十折交叉驗證選擇最優模型。比如在對付費使用者偏好的深度挖掘中,針對遊戲使用者總結了幾種常用的資料探勘技術:

其中,關聯規則分析是購物籃經常應用的一種挖掘技術,基於物品協同過濾的方法來對玩家進行topn商品推薦是目前電商流行的推薦演算法之一,並利用社會網路分析中的社**現技術研究使用者購買物品的偏好。

在渠道使用者質量分析一章中,書中借鑑時間管理理論中乙個非常重要的四象限法則,對渠道使用者進行象限劃分,進而研究不同渠道的使用者質量情況。書中利用median-iqr方法分析arppu、arpu、新增次日留存率和新增七日留存率等指標,檢視不同渠道在一月份資料的集中及離散程度。這裡使用中位數作為衡量中心的統計量,應用四分位距(iqr)作為離散指標的統計量更有意義。與更常用的均值和標準差相比,這些統計量在有離群值存在時更加穩健。

由於傳統的資料分析技術都是針對單一維度進行研究,這樣並未考慮到維度間的關係,本章最後還提出使用者質量打分模型,利用能體現使用者數量、使用者質量和使用者收入等原始指標,進行模型指標轉化,並得到渠道使用者質量得分,進而對渠道使用者優劣進行綜合評價。

在提高篇詳細介紹了r語言資料探勘工具rattle,此工具能夠在乙個圖形化的介面上完成資料匯入、資料探索、資料視覺化、資料建模和模型評估整個資料探勘流程;最後一章介紹了web開發框架shiny包,使得r的使用者不必太了解css、js,只需要了解一些html的知識就可以快速完成web開發。

資料分析與挖掘 R語言 多元線性回歸

乙個簡單的例子!環境 centos6.5 hadoop集群 hive r rhive,具體安裝及除錯方法見部落格內文件。線性回歸主要用來做 模型。1 準備資料集 x y 0.10 42.0 0.11 43.5 0.12 45.0 0.13 45.5 0.14 45.0 0.15 47.5 0.16 ...

資料分析與R語言01

prod 就是連乘,例如 x c 1 5 則prod x 1 2 3 4 5 120 seq 產生向量,例如 seq 5,20 seq 5,121,by 2 步長為2 seq 5,121,length 10 diag 矩陣的對角線,例如 diag 10,3,4 返回三行四列,且對角線是10 1 2 ...

R語言 資料分析

二 大資料分析 三 資料分析常用工具 資料分析是指用適當的統計方法對收集來的大量第一手資料和第二手資料進行分析,以求最大化地開發資料資料的功能,發揮資料的作用。資料分析是為了驗證假設的問題,需要提供必要的資料驗證。分析模型構建完成後,需要利用測試資料驗證模型的正確性。資料分析是為了挖掘更多的問題,並...