蓋亞遊戲資料分析面試總結

2021-09-24 13:01:46 字數 451 閱讀 4729

1、自我介紹

2、關於電信使用者的資料**方面,介紹具體的演算法是怎麼進行的。

那麼如何進一步提高精度?(我答可以用xgboost)

3、如果給出一組遊戲類的歷史資料,arppu等資料呢?我回答的是arima模型,後來面試官提出prophet。可以提取趨勢、週期性、節假日等。facebook的開源包。

4、對主成分分析介紹一下,常用的演算法有什麼?

5、通過感測器採集到的一些時間序列資料,用什麼演算法識別出是指令碼還是真人玩家?

(想了半天說用無監督演算法裡的聚類分析,dbscan演算法)後來他又引導我說是時序資料。後來說可以用特徵提取各種行為,主要是特徵工程,然後根據波動範圍波動頻率等進行識別。。(沒太懂這個是什麼意思)

6、後來又提到了boost 。

7、介紹了基本用的工具和工作內容。

工作內容是指標提取、用機器學習、深度學習等**,工具是hive hadoop

資料分析面試總結

data node mapreduce 分布式計算 mapreduce流程 mrjob yarn 資源排程協調 第三正規化 不存在屬性對主鍵的傳遞依賴 永續性事務執行成功後,該事務對資料庫的更改是持久儲存在資料庫中的 快排思想 用到了分治思想,和分治演算法一樣為了進行排序需要先對其劃分的子區間進行排...

遊戲資料分析

最近專案上線了,得到了過年期間的一筆資料,通過資料總結出來不少東西 1 關卡留存率頭3關依次遞減10 左右,後面的關卡依次遞減5 算比較正常 2 關卡中卡玩家的關卡不宜過難,否則遊戲留存會遭到重創 我們這次第10關卡丟了30 的玩家.3 玩家購買的重中之重還是基於主介面 選人介面 居多,推送購買的,...

資料分析面試

整合學習思想 兩個流派 1 boosting 通過將弱學習器提公升為強學習器的整合方法來提高 的精度。典型演算法 adaboost gbdt 2 bagging 通過自動取樣的方法生成眾多並行式分類器,通過 少數服從多數 的原則來確定最終的結果。典型演算法 隨機森林 思想 一棵樹是決策樹,多棵樹就是...