演算法工程師該如何提高資料敏感度?

2021-09-27 03:34:42 字數 2654 閱讀 3341

大家有沒有特別羨慕和害怕過這種人,他能一眼看出你做的ppt裡面的資料異常,隨時能提出乙個資料證明你的小結論有問題,然後以乙個資料問題迅速推翻你整  個報告的結論,結果就是你做了整整乙個月的分析,全毀了,從頭再來。

這樣的人邏輯性極強且對你的匯報有生殺大權,最重要的是他有極強的資料敏感度。

那麼,什麼是資料敏感度?

所謂的資料敏感度,其實就是在大腦內建立了數字和業務之間的聯絡,而優秀的資料敏感度,就是能夠一眼看出資料的問題和背後可能的原因。

什麼叫一眼看出?

❖ 如果你是遊戲行業的,我告訴你這款mmorpg的次留是20%,你能知道我款產品在行業裡處於什麼樣的水準,遊戲前期可能存在什麼樣的問題等;

❖ 如果你是o2o行業的,我告訴你外賣訂單量相比於昨天**了10%,你能很快判斷出問題的影響面和造成訂單量**的可能原因;

❖ 如果你是電商行業的,我告訴你我這款產品的復購率是40%,你能很快判斷出我這款產品大概是什麼型別的產品,在行業內是什麼樣的水準;

做到這程度,就叫優秀的資料敏感度。如何提公升資料敏感度呢?

秘籍:熟悉業務

資料敏感度練成的基礎是一定要對業務非常熟悉,無數次的推測及驗證都是有用的寶貴經驗。

接下來我會根據分析師資料敏感度高的三個表現來給出提公升資料敏感度的方法。

⒈如何快速判斷資料是高了低了還是錯了:熟記關鍵指標的大數、觀察趨勢、緊盯異常值

這種快速判斷是基於平時對業務資料的熟記與使用的,請相信每個人的記憶力有好壞之分,但是只要下功夫,熟記業務的關鍵指標,了解他們的基本規律,經過一段時間的積累,你看這些資料的時候肯定會覺得胸有成竹。

記憶資料的技巧也是有的,不需要記全,只需要把關鍵指標的大數記下來,忽略小數,每天早上養成看報表的習慣,觀察趨勢,盯緊異常數,多看一些別人是怎麼分析異常原因的案例。慢慢地,對各項資料有了基本概念之後,理解資料背後的業務邏輯關係,這樣在閱讀報表時也能很快發現異常值,及時進行追蹤。

但是對於想轉行的新人,或者說應屆生來說,這個時候還沒有接觸到具體業務的機會,怎麼辦?

對於新人或面臨轉行的人來說,這兩種型別的人都缺少對本行業的通識,第一件要做的事就是背資料,記住這個行業的行業平均資料和各項通用指標的定義,這麼做是為了對整個行業有個總體的認知。

比如遊戲行業,可以查詢應用寶、360、硬核等各家平台發布的遊戲資料,對市面上的各種遊戲型別的留存、付費等資料有乙個整體的整理和記憶,比如arppu、arpu、次日留存、三日留存、七日留存、月留存、付費率等等。

比如電商行業,流量*轉化率*客單價*複購率這個公式則是重中之重等等。

⒉知道所有指標是怎麼來的,知道它們的意義以及相互的關係,進而判斷資料異常的原因

提公升敏感度的時刻想著三個問題:

❖ 資料怎麼來的?

理解業務,分析溯源,同時也要判斷資料**的可靠性

指標維度有哪些?

理解評估標準,不同業務有不同的關鍵業務指標,利用思維導圖積累相關業務的指標體系,多總結多問為什麼;指標體系經常用於資料細分找原因,知道資料構成才能更快地拆分資料,找到異常原因。

資料如何說明業務?

指標在業務中的應用,業務資料正常水平是怎麼樣的,受節假日或者活動營銷的影響的資料又是怎麼樣的,要多對比,結合環比同比明白資料高低的意義等。

⒊拿到資料,能夠根據分析目標很快理出分析框架,得出結論。

其次先明確指標變動的異常程度和影響面,訂單量比前一日**5%,是否大到必須加以重視。

確定需要引起重視後,就需要尋求資料分析的角度,排查異常原因,我們以遊戲行業為例,分析影響資料異常變動的原因可能有哪些,這裡的思考模式其實就是金字塔結構思維模式

先考慮全域性指標:包括一定時間內新增使用者量、總體付費率、總留存率、使用者活躍度、各環節總轉化率、搜尋功能使用率、翻頁率、崩潰率等。全域性指標用於分析對全體使用者產生影響的共性原因,絕大部分問題都會在全域性指標上體現出來;

在上述兩項指標基礎上,再考慮使用者行為資料:重點觀測使用者在不同時間段、不同需求型別下的行為,從而定位到由於某一細分人群的定向變化產生的資料異常;

時間因素:外界環境的影響也可能對產品資料造成影響,因此觀測環比和同比資料都很重要。

典型如「月末效應」,即一定規模的使用者群體因月底流量耗盡而減少上網行為,造成整體流量的下滑。另外,對於一款外賣產品而言。天氣變化也會造成資料波動,通常陰雨天氣的訂單量會走高。

同樣的,「周一效應」「寒暑假效應」也是遊戲行業比較常見的效應,遊戲dau在周一往往會走低,在寒暑假往往會走高;

輿情監控:包括但不限於通過人工或機器方式,從內部反饋渠道如客服系統到論壇、貼吧、微博、朋友圈等處採集大眾對產品的實時意見。極有可能因此發現導致產品資料驟然降低或飆公升的特殊輿情,如競爭對手有了哪些動作、母公司運作重大紕漏等;

定位到具體的問題和原因後,給出對應的結論和解決方案,比如修復某個bug,針對競爭對手的營銷策略做出同等力度的折扣反擊等。

分析出問題原因只是第一步,提出解決問題的方案才是最關鍵的。

作為前端工程師,該如何讓自己提高效率?

不知大家有沒類似這樣的經歷 一天忙到晚,一會被pm叫去確認需求,一會被設計拉去確認ui是否能實現,一會又被測試叫去確認bug,然後貌似做了很多事,但好像工作進度也沒什麼進展。然後只能晚上加班,在夜深人靜時還得敲 如果我們的工作效率能高一點 那也就不會那邊的苦逼了。所謂高效,就是,在更少的時間做更多的...

乙個工程師該如何高效工作

1.靜。在千頭萬緒,百般push,各種im 郵件狂轟濫炸中保持乙個靜字,找到最適合現在做的事情,情緒不要被外界所干擾。一次只做一件事,不要被打斷。有的公司土鱉文化嚴重,領導一會兒要求你幹這個,一會兒又說另外乙個事更緊急,完全打亂你的節奏。殊不知其實事情也沒那麼急,都是不把工程師當人的企業文化造成的。...

演算法工程師如何改進豆瓣電影

影迷們經常關注的電影排行榜裡,一部由100人評出9.0分的電影,和一部由10000人評出8.0分的電影,誰應該排在前面呢?這是我們演算法工程師時常會面對的問題。一些深度影迷可能會想到 imdb.com 網際網路電影資料庫 所採用的貝葉斯公式 見附註 這個公式的思路就是通過每部影片的 評分人數 作為調...