基於資料驅動的歸因建模方法

2022-04-01 19:43:02 字數 916 閱讀 1478

很久沒有寫部落格了,今天總算可以靜下心來寫點東西。前段時間一直在處理使用者經過許多廣告渠道進入公司站點玩遊戲並充值,充值的效益該算在哪個渠道的問題。在這個過程中也看了目前一些主流網路分析公司如谷歌、3c metrics等在這方面的基本模型。

這些方法最終沒有被上級認可,因為咱們的問題可能更為複雜。那就是咱們不但涉及到廣告渠道眾多,而且遊戲數量也眾多,存在乙個渠道推多個遊戲,乙個遊戲在多個渠道推的問題。並且,引入這些新的方法,可能需要將目前的平台上很多東西徹底修改,代價太大。所以以後一定要記住,一定要具備全域性的眼光,綜合考慮演算法、效率、經濟效益的影響,否則提出來的都是一些看上去很美但又不被接受的方法。

先來一段背景。

這是一種基於一階和二階條件概率的方法,其基本步驟如下:

(1)對於給定的資料集,計算經驗概率

其中:,y是乙個結果變數,取值為0或1。1表示使用者轉化(消費或者註冊,具體情況由商家定義),0表示沒有轉化。

表示p個不同的廣告路徑。

表示經過渠道 

且轉化了的使用者的個數,

表示的是既經過渠道

又經過渠道

且轉化的使用者的個數。反之亦然。

(2)計算渠道i的貢獻

當然,實際上還可以延伸到三階甚至更高階,但在實際應用中有兩階也就夠了,但是如果不放心,也可以考慮嘗試用三階看看。

上面的思路其實挺簡單,就是先計算乙個渠道為轉化做貢獻的概率,然後在此基礎上計算乙個渠道的總貢獻。

13 資料建模 建模方法三 實體建模

實體建模法並不是資料倉儲建模中常見的乙個方法,它 於哲學的乙個流派。從哲學的意義上說,客觀世界應該是可以細分的,客觀世界應該可以分成由乙個個實 體,以及實體與實體之間的關係組成。我們在資料倉儲的建模過程中完全可以引入這個抽象的方法,將整個業務也可以劃分成乙個個的實體,而每個實體之間的 關係,以及針對...

Chapter 10 需求建模 基於類的方法

語法解析 獲取潛在類 潛在類篩選 四種型別 泛化關係 是一種繼承關係,表示一般與特殊的關係,它指定了子類如何特化父類的所有特徵和行為。箭頭指向 帶三角箭頭的實線,箭頭指向父類。實現關係 是一種類與介面的關係,表示類是介面所有特徵和行為的實現。箭頭指向 帶三角箭頭的虛線,箭頭指向介面。關聯關係 是一種...

testng 資料驅動方法

自動化測試必然有測試資料,測試資料有多有少,我知道的testng的兩種資料驅動方式,第一種是直接將測試資料寫到測試類中,然後使用dataprovider來關聯資料,這種適用於測試資料少的情況,另一種方式是將資料寫到excel中,這種方式適用於資料量多的情況,比如資料上千。使用引數 source te...