點選率CTR修正方法 威爾遜區間

2021-10-04 18:13:04 字數 874 閱讀 5807

由於原始ctr計算方式只考慮了相對值,沒有考慮絕對值。即,沒有考慮**的數值大小,在**少的情況下,計算出的ctr其實不可靠,樣本充足的情況下,才能反應真實情況

舉例:此三個廣告的ctr 都是 0.5 ,但是按照實際表現,從置信的角度分析,應該是c > b > a,因為c的樣本數更多,可信度更高。

為了衡量樣本數對於 ctr 置信區間的影響,科學家們引入"威爾遜(wilson)區間"的概念。公式如下

結果:

walson_ctr(5,10):0.2365895936154873

walson_ctr(50,100):0.40382982859014716

walson_ctr(500,1000):0.4690690341793595

點選率 經驗

資料不均衡即是正負樣本的比例相差很大,對於資料不均衡有一些解決方法和經驗 1.決策樹在樣本不均衡的問題上會表現的好 2.在劃分樣本的時候,給較少的樣本大的權重 lgb eval lgb.dataset x test,label y test,reference lgb train,weight 1 ...

靜態頁更新點選率

靜態頁 body div id ny detailmain tit02 點選率 font color red script src test js.aspx?id 1 script font div body aspx 頁面 page language c import namespace syst...

用python實現刷點選率

準備 完整可執行 main 我的說明 跨平台 linux通過curl可以非常快速的訪問。但是同事不懂linux,只能通過urllib庫寫個跨平台的實現 可擴充套件性 為了增加程式的通用性,加入argparse庫,通過程式入參實現靈活應用。注意 推薦使用argparse,wxcop的很多同學還是使用老...