華為精英演算法大賽決賽總結

2021-09-26 13:37:51 字數 501 閱讀 8606

比賽第一步,先做eda,發現強特具體來說,如觀察某個變數對於label的分布

觀察特徵,比如觀察uid_value_counts(),那麼就會去除掉uid_counts()為1的樣本

(1):初賽複賽都用merge取樣,非常侷限

(2):隨機取樣,調整比例,達到和測試集分布一致

(3):基於uid_counts()取樣,考慮不同day的情況

(4):要考慮新使用者,提高泛化能力

(5):賽題理解,官方的話要嚴格揣摩(1)word2vec embedding

(2)xdeepfm,cin等各種推薦系統模型,參見深度系列

(1)從label出發,做關於某個feature的value_counts():

pd.grouby[『label』, 『feature』](『feature』).agg()
(2)根據特徵的value_counts(),做成2值特徵

(3)長尾做log變換,喂進lgb,加速收斂

華為程式設計大賽決賽題

題目 俄羅斯方塊覆蓋。給定 乙個21 21的格仔矩陣,從1到441編號。輸入是乙個檔案testin.txt,裡面有4個數字,每乙個數字代表陣列下標,陣列元素值為1,表示障礙。空著的格仔用0表示。這四個數字代表的圖形只能是這個中的一種!也就是說。矩陣中4個1勾勒出個圖形只能是這兩種樣子。要求是用俄羅斯...

2017華為程式設計大賽總結

華為研發部門,每年都會在部門內部舉辦一屆程式設計大賽。旨在讓開發人員在工作之餘,通過遊戲程式設計的切磋,提高技術和協作能力。在入職華為的第四個年頭,我終於如願拿到了部門程式設計大賽的冠軍。之前的每一年也都會參加,其中兩次抱大腿拿到了亞軍,一次因為太忙棄權了。這一屆終於帶隊拿到了冠軍,了卻了一樁心事。...

華為軟體精英挑戰賽總結

我們的成員分工 1 負責除錯 糾錯和上傳 2 負責查詢演算法思路 3 負責查詢演算法並且寫 框架 步驟 1 通過各個同學的專長進行分工,如上所示,確定一有思路就開小組會議討論。2 3號同學在網上查詢到乙個最基本的直連程式,該程式有錯誤,需要修改。3 1號同學同過3號同學給的直連 進行除錯和改錯,與此...