task01 賽題理解

2021-10-09 11:58:09 字數 936 閱讀 9598

零基礎入門金融風控-貸款違約**

task01:賽題理解

完全是好奇心驅使,在基本沒有基礎的情況下,看能不能通過一次課程(比賽)掌握機器學習的一般方法。我想,只要堅持到了最後,全程經歷了這個過程,一定會有所成。

關於賽題理解,個人認為主要需要做三件事:

閱讀「賽題理解", 搞清楚要解決的是什麼問題,以及基本的思路和方法;

理解對於**結果的評價標準,同時從評價標準反推,反過來進一步構思解決方法。

so,開始吧。

賽題理解其實在公開的鏈結中已經很清楚了,貼在這裡:

我摘錄幾個我認為重要的點:

理解對於**結果的評價標準。

「競賽採用auc作為評價指標。auc(area under curve)被定義為 roc曲線 下與座標軸圍成的面積。」

什麼是auc,什麼又是roc?混淆矩陣的真正、假正、真負、假負的理解是基礎,下面貼一下:

重點是這裡:roc空間將假正例率定義為x軸,將真正例率定義為y軸。乙個正例,意思就是乙個違約,風控模型必然對違約敏感(厭惡違約),因此要盡可能把所有的正例都找出來,哪怕是錯判了也好(就減少可能發生的違約了)。不過也不能極端呀,要是把所有人都判為可能違約了,那生意也就不用做了。所以一定要把要違約的判准咯,也就是y軸(tpr)一定要高,同時x軸(fpr)要盡量低一些。

這是直觀理解了,後面會越來越深入。

好了,先到這裡,帶著對後續的未知,打卡。

機器學習Task01

x,y 輸入資料,array like,shape n,s 點的大小 標量或array like,shape n,可選 大小以點數 2。預設是rcparams lines.markersize 2。c 點的顏色 順序或顏色順序,可選,預設 b c可以是單個顏色格式的字串,也可以是一系列顏色 規範的長...

金融風控 Task01

題目理解 通過這道賽題來引導大家走進金融風控資料競賽的世界,主要針對於於競賽新人進行自我練習 自我提高。指標 分類演算法常見的評估指標如下 1 混淆矩陣 confuse matrix 2 準確率 accuracy 3 精確率 precision 4 召回率 recall 5 f1 score 6 p...

動手學深度學習 task01

task 1 線性回歸 多層感知機 softmax函式 1 線性回歸作為基本的機器學習演算法,實現較簡單,應用廣泛。以下為用pytorch編寫的線性回歸類 import torch.nn as nn import torch from torch.autograd import variable f...