DW金融風控比賽專案任務一賽題理解

2021-10-09 11:24:34 字數 1641 閱讀 4962

本次新人賽是datawhale與天池聯合發起的0基礎入門系列賽事第四場 —— 零基礎入門金融風控-貸款違約**。

field

description

id為貸款清單分配的唯一信用證標識

loanamnt

貸款金額

term

貸款期限(year)

interestrate

貸款利率

installment

分期付款金額

grade

貸款等級

subgrade

貸款等級之子級

employmenttitle

就業職稱

employmentlength

就業年限(年)

homeownership

借款人在登記時提供的房屋所有權狀況

annualincome

年收入verificationstatus

驗證狀態

issuedate

貸款發放的月份

purpose

借款人在貸款申請時的貸款用途類別

postcode

regioncode

地區編碼

dti債務收入比

delinquency_2years

借款人過去2年信用檔案中逾期30天以上的違約事件數

ficorangelow

借款人在貸款發放時的fico所屬的下限範圍

ficorangehigh

借款人在貸款發放時的fico所屬的上限範圍

openacc

借款人信用檔案中未結信用額度的數量

pubrec

貶損公共記錄的數量

pubrecbankruptcies

公開記錄清除的數量

revolbal

信貸周轉餘額合計

revolutil

迴圈額度利用率,或借款人使用的相對於所有可用迴圈信貸的信貸金額

totalacc

借款人信用檔案中當前的信用額度總數

initialliststatus

貸款的初始列表狀態

表明貸款是個人申請還是與兩個共同借款人的聯合申請

earliescreditline

借款人最早報告的信用額度開立的月份

title

借款人提供的貸款名稱

policycode

公開可用的策略_**=1新產品不公開可用的策略_**=2

n系列匿名特徵

匿名特徵n0-n14,為一些貸款人行為計數特徵的處理

提交結果為每個測試樣本是1的概率,也就是y為1的概率。評價方法為auc評估模型效果(越大越好)。

模型評估請參考本文

datawhale官方文件

賽題理解是開始比賽的第一步,賽題的理解有助於對競賽全域性的把握。通過賽題理解有助於對賽題的業務邏輯把握,對於後期的特徵工程構建和模型選擇都尤為重要。

在開始比賽之前要對賽題進行充分的了解。

比賽什麼時候開始,什麼時候結束,什麼時候換b榜資料。

和該比賽有沒有類似的比賽可以參考借鑑。

線上提交結果的次數往往是有限的,提前了解每日可以提交的次數。

比賽使用的是什麼評價指標,可以選擇相同的評價指標作為線下驗證的方式。

金融風控專案

一 問題定義 金融的核心是風險控制。自然而然地,ai的主戰場也變成了如何使用ai技術精準的做風險控制。在風控領域,有乙個很重要的問題是 如何通過使用者的資訊來判斷使用者的逾期與否?我們通過收集使用者的基本資訊 地域資訊 社交資訊等來判斷乙個人的逾期概率。資料如下 二 roc與auc 特徵工程 第一 ...

比賽 專案 大學?

上週體育老師說 下週要考試了!我才想起,原來這麼快就到16周了,這個學期又差不多過去了。太快了,我有種錯覺好像才剛剛開始呢!最近都貌似很忙,忙到沒有時間停下來思考了 好吧.我承認我一直在想些有的沒的 最近的一段時間,一直充斥著各種比賽。最高記錄是兩周五場acm選拔賽 也就是接近20小時 估計我是比怕...

金融風控模型

工作中暫時未涉及。此處為有幸得到的ppt。記錄學習內容,還有些心得,有錯誤請指出,感激 什麼是欺詐風險 網路借款人是否是本人 網路借款人提交的資料是否真實 什麼是信用風險 網路借款人是否有還款的能力 是否是沒有還款意願的老賴,多次違約 貸款公司如何防範以上兩種風險 針對乙個p2p借款的流程來說,借款...