金融風控實戰之 Python 評分卡建模

2021-09-24 10:58:43 字數 865 閱讀 4148

當下金融科技是機器學習應用最火的業務場景之一,風控演算法工程師需求旺盛,既能深耕「風控業務」外功,又能兼修「機器學習」內功的演算法工程師市場稀缺。

互利網上較多風控建模教程均採用國外陳舊資料集,早已脫離國內當前實際信貸業務,建模意義不大。因此,本 chat 不採用 lendingclub、germancreditrisk 等國外信貸資料集。本chat 採用資料來源為本人時任某平台風控總監時的某年度真實信貸資料,配套教學**為已上線穩定執行**。

為確保資料合規性和使用合法性,已剔除使用者四要素等敏感資訊,僅保留網路公開爬蟲資料和三方資料等部分業務指標,且關鍵變數均已做脫敏處理。為保證**不涉及洩露商業機密,僅展示例如分箱、woe、iv等核心函式coding,不影響建模整體理解。以上資料、指標、**,僅用於當前評分卡教學中,特此說明。

本場 chat 主要內容有以下6點:

消費金融評分卡業務,其常用資料來源有哪些?評分卡模型一般會用哪些指標?什麼是特徵工程?如何做好金融申請評分卡的特徵工程?

評分卡變數怎樣進行分箱?為什麼變數需要進行分箱?常用的分箱方法如:等頻分箱、等寬分箱、卡方合併分箱、best基於決策樹的最優分箱,他們的分箱概念分別是什麼?他們之間分別有怎樣的優點和缺點?

3、什麼是woe和iv?woe和iv背後的業務本質是什麼?woe和iv的計算方式是怎樣的?

4、評分卡背後包含怎樣的數學含義?怎樣通過推導lr公式快速理解評分卡的精髓?

5、整合模型和評分卡模型結果之間如何轉換?怎樣通過數學公式的推導,將整合模型轉化成分數輸出?

6、模型結果怎樣進行評估?怎樣用「大白話」去理解ks和auc值的含義?

閱讀全文:

金融風控專案

一 問題定義 金融的核心是風險控制。自然而然地,ai的主戰場也變成了如何使用ai技術精準的做風險控制。在風控領域,有乙個很重要的問題是 如何通過使用者的資訊來判斷使用者的逾期與否?我們通過收集使用者的基本資訊 地域資訊 社交資訊等來判斷乙個人的逾期概率。資料如下 二 roc與auc 特徵工程 第一 ...

金融風控模型

工作中暫時未涉及。此處為有幸得到的ppt。記錄學習內容,還有些心得,有錯誤請指出,感激 什麼是欺詐風險 網路借款人是否是本人 網路借款人提交的資料是否真實 什麼是信用風險 網路借款人是否有還款的能力 是否是沒有還款意願的老賴,多次違約 貸款公司如何防範以上兩種風險 針對乙個p2p借款的流程來說,借款...

金融風控資料

anthor 小李江湖 date 2020 9 15 好記性不如爛筆頭!最近報名參加阿里天池金融風控貸款違約 大賽,學習資料分析方法,以賽學習,在此記錄學習的過程,總結參加大賽的方法。1.1 參賽目的阿里天池平台為初學者提供學習平台,為大神提供展示才華平台。本人一直在學習的門口遲遲徘徊無法入門,藉此...