python風控建模實戰lendingClub

2021-10-23 17:32:27 字數 2733 閱讀 7945

(博主原創錄製)

作者toby:持牌照消費金融模型專家,和中科院,中科大教授保持長期專案合作;和同盾,聚信立等外部資料來源公司有專案對接。熟悉消費金融場景業務,線上線下業務,包括現金貸,商品貸,醫美,反欺詐,汽車金融等等。模型專案200+,擅長python機器學習建模,對於變數篩選,衍生變數構造,變數缺失率高,正負樣本不平衡,共線性高,多演算法比較,調參等疑難問題有良好解決方法。

課程介紹

lendingclub是美國最早金融信貸公司,堪稱p2p鼻祖。針對消費金融,現金貸等線上貸款場景,此教程教會學員如何運用python+catboost+lightgbm等演算法建立風控審批模型。實操專案包括p2p的lendingclub和消費者信用評分百萬獎金挑戰賽,課程建模資料量10萬+。

之前博主錄製《python信用評分卡建模(附**)》課程是針對邏輯回歸評分卡模型;《python風控建模實戰lendingclub》此課程是針對整合樹模型,包括catboost,lightgbm,xgboost。兩個課程演算法原理是不同的。

此課程catboost整合樹演算法有諸多優點,自動化處理缺失資料,自動化調參,無需變數卡方分箱。學員學完後不再為資料預處理,調參,變數分箱而煩惱。此教程建立模型效能卓越,最高效能ks:0.5869,auc:0.87135,遠超網際網路上其它建模人員效能。

課程目的

為了從銀行/消費金融公司的角度將信貸損失降到最低,銀行需要制定決策規則,確定誰批准貸款,誰不批准。 在決定貸款申請之前,貸款經理會考慮申請人的信用水平。lendingclub信貸資料報含有關100多個變數的資料,以及10萬多個貸款申請者被認為是好信用風險還是壞信用風險的分類。 預期基於此資料開發的**模型將為銀行經理/cro/貸前審批人員提供指導,以根據他/她的個人資料來決定是否批准準申請人的貸款。

課程目錄

章節2 python程式設計基礎

課時14python檔案基本操作

課時15python官網

課時16變數_表示式_運算子_值

課時17字串string

課時18列表list

課時19程式的基本構架(條件,迴圈)

課時20資料型別_函式_物件導向程式設計

課時21python2和3區別

課時22程式設計技巧和學習方法

章節3 python機器學習基礎知識

課時23uci機器學習資料庫介紹

課時24機器學習書籍推薦

課時25如何選擇演算法

課時26sklearn機器學習演算法速查表

課時27python資料科學常用的庫

課時28python資料科學入門介紹(選修)

章節5catboost基礎介紹

課時32catboost基礎知識講解-比xgboost更優演算法登場

課時33catboost官網介紹

章節7ks(kolmogorov–smirnov)模型區分能力指標

課時49ks簡介

課時50step1獲取模型分

課時51step2_計算ks_方法1

課時52step3_計算ks_方法2

課時53step4_計算ks_excel推理

課時54step5_繪製ks圖

課時55step6_ks評估函式

課時56step7_ks指令碼彙總_分治演算法

課時57step8_ks缺陷

章節8auc(area under curve)模型區分能力指標

課時58excel繪製roc曲

課時59python計算auc很簡單

課時60python輕鬆繪製roc曲線

課時61auc評估函式_auc多大才算好?

課時62gini基尼係數基本概念和auc關係

章節9pickle儲存模型

課時63pickle儲存和匯入模型包_避免重複訓練模型時間

章節10psi模型穩定性評估指標(上)

課時64拿破崙和希特拉征服歐洲為何失敗?數學psi指標揭露歷史真相

課時65excel手把手教你推導psi的計算公式

課時66psi計算公式奧義

課時67psi的python指令碼講解

章節11psi模型穩定性評估指標(下)

課時68step1.篩選lendingclub2023年q3和q4資料

課時69step2_計算train,test,oot模型分

課時70step3.計算q3和q4模型分psi

章節12模型維度與邊際效應

課時71邊際效應基本概念

課時72模型維度與邊際效應,變數越多越好嗎?

課時73降維實操,結果讓人吃驚!

課時74模型變數數量越多,區分能力(ks)越高嗎?

章節13catboost分類變數處理

課時75 one-hot encoding熱編碼

課時76 cat_features分類變數處理(數值型)1

課時77 cat_features分類變數處理(字串型別)

課時78 不同分類變數處理方法的結果對比

章節14catboost調參

課時79gridsearchcv網格調參簡述

課時80iterations樹的顆樹

課時81eval_metric評估引數(logloss_auc_accuracy_f1_recall)

課時82learning_rate學習率

課時83樹深度depth(max_depth)

課時84 l2_leaf_reg正則係數l2調參

章節15多演算法比較

課時85xgboost分類器模型

課時86lightgbm分類器建模

課時87邏輯回歸分類器和多演算法比較結果

金融風控實戰之 Python 評分卡建模

當下金融科技是機器學習應用最火的業務場景之一,風控演算法工程師需求旺盛,既能深耕 風控業務 外功,又能兼修 機器學習 內功的演算法工程師市場稀缺。互利網上較多風控建模教程均採用國外陳舊資料集,早已脫離國內當前實際信貸業務,建模意義不大。因此,本 chat 不採用 lendingclub german...

風控建模整體流程

1.確定建模目的 在信貸領域中建立風控模型是為了找出可能會逾期的客戶,根據逾期的可能性和資金的鬆緊程度選擇是否放貸。在支付領域建立風控模型是為了找出可能存在非法經營的商戶,保證商戶沒有違法經營。2.確定好壞樣本邏輯 在信貸領域中逾期大於x期 不同公司取值不同 的客戶定義為壞客戶 1 從未逾期的客戶定...

信貸風控建模 無監督分箱方法

在評分卡模型的開發中,連續型變數需要進行分箱操作才能放入模型當中。分箱操作的定義如下 1 等距分箱法 import numpy as np import pandas as pd from pandas import dataframe np.random.seed 1 隨機數生成器種子 incom...