(博主原創錄製)
作者toby:持牌照消費金融模型專家,和中科院,中科大教授保持長期專案合作;和同盾,聚信立等外部資料來源公司有專案對接。熟悉消費金融場景業務,線上線下業務,包括現金貸,商品貸,醫美,反欺詐,汽車金融等等。模型專案200+,擅長python機器學習建模,對於變數篩選,衍生變數構造,變數缺失率高,正負樣本不平衡,共線性高,多演算法比較,調參等疑難問題有良好解決方法。
課程介紹
lendingclub是美國最早金融信貸公司,堪稱p2p鼻祖。針對消費金融,現金貸等線上貸款場景,此教程教會學員如何運用python+catboost+lightgbm等演算法建立風控審批模型。實操專案包括p2p的lendingclub和消費者信用評分百萬獎金挑戰賽,課程建模資料量10萬+。
之前博主錄製《python信用評分卡建模(附**)》課程是針對邏輯回歸評分卡模型;《python風控建模實戰lendingclub》此課程是針對整合樹模型,包括catboost,lightgbm,xgboost。兩個課程演算法原理是不同的。
此課程catboost整合樹演算法有諸多優點,自動化處理缺失資料,自動化調參,無需變數卡方分箱。學員學完後不再為資料預處理,調參,變數分箱而煩惱。此教程建立模型效能卓越,最高效能ks:0.5869,auc:0.87135,遠超網際網路上其它建模人員效能。
課程目的
為了從銀行/消費金融公司的角度將信貸損失降到最低,銀行需要制定決策規則,確定誰批准貸款,誰不批准。 在決定貸款申請之前,貸款經理會考慮申請人的信用水平。lendingclub信貸資料報含有關100多個變數的資料,以及10萬多個貸款申請者被認為是好信用風險還是壞信用風險的分類。 預期基於此資料開發的**模型將為銀行經理/cro/貸前審批人員提供指導,以根據他/她的個人資料來決定是否批准準申請人的貸款。
課程目錄
章節2 python程式設計基礎
課時14python檔案基本操作
課時15python官網
課時16變數_表示式_運算子_值
課時17字串string
課時18列表list
課時19程式的基本構架(條件,迴圈)
課時20資料型別_函式_物件導向程式設計
課時21python2和3區別
課時22程式設計技巧和學習方法
章節3 python機器學習基礎知識
課時23uci機器學習資料庫介紹
課時24機器學習書籍推薦
課時25如何選擇演算法
課時26sklearn機器學習演算法速查表
課時27python資料科學常用的庫
課時28python資料科學入門介紹(選修)
章節5catboost基礎介紹
課時32catboost基礎知識講解-比xgboost更優演算法登場
課時33catboost官網介紹
章節7ks(kolmogorov–smirnov)模型區分能力指標
課時49ks簡介
課時50step1獲取模型分
課時51step2_計算ks_方法1
課時52step3_計算ks_方法2
課時53step4_計算ks_excel推理
課時54step5_繪製ks圖
課時55step6_ks評估函式
課時56step7_ks指令碼彙總_分治演算法
課時57step8_ks缺陷
章節8auc(area under curve)模型區分能力指標
課時58excel繪製roc曲
課時59python計算auc很簡單
課時60python輕鬆繪製roc曲線
課時61auc評估函式_auc多大才算好?
課時62gini基尼係數基本概念和auc關係
章節9pickle儲存模型
課時63pickle儲存和匯入模型包_避免重複訓練模型時間
章節10psi模型穩定性評估指標(上)
課時64拿破崙和希特拉征服歐洲為何失敗?數學psi指標揭露歷史真相
課時65excel手把手教你推導psi的計算公式
課時66psi計算公式奧義
課時67psi的python指令碼講解
章節11psi模型穩定性評估指標(下)
課時68step1.篩選lendingclub2023年q3和q4資料
課時69step2_計算train,test,oot模型分
課時70step3.計算q3和q4模型分psi
章節12模型維度與邊際效應
課時71邊際效應基本概念
課時72模型維度與邊際效應,變數越多越好嗎?
課時73降維實操,結果讓人吃驚!
課時74模型變數數量越多,區分能力(ks)越高嗎?
章節13catboost分類變數處理
課時75 one-hot encoding熱編碼
課時76 cat_features分類變數處理(數值型)1
課時77 cat_features分類變數處理(字串型別)
課時78 不同分類變數處理方法的結果對比
章節14catboost調參
課時79gridsearchcv網格調參簡述
課時80iterations樹的顆樹
課時81eval_metric評估引數(logloss_auc_accuracy_f1_recall)
課時82learning_rate學習率
課時83樹深度depth(max_depth)
課時84 l2_leaf_reg正則係數l2調參
章節15多演算法比較
課時85xgboost分類器模型
課時86lightgbm分類器建模
課時87邏輯回歸分類器和多演算法比較結果
金融風控實戰之 Python 評分卡建模
當下金融科技是機器學習應用最火的業務場景之一,風控演算法工程師需求旺盛,既能深耕 風控業務 外功,又能兼修 機器學習 內功的演算法工程師市場稀缺。互利網上較多風控建模教程均採用國外陳舊資料集,早已脫離國內當前實際信貸業務,建模意義不大。因此,本 chat 不採用 lendingclub german...
風控建模整體流程
1.確定建模目的 在信貸領域中建立風控模型是為了找出可能會逾期的客戶,根據逾期的可能性和資金的鬆緊程度選擇是否放貸。在支付領域建立風控模型是為了找出可能存在非法經營的商戶,保證商戶沒有違法經營。2.確定好壞樣本邏輯 在信貸領域中逾期大於x期 不同公司取值不同 的客戶定義為壞客戶 1 從未逾期的客戶定...
信貸風控建模 無監督分箱方法
在評分卡模型的開發中,連續型變數需要進行分箱操作才能放入模型當中。分箱操作的定義如下 1 等距分箱法 import numpy as np import pandas as pd from pandas import dataframe np.random.seed 1 隨機數生成器種子 incom...