金融申請評分卡 資料準備 造衍生變數

2021-08-28 10:46:00 字數 907 閱讀 2366

評分卡開發在資料整理好之後,我們的重點工作就是創造衍生變數了!

造衍生變數是整個開發評分卡模型過程中最重要、最艱辛也最有趣的乙個節點。最重要是因為衍生變數的好壞往往會影響評分卡模型的各種測評指標,決定策略的反欺詐能力;最艱辛是因為造衍生變數除了要基於業務變數理解之外還要開發人員大開腦洞組合基礎變數,有很多時候花了一天時間造好一兩個衍生變數但最後都進不了模型,這個時候就又要重新去開腦洞進行變數的組合。當然現在也可以結合一些演算法比如決策樹、隨機森林進行特徵工程造衍生變數,但是造好的變數是否可以進入評分卡模型以及是否容易在策略引擎上部署等問題又要反覆校驗(如果你公司是基於python或則r自主開發的決策系統,那衍生變數的部署就變的比較方便);最有趣當然好理解啦,因為造變數過程的艱辛,整個評分卡開發流的重要性決定了我們造好變數進入模型上線部署的成就感!

那麼大家可能會問,到底如何造衍生變數呢?

it depends on you!

既然我說了造衍生變數是乙個開腦洞的活兒,每個人的腦洞又不一樣,當然沒有乙個絕對的邏輯或者公式去套用了,但是有一些造變數的小技巧和小套路,幫助大家可以很快的開啟腦洞造出變數iv很高的好變數。

tips1:善用產品准入規則變數,弱弱聯合會變強;

tips3:風控核心防欺詐,設身處境去思考;

tips4:風控基本出發點是評估個人還款能力和還款意願;

tips5:合理利用一些演算法,省時省力又高效;

實際操作中大家需要注意以下幾點:

1、決策樹節點前先做資料分割槽,篩選出train data和validate data;

2、注意調整決策樹節點的屬性欄,重點可以聚焦在拆分規則、節點、互動式抽樣裡的條件設定;

3、互動式決策樹在屬性-訓練-互動式開啟;

4、在開啟的互動式決策樹裡進行節點的拆分、訓練以及修建節點;

5、注意關注決策樹裡訓練樣本和驗證樣本好壞比例的變動幅度。

金融申請評分卡 資料準備 缺失值資料清洗

今天我們來聊聊資料準備中的資料清洗。其實資料清洗這四個字對於常常做資料分析建模的同學們一定不陌生,不管在實際工作中有沒有真正做清洗,我們都會先把這個口號喊出來,資料清洗這塊其實我也一直不太願意拿出來說,因為這種活實在太結合業務理解了,而且還見仁見智,並不是簡簡單單的三步 缺失值填補 異常值刪除 錯誤...

金融申請評分卡(1)

目前金融申請評分卡主要使用在一些網際網路金融企業和保險銀行機構,主要用來解決目前金融機構存在的信用風控問題。從最早的有抵押無規則 無抵押有規則 資料模型,形成了目前在風控領域的基本風控脈絡 現今主要採用基於資料驅動建立的風控模型,主要就是目前應用最廣泛最多的評分卡模型,評分卡模型主要由分為四種,即 ...

金融風控 申請評分卡模型 申請評分卡介紹

從這篇博文開始,我將總結金融風控中的另外乙個模型 申請評分卡模型。這篇博文將主要來介紹申請評分卡的一些基本概念。本篇博文將以以下四個主題來進行介紹說明 交易對手未能履行約定契約中的義務而造成經濟損失的風險,即受信人不能履行還本付息的責任而使授信人的預期收益與實際收益發生偏離的可能性它是金融風險的主要...