網際網路金融授信模型

2021-10-06 23:05:32 字數 1077 閱讀 9587

授信模型:

芝麻信用

1.身份 穩定性

2.履約能力 兜底性

3.信用歷史 歷史性

4.人脈關係 穩定性+若價值性

5.行為偏好 真正價值

一. 資料變數

1.原始變數

2.衍生變數 時間,函式,比率

在選擇變數的時候,基於rmf,一年的資料

二. 資料處理

迭代優化,前期不會很複雜

數值和字元型缺失性和合理性檢驗

數值型字段相關性驗證

字串欄位的離散性處理

字元型性:一般採用專家打分法

小學 0-20 初中20-40… 所有變數均變為數值

資料標準化:資料在量級和量綱上相差很大,沒有可比性,對所有字段進行標準化,標準化的方式對後面模型效果沒有影響

三. 建模前的思考

在不同時期的權重不一樣,所以每個模型都要單獨建模,在建模前需要把業務目標理一理,這樣才能找到用什麼模型

邏輯上就是:根據使用者的資料,算出違約的概率,而這個概率也可以轉化為使用者的分數,所以邏輯回歸模型可以使用。

假設該模組包含的字段有最近乙個月主動查詢金額機構信用次數x1,最近乙個月需要還貸總額x2,最近乙個月逾期總額x3

那麼其違約的概率

p= 1/(1+e-(ax1+bx2+cx3))

四. 模型離線效果評估

混淆矩陣和roc曲線

roc 曲線:根據混淆矩陣做出的,區分模型能否把好壞樣本分開的乙個圖,一般取roc下面的面積auc,來衡量模型效果

越大越好,一般0.6以上

在實際過程中,最重要的是壞賬率這個評估指標

五. 模型的執行週期

在產品初期,因為模型的變數太多,所以模型的迭代速度非常快,基本每月都要跑一次,可能出現某個使用者分數奇高,這是正常的,這些都需要不斷的調整權重和係數,慢慢優化才行,最終還需要模型落地

六.模型落地

落地場景,模型準確率高才合作

多維度評估,芝麻信用只是乙個參考維度

一般這樣:機器呼叫該使用者央行的徵信,介面呼叫使用者的芝麻分 該使用者在招聯的信用評估情況,結合三者,出一套授信方案,模型基本正式使用

網際網路金融

目錄 網際網路金融分類舉例 指紋識別對手機銀行業務帶來的便利和風險 人臉識別 網際網路金融與傳統金融的五大區別 1.定位不同 2.驅動因素不同 3.模式不同 4.治理機制不同 5.優勢不同 目前網際網路金融大概可以分為六類,其中三種是目前中國執行時間和運作企業比較多,相對比較成熟的,主要是第三方服務...

網際網路金融風控模型

1 網際網路金融前10名排行榜 資料截止日期2017 09 12 1.1 螞蟻金服 1.1.2 人臉識別技術 1.1.3 雲計算技術 1.1.4 風控技術 1.1.5 人工智慧技術 1.2 陸金所風控調研 小結 投資使用者與產品匹配度 1.3 京東金融風控調研 1.3.2 風控的靈魂是資料,所有決策...

笑看網際網路金融

在這個圈子裡面已經摸爬滾打5年之久,但是一直都是逛園子,從來沒有寫過部落格,最近突然想把自己的一些心得分享出來,第一次寫部落格,可能寫的不好,希望大家不要噴,口下留情。今天是我的第一篇部落格,所以也沒有好好的準備,就簡單的寫一些。因為目前工作的原因,接觸了一些網際網路金融方面的知識,之前我對比如說 ...