評分卡SCORECARD 理論知識

2021-09-29 20:54:37 字數 4411 閱讀 8383

這九個字母分別是九個英文單詞的首寫字母,代表評分卡開發工作順序,它們的含義分別是:

s = sampling資料選取與抽樣

c = cleansing資料檢測、資料清洗、資料鏈結與合併

o = optimization資料優化處理,包括客戶分群(segmentation)、變數分析與加工、粗分組等

r = regression利用統計學回歸技術構建模型

e = equalization將模型轉化為評分卡形式

c = confirmation 評分卡評估與確認

a = administration評分卡實施上線與管理,包括指定管理人,記錄評分卡使用情況等

r = review評分卡跟蹤驗證

d = documentation整理記錄,完成專案技術文件

下面按照字母順序,詳細描述scorecard方**的關鍵內容:

s = sampling,資料選取與抽樣(建議雙盲隨機抽取)

開發評分卡,我們希望能夠使用所有可以獲得的資料,對資料的存在性、獲得的難易程度、未來使用的可能性、時效性、以及資料質量進行評估,去除不能用來開發評分卡的資料,通過取捨過程確定開發資料集,這個過程就是資料選取。

首先、我們需要確定評分卡的開發目標,也就是評分卡要解決的問題,即要衡量和**什麼;

其次、是選擇資料的觀察區間和表現區間,觀察區間是獲得評分卡自變數的資料採集時間段,表現區間則是評分卡因變數的資料採集時間段,表現區間採集的客戶表現資料,用來確定「好」、「壞」客戶。

絕大多數情況下,在開發評分卡的業務中,可以把賬戶按照日常運營操作的實際情況分為「好」賬戶、「壞」賬戶。所謂的「好」賬戶,就是日常願意保留的賬戶,而「壞」賬戶是產生日常不希望看到的情況的那些賬戶。這裡的定義往往在每次開發評分卡的時候都需要仔細討論。相對於「壞」賬戶的數量來說,往往存在有大量的「好」賬戶,而且數目可能很大。開發統計學評分卡,通常不需要將所有的「好」賬戶都納入開發資料集,而是從「好」賬戶中選取有代表性的樣本資料,這個過程稱為資料抽樣。常用的抽樣方法有:簡單隨機抽樣、系統抽樣、整群抽樣和分層抽樣,將根據實際情況確定抽樣方法。

c = cleansing, 資料檢測、資料清洗、資料鏈結與合併(資料集市的那套建設方法)

選定樣本資料後,可能會提供多個**、甚至多種型別的資料集。我們需要首先將這些資料集進行整理,成為同一類資料,例如sas資料,或者txt形式的資料。資料整理的複雜程度取決於日常的資料儲存方式、評分卡建立需要使用的資料來源數量、及資料維護方式。資料整理過程包括下面三個步驟:

1、資料檢測。原始資料通常會存在各種各樣的問題,如:不同時期的資料格式不一致,存在錯誤值、缺失值、異常值等。資料檢測是通過對變數進行分步檢測工作,發現資料中存在的問題。

2、資料清洗。根據資料檢測的結果,對資料中存在的錯誤和問題進行針對性處理,剔除不合理記錄、去掉重覆記錄、及對缺失資料項進行處理,將「不乾淨資料」清洗成「乾淨資料」。比較常見的缺失資料處理方法有:直接刪除法、特殊值填充法、平均數填充法、眾數填充法等。考慮到在未來將評分卡應用到零售日常業務過程中會遇到的複雜情況,通常會根據實際資料情況採用某一種簡單但是有效的處理方法。

o = optimization,資料優化處理,包括客戶分群(segmentation)、變數分析與加工、粗分組等

資料的詳細分析與加工,在開發評分卡的流程中,占有絕對重要的地位,也是花費時間最多的一項工作。在資料質量相同的前提下,只有這一步工作進行得細緻周到,才有可能開發出高質量的評分卡。歷史經驗表明,如果對資料進行同樣深度的加工,無論將來採用哪種評分卡開發方法,結果的差異性不會很大,反之,如果資料分析加工工作做得不夠深入,無論用什麼方法,都不可能得到高質量的評分卡。

按順序對工作步驟介紹如下:

1、客戶分群(segmentation)。客戶分群是對這些開發資料進行詳細分析,將風險成因特徵相似的客戶聚在一起,將風險成因特徵差異較大的人分為不同的群體,使得分別開發的評分卡都更具有針對性。分群首先要基於業務用途,其次是結合資料進行調整。

2、中間變數(attributes)。根據評分卡開發經驗對建模資料進行加工,產生中間變數,也就是衍生變數。中間變數的產生是評分卡開發的乙個重要環節,沒有合理的中間變數集,就不可能建立高質量的評分卡。產生中間變數時,要考慮變數的**能力、變數的類別、變數的穩定性等因素,盡量覆蓋到影響評分卡**目標的所有角度。在這個環節中,需要對連續型數值變數進行離散化處理。

3、粗分組(coarse classing)。在將連續型數值變數進行離散化處理之後,所有有可能進入模型的變數都需要逐一進行粗分組運算。對變數進行粗分組處理,既可以避免模型出現過渡擬合,影響將來評分卡的穩定性,也可以解決模型對變數的單調性和線性要求。粗分組的一般原則是在**未來表現時,將模式相近的相鄰變數屬性進行組合,同時確保分組中有足夠的樣本以彰顯統計意義。粗分組工作的結果,是將所有可能進入評分卡的變數都劃分成有限個屬性區間或組別的形式,從而可以以啞變數或者證據權重的形式進入建模型階段。

最後,將開發資料全部整理到乙個資料集內,我們將得到乙個資料表,採用以每條記錄為一行的資料羅列方式。

r = regression, 利用統計學回歸技術建模型

在模型構建時要將資料集劃分成開發集和測試集,基於開發集進行模型建立,通過考察測試集的模型效果來校驗模型。

e = equalization,將模型轉化為評分卡形式

模型建立以後,需要將模型的係數轉化為評分。通常我們希望看到的評分卡分數,均為正整數,這是為了保證在使用上的方便性。會建議日常對評分卡選定乙個恰當的分數區間。另外,對於一套多張評分卡的情形,經過這樣的轉化,可以使得無論出自哪一張評分卡,同樣的分數都對應同樣的「好」「壞」比例,便於制定和執行信貸決策。

c = confirmation,評分卡評估與確認

開發完成的評分卡要滿足一定的質量標準。首先,評分卡要具備合理性。對評分卡中變數的分值及趨勢,需要與業務經驗吻合,不存在矛盾或者不合理的情況。其次,評分卡要具備一定的穩定性。評分卡在開發集和測試集、及跨時區校驗集上的**能力指標要穩定,評分卡的**能力不應該隨個別變數的變動而發生顯著改變;最後,評分卡必須對目標變數有比較好的**能力。採用的評分卡**能力評估指標有:分離度(divergence)、洛倫茲曲線(lorenzo curve)、k-s檢驗(kolmogorov-smirnov)等。

此外,由於評分卡的開發周期往往歷時數週,甚至數月,在開發過程中,業務經營上不可避免的會發生一些變化,因此在完成開發以後,需要再次與評分卡使用人員溝通,了解是否有資料定義變動、資料流程變動等,這樣可以對評分卡進行相應的調整,得到最終確認。

a = administration,評分卡實施上線與管理,包括指定管理人,記錄評分卡使用情況等

評分卡確認後,在上線使用的時候,需要三個方面的配合:it系統、風控政策、業務流程。可以在這三個方面提供相應的輔導,比如在系統中實現評分卡計算的時候,提供評分卡安裝指引,確保評分卡被正確的安裝到決策引擎軟體當中;在政策方面,可以輔導日常的評分卡管理人員制定人工修正評分卡的規定和管理辦法,比如允許在何種情況下,根據哪些原因批准乙個未達到界限分數的申請人,以及如何對這樣的案例進行評估;在流程方面,客戶使用了評分卡進行信貸審批和賬戶管理之後,可以提供參考意見,建議優化調整某些工作步驟。

評分卡投入使用後,評分卡管理人員需要記錄與評分卡有關的業務變化,例如大型營銷活動、政策調整、信用卡資產併購等等,這些記錄往往可以解釋評分卡跟蹤中發現的異常現象。

r = review,評分卡跟蹤驗證

每一張評分卡都會有有效期,以往的經驗顯示這個有效期通常只有一兩年,極端情況下幾個月甚至更少,如果經濟環境變化比較大,日常信貸政策有重大調整,或者日常的客戶管理模式發生變化,都會直接導致評分卡有效期的縮短。相反,如果信貸環境沒有明顯變化,日常的風險管理原則變化不大,則評分卡的有效期會比較長。乙個評分卡隨時間而失效,不說明評分卡質量差,而是說明需要重新開發評分卡的時候到了。

日常需要持續性的對評分卡進行跟蹤驗證,首先需要檢查評分卡的適用性,即確保應用評分卡的人群和評分卡開發樣本之間沒有重大差異;其次,日常需要確保評分卡的有效性,即評分卡依然可以有排序功能。

評分卡開發完成以後,即使是在評分卡上線之前,也可以馬上進行評分卡的跟蹤工作,了解評分卡應用人群的整體偏移情況,考察其適用性;評分卡開發完成一段時間後,可以驗證評分卡的有效性。前者稱為前端跟蹤,後者稱為後端跟蹤。

在完成評分卡開發工作後,會提供評分卡的前端和後端跟蹤報表模板,供評分卡管理人員使用。如果日常需要,也會提供解讀報表的諮詢服務。

d = documentation,整理記錄,完成專案技術文件

作為風險管理的公司,清晰完整的專案文件是必不可少的,它記錄完整的項開發過程,使開發過程可以經受住無論來自於監管當局,還是內部審計部門的挑戰,同時也方便評分卡管理人員了解專案情況,便於對評分卡進行跟蹤驗證。

另外,用敏捷專案管理來對評分卡的落地實現是非常好的一種方式,推薦大家使用。

消費金融風控聯盟一如既往的專注於消費金融下的多場景風控方案設計、策略落地實施及相關風控知識分享,為廣大消金及風控從業人員提供滿意的服務。

C卡催收評分卡

2 業務階段 c卡適用於貸後環節,根據使用者當前還款狀態為逾期的情況下,未來還款的可能性。3 資料使用 a卡申請評分卡一般可做貸款0 1年的信用分析,b卡行為評分卡一般為3 5年,催收評分卡則對資料要求更大,需加入催收後客戶反應等屬性資料。4 常用模型 在信貸領域,構建評分卡最常用的演算法是邏輯回歸...

python評分卡模型 簡書 評分卡模型

信用評分卡分類 a卡 申請評分卡,側重貸前,在客戶獲取期,建立信用風險評分,客戶帶來違約風險的概率大小 b卡 行為評分卡,側重貸中,在客戶申請處理期,建立申請風險評分模型,客戶開戶後一定時期內違約拖欠的風險概率,有效排除了信用不良客戶和非目標客戶的申請 c卡 催收評分卡,側重貸後,在帳戶管理期,建立...

金融風控 申請評分卡模型 申請評分卡介紹

從這篇博文開始,我將總結金融風控中的另外乙個模型 申請評分卡模型。這篇博文將主要來介紹申請評分卡的一些基本概念。本篇博文將以以下四個主題來進行介紹說明 交易對手未能履行約定契約中的義務而造成經濟損失的風險,即受信人不能履行還本付息的責任而使授信人的預期收益與實際收益發生偏離的可能性它是金融風險的主要...