測試資料 猜想大驗證(3)

2022-04-03 20:20:15 字數 664 閱讀 6200

有資料,不妨測試一下,非常有趣:

1.各個信用等級的逾期率

其他的都比較符合預期,但a的偏高,我也很納悶,把資料調出來,從高到低排是這樣的:

借的量巨大,一旦逾期,在整個逾期率的計算中必然拖累整體。加上a標總數比較少,這個效應就更加明顯了。看來資料沒啥毛病。將來對選擇標的進行模擬時,如果加上金額限制,同樣沒啥問題。如限制借款上限為6000,則逾期率就降低很多:

2.性別,女人比男人靠譜

3.借期,6月和12月是主體,但6月明顯逾期率低。是不是借期短就意味著借的時候對還款就心中有數呢?

4.年齡

20+:

30+:

40+:

50+:

5:各種認證

徵信:學歷:

實在太多,懶得貼了。還有複雜的條件,寫sql語句查實在費勁,不過現在可以在星文快投上隨意組合,設定完立刻看結果,有興趣可以慢慢研究。

構造測試資料 對比測試資料

正確 include using namespace std typedef long long ll const int max n 1e6 10 intmain return0 author max n date 2019 10 04 15.03.21 description 正確 錯誤 inc...

測試猜想(1)建立自己的測試資料庫

做了幾年的測試工作了,手動自動白盒都經歷過,有些關於測試工作的一些猜想,在此記載一下。在測試工作中,很多人都是自己隨機的錄入一些測試資料。有時候難免會導致測試資料在實際運用中完全不存在的情況。這個時候得到的測試結果也許是毫無意義的。所以我覺得作為乙個測試工程師,在軟體需求建立初期,就應該和需求設計人...

交叉檢驗 訓練資料,驗證資料和測試資料

最近在coursera上學習data analysis課程,課程論壇中有個帖子針對交叉檢驗 cross validation 中訓練資料集 train dataset 驗證資料集 validate dataset 和測試資料集 test dataset 展開討論,內容挺好的,記錄到這裡,作為備忘。交...