2017 06 13回顧 series篩選

2021-08-02 12:29:38 字數 532 閱讀 1914

1、上午涉及到幾天的小結,所以差不多用了乙個上午的時間,小結中確定了早睡的督促辦法

2、做員工貸的邏輯,沒什麼新東西,寫了新的邏輯

3、嘗試了7c的最大授信邏輯,但是有一些問題,擱置了

4、然後就是同盾的在網時長改版的問題

5、晚上主要是做標準評分卡的工具包,主要解決幾個問題,乙個是離散化的問題,離散化只能按照去重後的value個數來,還有就是沒寫group數量太小,結果不穩定的問題,類似於最小sample數,可以多加這樣乙個引數,然後某些bin沒有壞客戶,這種需要regroup,昨天主要就是解決如何半自動地regroup的問題,全自動應該十分困難,半自動現在都暫時未能解決,主要就是篩選賦值的問題,series也可以用進行篩選,比如

df['crdt_loanee_1m'][(df['crdt_loanee_1m'] >= 3) & (df['crdt_loanee_1m'] <= 8)]
這種方式可以篩選,但是如果直接賦值存在問題,乙個是有個warning,二的個是很奇怪,我後面的程式輸出受到了影響,現在還需要看一下!

2017 03 20回顧 霸氣

1 仔細看了矩陣求導的公式,推出了最小二乘的引數表示式,但是矩陣求導公式本身,我嘗試推導了一下,發現沒對頭,矩陣求導的關鍵就是對其中每乙個元素分別求導,然後照著 機器學習實戰 寫了最小二乘法的 2 和群內的夥伴交流了下,也說到了是否有意去外地,這成了我最近亟待考慮的問題 3 其中提到exprian的...

2016 12 28回顧 GBDT初探

gbdt是在sklearn的ensemble包中,屬於一種整合學習的思想,分為回歸樹和分類樹 from sklearn.ensemble import gradientboostingregressor from sklearn.ensemble import gradientboostingcla...

2016回顧與總結

2016年總結 工作半年了,回顧半年的經歷,總結如下 對產品都已經熟悉。對於常見的安裝過程中的問題也能夠判斷問題的大概。並且,通過指令碼的清環境安裝等,安裝過程中的問題也逐漸的減少。對我們自己內部的工具的使用,echo ring,nic status.py 等,論壇,gogs,wiki等的掌握使用。...