第18章 肝完方案(第2/2 頁)
她指了指下面的圖形闡釋:“在風控領域,標籤對主體特徵非常敏感,所以我們透過構造欺詐率特徵來表徵類別特徵,獲得了極高的收益。但在實際的構建過程中,直接使用均值會造成標籤洩漏,這裡我們採用kfold方式進行欺詐率特徵提取。
“將訓練集分為5個fold,每個fold使用其餘4個fold的欺詐率作為特徵。”
“對全量訓練集五折交叉驗證後,線上下auc指標增加的情況下,選取訓練集中isnew=1的資料集進行線下的五折交叉驗證,當線下auc與線上auc都增加時,才保留該部分特徵。”
“透過rank加權幾何平均來得出最後的融合。這樣的模型就能夠預測客戶是否會出現信用違約行為。”
林荃歌說完,看了看兩人:“您二位覺得這樣如何?”
“明天就交稿了,你帶我們去看看模型。”
姚霖彥直接站了起來,鄭雅勳也跟著站了起來。
“好。”
三人直接回了書房,林荃歌將模型展示給二人看,並讓姚霖彥選取了其中一個客戶資料,進行驗證。
“模型顯示出該客戶會違約,符合預期。我們的這個模型,有四大創新點:一是能發現潛在的欺詐行為。二是增強了模型學習測試集的能力。三是更貼近實際的業務意義,特徵解釋性強。四是雙重線下驗證的特徵篩選,保證了模型的穩定性。
聽完,二人互相對視了一眼。
姚霖彥率先鼓掌:“辛苦啦!阿州,才四天時間就做出了這些,實在是不容易啊!”
“沒有沒有,時間緊湊,模型其實還很粗糙。”林荃歌很是不好意思地摸了摸鼻子。
“不容易啊!你再完善完善文稿,明天交上去。今天就先休息休息。”姚霖彥拍了拍她的肩膀,“你這都熬瘦了。晚飯多吃點。我們也還沒吃呢!一起一起。”
三人吃飯,這伙食更是豐盛。
“真正野生大黃魚,來一條。”鄭雅勳主動夾了一條到林荃歌的碟中。
“謝謝鄭少。”
“別鄭少了,叫我阿勳。我相信我們肯定能進決賽。決賽現場,你叫阿勳多見外。”
“對對,叫我阿彥,我們現在可是同舟共濟的兄弟,決賽就靠你了。”
姚霖彥又夾了一條大黃魚到林荃歌的碟中,一臉燦爛。
:()女扮男裝復仇記
本章未完,點選下一頁繼續。