第17章 氪金大賽(第1/2 頁)
他笑了起來:“嗨——其實就是省裡搞了個金融建模,搞大了聲勢,成了國際賽事,其實還不是省裡那些人參加。我們去年錢花了不少,卻得了個倒數。今年準備一雪前恥。”
“明白了。我盡力。可能也許又會是倒數。做好心理準備。”林荃歌再次實話實說。
“沒事。總不能比倒數第一更差了。”姚霖彥從樓上走了下來,一身lv睡衣。
“姚董。”林荃歌見他一臉疲態,頭髮半溼的樣子,便知這夥人也許玩了個通宵,現在只是為了等她到來。
“只有半個月的時間,辛苦你了。”姚霖彥將一疊檔案遞給她。
林荃歌開啟檔案一看。
“信用風險是金融監管機構重點關注的風險,關乎金融系統執行的穩定。
在實際業務開展和模型構建過程中,面臨著高維稀疏特徵以及樣本不平衡等各種問題,如何應用機器學習等資料探勘方法提高信用風險的評估和預測能力,是各家金融機構積極探索的方向。
本次競賽提供實際業務場景中的信貸資料作為建模的物件,希望能借此展現各參賽選手資料探勘的實戰能力。
本次賽題給出30個非匿名的業務欄位以及112個匿名欄位,在極不平衡的樣本資料中,預測客戶是否會出現信用違約行為。
賽題難點
1資料的高維稀疏性導致資料的可利用性降低,給模型學習能力的提升帶來了困難;
2資料的極度不平衡,導致模型極其容易出現過擬合問題;
3匿名欄位的處理:如何理解並使用匿名欄位中潛在的業務意義;
4新舊資料探索:如何衡量新舊資料的差異,如何把握特徵的新舊差異,以及如何構建合適的驗證策略。”
後面是大片的相關資料、欄位說明。最後是評分指標。
林荃歌看了看,感受到了壓力,人家是團體作戰,而她是孤軍奮戰,居然還是一拖六。
林荃歌闔上檔案,摸了摸鼻子:“姚董,我們的參賽隊伍是七個人?”
“只有我們三個,他們都是來玩的。”
林荃歌這才放鬆下來,還好還好,一拖二,那她還能接受。
“姚董,有資料的電子版嗎?”
“我讓秘書馬上發你。”
“行。這是我的遊戲地址。”林荃歌迅速將郵箱地址發他,又問道,“那我是在這裡建模,還是帶回家幹?”
“就在這裡,我們要保密。對了,你們幾個,趕緊滾吧,老子要好好學習, 天天向上了。”
林荃歌又摸了摸鼻子,這有什麼好保密的,不就是個模型嘛!
沒想到,除了鄭雅勳,其餘四人均站起身,打著哈欠走了。
林荃歌一臉莫名:“他們就這麼走了?”
“他們就是看看,我們今年請來的人怎麼樣,看完就走了唄!”鄭雅勳向她解釋道。
二人將她帶到了一間極其寬敞的書房,擺了十來臺配置高階的電腦。
“電腦有故障就找阿龍,他在隔壁,馬上會來修。不過一般不會有事。”姚霖彥打著哈欠拍了拍林荃歌的肩膀,“五天後要提交方案了,如果透過就是決賽,加油啊!阿州。”
“這麼緊張的賽程?”林荃歌瞪大了眼睛,“決賽也是這樣提交方案?”
“現場給你半天時間作答。闖進決賽就有獎金。”
林荃歌剛剛粗略看了看,決賽隊伍有5支,按照名次成績,從最高300萬依次下來,最差也有100萬,可謂獎勵豐厚。
“姚董,有多少支隊伍參賽?”
“去年是4000多支隊伍吧。今年或許會增加。”
重賞之下必有勇夫,這