Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GCI2020Summer_FinalTask

Avatar for SotaMatsuzawa SotaMatsuzawa
August 20, 2020
250

 GCI2020Summer_FinalTask

東京大学松尾研究室開催のGCI(グローバル消費インテリジェンス)の最終課題にて作成したスライドです。Kaggleの「Home Credit Default Risk」のデータを用い、データサイエンティストとして事業提案をするといった内容でした。この課題に対し、事業提案の必然性・論理展開、データの可視化、事業規模の推定が適切にできているかといった点に注意しながら資料を作成しました。また、この提案やデータ分析の能力が認められ、優秀生に選ばれました。

Avatar for SotaMatsuzawa

SotaMatsuzawa

August 20, 2020
Tweet

Transcript

  1. 消費者⾦融業界の現状 顧客データ等の⼤量の情報から、⼈間が発⾒することができない複雑な 関係を表現することが可能に 2 Simple 簡単さ Secret 秘匿性 Safety 安全性

    4つのSが顧客から求められる時代になった Speed 速さ 消費者⾦融業界は収益改善のために Ø リスク管理をしつつも、より多くの顧客にサービスを提供したい Ø 信⽤⼒の⾼い顧客に対してより⼤⼝な融資を提供したい 顧客データの解析による⾼精度なリスク管理・優良顧客の推定が必要 申請から数分で審 査可能 スマホで3ステップ で申請可能 同僚に知られるこ となく融資可能 信頼できる融資会 社 AI活⽤
  2. データの紹介 データの内容 Ø ローン申請時に記⼊する情報(application_{train|test}.csv) 顧客ごとの主要データ(性別、職種、家族情報、債務不履⾏の有無等) Ø 信⽤情報機関から提供された情報(bureau.csv) 顧客の過去の他の⾦融機関での借⼊情報(延滞⾦額、利⽤限度額等) Ø 信⽤情報機関の残⾼情報(bureau_balance.csv)

    顧客の各⽉の残⾼状態 Ø Home Credit社製のクレジットカードの残⾼情報(credit_card_balance.csv) 申し込み⽇の前⽉のクレジットカードの利⽤情報、引き落とし額等 Ø 過去の申請時の記⼊情報(previous_application.csv) 過去の申請時の主要データ(契約タイプ、申請⾦額、利⽤⽬的) Ø POSキャッシュ残⾼情報(POS_CASH_balance.csv) Ø 分割⽀払い情報(installments_payments.csv) 約200種類ほどの顧客情報がデータとして蓄積 4 ご提供いただいた データの⼀部 n= 307506 債務履⾏者の割合
  3. データの可視化 5 顧客データについて様々なデータの可視化を⾏った 債務履⾏者 債務不履⾏者 仕事の種類 年齢 クレジット残⾼ NULL(不明)が多くその次にLaborが多い 債務履⾏者と不履⾏者にクレ

    ジット残⾼の差は⾒られない 20代から60代まで幅広い顧客が存在する ⼀つ⼀つの特徴だけでは債務 履⾏者と不履⾏者を区別する のは難しい 機械学習⼿法による⾼度な 解析が必要
  4. 事業のご提案 9 信⽤スコアを活⽤した事業と⻑期的⽀援のご提案 信⽤スコアを活⽤した事業 ⻑期的なご⽀援 ①リスク管理 債務不履⾏になる可能性の⾼い顧客へ のリスク管理が可能に 時系列分析 各国の景気動向に合わせた融資の判

    断が可能に ②優良顧客の推定 返済能⼒がある「優良顧客」への積極 的アプローチが可能に モデルのアップデート 様々な解析や学習により、さらな る精度向上が可能に 融資申請 融資 1分で完了
  5. ①信⽤スコアによるリスク管理 10 融資までの流れ インターネット上で申請に必要 な情報を⼊⼒ AIによる 審査 融資成⽴ 専⾨家の 審査

    融資不成⽴ NO NO YES YES 概要 信⽤スコアにより、債務不履⾏になる可能 性が⾼い顧客を予測 新規性 従来、⼈の勘と経験により⾏われてきた意 思決定をAI活⽤により素早く正確に⾏える 効果 債務不履⾏の可能 性がある融資へ慎 重な対応が可能に 顧客⽬線 スピード感ある融資 貴社⽬線 理想としては、AIによる審査のみで融資不成⽴の意思決定を⾏いたいが、 AIにNOと審査された顧客の中にも⼀定数存在するローン返済可能な顧客へ融資をするため 専⾨家の審査を必要とする Point AI活⽤により素早く正確な融資が可能に
  6. 信⽤スコアの妥当性 左のグラフから、信⽤スコアは 債務履⾏者︓0.71以上になることが多い 債務不履⾏者︓0.71未満になることが多い 信⽤スコアが0.7以上→◦︓債務履⾏者 0.7未満→×︓債務不履⾏者とすると… 債務不履⾏者のうち 11 債務履⾏者 債務不履⾏者

    債務履⾏・不履⾏による信⽤スコアの差 ⼀⽅、実際には◦なものを×と予測してい るものが44,801(全データの14%)件ある 場合により、専⾨知識の有する⼈による判 別が必要 57% が検出可能 信⽤スコアにより、債務履⾏者と不履⾏者の判別が可能に
  7. 収益へのインパクト 12 顧客の債務不履⾏率を下げることが収益の改善へ繋がる 融資額の中央値︓20万4515円* 年間融資数︓41,608,720⼈** 債務不履⾏率の差︓3% 仮に、 で試算すると、年間 3% 出典:Home

    Credit annual report 2017 *左のグラフように、融資額の分布は右に裾が⻑く平均値が⼤きく なってしまうので今回は中央値で試算(1テンゲ0.25円として計算) **貴社のホームページ記載の2017年の年間融資数を使⽤ 約2552億円 の損失を減らすことができる
  8. ⻑期的なご⽀援 14 ⻑期的なコンサルティングにより、各国の⾦融市場・景気動向に適応した融資 が可能に 2017年の債務不履⾏率が0.6%増加したのは、中国の 元安による消費者⾦融市場の急成⻑に対し、中国向 けの信⽤体系が不⼗分だったことが挙げられる 機械学習 ⾦融市場・景気動向に適応した 融資が可能に

    その他、融資判断の精度を⾼めるためにモデルのアップデートが可能になります 出典︓BTMU(China)経済週報2017年から⼀部抜粋 ⼊⼒ 既存のデータ + 為替データ →各国の景気動向を考慮するために為替データを活⽤
  9. お⾒積もり 15 AIによる信⽤スコアに加え、⻑期的なご⽀援をご提案します AIによる信⽤スコア Ø リスク管理 債務不履⾏率を57%削減し、年間 推定2552億円の損失を防ぎます Ø 優良顧客の推定

    債務履⾏率99.4%の信頼できる顧客 228万⼈へのアプローチが可能にな ります 内容 価格 AIのご提供料⾦として 3000万円 とさせていただきます ⻑期的なご⽀援 内容 Ø 時系列分析 景気動向に合わせた融資の判断が 可能になります Ø モデルのアップデート 精度向上のため経済指標やテキス トマイニングなどの導⼊ 価格 コンサルティング料⾦として 250万円/⽉ とさせていただきます 貴社のビジネスを加速させるために⾦融× AIを専⾨とする弊社のスタッフが 顧客データを活⽤し、ご⽀援いたします リスク管理により改善される年間収益2552億 円のうちの約0.01%と優良顧客推定による収 益を合計したお値段となっております