Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
守りたいデータがある メルペイ クレジットスコアのこれからの話など / merpay-3
Search
M3 Engineering
September 05, 2018
Technology
0
3.7k
守りたいデータがある メルペイ クレジットスコアのこれからの話など / merpay-3
2018/9/5 に開催された「merpay×M3 機械学習 NIGHT」の発表資料です。
https://mercari.connpass.com/event/97213/
#merpay_ml
M3 Engineering
September 05, 2018
Tweet
Share
More Decks by M3 Engineering
See All by M3 Engineering
エムスリー全チーム紹介資料 / Introduction of M3 All Teams
m3_engineering
4
290k
エムスリーマネジメントチーム紹介資料 / Introduction of M3 Management Team
m3_engineering
1
5.5k
エムスリーエビデンス創出プロダクトチーム紹介資料 / Introduction of M3 Create Evidence Team
m3_engineering
2
8k
ギークの理想が7つ集まるエムスリーで夢を叶えよう - エムスリー株式会社
m3_engineering
1
17k
エムスリー基盤チーム紹介資料 / Introduction of M3 Platform Team
m3_engineering
3
15k
エムスリーMR君ファミリー開発チーム紹介資料 / Introduction of M3 MRkun Family Dev Team
m3_engineering
3
15k
エムスリーマルチデバイスチーム紹介資料 / Introduction of M3 Multi Device Team
m3_engineering
4
21k
エムスリーQAチーム紹介資料 / Introduction of M3 QA Team
m3_engineering
2
19k
エムスリー SREチーム紹介資料 / Introduction of M3 SRE Team
m3_engineering
1
16k
Other Decks in Technology
See All in Technology
Goss: New Production-Ready Go Binding for Faiss #coefl_go_jp
bengo4com
0
1.1k
帳票Vibe Coding
terurou
0
140
つくって納得、つかって実感! 大規模言語モデルことはじめ
recruitengineers
PRO
24
6.4k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
8.6k
広島発!スタートアップ開発の裏側
tsankyo
0
250
人を動かすことについて考える
ichimichi
2
330
あとはAIに任せて人間は自由に生きる
kentaro
3
1.1k
我々は雰囲気で仕事をしている / How can we do vibe coding as well
naospon
2
220
KiroでGameDay開催してみよう(準備編)
yuuuuuuu168
1
130
[OCI Skill Mapping] AWSユーザーのためのOCI(2025年8月20日開催)
oracle4engineer
PRO
2
150
実践アプリケーション設計 ①データモデルとドメインモデル
recruitengineers
PRO
3
330
事業価値と Engineering
recruitengineers
PRO
2
350
Featured
See All Featured
The Cost Of JavaScript in 2023
addyosmani
53
8.8k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
820
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
We Have a Design System, Now What?
morganepeng
53
7.7k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Building Adaptive Systems
keathley
43
2.7k
GraphQLとの向き合い方2022年版
quramy
49
14k
Art, The Web, and Tiny UX
lynnandtonic
302
21k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Designing Experiences People Love
moore
142
24k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Transcript
守りたいデータがある メルペイ クレジットスコア これから 話 2018/09/05 merpay×M3 機械学習 NIGHT
自己紹介 @Hmj_kd メルペイ Machine Learning Engineer 北海道釧路市出身 釧路高専 情報工学科卒業後,東京 大学へ編集入学.
理学部物理学科 Black Hole 境界上 微分幾何や Inflation 宇宙論あたりを勉強し いました. そ 後,諸般 事情 ,プログラマ,データ分析屋,機械学習 エンジニア等を経 ,現在 至る. 現在 仕事 ,飲み会幹事以外 Project内 タスク全 .
以前,こういった話をし おりました
今日 こん こ を話します ➔ クレジットスコアリングモデル 一般論(再掲) ➔ メルカリ ういったデータを分析
利用 きるか ? ➔ メルペイ クレジットスコア これから つい
クレジットスコアリングモデル 一般論
クレジットスコアリングモデル 一般論 • そもそもクレジット(= 信用) ? 問題設定が難しい • 純粋 classificationだけ
く,与信付与等 意思決定や損失額等 シ ミュレーションもある • Imbalanced Data • 個人情報や機微情報等 高い情報管理
そもそもクレジット(= 信用) ? 一般的 , ”企業 融資”,”後払い サービス” 債務不履行リスク 評価,等
“貸し出 しリスク” をクレジット 扱っ いる. 一方,中国 “Zhima信用” ,シェアバイク 利用状況や,ソーシャルネット ワーク つ がり, 必ずしもお金だけ 紐付いた信用だけ い.
Imbalanced や シミュレーション等 問題性質 • 後払い 着目する ,顧客側 支払い義務が守られず ,支払いが滞る率
が高すぎる そもそも後払い いうサービス運営が き い ◦ → 一般的 未払い者数 << 支払い者数 あり,Imbalanced る • (下図:例,スコア 融資限度額 関係図) ◦ 貸し出し リスク 分類問題だけ く,貸す場合 ▪ くらい 限度額を設定するか ? ▪ それ より債務不履行 る確率的 期待値 ?
個人情報や機微情報等 高い情報管理 こちら 後述いたします.
メルカリ ういったデータを分析 利用 きるか ?
メルカリ データ • 出品データ ◦ 商品画像 ◦ 商品名 ◦ 商品説明
◦ 商品状態 ◦ 商品価格 ◦ カテゴリ ◦ ブランド ◦ サイズ ◦ 配送方法 • サポートコミュニティ ◦ Q&Aデータ • お客さま 行動データ ◦ 商品検索 ◦ 商品タップ ◦ 商品へ 「いい 」 ◦ 商品へ コメント ◦ 価格交渉 ◦ 商品購入 ◦ 商品出品 ◦ 取引メッセージ ◦ 問い合わせ ◦ 商品通報 • ライブフリマ ◦ 動画データ 画像 / 動画 / テキスト / 行動ログ ,多岐 わたる大量 データ
これから
検討したい 思っ いるこ 1. データ解析 プライバシー保護技術を取り入れる a. 悪意をもっ 情報を抜き取 ろう
する人(攻撃者)から,大切 情報をまもる b. モデリング中 人為的 ミスを防ぐため も 2. スコア 特徴量 設計次第 ,(スコアが表示された世界 )利用される方た ち 行動が変わる可能性がある a. (状態, 行動, 報酬)等を考慮 きそう ,強化学習 が想像しやすい b. そもそも 議論もし いく必要 ある
プライバシー保護技術 ... - プライバシー - 個人情報,要配慮情報, ... - プライバシ保護技術 -
データ解析 おけるプライバシー 保護 - よう 定義される か - よう すれ 保護しつつデータ解析が きるか - いった問題を統計学,データ工学,暗号理論 観点
事例や用語 紹介 • Netflix 事例 ◦ Kaggle コンペティション 公開されたデータ(映画 レイティング)
,個人 特定を防ぐ処理 が施され いた. ◦ 一方 ,特定 背景情報をもつ ら 一意 特定 きる条件が統計的 導かれ,個人 特定 が高い確率 可能 ある 主張された. • k-匿名性 ◦ 例) 30代, 男性, 港区 企業 勤め いる , 関東在住, ...
安全性を定量的 議論したい Q. 秘密 入力 x つい f 出力 y
= f(x) を公開した します. 攻撃者が y を得た き ,x が 程度推測されるか , よう 評価すれ よいか ? 引用 : データ解析 おけるプライバシー保護
さいご
チームメンバーを募集し おります ➔ [merpay]ソフトウェアエンジニア(Machine Learning) ➔ [merpay]エンジニアリングマネージャー(Machine Learning) もしご興味ありましたら @Hmj_kd
ま ご連絡ください. 引用 : https://medium.com/moonshot/ataengineers-vs-data-scientist-13fce30812a7
ご清聴ありが うございます !!