Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20230222 フィンテック養成勉強会#28 金融に活かすデータの開拓と利活用(技術編) ...
Search
Ryuya Nakamura
February 23, 2023
Technology
260
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20230222 フィンテック養成勉強会#28 金融に活かすデータの開拓と利活用(技術編) データ活用とプライバシー
Ryuya Nakamura
February 23, 2023
More Decks by Ryuya Nakamura
See All by Ryuya Nakamura
本当に「時間がなかった」のか?
nrryuya
0
390
「弁護士バイアス」とその対処法
nrryuya
2
1.6k
AIオンボーディングとAIプロセスマイニング
nrryuya
5
3k
アルファを作る人になる
nrryuya
0
510
学生時代のキャリア探索の心がけ
nrryuya
0
370
フィードバックされやすい人になろう
nrryuya
36
25k
間違いが許されなくてもLLMが使えるユースケースとは @GenAI Playground Meetup #01
nrryuya
13
6.5k
20240725 LLMによるDXのビジョンと、今何からやるべきか @Azure OpenAI Service Dev Day
nrryuya
4
2.8k
「知的単純作業」を自動化する、地に足の着いた大規模言語モデル (LLM) の活用
nrryuya
9
13k
Other Decks in Technology
See All in Technology
Agentic Web
dynamis
1
130
AIを「創る」と「使う」の循環 — HRテックが実践するリアルなAI組織実装
taketo957
0
1.5k
AI フレンドリーなエラー監視を TypeScript で実現する
shinyaigeek
2
260
ITエンジニアを取り巻く環境とキャリアパス / A career path for Japanese IT engineers
takatama
4
1.8k
JEP 522 Deep Dive - G1 GC同期コスト削減によるスループット向上を徹底検証&解説
tabatad
1
850
もりもり新機能を一挙紹介! AgentCoreに入門して、AWS上にAIエージェントを構築しよう
minorun365
PRO
6
800
ブロックチェーン / Blockchain
ks91
PRO
0
110
Chart.js が簡単に使えるようになっていたので OGP 画像生成に使った話
kamekyame
0
160
AI駆動開発が変える、大規模開発の前提 ーHuman in the Loop から Human on the Loop へ / AIE2026
visional_engineering_and_design
7
4.8k
10倍の生産性を実現するAI駆動並列エージェントのすべて
kumaiu
2
220
データ基盤をDataformで整えた話 〜 開発環境を添えて 〜
takapy
0
110
AI活用を推進するために ファインディが下した、一つの小さな決断
starfish719
0
250
Featured
See All Featured
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
370
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
590
Optimising Largest Contentful Paint
csswizardry
37
3.7k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
600
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
Site-Speed That Sticks
csswizardry
13
1.2k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Discover your Explorer Soul
emna__ayadi
2
1.1k
Transcript
1 © LayerX Inc. 「データ活用とプライバシー」 2023/2/22 フィンテック養成勉強会#28 金融に活かすデータの開拓と利活用(技術編) LayerX PrivacyTech事業部長
中村 龍矢
2 © LayerX Inc. これまで取り組んできたこと 自己紹介 データ分析・機械学習 東京大 工学部 •
データサイエンスと出会う Gunosy データ分析部 • アプリのデータ分析 • 機械学習での分類/推薦 セキュリティ・形式検証 データプライバシー LayerX 創業時からR&D • ブロックチェーンをきっかけに セキュリティの研究を始める • Ethereumへのコントリ ビューション R&Dから事業化 • 今に至る 中村 龍矢 • LayerX 執行役員 兼 PrivacyTech事業部長 • IPA 未踏スーパークリエータ • 2020年度 電子情報通信学会 インターネット アーキテクチャ研究賞 最優秀賞 (共著)
3 © LayerX Inc. LayerX PrivacyTech事業の紹介
4 © LayerX Inc. • SaaS事業・Fintech事業に続く第三の事業としてPrivacyTech事業を展開 LayerXの事業紹介 自社プロダクト(SaaS)を提供 プライバシー保護 /秘匿化技術
三井物産様と合弁会社 SaaS事業 Fintech事業 PrivacyTech事業 出資・出向
5 © LayerX Inc. • 世の中にあるデータのうち、データ流通のポテンシャルはまだ数%くらいしか発揮されていない(?) • 医療、行政、金融など様々な社会問題の解決に繋がる データソース別の利用シーン(一例) 顧客属性データ
決済・取引データ 移動履歴データ スマホ位置情報 電子カルテ 購買データ TV視聴データ 電力利用データ 政策立案・改善 商圏分析 ・立地検討 マーケティング 施策立案・改善 製品開発 広告などの パーソナライズ 事例①:Suica利用データ 事例②:電力利用データ • 駅の利用状況データを通じて人の流れをより正確に把握することによ る、観光施策や地域活性化向けの活用を狙うもの。 • 首都圏を中心に駅ごとの乗降者数のデータなどを集計したレポート 「駅カルテ」を作成。 • スマートメーターを通じて収集した電力データを利用するもの。 • 特定地域での電力使用状況に基づく商圏分析や、各世帯での電力使用 状況に基づく高齢者見守り・再配達削減などに活用を図る。 出所:JR東日本、電力・ガス基本政策小委員会 パーソナルデータ流通の可能性
6 © LayerX Inc. 就職で不利になったり、 勤務先で差別されないか・・・ パーソナルデータ流通に伴うプライバシーの懸念 • 学歴、病歴 •
収入、資産 • 行動履歴 • etc. 本人 様々な事業者 病歴のせいで生命保険に加入できなく なるかも・・・ 不安 • しかし、パーソナルデータの外部提供は、ユーザー・ステークホルダーの不安につながる可能性 • 価値のあるリアルなデータほど、伝統的な大きな企業が保有することが多く、何十年とかけて築き上げてき たユーザー・社会との信頼関係は非常に重要 クレカが作れなくなったり、必要な時に お金を借りれられなかったらどうしよ う・・・ データ取得 自分のデータが勝手に 売られるのは気持ち悪い! designed by Freepik
7 © LayerX Inc. 「Anonify(アノニファイ)」とは • 世界中で進む先端的なプライバシー分野の学術研究を土台に、実務的なデータ利活用に応用できるよう LayerXが独自に開発したプライバシー保護のアルゴリズム群
8 © LayerX Inc. PrivacyTech事業の取り組み実績 • 次世代金融における秘匿化技術の活用可能性に関する共同研究 • 秘匿性を担保した複数企業間の取引記録インフラの事業検討・技術検証 協業事例(一部)
メディア掲載(抜粋) • 住民意見収集システムとして採用(秘匿化技術国内初の実用化事例) • インターネット投票の実現に向け、公職選挙法の規制緩和の提案 • 「Anonify」を活用した自動車走行データの分析サービスの提供を開始 • プライバシー保護とデータ利活用のさらなる高度化に向けた共創を開始 • テキストデータのプライバシー保護技術適用の共同研究 JCB様 つくば市様 リクルート様 あいおいニッセイ 同和損保様 • 医療データのプライバシー保護に関する共同研究 JMDC様
9 © LayerX Inc. プライバシーテックのイメージ 〜差分プライバシーの例〜
10 © LayerX Inc. プライバシーテック・プライバシーエンジニアリング https://jobs.apple.com/en-us/details/200423409/platform-privacy-engineer https://careers.mastercard.com/us/en/job/R-184152/Vice-Preside nt-Privacy-Engineer https://www.metacareers.com/v2/jobs/431958232249790/ •
プライバシーは心理的・倫理的な話というイメージもあるものの、技術的に解決できる問題もある • 「Privacy Engineer」という職種の求人も見かける Meta (Facebook) Mastercard Apple
11 © LayerX Inc. 要素技術の紹介: 差分プライバシーとは • 差分プライバシー: 2006年に考案された、数学的に証明可能なプライバシー保証を提供するアプローチ •
アカデミアにおけるプライバシー定義のデファクト・スタンダード 定義を満たすアルゴリズムの構成 差分プライバシーの定義 出典: https://www.cis.upenn.edu/~aaroth/Papers/privacybook.pdf
12 © LayerX Inc. 平均年収:800万円 平均年収:799.9万円 Aさん在籍時の合計年収 = 平均800万円 *
51人 Aさん退職後の合計年収 = 平均799.9万円 * 50人 Aさんの年収 = 800 * 51 - 799.9 * 50 = 805万円 Aさん在籍時 (51名) Aさん退職後 (50名) ・・・・・・・・・・・・・ ・・・・・・・・・・・・・ たった1000円分の平均年収の 変化から、Aさんの給与がわ かってしまう プライバシーリスクは意外なところにある • 統計情報だけを提供しても、差分から特定個人のデータが炙りだされてしまう • 1970年代(もしくはもっと前)から続く、長い研究の歴史 • 実際にはもっともっと色々なリスクがある!
13 © LayerX Inc. 差分プライバシーでの解決 • 機密なデータに基づく統計データに、プライバシーを保護するノイズを注入する • 誤差が発生するが、統計的な分析では活用できる 年齢
性別 住所 年収 32 男性 東京都中央区 650万円 24 女性 神奈川県横浜市 600万円 56 男性 東京都中央区 1000万円 44 女性 千葉県松戸市 950万円 ノイズ付与後の 平均年収: 810万円 平均年収: 800万円 (真の値) 公開しない 元のデータの 復元困難 元のパーソナルデータ 差分プライバシー のアルゴリズム +10万円の ノイズを付与
14 © LayerX Inc. プライバシーテックの 活用事例
15 © LayerX Inc. プライバシーテックの登場パターン • プライバシーテックの登場パターンを大きく三つに大別 designed by Freepik
③双方向のデータ連携 (特に名寄せを行う場合) ②一方通行のデータ提供 注: 個別のプライバシー保護の要素技術は、上記の分類に一対一対応するわけではなく、組み合わせて使われる (差分プライバシーはどこにでも登場する) ①エンドユーザーからの データ収集
16 © LayerX Inc. • LINEスタンプ選択時のサジェスト機能のアップデートにおいて、ユーザーのプライバシーを保護しつつ利便 性を向上させるため、「差分プライバシー」「連合学習」が導入された。 • 同様の技術はGAFAMの各種サービスでも活用されており、iPhoneでのログ収集などが有名 国内他社における差分プライバシー適用事例
LINEスタンプのサジェスト機能における差分プライバシー実用事例 出所:https://linecorp.com/ja/security/article/429 差分プライバシーを用いて処理結果(学習モ デルの更新情報)に対してノイズ付加
17 © LayerX Inc. プライバシーテックの登場パターン • プライバシーテックの登場パターンを大きく三つに大別 designed by Freepik
③双方向のデータ連携 (特に名寄せを行う場合) ②収集したデータの外部提供 注: 個別のプライバシー保護の要素技術は、上記の分類に一対一対応するわけではなく、組み合わせて使われる (差分プライバシーはどこにでも登場する) ①エンドユーザーからの データ収集
18 © LayerX Inc. データ外部提供における差分プライバシーの活用事例 Linkedinの広告主向けダッシュボードでは、広告の表示 数やクリック数を可視化。ユーザーの閲覧情報などを逆算 する攻撃を防ぐため、差分プライバシーの亜種を導入(出 典) 差分プライバシーの活用事例
米国 国勢調査局 米国の国勢調査において、人口統計や所得や学歴などの 統計情報を公開する際に、差分プライバシーを活用。(出 典) コロナ禍におけるFacebookユーザーの行動情報(1日 の間にユーザーが移動する量と、家にいる人の数の指標) を疫学研究を目的として公開する上で、差分プライバシー を活用。(出典) 機密性の高いユーザーの位置情報を、社内のデータサイエ ンティストがプライバシー保護を担保したまま分析するた めに、差分プライバシーを活用。(出典) • 米国の国勢調査や、グローバル大手IT企業などが、国民・消費者に対して透明性のある安全なデータ利活用 を進める上で、差分プライバシーを活用している。 参考:差分プライバシーとは - AppleやGoogleも活用する最先端のプライバシー保護技術
19 © LayerX Inc. 事例: COVID-19の疫学研究のためのFacebookのデータ公開 • コロナ禍におけるFacebookユーザーの行動情報(1日の間にユーザーが移動する量と、家にいる人の数 の指標)を疫学研究を目的として公開する上で、差分プライバシーを活用。 出所:https://visualization.covid19mobility.org/
https://about.fb.com/news/2020/04/data-for-good/
20 © LayerX Inc. 事例: LinkedIn 広告主向けの分析ダッシュボード • Linkedinの広告主向けダッシュボードでは、広告の表示数やクリック数を可視化。 •
ユーザーの閲覧情報などを逆算する攻撃を防ぐため、差分プライバシーの亜種を導入。 出所:https://arxiv.org/pdf/1809.07754.pdf
21 © LayerX Inc. 当社事例: あいおいニッセイ同和損害保険さま • 保険加入者様の自動車走行データを用いたデータ分析サービスを、Anonifyを用いて、プライバシー保護 をした形で実現。 •
急ブレーキ等の危険挙動を、場所や、性別や年齢情報等の様々な切り口で分析が可能。 • 自治体様に提供することで、交通安全対策に用いるなど。 ◦ 結果的に交通事故が削減されれば、保険金の支払いも減り本業にもシナジーがある ◦ (単なる「データ販売」に限らないデータ外部提供の事例) 出所:2022年6月30日付け、LayerXプレスリリース
22 © LayerX Inc. 安全性と有用性のトレードオフ • 安全性も有用性も完璧という「銀の弾丸」は存在しない • LayerXでは、組織間のデータ提供のユースケースに絞った最適解を研究し続けている プ
ラ イ バ シ | 保 護 水 準 高 低 有用性 高 低 銀の弾丸
23 © LayerX Inc. • 技術的に安全であることは、それ単体で直ちに必ずしもエンドユーザーの安心に繋がるわけではないもの の、実質的なリスクを対処し、説明可能にすることは、それ以外の解決策の土台になる。 さいごに: プライバシーテックを起点にした信用の連鎖 2つ目のドミノ
• 規制当局・プライバシー保護の有識者の方 3つ目のドミノ • メディア・政府などの権威 4つ目のドミノ • 一般のデジタルリテラシーのある方 5つ目のドミノ • さらに広い一般の方・社会全体 最初のドミノ • 厳密なプライバシー保護とその説明力
24 © LayerX Inc.