Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20230222 フィンテック養成勉強会#28 金融に活かすデータの開拓と利活用(技術編) ...

20230222 フィンテック養成勉強会#28 金融に活かすデータの開拓と利活用(技術編) データ活用とプライバシー

Ryuya Nakamura

February 23, 2023
Tweet

More Decks by Ryuya Nakamura

Other Decks in Technology

Transcript

  1. 2 © LayerX Inc. これまで取り組んできたこと 自己紹介 データ分析・機械学習 東京大 工学部 •

    データサイエンスと出会う Gunosy データ分析部 • アプリのデータ分析 • 機械学習での分類/推薦 セキュリティ・形式検証 データプライバシー LayerX 創業時からR&D • ブロックチェーンをきっかけに セキュリティの研究を始める • Ethereumへのコントリ ビューション R&Dから事業化 • 今に至る 中村 龍矢 • LayerX 執行役員 兼 PrivacyTech事業部長 • IPA 未踏スーパークリエータ • 2020年度 電子情報通信学会 インターネット アーキテクチャ研究賞 最優秀賞 (共著)
  2. 5 © LayerX Inc. • 世の中にあるデータのうち、データ流通のポテンシャルはまだ数%くらいしか発揮されていない(?) • 医療、行政、金融など様々な社会問題の解決に繋がる データソース別の利用シーン(一例) 顧客属性データ

    決済・取引データ 移動履歴データ スマホ位置情報 電子カルテ 購買データ TV視聴データ 電力利用データ 政策立案・改善 商圏分析 ・立地検討 マーケティング 施策立案・改善 製品開発 広告などの パーソナライズ 事例①:Suica利用データ 事例②:電力利用データ • 駅の利用状況データを通じて人の流れをより正確に把握することによ る、観光施策や地域活性化向けの活用を狙うもの。 • 首都圏を中心に駅ごとの乗降者数のデータなどを集計したレポート 「駅カルテ」を作成。 • スマートメーターを通じて収集した電力データを利用するもの。 • 特定地域での電力使用状況に基づく商圏分析や、各世帯での電力使用 状況に基づく高齢者見守り・再配達削減などに活用を図る。 出所:JR東日本、電力・ガス基本政策小委員会 パーソナルデータ流通の可能性
  3. 6 © LayerX Inc. 就職で不利になったり、 勤務先で差別されないか・・・ パーソナルデータ流通に伴うプライバシーの懸念 • 学歴、病歴 •

    収入、資産 • 行動履歴 • etc. 本人 様々な事業者 病歴のせいで生命保険に加入できなく なるかも・・・ 不安 • しかし、パーソナルデータの外部提供は、ユーザー・ステークホルダーの不安につながる可能性 • 価値のあるリアルなデータほど、伝統的な大きな企業が保有することが多く、何十年とかけて築き上げてき たユーザー・社会との信頼関係は非常に重要 クレカが作れなくなったり、必要な時に お金を借りれられなかったらどうしよ う・・・ データ取得 自分のデータが勝手に 売られるのは気持ち悪い! designed by Freepik
  4. 8 © LayerX Inc. PrivacyTech事業の取り組み実績 • 次世代金融における秘匿化技術の活用可能性に関する共同研究 • 秘匿性を担保した複数企業間の取引記録インフラの事業検討・技術検証 協業事例(一部)

    メディア掲載(抜粋) • 住民意見収集システムとして採用(秘匿化技術国内初の実用化事例) • インターネット投票の実現に向け、公職選挙法の規制緩和の提案 • 「Anonify」を活用した自動車走行データの分析サービスの提供を開始 • プライバシー保護とデータ利活用のさらなる高度化に向けた共創を開始 • テキストデータのプライバシー保護技術適用の共同研究 JCB様 つくば市様 リクルート様 あいおいニッセイ 同和損保様 • 医療データのプライバシー保護に関する共同研究 JMDC様
  5. 10 © LayerX Inc. プライバシーテック・プライバシーエンジニアリング https://jobs.apple.com/en-us/details/200423409/platform-privacy-engineer https://careers.mastercard.com/us/en/job/R-184152/Vice-Preside nt-Privacy-Engineer https://www.metacareers.com/v2/jobs/431958232249790/ •

    プライバシーは心理的・倫理的な話というイメージもあるものの、技術的に解決できる問題もある • 「Privacy Engineer」という職種の求人も見かける Meta (Facebook) Mastercard Apple
  6. 11 © LayerX Inc. 要素技術の紹介: 差分プライバシーとは • 差分プライバシー: 2006年に考案された、数学的に証明可能なプライバシー保証を提供するアプローチ •

    アカデミアにおけるプライバシー定義のデファクト・スタンダード 定義を満たすアルゴリズムの構成 差分プライバシーの定義 出典: https://www.cis.upenn.edu/~aaroth/Papers/privacybook.pdf
  7. 12 © LayerX Inc. 平均年収:800万円 平均年収:799.9万円 Aさん在籍時の合計年収 = 平均800万円 *

    51人 Aさん退職後の合計年収 = 平均799.9万円 * 50人 Aさんの年収 = 800 * 51 - 799.9 * 50 = 805万円 Aさん在籍時 (51名) Aさん退職後 (50名) ・・・・・・・・・・・・・ ・・・・・・・・・・・・・ たった1000円分の平均年収の 変化から、Aさんの給与がわ かってしまう プライバシーリスクは意外なところにある • 統計情報だけを提供しても、差分から特定個人のデータが炙りだされてしまう • 1970年代(もしくはもっと前)から続く、長い研究の歴史 • 実際にはもっともっと色々なリスクがある!
  8. 13 © LayerX Inc. 差分プライバシーでの解決 • 機密なデータに基づく統計データに、プライバシーを保護するノイズを注入する • 誤差が発生するが、統計的な分析では活用できる 年齢

    性別 住所 年収 32 男性 東京都中央区 650万円 24 女性 神奈川県横浜市 600万円 56 男性 東京都中央区 1000万円 44 女性 千葉県松戸市 950万円 ノイズ付与後の 平均年収: 810万円 平均年収: 800万円 (真の値) 公開しない 元のデータの 復元困難 元のパーソナルデータ 差分プライバシー のアルゴリズム +10万円の ノイズを付与
  9. 15 © LayerX Inc. プライバシーテックの登場パターン • プライバシーテックの登場パターンを大きく三つに大別 designed by Freepik

    ③双方向のデータ連携 (特に名寄せを行う場合) ②一方通行のデータ提供 注: 個別のプライバシー保護の要素技術は、上記の分類に一対一対応するわけではなく、組み合わせて使われる (差分プライバシーはどこにでも登場する) ①エンドユーザーからの データ収集
  10. 17 © LayerX Inc. プライバシーテックの登場パターン • プライバシーテックの登場パターンを大きく三つに大別 designed by Freepik

    ③双方向のデータ連携 (特に名寄せを行う場合) ②収集したデータの外部提供 注: 個別のプライバシー保護の要素技術は、上記の分類に一対一対応するわけではなく、組み合わせて使われる (差分プライバシーはどこにでも登場する) ①エンドユーザーからの データ収集
  11. 18 © LayerX Inc. データ外部提供における差分プライバシーの活用事例 Linkedinの広告主向けダッシュボードでは、広告の表示 数やクリック数を可視化。ユーザーの閲覧情報などを逆算 する攻撃を防ぐため、差分プライバシーの亜種を導入(出 典) 差分プライバシーの活用事例

    米国 国勢調査局 米国の国勢調査において、人口統計や所得や学歴などの 統計情報を公開する際に、差分プライバシーを活用。(出 典) コロナ禍におけるFacebookユーザーの行動情報(1日 の間にユーザーが移動する量と、家にいる人の数の指標) を疫学研究を目的として公開する上で、差分プライバシー を活用。(出典) 機密性の高いユーザーの位置情報を、社内のデータサイエ ンティストがプライバシー保護を担保したまま分析するた めに、差分プライバシーを活用。(出典) • 米国の国勢調査や、グローバル大手IT企業などが、国民・消費者に対して透明性のある安全なデータ利活用 を進める上で、差分プライバシーを活用している。 参考:差分プライバシーとは - AppleやGoogleも活用する最先端のプライバシー保護技術
  12. 20 © LayerX Inc. 事例: LinkedIn 広告主向けの分析ダッシュボード • Linkedinの広告主向けダッシュボードでは、広告の表示数やクリック数を可視化。 •

    ユーザーの閲覧情報などを逆算する攻撃を防ぐため、差分プライバシーの亜種を導入。 出所:https://arxiv.org/pdf/1809.07754.pdf
  13. 21 © LayerX Inc. 当社事例: あいおいニッセイ同和損害保険さま • 保険加入者様の自動車走行データを用いたデータ分析サービスを、Anonifyを用いて、プライバシー保護 をした形で実現。 •

    急ブレーキ等の危険挙動を、場所や、性別や年齢情報等の様々な切り口で分析が可能。 • 自治体様に提供することで、交通安全対策に用いるなど。 ◦ 結果的に交通事故が削減されれば、保険金の支払いも減り本業にもシナジーがある ◦ (単なる「データ販売」に限らないデータ外部提供の事例) 出所:2022年6月30日付け、LayerXプレスリリース
  14. 23 © LayerX Inc. • 技術的に安全であることは、それ単体で直ちに必ずしもエンドユーザーの安心に繋がるわけではないもの の、実質的なリスクを対処し、説明可能にすることは、それ以外の解決策の土台になる。 さいごに: プライバシーテックを起点にした信用の連鎖 2つ目のドミノ

    • 規制当局・プライバシー保護の有識者の方 3つ目のドミノ • メディア・政府などの権威 4つ目のドミノ • 一般のデジタルリテラシーのある方 5つ目のドミノ • さらに広い一般の方・社会全体 最初のドミノ • 厳密なプライバシー保護とその説明力