Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20230222 フィンテック養成勉強会#28 金融に活かすデータの開拓と利活用(技術編) データ活用とプライバシー

20230222 フィンテック養成勉強会#28 金融に活かすデータの開拓と利活用(技術編) データ活用とプライバシー

Ryuya Nakamura

February 23, 2023
Tweet

More Decks by Ryuya Nakamura

Other Decks in Technology

Transcript

  1. 1
    © LayerX Inc.
    「データ活用とプライバシー」
    2023/2/22 フィンテック養成勉強会#28
    金融に活かすデータの開拓と利活用(技術編)
    LayerX PrivacyTech事業部長 中村 龍矢

    View Slide

  2. 2
    © LayerX Inc.
    これまで取り組んできたこと
    自己紹介
    データ分析・機械学習
    東京大 工学部
    ● データサイエンスと出会う
    Gunosy データ分析部
    ● アプリのデータ分析
    ● 機械学習での分類/推薦
    セキュリティ・形式検証 データプライバシー
    LayerX 創業時からR&D
    ● ブロックチェーンをきっかけに
    セキュリティの研究を始める
    ● Ethereumへのコントリ
    ビューション
    R&Dから事業化
    ● 今に至る
    中村 龍矢
    ● LayerX 執行役員 兼 PrivacyTech事業部長
    ● IPA 未踏スーパークリエータ
    ● 2020年度 電子情報通信学会 インターネット
    アーキテクチャ研究賞 最優秀賞 (共著)

    View Slide

  3. 3
    © LayerX Inc.
    LayerX
    PrivacyTech事業の紹介

    View Slide

  4. 4
    © LayerX Inc.
    ● SaaS事業・Fintech事業に続く第三の事業としてPrivacyTech事業を展開
    LayerXの事業紹介
    自社プロダクト(SaaS)を提供 プライバシー保護
    /秘匿化技術
    三井物産様と合弁会社
    SaaS事業 Fintech事業 PrivacyTech事業
    出資・出向

    View Slide

  5. 5
    © LayerX Inc.
    ● 世の中にあるデータのうち、データ流通のポテンシャルはまだ数%くらいしか発揮されていない(?)
    ● 医療、行政、金融など様々な社会問題の解決に繋がる
    データソース別の利用シーン(一例)
    顧客属性データ
    決済・取引データ
    移動履歴データ
    スマホ位置情報
    電子カルテ
    購買データ
    TV視聴データ
    電力利用データ
    政策立案・改善
    商圏分析
    ・立地検討
    マーケティング
    施策立案・改善
    製品開発
    広告などの
    パーソナライズ
    事例①:Suica利用データ
    事例②:電力利用データ
    ● 駅の利用状況データを通じて人の流れをより正確に把握することによ
    る、観光施策や地域活性化向けの活用を狙うもの。
    ● 首都圏を中心に駅ごとの乗降者数のデータなどを集計したレポート
    「駅カルテ」を作成。
    ● スマートメーターを通じて収集した電力データを利用するもの。
    ● 特定地域での電力使用状況に基づく商圏分析や、各世帯での電力使用
    状況に基づく高齢者見守り・再配達削減などに活用を図る。
    出所:JR東日本、電力・ガス基本政策小委員会
    パーソナルデータ流通の可能性

    View Slide

  6. 6
    © LayerX Inc.
    就職で不利になったり、
    勤務先で差別されないか・・・
    パーソナルデータ流通に伴うプライバシーの懸念
    ● 学歴、病歴
    ● 収入、資産
    ● 行動履歴
    ● etc.
    本人
    様々な事業者
    病歴のせいで生命保険に加入できなく
    なるかも・・・
    不安
    ● しかし、パーソナルデータの外部提供は、ユーザー・ステークホルダーの不安につながる可能性
    ● 価値のあるリアルなデータほど、伝統的な大きな企業が保有することが多く、何十年とかけて築き上げてき
    たユーザー・社会との信頼関係は非常に重要
    クレカが作れなくなったり、必要な時に
    お金を借りれられなかったらどうしよ
    う・・・
    データ取得
    自分のデータが勝手に
    売られるのは気持ち悪い!
    designed by Freepik

    View Slide

  7. 7
    © LayerX Inc.
    「Anonify(アノニファイ)」とは
    ● 世界中で進む先端的なプライバシー分野の学術研究を土台に、実務的なデータ利活用に応用できるよう
    LayerXが独自に開発したプライバシー保護のアルゴリズム群

    View Slide

  8. 8
    © LayerX Inc.
    PrivacyTech事業の取り組み実績
    ● 次世代金融における秘匿化技術の活用可能性に関する共同研究
    ● 秘匿性を担保した複数企業間の取引記録インフラの事業検討・技術検証
    協業事例(一部)
    メディア掲載(抜粋)
    ● 住民意見収集システムとして採用(秘匿化技術国内初の実用化事例)
    ● インターネット投票の実現に向け、公職選挙法の規制緩和の提案
    ● 「Anonify」を活用した自動車走行データの分析サービスの提供を開始
    ● プライバシー保護とデータ利活用のさらなる高度化に向けた共創を開始
    ● テキストデータのプライバシー保護技術適用の共同研究
    JCB様
    つくば市様
    リクルート様
    あいおいニッセイ
    同和損保様
    ● 医療データのプライバシー保護に関する共同研究
    JMDC様

    View Slide

  9. 9
    © LayerX Inc.
    プライバシーテックのイメージ
    〜差分プライバシーの例〜

    View Slide

  10. 10
    © LayerX Inc.
    プライバシーテック・プライバシーエンジニアリング
    https://jobs.apple.com/en-us/details/200423409/platform-privacy-engineer
    https://careers.mastercard.com/us/en/job/R-184152/Vice-Preside
    nt-Privacy-Engineer
    https://www.metacareers.com/v2/jobs/431958232249790/
    ● プライバシーは心理的・倫理的な話というイメージもあるものの、技術的に解決できる問題もある
    ● 「Privacy Engineer」という職種の求人も見かける
    Meta (Facebook)
    Mastercard
    Apple

    View Slide

  11. 11
    © LayerX Inc.
    要素技術の紹介: 差分プライバシーとは
    ● 差分プライバシー: 2006年に考案された、数学的に証明可能なプライバシー保証を提供するアプローチ
    ● アカデミアにおけるプライバシー定義のデファクト・スタンダード
    定義を満たすアルゴリズムの構成
    差分プライバシーの定義
    出典: https://www.cis.upenn.edu/~aaroth/Papers/privacybook.pdf

    View Slide

  12. 12
    © LayerX Inc.
    平均年収:800万円
    平均年収:799.9万円
    Aさん在籍時の合計年収
    = 平均800万円 * 51人
    Aさん退職後の合計年収
    = 平均799.9万円 * 50人
    Aさんの年収
    = 800 * 51 - 799.9 *
    50
    = 805万円
    Aさん在籍時
    (51名)
    Aさん退職後
    (50名)
    ・・・・・・・・・・・・・
    ・・・・・・・・・・・・・
    たった1000円分の平均年収の
    変化から、Aさんの給与がわ
    かってしまう
    プライバシーリスクは意外なところにある
    ● 統計情報だけを提供しても、差分から特定個人のデータが炙りだされてしまう
    ● 1970年代(もしくはもっと前)から続く、長い研究の歴史
    ● 実際にはもっともっと色々なリスクがある!

    View Slide

  13. 13
    © LayerX Inc.
    差分プライバシーでの解決
    ● 機密なデータに基づく統計データに、プライバシーを保護するノイズを注入する
    ● 誤差が発生するが、統計的な分析では活用できる
    年齢 性別 住所 年収
    32 男性 東京都中央区 650万円
    24 女性 神奈川県横浜市 600万円
    56 男性 東京都中央区 1000万円
    44 女性 千葉県松戸市 950万円
    ノイズ付与後の
    平均年収: 810万円
    平均年収: 800万円
    (真の値)
    公開しない
    元のデータの
    復元困難
    元のパーソナルデータ
    差分プライバシー
    のアルゴリズム
    +10万円の
    ノイズを付与

    View Slide

  14. 14
    © LayerX Inc.
    プライバシーテックの
    活用事例

    View Slide

  15. 15
    © LayerX Inc.
    プライバシーテックの登場パターン
    ● プライバシーテックの登場パターンを大きく三つに大別
    designed by Freepik
    ③双方向のデータ連携
    (特に名寄せを行う場合)
    ②一方通行のデータ提供
    注: 個別のプライバシー保護の要素技術は、上記の分類に一対一対応するわけではなく、組み合わせて使われる
    (差分プライバシーはどこにでも登場する)
    ①エンドユーザーからの
    データ収集

    View Slide

  16. 16
    © LayerX Inc.
    ● LINEスタンプ選択時のサジェスト機能のアップデートにおいて、ユーザーのプライバシーを保護しつつ利便
    性を向上させるため、「差分プライバシー」「連合学習」が導入された。
    ● 同様の技術はGAFAMの各種サービスでも活用されており、iPhoneでのログ収集などが有名
    国内他社における差分プライバシー適用事例
    LINEスタンプのサジェスト機能における差分プライバシー実用事例
    出所:https://linecorp.com/ja/security/article/429
    差分プライバシーを用いて処理結果(学習モ
    デルの更新情報)に対してノイズ付加

    View Slide

  17. 17
    © LayerX Inc.
    プライバシーテックの登場パターン
    ● プライバシーテックの登場パターンを大きく三つに大別
    designed by Freepik
    ③双方向のデータ連携
    (特に名寄せを行う場合)
    ②収集したデータの外部提供
    注: 個別のプライバシー保護の要素技術は、上記の分類に一対一対応するわけではなく、組み合わせて使われる
    (差分プライバシーはどこにでも登場する)
    ①エンドユーザーからの
    データ収集

    View Slide

  18. 18
    © LayerX Inc.
    データ外部提供における差分プライバシーの活用事例
    Linkedinの広告主向けダッシュボードでは、広告の表示
    数やクリック数を可視化。ユーザーの閲覧情報などを逆算
    する攻撃を防ぐため、差分プライバシーの亜種を導入(出
    典)
    差分プライバシーの活用事例
    米国
    国勢調査局
    米国の国勢調査において、人口統計や所得や学歴などの
    統計情報を公開する際に、差分プライバシーを活用。(出
    典)
    コロナ禍におけるFacebookユーザーの行動情報(1日
    の間にユーザーが移動する量と、家にいる人の数の指標)
    を疫学研究を目的として公開する上で、差分プライバシー
    を活用。(出典)
    機密性の高いユーザーの位置情報を、社内のデータサイエ
    ンティストがプライバシー保護を担保したまま分析するた
    めに、差分プライバシーを活用。(出典)
    ● 米国の国勢調査や、グローバル大手IT企業などが、国民・消費者に対して透明性のある安全なデータ利活用
    を進める上で、差分プライバシーを活用している。
    参考:差分プライバシーとは - AppleやGoogleも活用する最先端のプライバシー保護技術

    View Slide

  19. 19
    © LayerX Inc.
    事例: COVID-19の疫学研究のためのFacebookのデータ公開
    ● コロナ禍におけるFacebookユーザーの行動情報(1日の間にユーザーが移動する量と、家にいる人の数
    の指標)を疫学研究を目的として公開する上で、差分プライバシーを活用。
    出所:https://visualization.covid19mobility.org/
    https://about.fb.com/news/2020/04/data-for-good/

    View Slide

  20. 20
    © LayerX Inc.
    事例: LinkedIn 広告主向けの分析ダッシュボード
    ● Linkedinの広告主向けダッシュボードでは、広告の表示数やクリック数を可視化。
    ● ユーザーの閲覧情報などを逆算する攻撃を防ぐため、差分プライバシーの亜種を導入。
    出所:https://arxiv.org/pdf/1809.07754.pdf

    View Slide

  21. 21
    © LayerX Inc.
    当社事例: あいおいニッセイ同和損害保険さま
    ● 保険加入者様の自動車走行データを用いたデータ分析サービスを、Anonifyを用いて、プライバシー保護
    をした形で実現。
    ● 急ブレーキ等の危険挙動を、場所や、性別や年齢情報等の様々な切り口で分析が可能。
    ● 自治体様に提供することで、交通安全対策に用いるなど。
    ○ 結果的に交通事故が削減されれば、保険金の支払いも減り本業にもシナジーがある
    ○ (単なる「データ販売」に限らないデータ外部提供の事例)
    出所:2022年6月30日付け、LayerXプレスリリース

    View Slide

  22. 22
    © LayerX Inc.
    安全性と有用性のトレードオフ
    ● 安全性も有用性も完璧という「銀の弾丸」は存在しない
    ● LayerXでは、組織間のデータ提供のユースケースに絞った最適解を研究し続けている












    有用性 高

    銀の弾丸

    View Slide

  23. 23
    © LayerX Inc.
    ● 技術的に安全であることは、それ単体で直ちに必ずしもエンドユーザーの安心に繋がるわけではないもの
    の、実質的なリスクを対処し、説明可能にすることは、それ以外の解決策の土台になる。
    さいごに: プライバシーテックを起点にした信用の連鎖
    2つ目のドミノ
    ● 規制当局・プライバシー保護の有識者の方
    3つ目のドミノ
    ● メディア・政府などの権威
    4つ目のドミノ
    ● 一般のデジタルリテラシーのある方
    5つ目のドミノ
    ● さらに広い一般の方・社会全体
    最初のドミノ
    ● 厳密なプライバシー保護とその説明力

    View Slide

  24. 24
    © LayerX Inc.

    View Slide