Slide 1

Slide 1 text

1 © LayerX Inc. 「データ活用とプライバシー」 2023/2/22 フィンテック養成勉強会#28 金融に活かすデータの開拓と利活用(技術編) LayerX PrivacyTech事業部長 中村 龍矢

Slide 2

Slide 2 text

2 © LayerX Inc. これまで取り組んできたこと 自己紹介 データ分析・機械学習 東京大 工学部 ● データサイエンスと出会う Gunosy データ分析部 ● アプリのデータ分析 ● 機械学習での分類/推薦 セキュリティ・形式検証 データプライバシー LayerX 創業時からR&D ● ブロックチェーンをきっかけに セキュリティの研究を始める ● Ethereumへのコントリ ビューション R&Dから事業化 ● 今に至る 中村 龍矢 ● LayerX 執行役員 兼 PrivacyTech事業部長 ● IPA 未踏スーパークリエータ ● 2020年度 電子情報通信学会 インターネット アーキテクチャ研究賞 最優秀賞 (共著)

Slide 3

Slide 3 text

3 © LayerX Inc. LayerX PrivacyTech事業の紹介

Slide 4

Slide 4 text

4 © LayerX Inc. ● SaaS事業・Fintech事業に続く第三の事業としてPrivacyTech事業を展開 LayerXの事業紹介 自社プロダクト(SaaS)を提供 プライバシー保護 /秘匿化技術 三井物産様と合弁会社 SaaS事業 Fintech事業 PrivacyTech事業 出資・出向

Slide 5

Slide 5 text

5 © LayerX Inc. ● 世の中にあるデータのうち、データ流通のポテンシャルはまだ数%くらいしか発揮されていない(?) ● 医療、行政、金融など様々な社会問題の解決に繋がる データソース別の利用シーン(一例) 顧客属性データ 決済・取引データ 移動履歴データ スマホ位置情報 電子カルテ 購買データ TV視聴データ 電力利用データ 政策立案・改善 商圏分析 ・立地検討 マーケティング 施策立案・改善 製品開発 広告などの パーソナライズ 事例①:Suica利用データ 事例②:電力利用データ ● 駅の利用状況データを通じて人の流れをより正確に把握することによ る、観光施策や地域活性化向けの活用を狙うもの。 ● 首都圏を中心に駅ごとの乗降者数のデータなどを集計したレポート 「駅カルテ」を作成。 ● スマートメーターを通じて収集した電力データを利用するもの。 ● 特定地域での電力使用状況に基づく商圏分析や、各世帯での電力使用 状況に基づく高齢者見守り・再配達削減などに活用を図る。 出所:JR東日本、電力・ガス基本政策小委員会 パーソナルデータ流通の可能性

Slide 6

Slide 6 text

6 © LayerX Inc. 就職で不利になったり、 勤務先で差別されないか・・・ パーソナルデータ流通に伴うプライバシーの懸念 ● 学歴、病歴 ● 収入、資産 ● 行動履歴 ● etc. 本人 様々な事業者 病歴のせいで生命保険に加入できなく なるかも・・・ 不安 ● しかし、パーソナルデータの外部提供は、ユーザー・ステークホルダーの不安につながる可能性 ● 価値のあるリアルなデータほど、伝統的な大きな企業が保有することが多く、何十年とかけて築き上げてき たユーザー・社会との信頼関係は非常に重要 クレカが作れなくなったり、必要な時に お金を借りれられなかったらどうしよ う・・・ データ取得 自分のデータが勝手に 売られるのは気持ち悪い! designed by Freepik

Slide 7

Slide 7 text

7 © LayerX Inc. 「Anonify(アノニファイ)」とは ● 世界中で進む先端的なプライバシー分野の学術研究を土台に、実務的なデータ利活用に応用できるよう LayerXが独自に開発したプライバシー保護のアルゴリズム群

Slide 8

Slide 8 text

8 © LayerX Inc. PrivacyTech事業の取り組み実績 ● 次世代金融における秘匿化技術の活用可能性に関する共同研究 ● 秘匿性を担保した複数企業間の取引記録インフラの事業検討・技術検証 協業事例(一部) メディア掲載(抜粋) ● 住民意見収集システムとして採用(秘匿化技術国内初の実用化事例) ● インターネット投票の実現に向け、公職選挙法の規制緩和の提案 ● 「Anonify」を活用した自動車走行データの分析サービスの提供を開始 ● プライバシー保護とデータ利活用のさらなる高度化に向けた共創を開始 ● テキストデータのプライバシー保護技術適用の共同研究 JCB様 つくば市様 リクルート様 あいおいニッセイ 同和損保様 ● 医療データのプライバシー保護に関する共同研究 JMDC様

Slide 9

Slide 9 text

9 © LayerX Inc. プライバシーテックのイメージ 〜差分プライバシーの例〜

Slide 10

Slide 10 text

10 © LayerX Inc. プライバシーテック・プライバシーエンジニアリング https://jobs.apple.com/en-us/details/200423409/platform-privacy-engineer https://careers.mastercard.com/us/en/job/R-184152/Vice-Preside nt-Privacy-Engineer https://www.metacareers.com/v2/jobs/431958232249790/ ● プライバシーは心理的・倫理的な話というイメージもあるものの、技術的に解決できる問題もある ● 「Privacy Engineer」という職種の求人も見かける Meta (Facebook) Mastercard Apple

Slide 11

Slide 11 text

11 © LayerX Inc. 要素技術の紹介: 差分プライバシーとは ● 差分プライバシー: 2006年に考案された、数学的に証明可能なプライバシー保証を提供するアプローチ ● アカデミアにおけるプライバシー定義のデファクト・スタンダード 定義を満たすアルゴリズムの構成 差分プライバシーの定義 出典: https://www.cis.upenn.edu/~aaroth/Papers/privacybook.pdf

Slide 12

Slide 12 text

12 © LayerX Inc. 平均年収:800万円 平均年収:799.9万円 Aさん在籍時の合計年収 = 平均800万円 * 51人 Aさん退職後の合計年収 = 平均799.9万円 * 50人 Aさんの年収 = 800 * 51 - 799.9 * 50 = 805万円 Aさん在籍時 (51名) Aさん退職後 (50名) ・・・・・・・・・・・・・ ・・・・・・・・・・・・・ たった1000円分の平均年収の 変化から、Aさんの給与がわ かってしまう プライバシーリスクは意外なところにある ● 統計情報だけを提供しても、差分から特定個人のデータが炙りだされてしまう ● 1970年代(もしくはもっと前)から続く、長い研究の歴史 ● 実際にはもっともっと色々なリスクがある!

Slide 13

Slide 13 text

13 © LayerX Inc. 差分プライバシーでの解決 ● 機密なデータに基づく統計データに、プライバシーを保護するノイズを注入する ● 誤差が発生するが、統計的な分析では活用できる 年齢 性別 住所 年収 32 男性 東京都中央区 650万円 24 女性 神奈川県横浜市 600万円 56 男性 東京都中央区 1000万円 44 女性 千葉県松戸市 950万円 ノイズ付与後の 平均年収: 810万円 平均年収: 800万円 (真の値) 公開しない 元のデータの 復元困難 元のパーソナルデータ 差分プライバシー のアルゴリズム +10万円の ノイズを付与

Slide 14

Slide 14 text

14 © LayerX Inc. プライバシーテックの 活用事例

Slide 15

Slide 15 text

15 © LayerX Inc. プライバシーテックの登場パターン ● プライバシーテックの登場パターンを大きく三つに大別 designed by Freepik ③双方向のデータ連携 (特に名寄せを行う場合) ②一方通行のデータ提供 注: 個別のプライバシー保護の要素技術は、上記の分類に一対一対応するわけではなく、組み合わせて使われる (差分プライバシーはどこにでも登場する) ①エンドユーザーからの データ収集

Slide 16

Slide 16 text

16 © LayerX Inc. ● LINEスタンプ選択時のサジェスト機能のアップデートにおいて、ユーザーのプライバシーを保護しつつ利便 性を向上させるため、「差分プライバシー」「連合学習」が導入された。 ● 同様の技術はGAFAMの各種サービスでも活用されており、iPhoneでのログ収集などが有名 国内他社における差分プライバシー適用事例 LINEスタンプのサジェスト機能における差分プライバシー実用事例 出所:https://linecorp.com/ja/security/article/429 差分プライバシーを用いて処理結果(学習モ デルの更新情報)に対してノイズ付加

Slide 17

Slide 17 text

17 © LayerX Inc. プライバシーテックの登場パターン ● プライバシーテックの登場パターンを大きく三つに大別 designed by Freepik ③双方向のデータ連携 (特に名寄せを行う場合) ②収集したデータの外部提供 注: 個別のプライバシー保護の要素技術は、上記の分類に一対一対応するわけではなく、組み合わせて使われる (差分プライバシーはどこにでも登場する) ①エンドユーザーからの データ収集

Slide 18

Slide 18 text

18 © LayerX Inc. データ外部提供における差分プライバシーの活用事例 Linkedinの広告主向けダッシュボードでは、広告の表示 数やクリック数を可視化。ユーザーの閲覧情報などを逆算 する攻撃を防ぐため、差分プライバシーの亜種を導入(出 典) 差分プライバシーの活用事例 米国 国勢調査局 米国の国勢調査において、人口統計や所得や学歴などの 統計情報を公開する際に、差分プライバシーを活用。(出 典) コロナ禍におけるFacebookユーザーの行動情報(1日 の間にユーザーが移動する量と、家にいる人の数の指標) を疫学研究を目的として公開する上で、差分プライバシー を活用。(出典) 機密性の高いユーザーの位置情報を、社内のデータサイエ ンティストがプライバシー保護を担保したまま分析するた めに、差分プライバシーを活用。(出典) ● 米国の国勢調査や、グローバル大手IT企業などが、国民・消費者に対して透明性のある安全なデータ利活用 を進める上で、差分プライバシーを活用している。 参考:差分プライバシーとは - AppleやGoogleも活用する最先端のプライバシー保護技術

Slide 19

Slide 19 text

19 © LayerX Inc. 事例: COVID-19の疫学研究のためのFacebookのデータ公開 ● コロナ禍におけるFacebookユーザーの行動情報(1日の間にユーザーが移動する量と、家にいる人の数 の指標)を疫学研究を目的として公開する上で、差分プライバシーを活用。 出所:https://visualization.covid19mobility.org/ https://about.fb.com/news/2020/04/data-for-good/

Slide 20

Slide 20 text

20 © LayerX Inc. 事例: LinkedIn 広告主向けの分析ダッシュボード ● Linkedinの広告主向けダッシュボードでは、広告の表示数やクリック数を可視化。 ● ユーザーの閲覧情報などを逆算する攻撃を防ぐため、差分プライバシーの亜種を導入。 出所:https://arxiv.org/pdf/1809.07754.pdf

Slide 21

Slide 21 text

21 © LayerX Inc. 当社事例: あいおいニッセイ同和損害保険さま ● 保険加入者様の自動車走行データを用いたデータ分析サービスを、Anonifyを用いて、プライバシー保護 をした形で実現。 ● 急ブレーキ等の危険挙動を、場所や、性別や年齢情報等の様々な切り口で分析が可能。 ● 自治体様に提供することで、交通安全対策に用いるなど。 ○ 結果的に交通事故が削減されれば、保険金の支払いも減り本業にもシナジーがある ○ (単なる「データ販売」に限らないデータ外部提供の事例) 出所:2022年6月30日付け、LayerXプレスリリース

Slide 22

Slide 22 text

22 © LayerX Inc. 安全性と有用性のトレードオフ ● 安全性も有用性も完璧という「銀の弾丸」は存在しない ● LayerXでは、組織間のデータ提供のユースケースに絞った最適解を研究し続けている プ ラ イ バ シ | 保 護 水 準 高 低 有用性 高 低 銀の弾丸

Slide 23

Slide 23 text

23 © LayerX Inc. ● 技術的に安全であることは、それ単体で直ちに必ずしもエンドユーザーの安心に繋がるわけではないもの の、実質的なリスクを対処し、説明可能にすることは、それ以外の解決策の土台になる。 さいごに: プライバシーテックを起点にした信用の連鎖 2つ目のドミノ ● 規制当局・プライバシー保護の有識者の方 3つ目のドミノ ● メディア・政府などの権威 4つ目のドミノ ● 一般のデジタルリテラシーのある方 5つ目のドミノ ● さらに広い一般の方・社会全体 最初のドミノ ● 厳密なプライバシー保護とその説明力

Slide 24

Slide 24 text

24 © LayerX Inc.