LayerXに少しでもご興味をお持ちくださっている方々、PrivacyTech事業部が何をやっているのかが気になる方へ向けて、説明の資料をご用意しました。
メンバーと話してみたい方は、ぜひカジュアル面談をご活用ください。
【カジュアル面談一覧】 事業部長 中村 龍矢 事業副部長 畑島 崇宏 エンジニア 恩田 壮恭 代表取締役 CTO 松本 勇気
--------------------- 詳細: PrivacyTech採用情報
1© LayerX Inc.2022/9/13 LayerX PrivacyTech事業説明会(事業部長 中村 龍矢)LayerX Inc.
View Slide
2© LayerX Inc.中村 龍矢 (執行役員 兼 PrivacyTech事業部長)スピーカー紹介● 株式会社Gunosyにてデータ分析及び、AI/機械学習アルゴリズムの実装に従事● LayerXの創業より参画、研究開発をリード● セキュリティ・プライバシーの学術論文を国内外の学会にて発表● 2020年度IPA未踏スーパークリエータに認定● 東京工業大学との共同研究が2020年度インターネットアーキテクチャ研究賞(最優秀賞)● Ethereumの脆弱性を複数発見し、仕様策定に貢献し、Ethereum Foundationのグラントを日本拠点のチームで初めて獲得Twitter: @nrryuya_jp
3© LayerX Inc.本日のトピック● 「データ利活用とプライバシー」について、手触り感を持っていただく○ 特に、普段からデータに関わる方にぜひ知っていただきたい!● 私のパートでは、前提となる事業や技術の概要をお話しします● (本日のイベント全体を通して、プライバシー保護技術の専門的な話は割愛します)
4© LayerX Inc.PrivacyTech事業の概要とLayerXが取り組む理由
5© LayerX Inc.● 「企業の経済活動のデジタル化」を支援し、3つの事業を展開● PrivacyTech事業では、プライバシー保護技術「Anonify」のソリューションを提供LayerXの事業紹介自社プロダクト(SaaS)を提供 プライバシー保護/秘匿化技術三井物産様とAM合弁会社出資・出向SaaS事業 Fintech事業 PrivacyTech事業
6© LayerX Inc.LayerXのミッション● 「すべての経済活動をデジタル化」するため、「企業や組織を横断したDX」に創業時より着目● プライバシーやセキュリティの観点から生まれる「信用のコスト」を減らしたい● 当初、ブロックチェーンなどに着目していた(詳細は割愛)○ しかしながら、ブロックチェーンで企業横断のインフラなどを実現するのは少し早かった、、、
7© LayerX Inc.社外(お取引先様・行政など)グループ会社PrivacyTech事業のフォーカス● 企業間連携などではなく、まずは個別の企業の保有するパーソナルデータの外部提供から実現していく自社利活用の促進パーソナルデータ「眠れるデータの解放」
8© LayerX Inc.「Anonify(アノニファイ)」とは● 世界中で進む先端的なプライバシー分野の学術研究を土台に、実務的なデータ利活用に応用できるようLayerXが独自に開発したプライバシー保護のアルゴリズム群
9© LayerX Inc.PrivacyTech事業の取り組み実績● 次世代金融における秘匿化技術の活用可能性に関する共同研究● 秘匿性を担保した複数企業間の取引記録インフラの事業検討・技術検証協業事例(一部)メディア掲載(抜粋)● 住民意見収集システムとして採用(秘匿化技術国内初の実用化事例)● インターネット投票の実現に向け、公職選挙法の規制緩和の提案● 「Anonify」を活用した自動車走行データの分析サービスの提供を開始● プライバシー保護とデータ利活用のさらなる高度化に向けた共創を開始● テキストデータのプライバシー保護技術適用の共同研究JCB様つくば市様リクルート様あいおいニッセイ同和損保様
10© LayerX Inc.プライバシー保護データマイニングの紹介(時間の関係で少しだけ!)
11© LayerX Inc.● LayerXにおけるプライバシー保護データマイニング技術のユースケースは、データ外部提供先でのプライバシーリスクを守るもの● 攻撃者は、データ提供先の内部や、ハッキングや情報流出等での外部の人データ外部提供における問題設定生データ(保護対象)匿名化処理データオーナー データ利用者加工後データ攻撃者?
12© LayerX Inc.平均年収:800万円平均年収:799.9万円Aさん在籍時の合計年収= 平均800万円 * 51人Aさん退職後の合計年収= 平均799.9万円 * 50人Aさんの年収= 800 * 51 - 799.9 * 50= 805万円Aさん在籍時(51名)Aさん退職後(50名)・・・・・・・・・・・・・・・・・・・・・・・・・・たった1000円分の平均年収の変化から、Aさんの給与がわかってしまうプライバシー保護の難しさ● 統計情報だけを提供しても、差分から特定個人のデータが炙りだされてしまう● 1970年代(もしくはもっと前)から続く、長い研究の歴史● 実際にはもっともっと色々なリスクがある!
13© LayerX Inc.差分プライバシーとは● 機密なデータに基づく統計データに、プライバシーを保護するノイズを注入する● 誤差が発生するが、統計的な分析では活用できる年齢 性別 住所 年収32 男性 東京都中央区 650万円24 女性 神奈川県横浜市 600万円56 男性 東京都中央区 1000万円44 女性 千葉県松戸市 950万円ノイズ付与後の平均年収: 810万円平均年収: 800万円(真の値)公開しない元のデータの復元困難元のパーソナルデータ差分プライバシーのアルゴリズム+10万円のノイズを付与
14© LayerX Inc.差分プライバシーの数学的な定義● ただランダムにノイズを加えるわけではなく、数学的な証明に基づいている● プライバシーの担保を「しっかり説明できる」ことが重要視されているのがポイント(後述)出典: https://www.cis.upenn.edu/~aaroth/Papers/privacybook.pdf差分プライバシーによるノイズ付与統計量差分プライバシーによるノイズ付与統計量AさんありAさんなしAさんがいるか区別ができない意味:特定の個人が含まれていてもいなくても、「同じような」統計量となることを保証差分プライバシーの数学的な定義
15© LayerX Inc.実社会における差分プライバシーの活用事例参考:差分プライバシーとは - AppleやGoogleも活用する最先端のプライバシー保護技術Linkedinの広告主向けダッシュボードでは、広告の表示数やクリック数を可視化。ユーザーの閲覧情報などを逆算する攻撃を防ぐため、差分プライバシーの亜種を導入(出典)差分プライバシーの活用事例人口統計や、大卒者の収入と雇用に関する統計情報を公開する際に、差分プライバシーを活用。(出典)コロナ禍におけるFacebookユーザーの行動情報(1日の間にユーザーが移動する量と、家にいる人の数の指標)を疫学研究を目的として公開する上で、差分プライバシーを活用。(出典)機密性の高いユーザーの位置情報を、社内のデータサイエンティストがプライバシー保護を担保したまま分析するために、差分プライバシーを活用。(出典)● 米国政府や、グローバル大手IT企業などにも利用されている。● 社内における機密データの分析や、データを外部公開する等のケースにおいて、プライバシー保護をアカウンタビリティをもって保証する目的で利用されている。Meta(旧Facebook)LinkedInUber米国政府Apple, Google, Microsoft
16© LayerX Inc.事例: COVID-19の疫学研究のためのFacebookユーザーの行動情報● コロナ禍におけるFacebookユーザーの行動情報(1日の間にユーザーが移動する量と、家にいる人の数の指標)を疫学研究を目的として公開する上で、差分プライバシーを活用出所:https://visualization.covid19mobility.org/https://about.fb.com/news/2020/04/data-for-good/
17© LayerX Inc.合成データとは● 元のパーソナルデータの統計的な特徴を学習した機械学習モデルから架空のパーソナルデータを生成● 差分プライバシーと組み合わせることが可能
18© LayerX Inc.出所:https://www.jmir.org/2021/10/e30697/PDF, https://www.mdclone.com/adams-platform● MDCloneは、2016年創業のイスラエルの会社で、累計$104Mを調達● 合成データにより、医療データの外部との共有を、自由に、迅速に行えるプラットフォームを提供○ IRB(治験審査委員会)のプロセスを待たずにデータを活用できる事例: MDClone合成データの活用事例: ワシントン大学との全米COVIDコホート共同研究● COVID-19では、複数の施設から得られるビッグデータを用いた包括的な分析を行う上で、個々の施設に存在する臨床データの共有が課題となっている。● そこで、ワシントン大学では臨床データのプライバシー・機密性の保持との両立をはかるべく、MDClone社の協力のもと、合成データとして導出した。● 合成データから得られた結果をオリジナルデータから得られた結果と比較して検証した結果、○ 各ユースケースにおいて、合成データの分析結果は、データの分布が類似。○ 予測モデルも同等の性能を示すなど、オリジナルデータの分析結果をうまく模倣できている。
19© LayerX Inc.パーソナルデータ流通の意義と社会的な課題
20© LayerX Inc.● 世の中にあるデータのうち、データ流通のポテンシャルはまだ数%くらいしか発揮されていない(?)● 医療、行政、金融など様々な社会問題の解決に繋がるデータソース別の利用シーン(一例)顧客属性データ決済・取引データ移動履歴データスマホ位置情報電子カルテ購買データTV視聴データ電力利用データ政策立案・改善商圏分析・立地検討マーケティング施策立案・改善製品開発広告などのパーソナライズ事例①:Suica利用データ事例②:電力利用データ● 駅の利用状況データを通じて人の流れをより正確に把握することによる、観光施策や地域活性化向けの活用を狙うもの。● 首都圏を中心に駅ごとの乗降者数のデータなどを集計したレポート「駅カルテ」を作成。● スマートメーターを通じて収集した電力データを利用するもの。● 特定地域での電力使用状況に基づく商圏分析や、各世帯での電力使用状況に基づく高齢者見守り・再配達削減などに活用を図る。出所:JR東日本、電力・ガス基本政策小委員会パーソナルデータ流通の可能性
21© LayerX Inc.就職で不利になったり、勤務先で差別されないか・・・パーソナルデータ利用に伴うプライバシーの懸念● 学歴、病歴● 収入、資産● 行動履歴● etc.本人様々な事業者病歴のせいで生命保険に加入できなくなるかも・・・不安● しかし、パーソナルデータの外部提供に伴い、ユーザー・ステークホルダーの不安につながりうる● 価値のあるリアルなデータほど、伝統的な大きな企業が保有することが多く、何十年とかけて築き上げてきたユーザー・社会との信頼関係は非常に重要なものであるクレカが作れなくなったり、必要な時にお金を借りれられなかったらどうしよう・・・データ取得自分のデータが勝手に売られるのは気持ち悪い!designed by Freepik
22© LayerX Inc.データ外部提供におけるジレンマ● その結果、保守的になり、提供する情報量を絞っているケースがある○ また、データを使う側も自由に使えなかったりする● しかし、データの利用者は、もっと沢山の情報量・もっと柔軟な分析を期待する○ 理想は、まるで自社のデータかのように分析できること現状提供しているもの 利用者が求めるものdesigned by Freepik
23© LayerX Inc.弊社PrivacyTech事業のビジョンこれまでこれから● リスクの判断基準が難しく、匿名加工情報なども使いにくい● データを安全に流通させる仕組みが整っていない● 統計的な(個人を選別しない)用途でデータが安全に流通● 明確な基準でプライバシーを担保し、外部に対する透明性、アカウンタビリティを担保外部データへのアクセスは困難データ保有者 データ利用者エンドユーザー 守り部門/規制当局暗黙的で形式的な同意取得リスク把握が困難で保守的な判断非選別目的で柔軟に活用可能にデータ保有者 データ利用者エンドユーザー 守り部門/規制当局明確なルールでリスクを評価客観的な安全性による安心感designed by Freepik
24© LayerX Inc.あいおいニッセイ同和損害保険さまの事例● 取得したユーザ様の走行データを元に、様々な切り口で分析した統計情報を、プライバシー保護を通じて元データが逆算されることのないようにした上で、ユーザー様が参照できるダッシュボードを構築。出所:2022年6月30日付け、LayerXプレスリリース<LayerXのお客様事例>自動車走行データの分析サービスの提供開始○ あいおいニッセイ同和損保さまがテレマティクス自動車保険で蓄積する自動車走行データなどにLayerXの提供する最先端プライバシー保護技術「Anonify(アノニファイ)」を適用した上で、性別や年齢情報等を用いたデータ分析サービスをご提供。
25© LayerX Inc.あいおいニッセイ同和損害保険さまの事例出所:https://xtech.nikkei.com/atcl/nxt/column/18/00001/06973/● 「Anonify」により、より柔軟な切り口で分析が可能に● 結果的に交通事故が削減されれば、保険金の支払いも減り本業にもシナジーがある○ 単なる「データ販売」に限らないデータ外部提供の事例
26© LayerX Inc.● 技術的に安全であることは、それ単体で直ちに必ずしもエンドユーザーの安心に繋がるわけではないものの、実際的なリスクを対処し、説明可能にすることは、全ての解決策の土台になる● 技術によるプライバシー担保や「トラスト」の形成は、これからの社会における長期の重要テーマ信用の連鎖最初のドミノ● 規制当局・プライバシー保護の有識者2つ目のドミノ● メディア・政府などの権威3つ目のドミノ● 一般の方(デジタルリテラシーのある方等)4つ目のドミノ● さらに広い一般の方・社会全体
27© LayerX Inc.技術的な面白さ
28© LayerX Inc.プライバシー保護技術のトレードオフプライバシ|保護水準高低有用性 (*2) 高低何も出せない 生データ同等トレードオフあり既知の様々な攻撃あり単体で非常に高いリスクほぼ解消一定範囲でほぼ解消一部攻撃あり& 未知の攻撃への保証なし● 有用性とプライバシー保護にはトレードオフがあり、「銀の弾丸」は存在しない。● 差分プライバシーはかなり高いプライバシー保護要件であり、「適切な緩和」の研究も行われている銀の弾丸プライバシー保護技術のR&Dの面白さ
29© LayerX Inc.プライバシー保護技術のR&Dの面白さ参考:"Differential privacy in health research: A scoping review" https://academic.oup.com/jamia/article/28/10/2269/6333353● 世界的に研究が盛んで、日々新しい手法が出続けている!● 社会実装がはじまった結果、良いリサーチクエスチョンが出始めた時期○ 実際のデータやユースケースのドメイン知識と組み合わせることで、有用性を改善できる差分プライバシーに関する年別論文出版件数(EBSCOhost)
30© LayerX Inc.データ分析の面白さ出典: https://xtrend.nikkei.com/atcl/contents/casestudy/00012/00994/● 位置・移動データ、決済データ、医療データなど「リアルな」データだからこその統計的な難しさ● データの掛け合わせにより、さらにデータサイエンス・機械学習の可能性は広がる○ 例: 走行データに、歩行者の人流データや、天気のデータを掛け合わせて、急ブレーキ原因を分析
31© LayerX Inc.データ基盤・プロダクト開発の面白さ● プライバシー保護されたデータを簡単に提供できるデータ抽出基盤のプロダクトを開発中● 詳しくは次の須藤 (osuke) さんのパートで!
32© LayerX Inc.ぜひお話ししましょう!● 今日お話ししたのは、あくまで「最初にフォーカスしている事業セグメント」です!● 今後の事業展開について、色々な構想がありますので、ぜひお話しさせてください〜https://meety.net/matches/OOXRSCHNJYrs
33© LayerX Inc.Q&A
34© LayerX Inc.