Slide 1

Slide 1 text

© LY Corporation 連合学習を用いたスタンプの推薦 2024.12.10 連合学習ビジネス活用ワークショップ LINEヤフー研究所 ML Privacyチーム リーダー 長谷川 聡

Slide 2

Slide 2 text

© LY Corporation Satoshi HASEGAWA 専門 : プライバシー保護技術 (Privacy Enhancing Technologies) 1 2014 -2021 NTT Secure Platform Laboratories Researcher 2021- LINE / LINEヤフー ML Privacy Team Senior Research Engineer 2024- LINEヤフー(LINEヤフー研究所) AI S&P Office ML Privacy Team Manager Selected Works LINE/LINEヤフー - 連合学習における差分プライバシ導入 NTT - 匿名化に関する研究開発

Slide 3

Slide 3 text

© LY Corporation サービス コミュニケーションアプリ「LINE」や総合インターネットサービス「Yahoo! JAPAN」を始めとした、さまざまなサービスを展開 2 友だちや家族と、1対1やグループでのトーク、音声通話・ビデオ通話を、国内・ 海外・通信キャリアを問わず、いつでも、どこでも無料で楽しめます。さまざまな人 や情報、サービス、企業・ブランドと、シームレスに繋がることが可能です。 ポータルサイト「Yahoo! JAPAN」をはじめ、検索、ニュース、天気、ショッピング、 オークションなど、これまでさまざまなサービスをスマートフォン・パソコンなどの デバイス向けに提供しています。 コミュニケーションアプリ LINE 総合インターネットサービス Yahoo! JAPAN

Slide 4

Slide 4 text

© LY Corporation ユーザー数※1 業績※2 サービス提供国・地域※3 従業員数※4 グループ会社数※5 ※1:Yahoo! JAPAN月間ログインユーザーID数、LINE月間アクティブユーザー数(MAU)、PayPay登録ユーザー数、ZOZOTOWN事業 年間購入者数(Yahoo!ショッピング含まず)の合算(全て2024年3月末時点) ※2:2024年3月期 数字で見るLINEヤフー グループ延べ利用者数 3.2億超 Yahoo! JAPAN 5,560万 月間ログインユーザーID数 LINE 1.96億 月間アクティブユーザー数 売上収益 1兆 8,146億円 調整後EBITDA 4,149億円 連結 約 28,000人 単独 11,000人以上 115社 ※3:2023年8月時点 ※4:2024年3月時点 ※5:グループ会社数 2024年3月時点 約 230ヶ国・地域 3

Slide 5

Slide 5 text

© LY Corporation 目次 • スタンプ推薦とは? • スタンプ推薦における連合学習の位置付け • よりプライバシに配慮した連合学習の実装と導入効果 4

Slide 6

Slide 6 text

© LY Corporation スタンプ推薦とは? ユーザの入力に応じたスタンプの候補を出力する機能 5 https://store.line.me/stickers-premium/landing/ja • 意味的なタグをもとに推薦 • スタンプには意味を表す「タグ」が付与され ている. • 入力文字から段階的に推薦 • 各ラベルに関連付けられた定義済みのキー ワードを使用し, テキスト入力中に段階的に 推薦する.

Slide 7

Slide 7 text

© LY Corporation スタンプの意味的なタグ 6 https://creator.line.me

Slide 8

Slide 8 text

© LY Corporation 「LINEスタンプ プレミアム」サービス 7 https://store.line.me/stickers-premium/landing/ja • 1500万以上のスタンプが 使い放題 ➔ スタンプ推薦が重要

Slide 9

Slide 9 text

© LY Corporation 目次 • スタンプ推薦とは? • スタンプ推薦における連合学習の位置付け • よりプライバシに配慮した連合学習の実装と導入効果 8

Slide 10

Slide 10 text

© LY Corporation オンデバイス ML推論 サーバサイド ML 連合学習 機械学習(ML)ベースでとりうる手法が3つ 9 スタンプ推薦の実現方法

Slide 11

Slide 11 text

(1) サーバサイドML 中央サーバがデータを収集し, MLの処理を実施 Output Output Output Output Output Output Output Output Training Inference ML 10

Slide 12

Slide 12 text

(2) オンデバイスML推論 クライアントデバイスは, サーバからMLモデルを受信し, 推論処理を実施 ML Training Global Model Global Model Global Model Global Model Global Model Global Model Global Model Global Model Inference Inference Inference Inference Inference Inference Inference Inference 11

Slide 13

Slide 13 text

Training Training Training Training Training (3) 連合学習 (FL) クライアントによるオンデバイスML学習 + サーバによるモデル集約 ML Training Training Training Local Model Local Model Local Model Model Aggregation 12

Slide 14

Slide 14 text

(3) 連合学習 (FL) サーバは, グローバルモデルを, 各デバイスに送信 ML Global Model Global Model Global Model Global Model Global Model Global Model Global Model Global Model Inference Inference Inference Inference Inference Inference Inference Inference Model Aggregation 13

Slide 15

Slide 15 text

© LY Corporation 各手法の特徴 連合学習は, クライアントとサーバが協調動作する分散型の機械学習 → 機微データをプライバシ保護したまま機械学習するケースに有効 14 (1) サーバサイドML (2) オンデバイスML推論 (3) 連合学習 大量のデータ 大量の計算資源 大量データを用いた レコメンド など 推論時の 通信が不要 素早いレスポンスが必要な User Interface系の処理 など クライアントのRawデータを サーバーに送る必要がない プライバシー保護・ パーソナライゼーション など

Slide 16

Slide 16 text

© LY Corporation スタンプ推薦におけるML活用 LINEスタンプ推薦において, どのMLアプローチを用いるか? 15 (1) サーバサイドML (2) オンデバイスML推論 (3) 連合学習 大量のデータ 大量の計算資源 大量データを用いた レコメンド など 推論時の 通信が不要 素早いレスポンスが必要な User Interface系の処理 など クライアントのRawデータを サーバーに送る必要がない プライバシー保護・ パーソナライゼーション など 採用 / 不採用 採用 / 不採用 採用 / 不採用

Slide 17

Slide 17 text

© LY Corporation ハイブリッドアプローチを採用 スタンプ推薦処理を2段階に分け, プライバシ観点で取り扱いに注意が必要なデータを用いる処理に, 連合学習を適用 16 (1) サーバサイドML (2) オンデバイスML推論 (3) 連合学習 大量のデータ 大量の計算資源 大量データを用いた レコメンド など 推論時の 通信が不要 素早いレスポンスが必要な User Interface系の処理 など クライアントのRawデータを サーバーに送る必要がない プライバシー保護・ パーソナライゼーション など 推薦候補の生成 (1st Stage) 推薦候補のランキング (2nd Stage) 採用 / 不採用 採用 / 不採用 採用 / 不採用

Slide 18

Slide 18 text

© LY Corporation Stageごとの処理の比較 1st stage vs. 2nd stage 17 推薦候補の生成 (1st stage) 推薦候補のランキング (2nd stage) スタンプの個数 1,500,000 → 100 100 学習データ スタンプの入手履歴 (購入や無料ダウンロード等) トークルーム等での スタンプ閲覧・送信履歴 推論処理 サーバ クライアント端末 学習処理 サーバ 主にクライアント端末

Slide 19

Slide 19 text

© LY Corporation 目次 • スタンプ推薦とは? • スタンプ推薦における連合学習の位置付け • よりプライバシに配慮した連合学習の実装と導入効果 18

Slide 20

Slide 20 text

Training Training Training Training Training 連合学習にローカル差分プライバシを適用して活用 ローカルモデルにノイズを加算 ➔ モデルから学習データの推定を, より困難にする ML Training Training Training Model Aggregation 19 Local Model Local Model Local Model

Slide 21

Slide 21 text

(ローカル)差分プライバシとは? Noisy Outputs 区別困難 ≃ ϵ で表される程度に プライバシ保護された 値を提供 20 • データ収集・解析の結果に対してプライバシの水準を統計的に表現した尺度 • 統計的に「どれだけ他人と見分けがつかないか」をプライバシパラメータ ε で表現 • (ノイズの加算により)いかなる知識との突合にも頑健なプライバシを提供 ノイズ 付加 ノイズ 付加 適切なノイズ設計が必要

Slide 22

Slide 22 text

Common Platform for FL Service specific システムアーキテクチャ サービス依存部分と共通プラットフォームに分離 21

Slide 23

Slide 23 text

Common Platform for FL Service specific システムアーキテクチャ さらに、サーバー側とクライアント側で分離(4象限に分類) Common Platform for FL (Client-side) Service specific (Server-side) Common Platform for FL (Server-side) Service specific (Client-side) 22

Slide 24

Slide 24 text

処理ステップ(1/3) ユーザの購入履歴などをもとに選択される候補となるスタンプ群をダウンロード 機械学習の推薦・学習処理は共通プラットフォーム側で処理 Platform (Client-side) Inference Training App.(Server-side) Platform (Server-side) App.(Client-side) Candidate Generation Prediction Request Local Evt. Dispatcher user input user 23

Slide 25

Slide 25 text

処理ステップ(2/3):推論 サーバーから学習モデルをダウンロードし、推薦処理を実行 Platform (Client-side) Training App.(Server-side) Platform (Server-side) App.(Client-side) Candidate Generation Prediction Request Local Evt. Dispatcher user input user ML Model Repository Prediction ML Model 24

Slide 26

Slide 26 text

Platform (Client-side) 処理ステップ(3/3):学習 ログ蓄積後のアイドル中に学習処理を実行して、学習結果を得る 差分プライバシのノイズを付与して、ユーザID等を削除してサーバに送信・集約 App.(Server-side) Platform (Server-side) App.(Client-side) Candidate Generation Prediction Request Local Evt. Dispatcher user input user Model Aggregation ML Model Repository ML Model (updated) Prediction Training log (local) ML Model Differential Privacy 25

Slide 27

Slide 27 text

A/B Test Result 5.6% uplift Personalized sticker suggestions evoke explicit premium sticker package downloads 26

Slide 28

Slide 28 text

© LY Corporation まとめ 27 • LINEスタンプ推薦における連合学習の活用例をご紹介 • プライバシに配慮しつつ, ユーザ体験を向上させるために活用

Slide 29

Slide 29 text

© LY Corporation より深く知るには? 28 https://privacy.lycorp.co.jp/ja/acquisition/privacy_techs.html https://tech-verse.me/ja/sessions/46 https://tech-verse.me/ja/sessions/25