Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ルールベースからMLへ みてね写真プリント自動提案の活用事例

ルールベースからMLへ みてね写真プリント自動提案の活用事例

本資料は、2025/10/7に開催された「渋谷 Biz × AI: ビジネスにおける AI 利活用 事例勉強会 第3回」における、MIXI 木内の発表資料です。
https://cyberagent.connpass.com/event/367576/

Avatar for MIXI ENGINEERS

MIXI ENGINEERS PRO

October 14, 2025
Tweet

More Decks by MIXI ENGINEERS

Other Decks in Technology

Transcript

  1. 2 ©MIXI ⾃⼰紹介 名前: kittchy / ⽊内 貴浩 / きのうち

    たかひろ 職種: MLエンジニア 経歴: - 学⽣時代は⾳声認識の研究で修⼠号取得 - 24新卒で株式会社MIXIに新卒⼊社 担当業務: - メディア解析基盤構築‧整備 - MLモデル⾼速化‧精度向上 - AI/ML技術を⽤いた新機能開発
  2. 3 ©MIXI 本⽇のテーマ‧⽬次 家族アルバム みてね の「写真プリント⾃動提案」ロジックを ルールベースからMLベースに置き換えた話 • 会社‧プロダクト紹介 •

    みてねの写真プリント • 従来の写真プリント⾃動提案 • ML⾃動提案の移⾏検討 • ML⾃動提案の下準備 • ML⾃動提案の本番導⼊ • まとめ 喋らないこと • 詳しい学習⽅法やチューニング⽅法
  3. ©MIXI エモーションと コミュニケーションで 「⼼もつながる」場と機会を 創造し続けます。 MIXI GROUPは、 ただ「つながればいい」という効率的な機能の提供ではなく、 歓喜や興奮、温かな思い、幸せ、居⼼地の良さの共有を通じて、 その先に、もっと深くて濃く豊かな、⼼のつながりを⽣み出すような、

    サービスの開発‧提供を⽬指しています。 現在、スポーツ‧ライフスタイル‧デジタルエンターテインメント の3つの領域で事業を展開しており、 それぞれの主な事業内容は右の通りです。 また、近年の投資活動の拡⼤と重要性を勘案し、 FY2023からはスタートアップやファンド出資等の投資活動を事業化しました。 スポーツ事業 プロスポーツチーム運営および 公営競技ビジネスの推進 ライフスタイル事業 インターネットを活用し、 人々の生活に密着したサービスの提供 デジタルエンターテインメント事業 スマホゲームを中心としたゲームの提供 MIXI GROUPの事業領域 3つの領域で “「心もつながる」 場と機会” を創造する事業を推進
  4. 19 ©MIXI ルールベース⾃動提案の課題と仮説 パーソナライゼーションの限界 • 全ユーザに同⼀ルールを適⽤ • 趣味嗜好を反映した⾃動提案が不可能 精度改善の限界 •

    ⼈⼿によるデータ分析‧ルール追加‧ 変更により、継続した改善が困難 データの変化に対する対応の限界 • ルールのチューニングが⼿作業 • データの変化に柔軟に対応できない データを⽤いて統計的なモデルをML技術で作れば全てを解決できるのでは?
  5. 21 ©MIXI ⽬的 写真プリント⾃動提案の精度向上 • 購⼊枚数向上 • ユーザ満⾜度向上 提案システムのメンテナンス性 •

    フォトブックから切り離し、写真プリント独⾃の最適化された仕組みを持つ • ⼈⼿に頼らず、機械学習により継続した改善ができる仕組みづくり パーソナライゼーションによる購買意欲向上 • ユーザセグメントごとの潜在的な購⼊傾向を活⽤した⾃動提案
  6. 24 ©MIXI 評価指標の策定 精度改善を図るためにまずは現状把握 評価指標を策定し、ベースラインとして、改善を繰り返す ⾃動提案の精度評価指標 • Precision@11: 11枚提案した中に実際に購⼊された写真の割合 KPI

    • メディア購⼊枚数: 実際に購⼊された写真の枚数 • 購⼊離脱率: ⾃動提案後に購⼊をやめたユーザの割合 • 写真選択時間: ユーザが写真を選ぶのにかかる時間
  7. 25 ©MIXI 学習‧評価セットの設計 BigQuery上で集計し、学習に⽤いるためのデータセットを構築 説明変数 (例) • 画像メタデータ : 解像度、撮影⽇など

    • ユーザ付加情報 : お気に⼊り登録数、コメント数 • 画像解析結果:顔検出結果‧⾃動タグ推定結果など ⽬的変数 • 過去の購⼊履歴から写真が購⼊されたかどうかを⼆値で表現
  8. 28 ©MIXI Python前処理ではなく BigQuery + dbt を採⽤した理由 理由1:⼤規模データの効率的な前処理 • BigQueryで整形しTable化

    → 実験サイクルを⾼速化 • dbtで前処理ロジックをGitHub管理 → メンテナンス性向上 理由2:データ整形結果のキャッシュ活⽤ • 他タスクと共通の中間テーブルを再利⽤‧共通化→ 効率的なデータ整形 理由3: データテストとドリフト検知 • dbt-elementaryなどを活⽤し、データ品質テストやドリフト検知を⾃動化
  9. 31 ©MIXI モデルの選定 LightGBMを採⽤ 選定理由 1. 類似タスクにおける実績 • 類似レコメンド系コンペで⾼成績‧主要⼿法として採⽤ 2.

    ⾼速な推論 • ⾼速で省メモリな推論が可能 3. 学習のしやすさ • パラメータチューニングが容易
  10. 34 ©MIXI ⾃動提案の多様化 2段階によるリランキングを⾏う 1. Phashによる同⼀‧類似画像の除外 2. Maximal Marginal Relevance

    (MMR) の導⼊ a. 類似度(撮影⽇)が近いものは後回しにされるように → Precision@11を保ったまま、多様な写真が提供可能となった
  11. 39 ©MIXI ABテストの実施 実際にユーザに提供してみて購⼊傾向に変化があるのかを検証 主な成果 ユーザ離脱率の減少: わずかな改善を確認 写真購⼊量の増加: 微増ながらポジティブな結果 処理性能の向上:

    ⼤幅な処理時間短縮を実現 メンテナンス性向上 : フォトブックとの依存を切る & 新しい特徴量の追加が容易に 課題 • 改善幅が限定的: 期待値に対してやや控えめな結果 • 継続的な改善の必要性: モデル精度向上のための重要な特徴量追加などの改善が必要
  12. 40 ©MIXI ルールベース⾃動提案の課題 (再掲) パーソナライゼーションの限界 • 全ユーザに同⼀ルールを適⽤ • 趣味嗜好を反映した⾃動提案が不可能 精度改善の限界

    • 影響が⼤きくルールの追加‧変更が ⼈⼿になるため、継続した改善が困難 データの変化に対する対応の限界 • ルールのチューニングが⼿作業 • データの変化に柔軟に対応できない Recall@K の指標では有意な差が出た A/BテストではKPI微改善 dbt & LightGBMの学習により、 特徴量を増やすなどの改善をしやすく ユーザごとに異なる提案結果を出せていた
  13. 42 ©MIXI 成果 技術的成果 • LightGBMベースのML⾃動提案システム構築 • 独⽴したデータパイプラインの確⽴ • 処理性能の⼤幅改善(従来⽐で⾼速化)

    • ⾃動提案の精度改善 ビジネス効果 • ユーザ体験の改善: 写真選択時の離脱率減少 • 購⼊量の微増: 継続的な成⻑トレンド • システムの拡張性向上: 将来的な機能追加への基盤整備
  14. 43 ©MIXI 今後の課題 モデル改良 • 特徴量エンジニアリングの強化 • より⾼度なパーソナライゼーション精度向上 • 新しいML⼿法の検討‧導⼊

    • 現在もモデルの改良を続けています MLOps体制の構築 • 継続的なモデル監視‧更新システム • ⾃動化された再学習パイプライン • A/Bテストの標準化と効率化