Upgrade to Pro — share decks privately, control downloads, hide ads and more …

機械学習・生成AIが拓く事業価値創出の最前線

 機械学習・生成AIが拓く事業価値創出の最前線

GREE Tech Conference 2025で発表された資料です。
https://techcon.gree.jp/2025/session/TrackA-5

Avatar for gree_tech

gree_tech PRO

October 17, 2025
Tweet

More Decks by gree_tech

Other Decks in Technology

Transcript

  1. ベースライン構築 LightGBMを用いた基本モデルの作成 特徴量追加とハイパラ調整 特徴量の追加や新規設計と、ハイパーパラメータの最適化 ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM / アンサンブルの検討

    LightGBMとLSTMの両軸で最適モデルの検討 最終チューニング 過学習を防ぐチューニング、相関の高い特徴量の排除 モデル改善プロセス 1 2 3 4 5 13 ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化
  2. ベースライン構築 LightGBMを用いた基本モデルの作成 特徴量追加とハイパラ調整 特徴量の追加や新規設計と、ハイパーパラメータの最適化 ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM / アンサンブルの検討

    LightGBMとLSTMの両軸で最適モデルの検討 最終チューニング モデル改善プロセス 1 2 3 4 5 15 過学習を防ぐチューニング、相関の高い特徴量の排除 F2 : 59% ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化
  3. ベースライン構築 LightGBMを用いた基本モデルの作成 特徴量追加とハイパラ調整 ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化 ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM / アンサンブルの検討

    LightGBMとLSTMの両軸で最適モデルの検討 最終チューニング モデル改善プロセス 1 2 3 4 5 16 過学習を防ぐチューニング、相関の高い特徴量の排除 F2 : 71.5% 目標ライン達成! 特徴量の追加や新規設計と、ハイパーパラメータの最適化
  4. ベースライン構築 LightGBMを用いた基本モデルの作成 特徴量追加とハイパラ調整 ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM / アンサンブルの検討 LightGBMとLSTMの両軸で最適モデルの検討

    最終チューニング モデル改善プロセス 1 2 3 4 5 17 過学習を防ぐチューニング、相関の高い特徴量の排除 F2 : 75.7% 目標ライン達成! ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化 特徴量の追加や新規設計と、ハイパーパラメータの最適化
  5. ML基盤構築例(ユーザー離脱予測システムのケース) Product Account 生データ データ変換 特徴量 前処理 最適化 学習 評価

    最終学習 推論 モデル保存 データ取得 結果出力 推論結果 監視 定期実行 学習済みモデル 設定ファイル ロギング ML System Account 20
  6. ML基盤構築例(ユーザー離脱予測システムのケース) Product Account 生データ データ変換 特徴量 前処理 最適化 学習 評価

    最終学習 推論 モデル保存 データ取得 結果出力 推論結果 監視 定期実行 学習済みモデル 設定ファイル ロギング ML System Account 21
  7. ML基盤構築例(ユーザー離脱予測システムのケース) Product Account 生データ データ変換 特徴量 前処理 最適化 学習 評価

    最終学習 推論 モデル保存 データ取得 結果出力 推論結果 監視 定期実行 学習済みモデル 設定ファイル ロギング ML System Account 22
  8. ML基盤構築例(ユーザー離脱予測システムのケース) Product Account 生データ データ変換 特徴量 前処理 最適化 学習 評価

    最終学習 推論 モデル保存 データ取得 結果出力 推論結果 監視 定期実行 学習済みモデル 設定ファイル ロギング ML System Account 23
  9. ML基盤構築例(ユーザー離脱予測システムのケース) Product Account 生データ データ変換 特徴量 前処理 最適化 学習 評価

    最終学習 推論 モデル保存 データ取得 結果出力 推論結果 監視 定期実行 学習済みモデル 設定ファイル ロギング ML System Account 24
  10. ML基盤構築例(ユーザー離脱予測システムのケース) Product Account 生データ データ変換 特徴量 前処理 最適化 学習 評価

    最終学習 推論 モデル保存 データ取得 結果出力 推論結果 監視 定期実行 学習済みモデル 設定ファイル ロギング ML System Account 25
  11. アプローチ①:Geminiへの置き換え Gemini 1.5 Proへの期待 ・マルチモーダル理解能力が高い ・BoundingBox(セリフの位置座標)が出力できる 34 そ う な

    の ? "text":"そうなの?", "coords": [ { "x": 100, "y": 200 }, { "x": 300, "y": 200 }, { "x": 300, "y": 250 }, { "x": 100, "y": 250 } ] 出力例: × 位置座標が不正確 × オノマトペ(※)が検出できない (※)擬音語や擬態語 結果 →素のGeminiでは難しい
  12. 各AIの得意分野を活かして組み合わせる 核心技術: 複数AIのハイブリッドアプローチ Finetuned Gemini 36 Pros: Cons: テキストの位置と内容 が正確

    不要な文字を拾う テキスト内容がデタラメ 位置精度は良い オノマトペも拾えている Vision AI 長所を採用! Gemini 綺麗な情報として 整理できる 位置情報が検出できない
  13. 改善結果 ビフォー (Vision AI単体) アフター (複数AIのハイブリッド) 不要な要素が除去され、漫画内の必要なテキストのみが出力 38 誤検出ノイズを多く含む ★

    ★ ★ ★ ★ ★ ★ ★ 出典:『アサルトリリィ Last Bullet しーくれっとがーでん ~Sweet Memoria~』(原作:尾花沢軒栄、漫画:千種みのり)
  14. 追加改善:YOLO(物体検出モデル)による読順制御 39 ① ② ③ ④ ⑤ 物体検出モデル「YOLO」を活用し、マンガの「コマ」を正確に検出 コマの位置関係(右上から左下)に基づき、コマの進行順を決定 各コマの中のテキストの位置関係(右上から左下)に基づき、

    セリフ順を決定 2.コマの進行順決定 3.コマの中の進行順決定 1.YOLOによるコマ検出 出典:『アサルトリリィ Last Bullet しーくれっとがーでん ~Sweet Memoria~』(原作:尾花沢軒栄、漫画:千種みのり)
  15. システム全体像 並列処理 • Vision AIとFinetuned Geminiの 検出処理同時実行 情報統合・整形 • Geminiによる情報整理と出力

    YOLO読順制御 • YOLOによるコマ検出と読順の 並べ替え 最終出力 • 順序付けされたJSON結果を生成 入力画像 • 処理対象の漫画画像を入力 漫画OCRの最終的なパイプラインは以下のステップで高精度な構造化JSONを生成 40
  16. 実現した主な成果 90% 作業工数削減率 当初の課題だった「読み取り精度の低さによる大幅な手修正」から 手直しが約1割で済む レベルへと大幅に改善 成果 今後の展望 : 更なるGeminiの応用で翻訳プロセス全体を高速化する

    1. AI翻訳の精度向上 :意訳や日本語特有の表現(オノマトペの表現など)で課題が残る 2. inpainting処理の改善 :現在はほぼ人手による修正が必要な状態 46
  17. まとめ 事例①: 離脱予測モデル実装 ・教科書的な手法を土台としつつ、ゲーム特性に合わせた特徴量を設計 ・モデル出力の解釈を次の改善につなげる循環的アプローチを確立 ・アナリストの分析力 × 事業部のドメイン知識 × モデル実装力により、高性能モデルを実現

    事例②: OCR実装(Gemini応用) ・生成AIを適用し、ベースライン性能を維持しつつ電子漫画OCR特有の課題に対応 ・プロンプトエンジニアリングと複数モデルのハイブリッド活用により、大幅な制作工数削減を実現 48