機械学習・生成AIが拓く事業価値創出の最前線

機械学習・生成AIが拓く事業価値創出の最前線株式会社グリーマネージャー松富めぐみエンジニア石原達馬

松富めぐみ 2019年グリー株式会社（現グリーホールディングス）に中途入社。入社後は社内向けデータ基盤のプロダクトマネジメントやAIシステム開発プロジェクトの推進役を担う現在はPdMとエンジニアから構成されるグループにてシニアマネージャーに従事。料理とサウナが好き。 2

石原達馬 2018年グリー株式会社（現グリーホールディングス）に中途入社。社内データ基盤の開発運用と機械学習分野のPoCとサービス開発運用に携わるプロフィール写真を要求されたので右の画像を提出したところ何も言われずに通ったのでモデレーターに敬意を払いこれで押し切ろうと思う 3

アジェンダ • 私たちの組織について • 事例紹介1. 離脱ユーザー予測 • ML基盤の構築例（事例1のケース） • 事例紹介2.
電子漫画制作におけるAI活用 • まとめ

私たちの組織について自社のデータ基盤において設計→構築→運用まで一気通貫で対応。オンプレ→AWSへの移管やGCPベースの基盤構築実績あり。世の中のAIをベースに独自のノウハウを加え、自社課題に合わせたソリューションを開発。導入後もAIモデルの継続的な性能向上をサポート。 Vertex AIを活用した前処理、学習・推論、デプロイ、性能評価、監視を含む MLパイプラインにより効率的なAIモデルの運用を実現。データ基盤 AI実装
ML基盤自社やグループ内外の会社向けにAI・データ活用の支援やサービス提供を行いビジネス価値の創出に貢献。 5

事例紹介1. 離脱ユーザー予測

目的：ユーザーの離脱防止による売上損失の低減離脱ユーザー予測背景： • 離脱率自体は高くはないが、課金ユーザーの離脱・退会による売上影響は軽視できない • 潜在的な離脱リスクがあるユーザーを検知し、早期対策を打つことで離脱を防ぐ仕組みを作る概要：ブラウザゲームにおける、潜在的離脱ユーザーを予測するモデルの開発
7

モデル実装施策実行モデル評価システム化循環プロセスにより施行性能目標到
達 8 ★今ココ要件定義開発プロセス PoC 本番化

要件定義について主に決めたことゴール設定・予測する対象である「離脱」の定義をどうするか？データ要件・離脱に影響しそうな変数は何か？モデル要件・初手としてどの機械学習モデルを用いるか？・精度の評価指標を何に置くか？目標ラインをどうするか？ 9

プロダクト視点での要件出し

プロダクト視点での要件出し機械学習の要件に変換データサイエンス視点での定義化 ×

モデルのアプローチ評価指標の設定 Recall／F2スコアを重視。離脱ユーザーを取りこぼさないモデル設計を目指す特徴量エンジニアリングプレイ/ソーシャル行動、課金履歴、属性、時系列変化を捉える特徴量を設計モデル選定と検証 LightGBMと、行動の時系列パターンを直接学習するLSTMの両面から検証を実施
運用設計 Vertex AI Pipelinesで再現性あるMLパイプラインを構築。定期実行の仕組みを実装離脱定義は「翌月・翌々月の離脱」として設計 12

ベースライン構築 LightGBMを用いた基本モデルの作成特徴量追加とハイパラ調整特徴量の追加や新規設計と、ハイパーパラメータの最適化ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM / アンサンブルの検討
LightGBMとLSTMの両軸で最適モデルの検討最終チューニング過学習を防ぐチューニング、相関の高い特徴量の排除モデル改善プロセス 1 2 3 4 5 13 ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化

ベースライン構築 LightGBMを用いた基本モデルの作成特徴量追加とハイパラ調整特徴量の追加や新規設計と、ハイパーパラメータの最適化ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM /
アンサンブルの検討 LightGBMとLSTMの両軸で最適モデルの検討最終チューニング過学習を防ぐチューニング、相関の高い特徴量の排除モデル改善プロセス 1 2 3 4 5 14 F2 : 36%

ベースライン構築 LightGBMを用いた基本モデルの作成特徴量追加とハイパラ調整特徴量の追加や新規設計と、ハイパーパラメータの最適化ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM / アンサンブルの検討
LightGBMとLSTMの両軸で最適モデルの検討最終チューニングモデル改善プロセス 1 2 3 4 5 15 過学習を防ぐチューニング、相関の高い特徴量の排除 F2 : 59% ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化

ベースライン構築 LightGBMを用いた基本モデルの作成特徴量追加とハイパラ調整ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM / アンサンブルの検討
LightGBMとLSTMの両軸で最適モデルの検討最終チューニングモデル改善プロセス 1 2 3 4 5 16 過学習を防ぐチューニング、相関の高い特徴量の排除 F2 : 71.5% 目標ライン達成！特徴量の追加や新規設計と、ハイパーパラメータの最適化

ベースライン構築 LightGBMを用いた基本モデルの作成特徴量追加とハイパラ調整ユーザークラスタリングによるモデル分割とチューニング、新規特徴量の精査 LSTM vs LightGBM / アンサンブルの検討 LightGBMとLSTMの両軸で最適モデルの検討
最終チューニングモデル改善プロセス 1 2 3 4 5 17 過学習を防ぐチューニング、相関の高い特徴量の排除 F2 : 75.7% 目標ライン達成！ハイリスク群/ロイヤル群のクラスタ分割とモデル最適化特徴量の追加や新規設計と、ハイパーパラメータの最適化

達成した成果・高精度の離脱予測モデル構築次フェーズの計画 • 予測結果に基づく施策の設計と実行 • 施策効果検証の仕組み構築 • モデルの他プロダクト横展開最終的な狙い：離脱防止による売上損失の抑制
成果と今後の展開 Recall 86%／F2 76%を達成 18

ML基盤の構築事例

ML基盤構築例（ユーザー離脱予測システムのケース） Product Account 生データデータ変換特徴量前処理最適化学習評価
最終学習推論モデル保存データ取得結果出力推論結果監視定期実行学習済みモデル設定ファイルロギング ML System Account 20

事例紹介2. 電子漫画制作におけるAI活用

目的：クラウドツールを用いた漫画ローカライズにおける制作工数削減開発したAIエンジン機能： • 漫画データのOCR処理（吹き出し／セリフの読み取り） • 多言語翻訳機能 • Inpainting（文字削除・背景修復）処理電子漫画制作におけるAI活用概要：電子漫画翻訳クラウドツールにおける、AI機能開発（グループ会社支援）
27

目的：クラウドツールを用いた漫画ローカライズにおける制作工数削減開発したAIエンジン機能： • 漫画データのOCR処理（吹き出し／セリフの読み取り） • 多言語翻訳機能 • Inpainting（文字削除・背景修復）処理電子漫画制作におけるAI活用概要：電子漫画翻訳クラウドツールにおける、AI機能開発（グループ会社支援）
28 　こちらに絞ってご紹介

初期段階でのOCR 29 出典：『アサルトリリィ Last Bullet しーくれっとがーでん～Sweet Memoria～』（原作：尾花沢軒栄、漫画：千種みのり） GoogleCloud VisionAIを採用

初期段階でのOCR 30 文字として誤検出出典：『アサルトリリィ Last Bullet しーくれっとがーでん～Sweet Memoria～』（原作：尾花沢軒栄、漫画：千種みのり） GoogleCloud
VisionAIを採用

初期段階でのOCR 31 ルビを拾う出典：『アサルトリリィ Last Bullet しーくれっとがーでん～Sweet Memoria～』（原作：尾花沢軒栄、漫画：千種みのり） GoogleCloud
VisionAIを採用

初期段階でのOCR 32 読順がでたらめ出典：『アサルトリリィ Last Bullet しーくれっとがーでん～Sweet Memoria～』（原作：尾花沢軒栄、漫画：千種みのり） GoogleCloud
VisionAIを採用

漫画のOCRの難しさ 33 漫画固有の課題への対処が必要！！

アプローチ①：Geminiへの置き換え Gemini 1.5 Proへの期待・マルチモーダル理解能力が高い・BoundingBox（セリフの位置座標）が出力できる 34 そうな
の ? "text":"そうなの?", "coords": [ { "x": 100, "y": 200 }, { "x": 300, "y": 200 }, { "x": 300, "y": 250 }, { "x": 100, "y": 250 } ] 出力例： × 位置座標が不正確 × オノマトペ(※)が検出できない (※)擬音語や擬態語結果　→素のGeminiでは難しい

アプローチ②：Geminiのファインチューニング BoundingBoxの精度向上を目的とし、位置情報付きの学習データ400ページ分を用いて実施 Pros：位置情報の精度は大幅に向上し、オノマトペもある程度認識 Cons：テキスト認識精度が大幅に劣化し、内容が崩壊するという問題が発生位置情報とテキスト精度のトレードオフが課題 35

各AIの得意分野を活かして組み合わせる核心技術: 複数AIのハイブリッドアプローチ Finetuned Gemini 36 Pros： Cons：テキストの位置と内容が正確
不要な文字を拾うテキスト内容がデタラメ位置精度は良いオノマトペも拾えている Vision AI 長所を採用！ Gemini 綺麗な情報として整理できる位置情報が検出できない

ハイブリット処理の流れプロンプトの指示: FinetunedGeminiによる出力 VisionAIによる出力 Geminiにて認識最終出力 37 ・VisionAIのみにある出力は無視・FinetunedGeminiのみにある出力は優先
・テキストの内容やBoundingBoxはVision AIを優先・ルビやページ番号は削除

改善結果ビフォー (Vision AI単体) アフター (複数AIのハイブリッド) 不要な要素が除去され、漫画内の必要なテキストのみが出力 38 誤検出ノイズを多く含む ★
★ ★ ★ ★ ★ ★ ★ 出典：『アサルトリリィ Last Bullet しーくれっとがーでん～Sweet Memoria～』（原作：尾花沢軒栄、漫画：千種みのり）

追加改善：YOLO(物体検出モデル)による読順制御 39 ① ② ③ ④ ⑤ 物体検出モデル「YOLO」を活用し、マンガの「コマ」を正確に検出コマの位置関係（右上から左下）に基づき、コマの進行順を決定各コマの中のテキストの位置関係（右上から左下）に基づき、
セリフ順を決定 2.コマの進行順決定 3.コマの中の進行順決定 1.YOLOによるコマ検出出典：『アサルトリリィ Last Bullet しーくれっとがーでん～Sweet Memoria～』（原作：尾花沢軒栄、漫画：千種みのり）

システム全体像並列処理 • Vision AIとFinetuned Geminiの検出処理同時実行情報統合・整形 • Geminiによる情報整理と出力
YOLO読順制御 • YOLOによるコマ検出と読順の並べ替え最終出力 • 順序付けされたJSON結果を生成入力画像 • 処理対象の漫画画像を入力漫画OCRの最終的なパイプラインは以下のステップで高精度な構造化JSONを生成 40

その後継続的な性能改善を進めている。 41 Geminiのバージョンアップに合わせてファインチューニングの再調整、プロンプトの微調整を実施。現時点では Gemini 2.0 を適用。

改善結果 42 出典：『ブラックジャックによろしく』(著者：佐藤秀峰)

改善結果セリフについてはほぼ完璧な BoundingBoxとテキストを検出出典：『ブラックジャックによろしく』(著者：佐藤秀峰)

改善結果 44 セリフ順も正しい出典：『ブラックジャックによろしく』(著者：佐藤秀峰)

改善結果オノマトペはまだ課題あり出典：『ブラックジャックによろしく』(著者：佐藤秀峰)

実現した主な成果 90% 作業工数削減率当初の課題だった「読み取り精度の低さによる大幅な手修正」から手直しが約1割で済むレベルへと大幅に改善成果今後の展望：更なるGeminiの応用で翻訳プロセス全体を高速化する
1. AI翻訳の精度向上 :意訳や日本語特有の表現（オノマトペの表現など）で課題が残る 2. inpainting処理の改善 :現在はほぼ人手による修正が必要な状態 46

まとめ

まとめ事例①: 離脱予測モデル実装・教科書的な手法を土台としつつ、ゲーム特性に合わせた特徴量を設計・モデル出力の解釈を次の改善につなげる循環的アプローチを確立・アナリストの分析力 × 事業部のドメイン知識 × モデル実装力により、高性能モデルを実現
事例②: OCR実装（Gemini応用）・生成AIを適用し、ベースライン性能を維持しつつ電子漫画OCR特有の課題に対応・プロンプトエンジニアリングと複数モデルのハイブリッド活用により、大幅な制作工数削減を実現 48

まとめ得られた示唆技術 × ドメイン知識 × 推進体制の3要素が不可欠である今後のプロジェクトにも本アプローチを応用し、事業インパクトの最大化を目指す事業価値につながるAI活用には
49

ご清聴ありがとうございました！

機械学習・生成AIが拓く事業価値創出の最前線

機械学習・生成AIが拓く事業価値創出の最前線

gree_tech PRO

More Decks by gree_tech

Other Decks in Technology

Featured

Transcript