生成AI（Claude3.5 Sonnet）による次世代型レビュー承認システムの実現

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

© DMM 11 ## 役割 - あなたはレビューを審査するAIエージェントです。 ## 評価プロセス 1. レビュー情報の内容を把握してください。 2. 判断項目を順に評価してください。 3. 該当する可能性がある場合は、NGと出力します。 ## コンテンツ特性 - 性的表現でも商品の感想や間接的表現は許容 - 女優に関する一般的な感想は許容 - 出演者関する言及は許容プロンプトの例（1/2） ## 判断基準 - 身体的特徴への侮辱 - 過度に攻撃的/下品な表現 ## 出力形式判定結果スコア理由の説明該当カテゴリ(N001) プロンプトの例（2/2）（PoC）プロンプトの設定例

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

© DMM 14 1.承認ワークフローの構築 ● 複雑な承認プロンプトを誹謗中傷や文言不明といった単純な判定ステップに分解 ● 各判定ステップの結果を次ステップに渡すチェーン方式を採用 (Prompt Chain) 禁則語彙か誹謗中傷か文言が不明か判定結果 Step functions 承認ワークフロー化のメリット 1. 単純ステップによるAIの誤判定の抑制 2. データ処理と承認ロジックの完全分離 3. ステップの組み替えで迅速な改修が可能 prompt prompt prompt ステップ分解

Slide 15

Slide 15 text

© DMM 1.Step Functionsの選択理由 15 Step Functions 1. AWS統合：Bedrock及びAWS他サービスと連携が容易（S3,Aurora,Lambda） 2. 管理：マネージドサービスによるサーバー管理不要 3. 拡張性：需要に応じたスケーリング、並列・非同期実行が可能 4. 可視性：各ステップの詳細な状況把握が容易で充実 (X-Ray/CloudWatch）

Slide 16

Slide 16 text

Slide 17

Slide 17 text

© DMM 17 ● ステップ進捗と共に、判定数が大きく減少、必要な部分に集中投資し、コスト最適化 ○ 初期ステップ：少数のトークンによる簡易判定、明らかに問題ないものを除外 ○ 後期ステップ：怪しいデータに対して大量のトークンを使い詳細分析簡易判定詳細分析 2.アプローチの補足：コスト最適化の実現判定数減 Step Functions NG ワード検出最終審査精密分析アノテーションスクリーニング検査

Slide 18

Slide 18 text

Slide 19

Slide 19 text

© DMM 19 各ステップの事例：文脈判定 c.スクリーニング検査 (Screening) ● 簡易検査項目に従い、問題点を洗い出す ● AIが持つ事前知識（Reasoning）を利用 ● トークンの使用量を最小限に抑え判定 ## 簡易検査項目 N001. 誹謗中傷に該当する表現はあるか N002. プライバシー侵害に該当するか N003. 不明な文言が存在するか N004. 著作権侵害の可能性がある内容を含むか N005. 過度な暴力的表現が含まれているか N006. 商品と無関係な内容が含まれているか N007. 広告目的の内容が含まれているか例）あいつは*やばい*よ → N001に該当スクリーニング検査の例（簡易検査項目) 該当

Slide 20

Slide 20 text

© DMM N001: 誹謗中傷 ## NG基準以下を誹謗中傷と判断します - N001-01: 出演者/製作者の特徴を侮辱する表現 - N001-02: 過度に攻撃的または下品な言葉遣い - N001-03: 作品や製作陣を不当に貶める表現 ## NGサンプル - "太りすぎ、クソすぎる頭悪すぎ" [N001-01] - "下手すぎ。素人以下。二度と見たくない" [N001-02] - "視聴者をバカにしてる。低レベル" [N001-03] 20 各ステップの事例：文脈判定 d.精密分析 (In-Depth-Analysis) ● スクリーニング検査で該当した検査項目に対し、カテゴリ用プロンプトで精密分析 ● 例：誹謗中傷のカテゴリに対し、多数のNG基準、サンプルを与え、深く分析 N001: 誹謗中傷 ## NG基準以下を誹謗中傷と判断します - N001-01: 出演者/製作者の特徴を侮辱する表現 - N001-02: 過度に攻撃的または下品な言葉遣い - N001-03: 作品や製作陣を不当に貶める表現 ## NGサンプル - "太りすぎ、クソすぎる頭悪すぎ" [N001-01] - "下手すぎ。素人以下。二度と見たくない" [N001-02] - "視聴者をバカにしてる。低レベル" [N001-03] 例）あいつは*やばい*よ → N001：誹謗中傷の観点で詳細チェック N001: 誹謗中傷 ## NG基準以下を誹謗中傷と判断します - N001-01: 出演者/製作者の特徴を侮辱する表現 - N001-02: 過度に攻撃的または下品な言葉遣い - N001-03: 作品や製作陣を不当に貶める表現 ## NGサンプル - "太りすぎ、クソすぎる頭悪すぎ" [N001-01] - "下手すぎ。素人以下。二度と見たくない" [N001-02] - "視聴者をバカにしてる。低レベル" [N001-03] ・・・精密分析例（カテゴリ：誹謗中傷)

Slide 21

Slide 21 text

© DMM 21 ステップの事例：文脈判定 e.最終審査 (Final Judgement) ● 精密分析の結果とCOTを用いて再審査 ● 最終審査の結果としては、AIの思考が順序立てて整理され、正確な理由と結果が出力されますレビューを総合的に分析した結果、OKと判断しました 1. 全体的なトーンが否定的で評価しています。 2. *やばいよ*という文言は存在します 3. レビューが誹謗中傷に該当していません。 0.40 OK 最終出力例（XML) 例）あいつは*やばい*よ → OKで問題なし

Slide 22

Slide 22 text

Slide 23

Slide 23 text

© DMM 23 プロダクトへの適用 ● AIの判定結果と判定理由は、オペレータが承認作業する管理画面に表示 ● 現在承認の判断補助として活用、オペレータから高評価管理画面の構成例「不適切レビューを迅速に検知」「AIの視点による適切な観点でレビューを評価」太郎さんのレビューテストテストテストテストテストテストテストテストテストテストテストテストテストテストテストテストテストテストテストテスト AIの見解　NG:文言不明「テスト」という単語の無意味な繰り返しで構成されており商品に関する有用な情報を提供していません

Slide 24

Slide 24 text

© DMM 24 ● Claude3.5 Sonnetを活用し、レビュー承認システムを構築（生成AIは使い方によって人と同様の高精度なシステムを構築することが可能） ● 今後は生成AIによるオペレーションの完全自動化を目指す ○ 完全自動化の暁には、150時間〜/月の人的コストの削減が可能まとめ本事例が、皆様の生成AI活用の参考となり、新たなイノベーションの創出につながれば幸いです。完全自動化計画 ● 60事業部のうち、導入が可能な事業部から開始 ● 承認判定のスコアが一定値以上のものを自動化 ● 承認後レビューを定期監視する仕組みの導入

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

© DMM 下記はプロンプト改善のための原因が特定しにくくなるので現在は利用停止 ● RAG ○ グレーゾーンのサンプルに対してDBに格納し、参照情報を動的に利用する ○ 人の判断にもばらつきが多いため不採用 ● アンサンブル LLM ○ 複数のLLMに回答させて、多数決で回答を決定する ● TOT（Tree of Thoughts） ○ 複数の役割・視点を用いて3人に回答することで精度を上げる方式下記は実践済み ● COT（Chain of Thoughts) ○ 段階的に推論を導き出すことで誤判定を抑制する ● RIG ○ 参照元の情報を回答時に付与することでハルシネーションを防止する手法 ○ 既に実践済み、カテゴリ毎に採番、回答時に該当したカテゴリ番号を付与する（その他）

Slide 29

Slide 29 text

© DMM ● プロンプト分割：各事業の特性に応じ、プロンプトをカスタマイズ ● UKカテゴリの新設：AIの判断が困難な場合はUnknown（UK）カテゴリを設定 ● プロンプト検証ツール：仮設定し、精度検証、迅速なプロンプトエンジニアリングが可能（その他）従来プロンプト物販用プロンプトレンタル用プロンプト動画用プロンプト電書用プロンプト事業部用のプロンプト Unknownカテゴリの導入プロンプト検証ツール OK NG UK プロント設定・検証ツール検証結果プロンプト仮設定検証

Slide 30

Slide 30 text

© DMM （その他） 30 • プロンプト検証時の構成 - Aurora: 大量の検証データを抽出 - SageMaker: 抽出データの高速処理 - Step Functions: 承認ワークフロー • 検証時間: 3時間 → 15分（1/12に短縮） • プロンプトの精度の即時検証可能に！ ● バッチ検証 ○ プロンプトの精度を迅速にバッチ検証する仕組みを開発 ○ StepFunctionsの非同期・並列機能でバッチ検証し、検証時間を3時間から15分へ短縮

Slide 31

Slide 31 text