Upgrade to Pro — share decks privately, control downloads, hide ads and more …

生成AI(Claude3.5 Sonnet)による 次世代型レビュー承認システムの実現

matsui-dmm
October 29, 2024

生成AI(Claude3.5 Sonnet)による 次世代型レビュー承認システムの実現

本発表では、DMM.comが取り組む生成AIを活用した革新的なユーザーレビュー承認システムについてご紹介します。月間数万件以上のレビュー投稿を扱う当社のプラットフォームにおいて、従来の人手による承認プロセスが抱える課題を解決すべく、Amazon Bedrock上のClaude3.5を導入しました。高度な言語理解能力を持つ生成AIの活用により、コンテンツモデレーションの効率を大幅に向上させた事例を共有します。

アジェンダ: 1) DMM.comのユーザーレビュー基盤の課題, 2) Claude3.5を活用したレビュー承認システムの構成, 3) プロンプトエンジニアリング, 4) 段階的判定プロセスによる判定精度向上, 5) 運用後の継続的改善によるアプローチ, 6) システム導入の効果, 7) 今後の展望とまとめ

matsui-dmm

October 29, 2024
Tweet

Other Decks in Technology

Transcript

  1. © DMM © DMM CONFIDENTIAL 生成AI(Claude3.5 Sonnet)による 次世代型レビュー承認システムの実現 Content Moderation

    of Reviews Using Generative AI: To Next Generation 合同会社DMM.com プラットフォーム開発本部 ユーザーレビューグループ
  2. © DMM 6 ユーザーレビューの提供体制 レビューAPI レビュー機能 DataBase • PF開発部:事業部向けのレビューの共通機能を開発 •

    事業部 :レビューの共通機能を利用し、サービスを展開 • 運営部 :ユーザーから投稿されたレビューをオペレータが審査・承認 PF開発部 事業部 運営部
  3. © DMM 10 レビュー承認システムを構築 • 生成AIとしてAWSの Bedrockを活用し、承認システムを構築 ◦ 選択理由:既存レビュー基盤がAWS +

    事前評価でBedrock (Claude3)が最も高い能力 • 投稿後に各AWSサービス(API Gateway→Lambda→Bedrock→Aurora)と連携し、承認判定 レビュー投稿 承認判定 AI
  4. © DMM 11 ## 役割 - あなたはレビューを審査するAIエージェントです。 ## 評価プロセス 1.

    レビュー情報の内容を把握してください。 2. 判断項目を順に評価してください。 3. 該当する可能性がある場合は、NGと出力します。 ## コンテンツ特性 - 性的表現でも商品の感想や間接的表現は許容 - 女優に関する一般的な感想は許容 - 出演者関する言及は許容 プロンプトの例(1/2) ## 判断基準 - 身体的特徴への侮辱 - 過度に攻撃的/下品な表現 ## 出力形式 <output> <result>判定結果</result> <score>スコア</score> <reason>理由の説明</reason> <category>該当カテゴリ(N001)</category> </output> プロンプトの例(2/2) (PoC)プロンプトの設定例
  5. © DMM 14 1.承認ワークフローの構築 • 複雑な承認プロンプトを誹謗中傷や文言不明といった単純な判定ステップに分解 • 各判定ステップの結果を次ステップに渡すチェーン方式を採用 (Prompt Chain)

    禁則語彙か 誹謗中傷か 文言が不明か 判定結果 Step functions 承認ワークフロー化のメリット 1. 単純ステップによるAIの誤判定の抑制 2. データ処理と承認ロジックの完全分離 3. ステップの組み替えで迅速な改修が可能 prompt prompt prompt ステップ分解
  6. © DMM 1.Step Functionsの選択理由 15 Step Functions 1. AWS統合:Bedrock及びAWS他サービスと連携が容易(S3,Aurora,Lambda) 2.

    管理:マネージドサービスによるサーバー管理不要 3. 拡張性:需要に応じたスケーリング、並列・非同期実行が可能 4. 可視性:各ステップの詳細な状況把握が容易で充実 (X-Ray/CloudWatch)
  7. © DMM 18 各ステップの事例:キーワード検出 b.アノテーション • 不適切な可能性のある語彙をLLMで検出しマーク • 判定結果はその後のステップで利用 a.NGワード検出

    • NGワードを検出し、一発アウト 例:死ね、殺す、馬鹿 例:暴力、差別、やばい 例)あいつはやばいよ →  あいつは*やばい*よ 例)明日、死ねと言われた -> NG
  8. © DMM 19 各ステップの事例:文脈判定 c.スクリーニング検査 (Screening) • 簡易検査項目に従い、問題点を洗い出す • AIが持つ事前知識(Reasoning)を利用

    • トークンの使用量を最小限に抑え判定 ## 簡易検査項目 N001. 誹謗中傷に該当する表現はあるか N002. プライバシー侵害に該当するか N003. 不明な文言が存在するか N004. 著作権侵害の可能性がある内容を含むか N005. 過度な暴力的表現が含まれているか N006. 商品と無関係な内容が含まれているか N007. 広告目的の内容が含まれているか 例)あいつは*やばい*よ → N001に該当 スクリーニング検査の例 (簡易検査項目) 該当
  9. © DMM N001: 誹謗中傷 ## NG基準 以下を誹謗中傷と判断します - N001-01: 出演者/製作者の特徴を侮辱する表現

    - N001-02: 過度に攻撃的または下品な言葉遣い - N001-03: 作品や製作陣を不当に貶める表現 ## NGサンプル - "太りすぎ、クソすぎる 頭悪すぎ" [N001-01] - "下手すぎ。素人以下。二度と見たくない" [N001-02] - "視聴者をバカにしてる。低レベル" [N001-03] 20 各ステップの事例:文脈判定 d.精密分析 (In-Depth-Analysis) • スクリーニング検査で該当した検査項目に 対し、カテゴリ用プロンプトで精密分析 • 例:誹謗中傷のカテゴリに対し、多数のNG基 準、サンプルを与え、深く分析 N001: 誹謗中傷 ## NG基準 以下を誹謗中傷と判断します - N001-01: 出演者/製作者の特徴を侮辱する表現 - N001-02: 過度に攻撃的または下品な言葉遣い - N001-03: 作品や製作陣を不当に貶める表現 ## NGサンプル - "太りすぎ、クソすぎる 頭悪すぎ" [N001-01] - "下手すぎ。素人以下。二度と見たくない" [N001-02] - "視聴者をバカにしてる。低レベル" [N001-03] 例)あいつは*やばい*よ → N001:誹謗中傷の観点で詳細チェック N001: 誹謗中傷 ## NG基準 以下を誹謗中傷と判断します - N001-01: 出演者/製作者の特徴を侮辱する表現 - N001-02: 過度に攻撃的または下品な言葉遣い - N001-03: 作品や製作陣を不当に貶める表現 ## NGサンプル - "太りすぎ、クソすぎる 頭悪すぎ" [N001-01] - "下手すぎ。素人以下。二度と見たくない" [N001-02] - "視聴者をバカにしてる。低レベル" [N001-03] ・・・ 精密分析例(カテゴリ:誹謗中傷)
  10. © DMM 21 ステップの事例:文脈判定 e.最終審査 (Final Judgement) • 精密分析の結果とCOTを用いて再審査 •

    最終審査の結果としては、AIの思考が順 序立てて整理され、正確な理由と結果が 出力されます <output> <reason> レビューを総合的に分析した結果、OKと判断しました 1. 全体的なトーンが否定的で評価しています。 2. *やばいよ*という文言は存在します 3. レビューが誹謗中傷に該当していません。 </reason> <score>0.40</score> <result>OK</result> </output> 最終出力例(XML) 例)あいつは*やばい*よ → OKで問題なし
  11. © DMM 23 プロダクトへの適用 • AIの判定結果と判定理由は、オペレータが承認作業する管理画面に表示 • 現在承認の判断補助として活用、オペレータから高評価 管理画面の構成例 「不適切レビューを迅速に検知」

    「AIの視点による適切な観点で レビューを評価」 太郎さんのレビュー テストテストテストテストテストテストテストテストテストテスト テストテストテストテストテストテストテストテストテストテスト AIの見解 NG:文言不明 「テスト」という単語の無意味な繰り返しで構成されており商品に関する 有用な情報を提供していません
  12. © DMM 24 • Claude3.5 Sonnetを活用し、レビュー承認システムを構築 (生成AIは使い方によって人と同様の高精度なシステムを構築することが可能) • 今後は生成AIによるオペレーションの完全自動化を目指す ◦

    完全自動化の暁には、150時間〜/月の人的コストの削減が可能 まとめ 本事例が、皆様の生成AI活用の参考となり、 新たなイノベーションの創出につながれば幸いです。 完全自動化計画 • 60事業部のうち、導入が可能な事業部から開始 • 承認判定のスコアが一定値以上のものを自動化 • 承認後レビューを定期監視する仕組みの導入
  13. © DMM 下記はプロンプト改善のための原因が特定しにくくなるので現在は利用停止 • RAG ◦ グレーゾーンのサンプルに対してDBに格納し、参照情報を動的に利用する ◦ 人の判断にもばらつきが多いため不採用 •

    アンサンブル LLM ◦ 複数のLLMに回答させて、多数決で回答を決定する • TOT(Tree of Thoughts) ◦ 複数の役割・視点を用いて3人に回答することで精度を上げる方式 下記は実践済み • COT(Chain of Thoughts) ◦ 段階的に推論を導き出すことで誤判定を抑制する • RIG ◦ 参照元の情報を回答時に付与することでハルシネーションを防止する手法 ◦ 既に実践済み、カテゴリ毎に採番、回答時に該当したカテゴリ番号を付与する (その他)
  14. © DMM • プロンプト分割:各事業の特性に応じ、プロンプトをカスタマイズ • UKカテゴリの新設:AIの判断が困難な場合はUnknown(UK)カテゴリを設定 • プロンプト検証ツール: 仮設定し、精度検証、迅速なプロンプトエンジニアリングが可能 (その他)

    従来 プロンプト 物販用 プロンプト レンタル用 プロンプト 動画用 プロンプト 電書用 プロンプト 事業部用のプロンプト Unknownカテゴリの導 入 プロンプト検証ツール OK NG UK プロント 設定・検証 ツール 検証結果 プロンプト仮 設定 検証
  15. © DMM (その他) 30 • プロンプト検証時の構成 - Aurora: 大量の検証データを抽出 -

    SageMaker: 抽出データの高速処理 - Step Functions: 承認ワークフロー • 検証時間: 3時間 → 15分(1/12に短縮) • プロンプトの精度の即時検証可能に! • バッチ検証 ◦ プロンプトの精度を迅速にバッチ検証する仕組みを開発 ◦ StepFunctionsの非同期・並列機能でバッチ検証し、検証時間を3時間から15分へ短縮