OPENREC.tv におけるLLMを活用した監視効率化

Slide 1

Slide 1 text

株式会社OPENREC 野見山賢人 OPENREC.tv におけるLLMを活用した監視効率化

Slide 2

Slide 2 text

Name: 野見山賢人 (Kento NOMIYAMA) Works: OPENREC.tvでのバックエンド開発及び動画配信基盤の開発・運用 facebook: @clomkento GitHub: @clom 自己紹介

Slide 3

Slide 3 text

AGENDA - コンテンツの監視に関して - LLM検証のアプローチ - サービスへの組み込み、導入後の検証結果 - まとめ

Slide 4

Slide 4 text

OPENREC.tv とは - ゲーム実況や多種多様の番組を配信している動画配信プラットフォーム - 2015年1月リリース - 高画質・低遅延のライブ配信 - サブスクやPPVなどのファンコミュニティ向けの機能も充実

Slide 5

Slide 5 text

コンテンツの監視に関して

Slide 6

Slide 6 text

コンテンツの監視に関してライブ配信投稿動画チャット・コメントキャプチャユーザー CS

Slide 7

Slide 7 text

コンテンツの監視に関してライブ配信投稿動画チャット・コメントキャプチャユーザー CS 人力による監視を実施 (タイトル・内容) 不適切なコンテンツが一定時間サイト上に掲載されてしまう恐れがある LLMを活用し、監視の効率化を実施

Slide 8

Slide 8 text

Slide 9

Slide 9 text

キャプチャ - ライブ配信の一部分を切り出して1つの動画として公開できる機能 - キャプチャの視聴者はキャプチャに対してコメントやリアクションが可能月 2000 - 3000 件のキャプチャが作成

Slide 10

Slide 10 text

キャプチャ - 一定のロジックにより、人気となったキャプチャに関してはトップページに掲載 - トップページに掲載されるために過激なタイトルで投稿されていることがあり、プラットフォーム内で露出を控えるような対応を実施

Slide 11

Slide 11 text

アプローチ

Slide 12

Slide 12 text

アプローチ - 検証の方法 - ルールベース+LLM検証のハイブリッド - LLMに検証させる情報 - キャプチャのタイトル - LLM検証させる前に前処理を実施 - ルールベースのよる検証を実施 - こちらで定義したNGワードに対して置き換え - 要注意と判定されたものを通知することで監視効率を向上

Slide 13

Slide 13 text

アプローチ - NGワードの書き換え実施時 - 部分一致や完全一致だと / や, の区切りが含まれた場合にすり抜けが発生意図的に, / を利用した場合に誤検知が発生 -> LLM に任せる - 双方のメリットを活用することでコストを抑えつつ検証を実施可能 - ルールベースのみの判断が難しい部分をLLMに委ねるルールベース LLM メリット明確な条件に合わせたモデレーションが可能テキスト全文を解釈した上でモデレーションが可能デメリットテキスト全文を解釈した上でのモデレーションが難しい部分一致や完全一致といった条件の場合に区切り文字の場合にすり抜けが発生するモデレーション結果に対して誤った情報を提供する可能性(ハルシネーション)

Slide 14

Slide 14 text

アプローチ - LLM - Claude 3.5 Sonnet (Amazon Bedrock) - システムプロンプト - ルール定義 - 一般的にNGな項目 (公序良俗など) - 伏せ字やの補完 - 区切り文字の除外 - 出力条件 - CSVで出力するように指示 - ユーザープロンプト - キャプチャの情報 (id, タイトル)

Slide 15

Slide 15 text

プロンプトによる判定結果の精度 - 判定結果が正しく分類されているか Zero-Shot, Few-Shotでの推論を行い、比較を実施 - CS側で判定した正常、要注意(BAN済み)のキャプチャのタイトルを各100件 - LLMがどれだけ正しく判定できたかを確認 (二値分類) - Few-Shot では0件, 2件, 9件の要注意のキャプチャのタイトル例を示し、推論を実施 - 結果 - 正常なキャプチャではFew-Shotの方がより精度の高い分類ができた一方、要注意のキャプチャに関しては、Zero-Shotの方が精度よい結果となった - → Zero-Shot での推論を実施する形で組み込みを実施 Zero-Shot Few-Shot (2件) Few-Shot (9件) 正常と判定したもの 81 / 100 85 / 100 87 / 100 要注意と判定したもの 65 / 100 48 / 100 50 / 100

Slide 16

Slide 16 text

サービスへの組み込み、導入後の検証結果

Slide 17

Slide 17 text

サービスへの組み込み - Kubernetes の CronJob 機能で定期実行 - API経由でキャプチャの情報取得とモデレーション結果の更新を実施 - 定期実行頻度を短くすることで監視のリアルタイム性を向上 - 実行時にモデレーション対象が無い場合は LLM の実行をしないことでコストを削減

Slide 18

Slide 18 text

サービスへの組み込み - プロンプトの構成 - システムプロンプト - タイトルの分類ルール - 読み替えの対応表 - 出力条件 (CSV) - id, 判定結果, 理由 - ユーザープロンプト - 実際のキャプチャの情報をCSV 形式で指定 - id,title capture_id,"タイトル" タイトルを正常・要注意に分類するためのルール - 一般的に問題がある項目 - 伏せ字を推測 - NGワード回避のための区切り文字対応独自に定義している読み替え対応表 - 一般的に読み替えされない (サービスでよく使われるような) ワードを読み替えできるように定義出力条件 - CSVを生成するように出力条件を指定

Slide 19

Slide 19 text

- LLM からの応答 - 出力形式をCSV形式に限定するために明示的に指定する - 出力形式に沿った結果が出てこないケースも存在 (枕詞がある) - (システムプロンプト) 出力はCSV形式のみとして、ID,不適切コンテンツかどうかの判定,理由を出力してください。形式は以下の通りです。それ以外の出力はしないでください。 id,result,reason サービスへの組み込み Here is the CSV output with the title, ID, score, and reason for each entry: id,result,reason xxxxx,false, …..

Slide 20

Slide 20 text

サービスへの組み込み - 出力形式に沿った結果が出てこない場合もあった - 出力形式に合わせるように枕詞を削除することで適切に処理を行えるようにデータを加工 Here is the CSV output with the title, ID, score, and reason for each entry: id,result,reason xxxxx,false, ….. id,result,reason xxxxx,false, …..

Slide 21

Slide 21 text

サービスへの組み込み - CS向けには監視画面上で要注意のラベル表示とフィルタリング機能の提供 - 判定結果に関しては理由も含めて表示 - 優先的に確認することが可能に

Slide 22

Slide 22 text

モデレーション精度 - サービス組み込み後1週間の本番稼働でデータの収集と分類を実施 - 正常判定のうち LLM側の判定で取りこぼしがあったもの - 正常判定となったキャプチャの一部 (約 3%ほど) - 要因: CS側で内容評価をしているケースが多い - タイトルモデレーションに限界 - 精度向上のためには内容も含めた精査も必要 - タイトルのみの判定では高い精度を発揮した振り分けデータ 1176 正常判定 984 83.67% 要注意判定 192 16.33% CSチームに展開

Slide 23

Slide 23 text

LLM検証導入後 - CS側としては必要十分ではあるフィードバックを得られた - 監視業務においてその部分がある程度緩和され、業務効率化を図ることには繋げられた - 現状としては業務効率化のための導入 - 自動化はLLM検証の結果を踏まえ、よりサービスの特性や監視の状況に合わせてプロンプトチューニングを進めていく必要が出てきた - テキストモデレーションで横展開が可能になるため、他の監視項目も行えないか

Slide 24

Slide 24 text

まとめ - LLM を用いたキャプチャの監視効率化 - 正常なキャプチャに紛れ込まれている要注意のキャプチャに関しても取りこぼしも少なく、ある程度のタイトルモデレーションが実現可能あった - 要注意をベースにCS側でも監視業務の効率化に繋げられた - 自動化は検証結果を踏まえたプロンプトチューニングが必要 - LLMのモデレーション検証の横展開 - タイトルによるモデレーションはテキストベースでのモデレーションのため、チャットやユーザー情報のモデレーションへの展開はしやすくなる - 監視効率化のためのLLM活用の検討中