Zennへのスパム投稿が急増したのでLLMでなんとかした話

Zennへのスパム投稿が急増したので LLMでなんとかした話 Classmethod AI Talks 2024.9.17 クラスメソッド株式会社 Zennチーム dyoshikawa

自己紹介 @dyoshikawa 文系学部卒、元非エンジニア 2020年10月サーバサイドエンジニア枠で入社（今年で4年目） 2023年よりZennチームのソフトウェアエンジニア

自己紹介フロントエンド: Next.js, React, Vue2などバックエンド: Ruby on Rails, Node.js+Express,
PHP+Laravelなどインフラ: Google Cloud, AWS 資格: 応用情報技術者、AWS Specialty Securityなど

Zennについて https://zenn.dev/ エンジニアのための情報共有コミュニティサービス 2023年12月に会員数10万|月間PV数1000万突破を発表 🎉

本題

生じた課題 👉

課題 2024年6月頃より、Zennにスパム投稿が急増後で触れますが、多い月で約1500件検出される結果にユーザの違反報告が増加したことで事態を認識することになったスパム投稿が読者の目に触れることが定常化することは避けたいため、対策を講じることに

課題しかし・・・ Zenn運営は4〜5人の少人数体制人間の目ですべての投稿をチェックすることは現実的ではない 🤮 開発メンバーに自然言語処理や機械学習の専門的知見もない 🤔

LLM+プロンプトエンジニアリングなら？ 💡

浮かんだ解決策 LLM+プロンプトエンジニアリングでスパム投稿を自動検出する仕組みを構築するあまりコア機能でないところに工数もかけたくないので、フロー全体（検出データの蓄積からオペレーターによる目視確認とその処理まで）は既存の違反報告機能を活用する 1. LLMが公開コンテンツを巡回 2. スパムと判定した場合、違反報告を起票
3. Zennチームが違反報告をチェック

解決策シーケンス図に起こすとこんな感じ違反報告公開コンテンツ (記事、Book、Scrap、コメント) LLM 違反報告公開コンテンツ (記事、Book、Scrap、コメント) LLM
Zennチーム巡回起票チェック Zennチーム

前提 🔍

現状のZennの構成 🔧

そのため以下が前提になるインフラはGoogle Cloud Ruby on Railsバックエンドから呼び出す

やっていく 💪

やること LLMの選定プロンプトの調整構成の検討本番導入

やること LLMの選定 👈 プロンプトの調整構成の検討本番導入

LLMの選定 Google Cloud Vertex AIプラットフォームを使用 ZennのインフラがGoogle Cloudだから IAM権限管理などなど考えるとクラウドプラットフォームは寄せてしまった方が楽

Gemini？Claude？ Vertex AIで使える2大モデル Gemini/Claude Claudeは特にAWSのBedrockを採用する場合においてファーストチョイス感があり、かつ評判も良い印象しかしGoogleといえばGeminiか？

比較検討する ⚖️

価格（Gemini） https://cloud.google.com/vertex-ai/generative-ai/pricing? hl=ja#gemini-models 文字数あたりの表記モデル入力コスト（1,000文字あたり）出力コスト（1,000文字あたり） Gemini 1.5 Pro
$0.00125 $0.00375 Gemini 1.5 Flash $0.000125 $0.000375

価格（Claude） https://cloud.google.com/vertex-ai/generative-ai/pricing? hl=ja#partner-models トークン数あたりの表記モデル入力コスト (1,000トークンあたり) 出力コスト (1,000トークンあたり) Claude
3/3.5 Sonnet $0.003 $0.015 Claude 3 Haiku $0.00025 $0.00125

価格 1トークン≒1文字（日本語のマルチバイト文字換算で）と仮定すれば、Geminiの方が単価は安そう？ Gemini 1.5 Pro 入力: $0.00125 / 1000文字あたり
Claude 3/3.5 Sonnet 入力: $0.003 / 1000トークンあたり

リージョン Claude Sonnet: us-central1 (Iowa), asia-southeast1 (Singapore) Haiku: us-central1 (Iowa),
europe-west4 (Netherlands) Geminiは東京リージョン（asia-northeast1）が使える

SDK対応状況 Ruby on Railsから使いやすいか？ SDK対応状況 Gemini: Python, Node.js, Go, Dart,
Android(Java, Kotlin), Swift Claude: Python, Node.js

SDK対応状況 Rubyから呼び出すという点では同等どちらもSDKがないため SDK対応言語はGeminiの方が多い

JSON出力 LLMをシステムに組み込む際は返答をJSONで出力してくれた方が何かと都合がいい LLMによってJSON出力指示のベストプラクティスが異なる

JSON出力（Gemini） Gemini API を使用して JSON 出力を生成する | Google AI for
Developers generation_config に {"response_mime_type": "application/json"} を指定することでJSON形式の出力になる

JSON出力（Gemini）構造はプロンプトで下記のように指示する PythonのType Hints風の記法 List 5 popQular cookie recipes. Using
this JSON schema: Recipe = {"recipe_name": str} Return a `list[Recipe]` 実際、手元の検証ではJSON Schemaで指示するよりJSONパースエラーが少なかったので上記がベスプラっぽい response_schema にJSON Schemaを渡す方法もあるこちらの方が精度良さそう

JSON出力（Claude）出力フォーマットの制御 (JSONモード) - Anthropic LLM（assistant）の出力の一文字目に { を指定する messages: [
{ role: "user", content: [ { type: "text", text: "猫についての俳句を書いてください。“first_line”、“second_line”、“third_line”をキーとするJSON形式を使用してください。" }, ], role: "assistant", content: [ { type: "text", text: "{" # JSONの一文字目を入力しておく }, ], } ],

JSON出力（Claude）構造の指定はどうする？ドキュメントの例はプロンプト内において猫についての俳句を書いてください。“first_line”、“second_line”、“third_line”をキーとするJSON形式を使用してください。 JSON形式でチョコレートチップクッキーのレシピを生成してください。といったややざっくりした指定手元の検証ではPython風、JSON
Schemaいずれでもおおむね期待通りの出力が得られた

回答精度モデルごとの回答精度を評価したい以下を数件用意し、各モデルに判定させるスパムでない投稿と判定されることを期待するコンテンツスパム投稿と判定されることを期待するコンテンツモデルごとにプロンプトは多少カスタマイズ

回答精度判定結果よりスコア付けすると、おおむね次の結果になった Gemini 1.5 Flash < Claude 3 Haiku =
Claude 3 Sonnet = Claude 3.5 Sonnet < Gemini 1.5 Pro Gemini 1.5 Proでベースのプロンプトを作成したので、必ずしもフェアではないかも LLMの定量的な評価は難しい 🤔 でも取れた結果を材料にするしかない

回答精度比較はほどほどで良い現時点ではGPT/Claude/Geminiの御三家（？）であればどれを選んでも大失敗することはないはず回答精度は常にお互い抜きあっている状態その時点で一番良いものを拘って選んでも、状況がすぐに変わる失敗しないようにするのではなく、いざとなったらモデルを差し替えることができる素結合なソフトウェア設計をすることが重要そう

Gemini独自の機能 Geminiのみ使える機能がある Context Caching 同じプロンプトを繰り返し使用する場合、コンテキストをキャッシュしてコストの最適化ができる Batch Prediction リアルタイムな応答を必要としない用途の場合、バッチ処理でコストの最適化ができる

Gemini独自の機能（補足） Claudeもキャッシュによる最適化機能を発表 Prompt caching with Claude \ Anthropic is now
available on the Anthropic API. 上記のため、AWSのBedrockやGoogle Cloud Vertex AIではまだ使えないと思われる参考: https://github.com/boto/boto3/issues/4262

Gemini vs Claudeのまとめ ※あくまでVertex AI上で動かす場合の比較項目結果価格ほぼ同等。Context CachingやBatch
Predictionの存在を考えるとコストはGemini優位かリージョン Geminiは東京リージョンが使える JSON出力両方できる。Gemini 1.5 Proはパラメータから厳密な指定が可能 SDK Gemini: Python, Node.js, Go, Dart, Android(Java, Kotlin), Swift Claude: Python, Node.js 回答精度 Gemini 1.5 Flash < Claudeの各モデル < Gemini 1.5 Pro（あくまで今回の検証において）

LLM選定における考察 Vertex AIのLLMとしてはまずはGeminiの選定を検討するのが無難東京リージョンを選択可 Context Caching、Batch Predictionなど将来取れるオプションが多い

今回はGemini 1.5 Proを選定 🤖

今回はGemini 1.5 Proを選定実は当初はClaudeで本番導入を始めていたその後Geminiに切り替えたという経緯（なので本スライドは時系列的に正確ではありません。が、発表の都合上このようにさせてください 🙏）

LLMの選定おわり ✅

やること LLMの選定 ✅ プロンプトの調整構成の検討本番導入

やること LLMの選定 ✅ プロンプトの調整 👈 構成の検討本番導入

プロンプトの調整 LLM選定時よりは手が込んだ検証をする以下を十数件〜100件程度用意し、LLMに判定させるスパムでない投稿と判定されることを期待するコンテンツスパム投稿と判定されることを期待するコンテンツ

プロンプトの調整実行上の工夫として、テストデータのCSVファイル、検証用のカスタムrailsコマンドを作成しリポジトリにコミット。いつでも何度でも検証しやすいようにする判定 ↔️ プロンプト変更のサイクルを何度か回す

ほどほどにやる事前のプロンプト調整と検証に時間はかけすぎない「本番の」「最新の」コンテンツで動かしてみないとわからないことも多いスパムの手口も刻一刻と変化する精度が揺らいでも大惨事が起こる性質の取り組みではない 0% →90%にする労力 <<<<<
90% →99%にする労力テストデータで90%程度の精度が出た時点で完了

プロンプトの調整おわり ✅

やること LLMの選定 ✅ プロンプトの調整 ✅ 構成の検討本番導入

やること LLMの選定 ✅ プロンプトの調整 ✅ 構成の検討 👈 本番導入

構成の検討 Railsで動作するタスクAPI（バッチ処理のためのワーカー）を使用 DBからコンテンツを取得 Geminiの判定にかける（スパムか否か） Cloud Schedulerで処理をキックして定期的に巡回させる

RubyからGeminiを利用する Geminiを呼び出すコード credentials = Google::Auth.get_application_default access_token = credentials.fetch_access_token!["access_token"] uri =
URI(API_URL) http = Net::HTTP.new(uri.host, uri.port) http.use_ssl = true request = Net::HTTP::Post.new(uri.request_uri) request["Authorization"] = "Bearer #{access_token}" request["Content-Type"] = "application/json" request.body = { contents: { role: "user", parts: [ { text: "こんにちは" } ], }, generation_config: { temperature: TEMPERATURE, max_output_tokens: MAX_TOKENS

RubyからGeminiを利用するちなみにClaudeだとこんなコード request["Authorization"] = "Bearer #{access_token}" request["Content-Type"] = "application/json" request.body
= { anthropic_version: "vertex-2023-10-16", messages: [ { role: "user", content: [ { type: "text", text: "こんにちは" } ], } ], temperature: TEMPERATURE, max_tokens: MAX_TOKENS, stream: false }.to_json

構成の検討おわり ✅

やること LLMの選定 ✅ プロンプトの調整 ✅ 構成の検討 ✅ 本番導入

やること LLMの選定 ✅ プロンプトの調整 ✅ 構成の検討 ✅ 本番導入 👈

新施策の導入にあたっていつも考えること相反する要求スピード感は持ちたい一方でそれにより生じるリスク・負の影響は最小化したい両立するには・・・

段階的な導入 🚢

段階的な本番導入できるだけ早い段階で小さく本番で動かす素早くフィードバックを得られる段階的に導入することで、何かあった時の負の影響を局所化する負の影響の例: 管理画面の一覧に大量の誤検知が表示され、オペレーターが疲弊する

実際にやったこと対象期間を絞る対象コンテンツを絞る記事のみなど対象を絞ってスモールに導入し、様子を見る

実際にやったこと徐々に他コンテンツ（Book・Scrap・コメント）に対象を拡大対象期間も拡大当初想定まで網羅できたら完了

本番導入おわり ✅

やること LLMの選定 ✅ プロンプトの調整 ✅ 構成の検討 ✅ 本番導入 ✅

結果 💥

結果導入前と比べて3000%の検出件数ユーザーより月間50件報告 →月間1500件検出（最大） ※ 報告されるユーザーやコンテンツの重複を含むスパム疑いのある投稿についてピーク時より約80〜90％の削減見込みユーザーがスパム投稿を目にする機会が減少

結果月間140時間の運用工数を削減新しく投稿されるすべてのコンテンツを人力・目視でチェックする場合、月間70〜140時間要する（推定） AIに自動チェックさせることで上記工数をほとんど削減できたことになる

今後の展望プロンプトのさらなる最適化モデル選定の定期的な見直し本事例を学びとして他の側面へのLLM応用の余地を検討コンテンツ執筆の品質向上サポートユーザー体験の改善

まとめ LLMを活用してスパム投稿自動検出の仕組みを構築した 🤖 ユーザーと運営双方の負担を軽減できた 🎉 継続的に改善しつつ別の応用機会を探っていく 💪

最後に宣伝 📢

最後に宣伝 ZennのPublication機能をご利用いただくと、企業や組織の単位でテックメディアを立ち上げられます

ご清聴ありがとうございました質問・フィードバックよろしくお願いします 🙏

参考 https://cloud.google.com/vertex-ai/generative-ai/pricing?hl=ja https://ai.google.dev/gemini-api/docs/quickstart?hl=ja https://console.cloud.google.com/vertex- ai/publishers/anthropic/model-garden/claude-3-haiku https://ai.google.dev/gemini-api/docs/json-mode https://docs.anthropic.com/ja/docs/control-output-format https://ai.google.dev/gemini-api/docs/caching

参考 https://cloud.google.com/vertex-ai/generative- ai/docs/multimodal/batch-prediction-gemini

Zennへのスパム投稿が急増したのでLLMでなんとかした話

Zennへのスパム投稿が急増したのでLLMでなんとかした話

More Decks by dyoshikawa

Featured

Transcript