Upgrade to Pro — share decks privately, control downloads, hide ads and more …

メルカリIBISの紹介

Avatar for ktykogm ktykogm
September 17, 2025

 メルカリIBISの紹介

2025年9月17日にメルカリで行った「メルカリでのAI Agentの現在地を大公開っ」(https://mercari.connpass.com/event/366804/)というイベントで発表した内容です

Avatar for ktykogm

ktykogm

September 17, 2025
Tweet

More Decks by ktykogm

Other Decks in Technology

Transcript

  1. 2 自己紹介 oguma (@ktykogm) | 株式会社メルカリ • 現在: Platform Group

    Autonomous Cloud FinOpsチーム所属 • 過去: メルカリJP SREチーム(~2024年10月) • 専門領域: 信頼性・FinOps × AI/LLM活用 • 担当プロジェクト : IBIS(Incident Buddy and Insight System)のPM・開発 リード 今日お話しすること : AIエージェント開発の「リアルな学び」
  2. 3 今日のアジェンダ 1. なぜIBISを作ったのか - 背景と課題 2. 何を学んだのか - 失敗と成功の両方

    3. どう作ったのか - 技術選択と実装 4. どこに向かうのか - 今後の展望 テーマ: PoCから運用まで、リアルな試行錯誤の過程
  3. 4 Part 1: なぜIBISを作ったのか メルカリのインシデント対応における 3つの課題 1. 属人化の深刻化 a. 特定メンバーへの依存

    b. 知識の継承が困難 2. 効率性の問題 a. 過去事例の検索に時間がかかる b. 類似ケースの発見が困難 3. 精神的負荷 a. オンコール対応のストレス b. 「また同じような問題か...」という疲労感
  4. 5 マイクロサービス化による課題の増大 数字で見る現状 • サービス数の継続的増加 • インシデント発生頻度の上昇 • 対応時間の長期化傾向 根本的な問題

    • スケールに対してオンコール対応者数が不足 • 過去の知見が散在し、活用されていない • 「また車輪の再発明をしている」感覚 目指したい姿 • 過去の学びを組織として蓄積・活用 • 対応者の負担軽減と品質向上の両立
  5. 6 「AIで解決できるのでは?」という仮説 それまでの取り組み • 2022年:AIOps調査開始 • 2023年:LLM活用ケースの探索 ChatGPT体験での気づき • 「これは今までと違う」

    • 自然言語での複雑な推論が可能 • 文脈理解による柔軟な対応 仮説 • 過去のインシデント情報をLLM が理解できれば... • 類似ケースの発見と提案が自 動化できるのでは?
  6. 7 Part 2: 何を学んだのか(失敗編) 2024年12月:初期リリース時の課題 1. 「使われない」問題 • IBISの存在を忘れられる ◦

    問い合わせベースのみだった • インシデント時に思い出してもらえない • 学び: 受動的なシステムでは定着しない 2. 「品質のばらつき」問題 • 問い合わせ内容次第で精度が大きく変動 • 適切な質問ができないと有用な情報が得ら れない • 学び: ユーザーに負荷をかけるデザインは NG
  7. 8 Part 2: 何を学んだのか(成功編 1) 課題解決への転機 • 2025年初頭: Suggestion Bot開発開始

    • コンセプト: "人間の問い合わせを待たない" 成功要因1: プロアクティブ性 • インシデントチャンネル作成をトリガーに自動参加 • メッセージを収集して自動で類似事例を検索 • 結果: 存在を忘れられることがなくなった
  8. 10 Part 2: 何を学んだのか(成功編 2) 成功要因2: コンテキスト理解 • チャンネル内の会話から状況を自動判断 •

    適切なタイミングで情報提供 • 結果: ユーザーが質問を考える負荷が軽減 成功要因3: 継続的改善 • ユーザーフィードバックを積極的に収集 • 結果: UI/UX改善と精度向上
  9. 13 Part 3: どう作ったのか なぜLangGraphを選択したか LangChain(従来手法)の限界 • (基本的に)直列・線形的な処理フロー • 動的な判断が困難

    • 自律性に限界 LangGraph(選択した理由) • ReActフレームワーク(推論→行動 のループ) • 状況に応じた動的な判断 • ツール利用による機能拡張
  10. 14 アーキテクチャの核心: Vector Search インシデント情報の特性 • 類似した過去事例が豊富 • 文脈と詳細が重要 •

    リアルタイム性より正確性が重要 Vector Searchの利点 1. 意味的類似検索 : キーワード以外の関連性発見 2. 最新情報統合 : ベクターDBの継続更新
  11. 15 Vector Store BigQuery Vector Search採用理由 • 既存インフラ活用 : 追加コスト最小化

    • スケーラビリティ : メルカリ規模に対応 • コサイン類似度 : 効率的な近似最近傍検索
  12. 16 データ前処理:品質向上の要 前処理パイプライン 1. PII保護(spaCy NER使用)※NER = Named Entity Recognition

    2. 言語統一 • 日英混在 → 英語統一(注: Embedding用) • トークン効率向上 • ベクトル品質改善
  13. 18 現在の課題と改善点 課題1: 効果測定の難しさ • インシデントが発生しないと利用機会がない • MTTRへの定量的貢献度が測定困難 • ユーザーフィードバックに頼る評価方法

    ◦ いくつか評価基盤を検証中 課題2: 精度のばらつき • 情報の品質に依存する回答精度 • まれなケースでの対応力不足 • 継続的なモデル調整が必要 課題3: スケーラビリティ • 多言語対応(ユーザーとの会話、情報 提供側) • リアルタイム情報統合の遅れ 学び: 完璧を目指さず、継続的改善が重 要
  14. 19 Part 4: これからのチャレンジ MCP連携(WIP) • Model Context Protocol導入 •

    最新システム状態の自動取得 • 過去と現在の情報を統合した提案
  15. 24 メッセージ: AIエージェントの未来 IBISの経験から言えること 🚀 成功を積み重ねていくには 1. 明確な課題設定: 何を解決したいかを具体的に 2.

    段階的アプローチ: 小さく始めて徐々に拡張 3. 継続的改善: まずはユーザーフィードバックを重視 4. 人間中心設計: AIは人間の相棒として位置づけ