Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Langsmith入門 トレーシングとプロンプト管理を試す

ttnyt8701
February 26, 2025

Langsmith入門 トレーシングとプロンプト管理を試す

【AWS活用 AI/ML/LLM #4】機械学習/大規模言語モデルのモニタリング、保守、セキュリティ
https://blueish.connpass.com/event/346463/

ttnyt8701

February 26, 2025
Tweet

More Decks by ttnyt8701

Other Decks in Programming

Transcript

  1. ©BLUEISH 2025. All rights reserved. 目次 1. LangSmithについて a. 主な機能

    b. なぜ必要なのか c. その他特徴 d. プラン比較 e. Langfuseとの比較 2. LangSmithを試してみる a. トレース b. プロンプト管理 3. まとめ
  2. ©BLUEISH 2025. All rights reserved. LLMアプリケーション開発での課題 LLMでは以下の特性があります ❏ 非決定性である ❏

    同じ入力でも毎回異なる出力を返すことがある ❏ 出力の正確性、自然さ、一貫性 が保証されない ❏ ハルシネーションを起こす 一貫した応答を求められるアプリケーションでは、これらは問題となります 👉 LangSmithで改善しよう
  3. ©BLUEISH 2025. All rights reserved. 主な機能 ❏ トレーシング LLMのプロンプト、出力、実行ステップ、エラーなどリクエストの詳細を追跡 ❏

    モニタリング 応答時間、エラー率、リクエスト数 などシステム全体の健康状態を監視 ❏ 監視 トレーシング・モニタリングからシステムの内部状態を可視化し異常の特定を支援 ❏ 自動評価   事前に設定した 評価指標とモデルの出力を自動で比較して評価 ❏ キューの注釈 人間のフィードバックを収集し、モデルの出力品質を評価・改善 ❏ プロンプト管理 プロンプトのバージョン管理や A/B テストを通じてプロンプトの品質を最適化
  4. ©BLUEISH 2025. All rights reserved. その他特徴 ❏ フルマネージド・セルフホストどちらも対応 ❏ 個人利用であれば十分な無料枠がある

    ❏ LangChainと併用すると効率的に開発できる (LangChainを使用していなくても利用可能)
  5. ©BLUEISH 2025. All rights reserved. LangSmithとLangfuseの簡単な比較 引用: LangChainから使用する LangSmithとLangfuseの詳細比(https://zenn.dev/aidemy/articles/13ceca39b0ea6c) ※

    Enterpriseプラン (最上位プラン )に加入することでセルフホストも可能 どちらもLLMアプリケーションの開発・運用・改善を支援するツール