Slide 1

Slide 1 text

LangSmith入門 トレーシング・プロンプト管理を試す 立野 祐太 2025.02.27 ©BLUEISH 2025. All rights reserved.

Slide 2

Slide 2 text

立野 祐太 Yuta Tateno 普段はGo、GCPを用いたWEB開発をしています。 バックエンドエンジニア 自己紹介 ©BLUEISH 2024. All rights reserved.

Slide 3

Slide 3 text

©BLUEISH 2025. All rights reserved. 目的 LangSmithの機能・導入のイメージを掴んでもらう

Slide 4

Slide 4 text

©BLUEISH 2025. All rights reserved. 対象者 ❏ LLMアプリ開発の初心者の方 ❏ LangSmithや類似ツールを使ったことがない人

Slide 5

Slide 5 text

©BLUEISH 2025. All rights reserved. 目次 1. LangSmithについて a. 主な機能 b. なぜ必要なのか c. その他特徴 d. プラン比較 e. Langfuseとの比較 2. LangSmithを試してみる a. トレース b. プロンプト管理 3. まとめ

Slide 6

Slide 6 text

©BLUEISH 2025. All rights reserved. LLMアプリケーション開発での課題 LLMでは以下の特性があります ❏ 非決定性である ❏ 同じ入力でも毎回異なる出力を返すことがある ❏ 出力の正確性、自然さ、一貫性 が保証されない ❏ ハルシネーションを起こす 一貫した応答を求められるアプリケーションでは、これらは問題となります 👉 LangSmithで改善しよう

Slide 7

Slide 7 text

©BLUEISH 2025. All rights reserved. 🦜⚒LangSmithとは LLMアプリケーションの開発・運用・改善を支援するツール

Slide 8

Slide 8 text

©BLUEISH 2025. All rights reserved. 主な機能 ❏ トレーシング LLMのプロンプト、出力、実行ステップ、エラーなどリクエストの詳細を追跡 ❏ モニタリング 応答時間、エラー率、リクエスト数 などシステム全体の健康状態を監視 ❏ 監視 トレーシング・モニタリングからシステムの内部状態を可視化し異常の特定を支援 ❏ 自動評価   事前に設定した 評価指標とモデルの出力を自動で比較して評価 ❏ キューの注釈 人間のフィードバックを収集し、モデルの出力品質を評価・改善 ❏ プロンプト管理 プロンプトのバージョン管理や A/B テストを通じてプロンプトの品質を最適化

Slide 9

Slide 9 text

非決定性の課題を改善 1. トレーシングによって入力と出力を追跡し、特定の出力が生成された理由を分析 2. 評価によって非決定的な応答を 「許容範囲内」か「問題あり」かを判断 3. フィードバックからモデルやプロンプトを継続的に改善し、出力の非決定性を最 小化 👉 モデル、プロンプトの継続的な改善で出力の品質を安定させる ©BLUEISH 2025. All rights reserved.

Slide 10

Slide 10 text

©BLUEISH 2025. All rights reserved. その他特徴 ❏ フルマネージド・セルフホストどちらも対応 ❏ 個人利用であれば十分な無料枠がある ❏ LangChainと併用すると効率的に開発できる (LangChainを使用していなくても利用可能)

Slide 11

Slide 11 text

©BLUEISH 2025. All rights reserved. プラン比較

Slide 12

Slide 12 text

©BLUEISH 2025. All rights reserved. LangSmithとLangfuseの簡単な比較 引用: LangChainから使用する LangSmithとLangfuseの詳細比(https://zenn.dev/aidemy/articles/13ceca39b0ea6c) ※ Enterpriseプラン (最上位プラン )に加入することでセルフホストも可能 どちらもLLMアプリケーションの開発・運用・改善を支援するツール

Slide 13

Slide 13 text

©BLUEISH 2025. All rights reserved. LangSmithを試してみる Amazon Bedrockを用いてチャット機能を構築し、LangSmithを導入 トレーシングとプロンプト管理を試します ※PythonとLangChainで記述しています(LangChainを利用していなくても導入できます)

Slide 14

Slide 14 text

©BLUEISH 2025. All rights reserved. LangSmithを試してみる Amazon Bedrockに対応したLangChainのライブラリをインストール

Slide 15

Slide 15 text

©BLUEISH 2025. All rights reserved. LangSmithを試してみる 簡易的なチャット機能を構築

Slide 16

Slide 16 text

©BLUEISH 2025. All rights reserved. LangSmithを試してみる LangSmithを導入。 HPにアクセスしサインアップ

Slide 17

Slide 17 text

©BLUEISH 2025. All rights reserved. LangSmithを試してみる APIキーを発行

Slide 18

Slide 18 text

©BLUEISH 2025. All rights reserved. LangSmithを試してみる 環境変数をアプリケーションに設定

Slide 19

Slide 19 text

©BLUEISH 2025. All rights reserved. LangSmithを試してみる 以上、環境変数を設定するだけでLangSmithが使えるようになる

Slide 20

Slide 20 text

©BLUEISH 2025. All rights reserved. トレース チャットでやり取りをして、トレースされているか確認する

Slide 21

Slide 21 text

©BLUEISH 2025. All rights reserved. トレース 環境変数で設定したプロジェクト単位で監視

Slide 22

Slide 22 text

©BLUEISH 2025. All rights reserved. トレース 個々のやり取りのトレースが記録

Slide 23

Slide 23 text

©BLUEISH 2025. All rights reserved. トレース 入力プロンプトと生成された出力、メタデータ

Slide 24

Slide 24 text

©BLUEISH 2025. All rights reserved. トレース アプリ全体としてモニタリング

Slide 25

Slide 25 text

©BLUEISH 2025. All rights reserved. トレース 可視化して確認できる

Slide 26

Slide 26 text

©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプト管理を使ってみる

Slide 27

Slide 27 text

©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプトを作成。想定する変数、モデルを指定してプロンプトの出力をテスト

Slide 28

Slide 28 text

©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプトテンプレートを保存。LangSmith上で管理できる。

Slide 29

Slide 29 text

プロンプトの変更をコミットとしてバージョン管理 ©BLUEISH 2025. All rights reserved. プロンプト管理

Slide 30

Slide 30 text

©BLUEISH 2025. All rights reserved. プロンプト管理 保存したプロンプトはアプリケーションに簡単に呼び出せる

Slide 31

Slide 31 text

©BLUEISH 2025. All rights reserved. まとめ LangSmithはLLMアプリケーションの開発・運用・改善を支援し、簡単に導入できること がわかった