Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Text-to-SQLをLangSmithで評価
Search
西岡 賢一郎 (Kenichiro Nishioka)
July 26, 2024
Business
0
280
Text-to-SQLをLangSmithで評価
機械学習の社会実装勉強会第37回 (
https://machine-learning-workshop.connpass.com/event/324630/
) の発表資料です。
西岡 賢一郎 (Kenichiro Nishioka)
July 26, 2024
Tweet
Share
More Decks by 西岡 賢一郎 (Kenichiro Nishioka)
See All by 西岡 賢一郎 (Kenichiro Nishioka)
Claude Codeを使った情報整理術
knishioka
20
12k
Claude Skillsで"仕事の型"を配布する
knishioka
0
280
Claude Agent SDKで始める実践的AIエージェント開発
knishioka
0
130
AIがAIを拡張する時代へ ~Claude Codeで実現する高品質文書作成~
knishioka
0
160
MLflow × LLM 生成AI時代の実験管理とリスク低減
knishioka
0
150
Conductor: Git Worktreeで実現する並列AIコーディング
knishioka
0
120
ローカルLLMでファインチューニング
knishioka
0
2.1k
自作MCPサーバ入門
knishioka
0
140
成功と失敗の実像と生成AI時代の展望
knishioka
0
110
Other Decks in Business
See All in Business
組織でAIをQAに活用する仕組みづくり / Scaling AI-Powered QA Across Your Organization
medley
0
1k
(15枚)マイクロマネジメントとは何か? 問題点は? 正しいマネジメントとは何かを考える(AI活用スライド)
nyattx
PRO
2
2.4k
株式会社アペルザ_中途採用向け会社紹介資料
hr_team_aperza
4
140k
未経験PdM40%のプロダクトマネージャー組織を作った過程でわかった再現性について
numashi
1
750
株式会社TENET 会社紹介資料
tenetinc
1
22k
数字で見る松岡会計事務所
wf714201
0
330
AIを使ってライティングを楽に!MCP Serverの活用
hebiko
0
250
カンパニーデック 2025.12.25
toggletest
0
1.8k
対立を超えてビジネス、開発、顧客が本当に欲しかったものを全両立するプロダクト組織の作り方/trade-off basic rsgt2026
moriyuya
1
1.3k
採用向け会社紹介資料_20260105.pdf
yoshikatsu0423
0
120
コーポレートストーリー(新規投資家様向け会社説明資料)
gatechnologies
1
16k
Dayz株式会社 / 会社案内
dayzjp
PRO
0
210
Featured
See All Featured
Site-Speed That Sticks
csswizardry
13
1k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
37
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
78
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
41
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
54
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
The Limits of Empathy - UXLibs8
cassininazir
1
200
How to Think Like a Performance Engineer
csswizardry
28
2.4k
Believing is Seeing
oripsolob
0
19
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
115
100k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
0
220
Transcript
Text-to-SQLをLangSmithで評価 2024/07/27 第37回勉強会
自己紹介 • 名前: 西岡 賢一郎 ◦ Twitter: @ken_nishi ◦ note:
https://note.com/kenichiro ◦ YouTube: 【経営xデータサイエンスx開発】西岡 賢一郎のチャンネル (https://www.youtube.com/channel/UCpiskjqLv1AJg64jFCQIyBg) • 経歴 ◦ 東京大学で位置予測アルゴリズムを研究し博士 (学術) を取得 ◦ 東京大学の博士課程在学中にデータサイエンスをもとにしたサービスを提供する株式会社ト ライディアを設立 ◦ トライディアを別のIT会社に売却し、CTOとして3年半務め、2021年10月末にCTOを退職 ◦ CDPのスタートアップ (Sr. CSM)・株式会社データインフォームド (CEO)・株式会社ディース タッツ (CTO) ◦ 自社および他社のプロダクト開発チーム・データサイエンスチームの立ち上げ経験
Text-to-SQLの背景と必要性
Text-to-SQLとは • 自然言語の質問やコマンドをSQLクエリに変換する技術 • 例: "30歳以上のユーザーの平均年齢は?" → "SELECT AVG(age) FROM
users WHERE age >= 30;" • Text-to-SQLの仕組み ◦ 自然言語理解 (NLU): ▪ ユーザーが入力した自然言語の質問や要求を解析して、意図を理解します。 ◦ 文脈と構造の抽出: ▪ 質問の文脈や構造を抽出し、どのデータベースのテーブルやカラムが関係して いるかを特定します。 ◦ SQLクエリ生成: ▪ 抽出された情報を基に、適切なSQLクエリを生成します。 ◦ 実行と結果の表示: ▪ 生成されたSQLクエリをデータベースに対して実行し、その結果をユーザーに 返します。
なぜText-to-SQLが必要か • データベースへのアクセシビリティ向上 ◦ SQL非専門家でもデータ分析が可能に ◦ ビジネスユーザーが直接データにアクセス可能 • 開発効率の向上 ◦
繰り返し行われるクエリ作成の自動化 ◦ プロトタイピングの迅速化 • 自然言語インターフェースの実現 ◦ チャットボットやAIアシスタントへの統合 ◦ よりユーザーフレンドリーなデータ探索ツールの 開発 データ抽出依頼 データ抽出 Text-to SQLで データ抽出
Text-to-SQLの評価方法
評価指標の例 1. 正確性 (Correctness) ◦ 生成されたSQLが意図した結果を返すか 2. 効率性 (Efficiency) ◦
生成されたSQLが最適化されているか 3. 可読性 (Readability) ◦ 生成されたSQLが人間にとって理解しやすいか 4. 実行精度 (Execution Accuracy) ◦ 実行結果が期待される結果と一致するか
LangSmithを使ったText-to-SQL評価のデモ
LangSmithの概要 LLMアプリケーション開発でよく使われるLangChainのサー ビスである「LangSmith」は、LLMを楽に評価できる機能を 提供している。 • Evaluatorの設定 ◦ コードを書かずにEvaluatorを設定し、データ セットに紐づけられる •
PlayGround ◦ プログラムを書かずにプロンプトやモデルの設 定をテスト • 中間ステップの評価 ◦ RAGパイプラインなどの中間ステップを詳細に 評価 • 標準Evaluatorの利用: ◦ カスタムコードを書くことなく、標準の Evaluatorを使用 • Annotationの利用 ◦ 実行結果に注釈を追加し、詳細なフィードバッ クを提供
デモ 評価プロセス 1. 評価対象のText-to-SQL modelの定義 2. 評価用データセットの作成 3. カスタム評価器の設定 4.
評価の実行と結果の分析 デモの主要ポイント • SQLiteデータベースの使用 • LangChainのSQLエージェントの活用 • カスタムLLM評価器の実装 • 効率性スコアの計算 • LangSmithでの評価実行と結果の可視化
まとめ • Text-to-SQLはデータアクセシビリティと開発効率を向上 • 多面的な評価が重要: 正確性、効率性、可読性、実行精度 • LangSmithを使用することで、包括的かつ効率的な評価が可能 • 継続的な改善と最適化のためのツールとしてのLangSmithが便利