Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
Search
みのるん
PRO
October 27, 2024
Technology
2k
8
Share
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
【生成AI/LLM LT大会】今注目している技術や最新動向を共有!
https://blueish.connpass.com/event/333518/
みのるん
PRO
October 27, 2024
More Decks by みのるん
See All by みのるん
Claude Codeですべての日常業務を爆速化しよう!
minorun365
PRO
3
1.9k
2026年春のAgentCoreアプデ 細かいやつ全部まとめ
minorun365
PRO
5
270
「責任あるAIエージェント」こそ自社で開発しよう!
minorun365
PRO
10
3.3k
2026年のAIエージェント構築はどうなる?
minorun365
PRO
21
12k
モダンUIでフルサーバーレスなAIエージェントをAmplifyとCDKでサクッとデプロイしよう
minorun365
PRO
6
490
Claude Codeベストプラクティスまとめ
minorun365
PRO
68
60k
AWSの新機能をフル活用した「re:Inventエージェント」開発秘話
minorun365
PRO
3
960
まだ間に合う! Agentic AI on AWSの現在地をやさしく一挙おさらい
minorun365
PRO
20
5k
【AWS re:Invent 2025速報】AIビルダー向けアップデートをまとめて解説!
minorun365
PRO
5
780
Other Decks in Technology
See All in Technology
TypeScriptで実現する既存APIを活用したリモートMCPサーバー構築 / TSKaigi 2026
soarteclab
1
270
コーディングAIが導くリスクベースド探索的テストの実践
lycorptech_jp
PRO
1
390
基礎から解説!Icebergで紐解くSnowflake×Databricks連携の現在地
cm_yasuhara
0
240
Slack MCPでインシデント対応とFAQ生成を加速する:社内ワークショップの実践
lycorptech_jp
PRO
0
380
【禁断】Obsidianの第二の脳に「知の巨人」と呼ばれた師匠の脳をロードしてみた
nagatsu
0
6k
ECSのTerraformモジュールにコントリビュートした話
harukasakihara
1
340
Copilot CLI・IDE・Web・スマホで途切れない開発フローを目指して / One Copilot flow - CLI IDE Web Mobile
aeonpeople
1
730
自作エディターをOSSにして分かった、一人に刺さる開発が世界を動かす理由
shinyasaita
1
290
The Making of AI Chips
pfn
PRO
0
710
既存プロダクトQAから新規プロダクトQAへ
ryotakahashi
0
190
Oracle AI Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
6
1.7k
Amazon Bedrock で生成AI活用サービスをセキュアに構築する方法
takanorig
1
110
Featured
See All Featured
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
70
39k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
Designing for Timeless Needs
cassininazir
1
230
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
190
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
How to make the Groovebox
asonas
2
2.2k
Into the Great Unknown - MozCon
thekraken
41
2.5k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Transcript
ΈͷΔΜ !NJOPSVO --.ΞϓϦΛ 3BHBTͰධՁͯ͠ -BOHGVTFͰՄࢹԽ͠Α͏ʂ
XIPBNJ ޚా ູʢΈͷΔΜʣ!NJOPSVO ςοΫΤόϯδΣϦετ ,%%*ΞδϟΠϧ։ൃηϯλʔגࣜձࣾʢ,"(ʣ +"846(ӡӦ ౦ژࢧ෦ 43&ࢧ෦ /8+"84 •
"84$PNNVOJUZ)FSP • "844BNVSBJ • +BQBO"845PQ&OHJOFFS • +BQBO"84"MM$FSUT&OHJOFFS
Έͳ͞Μɺ --.ΞϓϦ࡞ͬͯ·͔͢ʁ
ͦΖͦΖɺ3"(νϟοτϘοτͷ1P$ ͖͖ͯͨํ͍ΔͷͰʜʁ
ੜ"*ΞϓϦͷ1P$Λଔۀͯ͠ ຊ൪ӡ༻ਐΉͨΊʹ ͔ܽͤͳ͍ཁૉͱ͍͑ʜ
ੜ"*ΞϓϦͷ1P$Λଔۀͯ͠ ຊ൪ӡ༻ਐΉͨΊʹ ͔ܽͤͳ͍ཁૉͱ͍͑ʜ ࢹͱධՁʂ
ᶃ ࢹฤ
ͱ͋ΔΞδϟΠϧ։ൃاۀͷ ΤϯδχΞɺΧάΧά͘Μ 3"(νϟοτϘοτΛߏங͠·ͨ͠
͋Δɺ͓٬͞·͔Β࿈བྷ͕ʜ ࠷ۙɺࣾһ͔Β ʮճ࣭͕མͪͨʯ ͱ͍͏ਃࠂ͕ ૿͍͑ͯΔΜͰ͕͢ʜ
͔֬ʹɺલਖ਼Ͱ͖͍ͯͨࣾφϨοδ2"ʹ ޡ͢ΔΑ͏ʹͳ͍ͬͯΔ ,"(ࣾͷ ެࣜΏΔΩϟϥʁ ʢώϯτɿௗྨʣ ΧάόʔυͰ͢ʢେӕʣ
͍͍ͬͨྼԽՕॴͲͩ͜Ζ͏ʜ ϓϩϯϓτ ςϯϓϨʔτ ݕࡧΫΤϦʔ ݕࡧ݁Ռ ճੜ
ϓϩϯϓτͱੜ݁Ռ͚ͩͰΘ͔Βͳ͍ʂ ,"(ࣾͷϚείοτ ΩϟϥΫλʔʁ ʢώϯτɿௗྨʣ ΧάόʔυͰ͢ʢେӕʣ ॾʑͷॲཧ
͔ͱ͍ͬͯɺຖճϩάړΔͷ͍ͩͿਏ͍ʜ
҆৺͍ͯͩ͘͠͞ɺ --.ΞϓϦઐ༻ͷ ࢹπʔϧ͕͋Γ·͢Α
༗໊ͳ--.ΞϓϦࢹπʔϧ -BOH$IBJO͕ࣾఏڙɻ 4BB4͕ͩɺ՝ۚ͢Ε ηϧϑϗετՄೳ -BOH4NJUI෩ͷػೳΛ 044ͱͯ͠ެ։ɻ खܰʹࣗڥͰಈ͔ͤΔ
ࠓճܖͳ͠ͰࢼͤΔ-BOHGVTFΛհ -BOH$IBJO͕ࣾఏڙɻ 4BB4͕ͩɺ՝ۚ͢Ε ηϧϑϗετՄೳ -BOH4NJUI෩ͷػೳΛ 044ͱͯ͠ެ։ɻ खܰʹࣗڥͰಈ͔ͤΔ
ίϯςφͱ%#͕༻ҙͰ͖Ε0,ɻ "84ͳΒ"QQ3VOOFSʴ3%4ͳͲ "84ΞΧϯτ "QQ3VOOFS 3%4 GPS1PTUHSF42- -BOHGVTF αʔόʔ σʔλϕʔε
ΞϓϦͷܭ؆୯ʂ ᶃ ڥมʹೝূΩʔͱαʔόʔ63-Λઃఆ ᶄ ࢹ͍ͨؔ͠ΛσίΔ PS-BOH$IBJOͳΒίʔϧόοΫΛ͢ Ҏ্ʂ FOW -"/('64&@4&$3&5@,&: -"/('64&@16#-*$@,&:
-"/('64&@)045
ܭޙɺ࣮ࡍʹΞϓϦΛಈ͔ͯ͠ΈΔͱʜ ෦ॲཧ͕Ұྎવʹʂ ॲཧ࣌ؒɺ τʔΫϯɺ ίετ ֤۠ؒͷ ೖग़ྗ༰ τϨʔεͷ ۠ؒྨ
Ͳ͜ʹ͕͔͔͍࣌ؒͬͯΔ͔ಛఆͰ͖Δ ΄ͱΜͲ͕--.ͷਪ࣌ؒ
ϓϩϯϓτςϯϓϨʔτ (6*Ͱཧˍߋ৽Ͱ͖Δʂ
ςετ༻ͷσʔληοτཧͰ͖Δʂ
ΧάΧά͘Μɺແࣄʹ ՕॴΛಛఆͰ͖·ͨ͠👏 ͊ɺͯ͞ Ϣʔβʔ͞Μ͕ؒҧͬͯ σʔλফͪ͠Όͬͯͨͷ͔ʜ
ᶄ ධՁฤ
ࠓ͓٬͞·͔ΒΫϨʔϜ͕ʂ ͦͦɺ ࣭ྼԽʹͬͱ ૣ͘ؾ͚ͮͳ͍ͷʁʁ
͜ͷ िؒεϓϦϯτͰ සൟʹΞϓσ͢Δ͠ɺ ຖճཏతͳධՁ ݱ࣮తͰͳ͍ʜ
҆৺͍ͯͩ͘͠͞ɺ --.ΞϓϦઐ༻ͷ ධՁπʔϧ͕͋Γ·͢Α
ͦΕ3BHBTʂ
࣮ଶ1ZUIPOϥΠϒϥϦɻ ৭ΜͳϝτϦΫεͰճ࣭ΛԽͯ͘͠ΕΔ 'BJUIGVMOFTT ʢ৴པੑʣ 3FTQPOTF3FMFWBODZ ʢԠͷؔ࿈ੑʣ $POUFYU1SFTJDJPO ʢจ຺ਫ਼ʣ $POUFYU3FDBMM ʢจ຺ճऩʣ
-BOHGVTFʹධՁϝτϦΫε͋Γ·͕͢ɺ 3BHBTಛʹఆධ͕͋Γ·͢
ͪͳΈʹ࠷ۙɺWΞϓσ͞Ε·ͨ͠ɻ 3"(͚ͩͰͳ͘ΤʔδΣϯτʹରԠ 🎉
ͦΜͳ3BHBTͷ͍ํ؆୯ʂ ᶃ ͍͍ͨϝτϦΫε ʴධՁʹ͏"*ϞσϧΛࢦఆ ᶄ --.ΞϓϦͷೖग़ྗΛ σʔληοτʹઃఆͯ͠ɺ ධՁϝιουΛ࣮ߦʢඇಉظʣ ᶅ ࢦఆͨ͠ϝτϦΫεͷ
͕ग़ྗ͞ΕΔʂ
ͨͩɺ͜ͷ͕ίϯιʔϧ ϩάʹग़͖ͯͨͱ͜ΖͰѻ͍ʹࠔΔ😅 Ͱ͍ͬͯ͏
ͦ͏ͩɺ͖ͬ͞ͷ-BOHGVTFʹ ৯ΘͤΕ͍͍ͷͰʁ
-BOHGVTFΫϥΠΞϯτͷTDPSFϝιουͰ τϨʔεʹͿͪࠐΉ͚ͩʂ
͋ͱτϨʔεҰཡΛோΊΔ͚ͩͰɺ ࣭ྼԽͨ͠ΒҰͰߜΓࠐΊΔʂ
ΧάΧά͘Μ ʮDPOUFYU@SFDBMMʯϝτϦΫεͷมԽʹΑΓɺ ࠶ൃ࣌ʹඵͰؾ͚ͮ·ͨ͠👏 ͓ɺͳΜ͔ٸʹ ݕࡧ݁ՌΛ Θͳ͘ͳͬͨͳ 3FDBMM͕ ͍ͭ͋ΔͰ
αΫοͱࢼͤΔຊޠͷೖهࣄॻ͖·ͨ͠ʂ
࠷ޙʹએ
ɺϥεϕΨεͷ"84SF*OWFOUͰొஃ͠·͢ʂ ʮΈͷΔΜʯͰ ݕࡧ͢Δͱʜ ۭ੮͋ͱΘ͔ͣʂ ݱߦ͔ͳ͍ਓ ৴͋Δ͔ʁ