Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLM Observabilityによる 対話型音声AIアプリケーションの安定運用
Search
Hiroyuki Moriya
January 16, 2026
Programming
500
2
Share
LLM Observabilityによる 対話型音声AIアプリケーションの安定運用
Hiroyuki Moriya
January 16, 2026
More Decks by Hiroyuki Moriya
See All by Hiroyuki Moriya
少人数プロダクト開発において SRE業務を増やさない工夫
gekko0114
0
970
音声データ解析パイプラインの Software Engineering / Context Engineering
gekko0114
0
310
IVRyエンジニア忘年LT大会2024 LLM監視の最前線
gekko0114
1
410
kueueに新しいPriorityClassを足した話
gekko0114
0
790
JobSet超入門
gekko0114
1
1.2k
Other Decks in Programming
See All in Programming
権限チェックの一貫性を型で守る TypeScript による多層防御
mnch
3
580
自動レビューエンジンの実装と運用 ~レビューのない世界へ~
kurukuru1999
2
250
TypeScriptだけでAIエージェントを作る フロント・エージェント・インフラのフルスタック実践
har1101
6
990
Old Dog, New Tricks: The Java 25 Reinvention - JNation
bazlur_rahman
0
120
ビジネスモデルから紐解く、AI+型駆動開発
hirokiomote
2
1.9k
AlarmKitで明後日起きれるアラームアプリを作る
trickart
0
150
AI駆動開発勉強会 広島支部 第一回勉強会 AI駆動開発概要とワークショップ
hayatoshimiu
0
360
運用エージェントは "作る" から "育てる" へ - 記憶と自己進化の3層設計パターン / self-evolving-agents-three-layer-agent-design
gawa
10
1.2k
Augmenting AI with the Power of Jakarta EE
ivargrimstad
0
140
Skillは並べた。動かなかった。契約で繋いだ。— 65個のSkillから、自走する開発サイクルへ
junholee
0
720
Copilot CLI の継戦能力を高める コンテキスト管理
nozomutu
1
940
CLIであることを活かしたGitHub Copilot CLI活用術 / GitHub Copilot CLI Pro Tips & Tricks
nao_mk2
1
970
Featured
See All Featured
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
Documentation Writing (for coders)
carmenintech
77
5.3k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
150
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
How to make the Groovebox
asonas
2
2.2k
Mobile First: as difficult as doing things right
swwweet
225
10k
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Transcript
~ LLMプロダクトの信頼性を上げるには? ~ LLM Observabilityによる 対話型⾳声AIアプリケーションの安定運⽤ 2026/01/16 Hiroyuki Moriya
LLMを組み込むと、最⾼のプロダクトが作れる! 2
LLMを組み込むと、最⾼のプロダクトが作れる! 3
LLMプロダクトを 安定的にプロダクション運⽤するには? 4
5 LLMプロダクトの開発 LLM APIの監視・運用 Hiroyuki Moriya (X: @Yamori_ds) AI engineer
/ SRE ⾃⼰紹介
6 1. IVRyについて 2. プロダクトの課題 3. 解決策 4. まとめ アジェンダ
IVRyについて 7
confidential 会社紹介 8 会社名 代表取締役 事業内容 住所 資本⾦等 設⽴年⽉ 株式会社IVRy(アイブリー)
奥⻄ 亮賀(Ryoga Okunishi) クラウド型AI電話SaaS(アイブリー)の運営 〒108-0073東京都港区三⽥三丁⽬5-19 住友不動産東京三⽥ガーデンタワー10F 46.1億円(準備⾦含む) 2019年3⽉
9 電話⾃動応答サービス
10 システムアーキテクチャ
11 システムアーキテクチャ
12 システムアーキテクチャ
IVRyの技術スタック 13
電話は今でも最重要連絡⼿段 14
15 あらゆる業種‧企業規模のお客様に導⼊
Medical appointments Restaurant reservations Hotel bookings FAQ inquiries 様々なユースケースに対応している 16
17 1. IVRyについて 2. プロダクトの課題 3. 解決策 4. まとめ アジェンダ
ハルシネーションの 抑制 Challenge #1 会話速度の安定化 Challenge #2 LLM APIを本番運⽤する難しさ 18
耐障害性能の確保 Challenge #3
ハルシネーションの抑制 19
20 LLMはハルシネーションする Problem
困難は分割せよ 21 Solution
AI workflowによる実装 22 1つのタスクを複数のLLM componentで分割して処理する → validation‧error分析が⾏えるようになり、安定した結果を出⼒できる
23 AI workflowの⼀例
24 Output has changed LLM APIのアウトプットが 変動することがある
確認を怠らない 25 Solution
26 1. Test cases 2. Run consistency tests 3. Notify
/ record results LLM APIのアウトプットの⼀貫性を 定期的に監視する
⾃動 電話 e2e test 27
28
29
30
31 Merge code Deploy latest code Execute automated phone E2E
tests Monitor on Datadog LLM Observability 電話 e2e testをコードマージ時に 実⾏させる
32 Datadog LLM Observability による監視
会話速度の安定化 33
会話速度の不安定化は、ユーザー体験を損ねる 34 Problem
完璧を求めない 35 Solution
36 Fast, stable, and cheap Slower, more $$$ Stability &
performance > latest models 自分たちのユースケースに合っ たモデル選定をする。
システム監視を怠らない 37 Solution
38 Datadog Inferred Servicesによる 外部通信の監視
39 Inferred serviceを通して、多くのmetricsを監視できる
耐障害性能の確保 40
システム障害は多くの影響を引き起こす 41 Problem
LLM APIは不安定である 42 LLM API Status in one day
最悪の事態に備える 43 Solution
44 複数のLLM APIを利用して、 fallbackシステムを実装する LLM fallback strategy
45 緊急時の 電話転送機能
困難は分割せよ / 確認を怠らない 01 ハルシネーションの抑制 完璧を求めない / システム監視を怠らない 02 会話を自然な速度にするために
最悪の事態に備える 03 障害への対策 まとめ: LLMをプロダクト 運⽤するために 46
47 We are Hiring!