Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLM Observabilityによる 対話型音声AIアプリケーションの安定運用
Search
Hiroyuki Moriya
January 16, 2026
Programming
2
120
LLM Observabilityによる 対話型音声AIアプリケーションの安定運用
Hiroyuki Moriya
January 16, 2026
Tweet
Share
More Decks by Hiroyuki Moriya
See All by Hiroyuki Moriya
IVRyエンジニア忘年LT大会2024 LLM監視の最前線
gekko0114
1
370
kueueに新しいPriorityClassを足した話
gekko0114
0
770
JobSet超入門
gekko0114
1
1k
Other Decks in Programming
See All in Programming
AI時代を生き抜く 新卒エンジニアの生きる道
coconala_engineer
1
520
Go コードベースの構成と AI コンテキスト定義
andpad
0
160
コマンドとリード間の連携に対する脅威分析フレームワーク
pandayumi
1
210
AI Agent Dojo #4: watsonx Orchestrate ADK体験
oniak3ibm
PRO
0
130
React 19でつくる「気持ちいいUI」- 楽観的UIのすすめ
himorishige
11
5.1k
AIで開発はどれくらい加速したのか?AIエージェントによるコード生成を、現場の評価と研究開発の評価の両面からdeep diveしてみる
daisuketakeda
1
660
はじめてのカスタムエージェント【GitHub Copilot Agent Mode編】
satoshi256kbyte
0
160
AI Agent の開発と運用を支える Durable Execution #AgentsInProd
izumin5210
7
1.5k
メルカリのリーダビリティチームが取り組む、AI時代のスケーラブルな品質文化
cloverrose
2
460
インターン生でもAuth0で認証基盤刷新が出来るのか
taku271
0
150
まだ間に合う!Claude Code元年をふりかえる
nogu66
5
930
AIによるイベントストーミング図からのコード生成 / AI-powered code generation from Event Storming diagrams
nrslib
2
1.3k
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Practical Orchestrator
shlominoach
190
11k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
54
49k
How to train your dragon (web standard)
notwaldorf
97
6.5k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
230
Site-Speed That Sticks
csswizardry
13
1k
Thoughts on Productivity
jonyablonski
74
5k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
120
Testing 201, or: Great Expectations
jmmastey
46
7.9k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Optimizing for Happiness
mojombo
379
70k
Exploring anti-patterns in Rails
aemeredith
2
220
Transcript
~ LLMプロダクトの信頼性を上げるには? ~ LLM Observabilityによる 対話型⾳声AIアプリケーションの安定運⽤ 2026/01/16 Hiroyuki Moriya
LLMを組み込むと、最⾼のプロダクトが作れる! 2
LLMを組み込むと、最⾼のプロダクトが作れる! 3
LLMプロダクトを 安定的にプロダクション運⽤するには? 4
5 LLMプロダクトの開発 LLM APIの監視・運用 Hiroyuki Moriya (X: @Yamori_ds) AI engineer
/ SRE ⾃⼰紹介
6 1. IVRyについて 2. プロダクトの課題 3. 解決策 4. まとめ アジェンダ
IVRyについて 7
confidential 会社紹介 8 会社名 代表取締役 事業内容 住所 資本⾦等 設⽴年⽉ 株式会社IVRy(アイブリー)
奥⻄ 亮賀(Ryoga Okunishi) クラウド型AI電話SaaS(アイブリー)の運営 〒108-0073東京都港区三⽥三丁⽬5-19 住友不動産東京三⽥ガーデンタワー10F 46.1億円(準備⾦含む) 2019年3⽉
9 電話⾃動応答サービス
10 システムアーキテクチャ
11 システムアーキテクチャ
12 システムアーキテクチャ
IVRyの技術スタック 13
電話は今でも最重要連絡⼿段 14
15 あらゆる業種‧企業規模のお客様に導⼊
Medical appointments Restaurant reservations Hotel bookings FAQ inquiries 様々なユースケースに対応している 16
17 1. IVRyについて 2. プロダクトの課題 3. 解決策 4. まとめ アジェンダ
ハルシネーションの 抑制 Challenge #1 会話速度の安定化 Challenge #2 LLM APIを本番運⽤する難しさ 18
耐障害性能の確保 Challenge #3
ハルシネーションの抑制 19
20 LLMはハルシネーションする Problem
困難は分割せよ 21 Solution
AI workflowによる実装 22 1つのタスクを複数のLLM componentで分割して処理する → validation‧error分析が⾏えるようになり、安定した結果を出⼒できる
23 AI workflowの⼀例
24 Output has changed LLM APIのアウトプットが 変動することがある
確認を怠らない 25 Solution
26 1. Test cases 2. Run consistency tests 3. Notify
/ record results LLM APIのアウトプットの⼀貫性を 定期的に監視する
⾃動 電話 e2e test 27
28
29
30
31 Merge code Deploy latest code Execute automated phone E2E
tests Monitor on Datadog LLM Observability 電話 e2e testをコードマージ時に 実⾏させる
32 Datadog LLM Observability による監視
会話速度の安定化 33
会話速度の不安定化は、ユーザー体験を損ねる 34 Problem
完璧を求めない 35 Solution
36 Fast, stable, and cheap Slower, more $$$ Stability &
performance > latest models 自分たちのユースケースに合っ たモデル選定をする。
システム監視を怠らない 37 Solution
38 Datadog Inferred Servicesによる 外部通信の監視
39 Inferred serviceを通して、多くのmetricsを監視できる
耐障害性能の確保 40
システム障害は多くの影響を引き起こす 41 Problem
LLM APIは不安定である 42 LLM API Status in one day
最悪の事態に備える 43 Solution
44 複数のLLM APIを利用して、 fallbackシステムを実装する LLM fallback strategy
45 緊急時の 電話転送機能
困難は分割せよ / 確認を怠らない 01 ハルシネーションの抑制 完璧を求めない / システム監視を怠らない 02 会話を自然な速度にするために
最悪の事態に備える 03 障害への対策 まとめ: LLMをプロダクト 運⽤するために 46
47 We are Hiring!