Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
マルチエージェント LLMチャットアプリケーションの 精度&レスポンス速度向上戦略
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
PharmaX(旧YOJO Technologies)開発チーム
August 06, 2024
960
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
マルチエージェント LLMチャットアプリケーションの 精度&レスポンス速度向上戦略
PharmaX(旧YOJO Technologies)開発チーム
August 06, 2024
More Decks by PharmaX(旧YOJO Technologies)開発チーム
See All by PharmaX(旧YOJO Technologies)開発チーム
PdMによるLiveバイブコーディング〜プロトタイプ開発実践〜
pharma_x_tech
1
78
2025.10.28_CodexとClaude Codeの比較検討 社内座談会
pharma_x_tech
2
620
LLMのアウトプットの評価と改善 〜DSPyによるプロンプト最適化入門によせて〜
pharma_x_tech
6
1.2k
2025.09.02_AIコーディングを利用した開発自動化を目指しての座談会
pharma_x_tech
5
350
AIコーディングを前提にした開発プロセス再設計〜開発生産性向上に向けた試行錯誤〜
pharma_x_tech
4
440
AIエージェントの評価・改善サイクル
pharma_x_tech
2
620
MCP & Computer Useをフル活用した社内効率化事例〜現在地と将来の展望
pharma_x_tech
1
460
AIエージェントの継続的改善のためオブザーバビリティ
pharma_x_tech
7
2.6k
Roo CodeとClaude Code比較してみた
pharma_x_tech
5
6.3k
Featured
See All Featured
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
BBQ
matthewcrist
89
10k
ラッコキーワード サービス紹介資料
rakko
1
3.7M
How GitHub (no longer) Works
holman
316
150k
Are puppies a ranking factor?
jonoalderson
1
3.6k
Ethics towards AI in product and experience design
skipperchong
2
310
A Tale of Four Properties
chriscoyier
163
24k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
370
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
Mobile First: as difficult as doing things right
swwweet
225
10k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
440
Transcript
マルチエージェント LLMチャットアプリケーションの 精度&レスポンス速度向上戦略 2024.08.07 # pharmax_tech_collabo
(C)PharmaX Inc. 2024 All Rights Reserve 2 自己紹介 上野彰大 PharmaX共同創業者・エンジニアリング責任者
好きな料理はオムライスと白湯とコーラ マイブームはLLMとRust X:@ueeeeniki
(C)PharmaX Inc. 2024 All Rights Reserve 3 趣味で勉強会コミュニティ StudyCoも運営 自己紹介
(C)PharmaX Inc. 2024 All Rights Reserve 4 医療アドバイザーに体調 のことをいつでも気軽に相 談できる
相談型医療体験 30種類以上の漢方薬からあ なたに合ったものを月毎に 提案 パーソナライズ漢方薬 定期的に漢方をお届けし、 一人ひとりに寄り添うかか りつけ医療を提供 継続的なかかりつけ 一生涯にわたって寄り添うかかりつけ漢方薬局「 YOJO」
(C)PharmaX Inc. 2024 All Rights Reserve 5 今回対象とするアプリケーション • ユーザーからのメッセージを受信したタイミングで
LLMによる返信のサジェストが作られ、一部の メッセージは自動送信&必要があれば薬剤師が確認・修正して送る ◦ 自動で送る場合は当然精度が重要 ◦ サジェストされる場合も、そのまま送信することができれば、返信速度が速くなる&生産性が 高くなるので精度が高いことはやはり重要 • 管理画面上でボタンを押す(ショートカットキーをタイプする)ことでもチャットがサジェストされる 薬剤師にチャットの返答をサジェッションするために LLMを活用している
(C)PharmaX Inc. 2024 All Rights Reserve 6 今回対象とするアプリケーション
(C)PharmaX Inc. 2024 All Rights Reserve 7 LLMによるメッセージサジェスト機能の効果 ユーザーからの返信数・割合 返信ありの件数
返信なしの件数 返信ありの件数 返信なしの件数 LLMのサジェストをそのまま投稿 薬剤師が1から作成して投稿 ユーザーからの返信 速度 LLMのサジェストをそのまま投稿したメッセージに対するユーザーの返信 薬剤師が1から作成して投稿したメッセージに対するユーザーの返信
(C)PharmaX Inc. 2024 All Rights Reserve 8 チャットアプリケーションにおける返信速度の重要性 • LINEというインターフェースの特性上、数分〜
10分程度の待ち時間は許容されると考えていた ◦ アンケートでも返信速度に対する不満は多くはなかった • 実際には、LLMのサジェスト機能を導入して返信速度が早くなった結果、ユーザーからの返信 率・返信速度、さらには購入率までもが向上した ◦ 感覚的には、ユーザーは10秒以内でLINEを閉じず、30秒以内でスマホを閉じないという 境界があるのではないか? • チャットアプリケーションであってもある程度の返信速度の担保の重要性を悟った チャットアプリケーションでは、 LLMを活用して返信速度を向上できればポジティブな影響がある
(C)PharmaX Inc. 2024 All Rights Reserve 9 YOJOにおけるフローエンジニアリング ① ②
③ ④ ⑤
(C)PharmaX Inc. 2024 All Rights Reserve 10 • ①ルールベースでLLM処理可能かを判定 •
②LLMで会話を分類しLLM処理可能かを判定 • ③LLMで次のフェーズに移るべきかどうかを判定 • ④LLMでメッセージを作成 • ⑤LLMで作成されたメッセージを評価( LLM-as-a-Judge)し、一定の水準を下回ったら再生成し て、クリアしたもののみをサジェストする YOJOにおけるフローエンジニアリング YOJOでは、メッセージがサジェストされるまでに複数の処理( agentic workflows)を行う
(C)PharmaX Inc. 2024 All Rights Reserve 11 各フェーズで同様のフローエンジニアリングを定義している(下図では①のルールベース判定は省略) ② ③
④ ⑤ YOJOにおけるフローエンジニアリング ⑤ ⑤ ③ ③ ② ④ ② ④ ② ④
(C)PharmaX Inc. 2024 All Rights Reserve 12 フローエンジニアリングのメリット・デメリット フローエンジニアリングを実践することで、精度は向上するがレスポンス速度は遅くなってしまう •
単一の目的を上手くこなす小さなエージェントを組み合わせることで、処理系全体で精度を向上 させることができる • エージェントのタスクを単一にすることでプロンプトの肥大を避け、保守性を向上させることもでき る ◦ 巨大なプロンプトは変更の影響をコントロールできなくなっていく • 一方で、最終的な出力までに複数の処理が行われるため、処理系全体のレスポンス速度は遅く なってしまう傾向にある
(C)PharmaX Inc. 2024 All Rights Reserve 13 フローエンジニアリングによる処理系の設計 単一の巨大プロンプトを活用したデザイン フローエンジニアリングを活用したデザイン
フローエンジニアリングでは、タスクを分割しエージェントを組合わせて最終的な目的を達成する
(C)PharmaX Inc. 2024 All Rights Reserve 14 単一の巨大プロンプトのイメージ 1つのエージェントに多くのタスクを任せる方式は、プロンプトの肥大化を招く ##
質問分類のルール ### 労務系 有給や休暇などの就業規則に関わる質問は労務として扱う ーーーー ### 人事系 社内の教育制度、採用活動などに関わる質問は労務として扱う (略) ーーーーーーーーーーーーーーー ## 回答作成のルール ### 労務系の質問への回答のルール ①〇〇 ②□□ ③△△ ーーーー ### 人事系の質問への回答のルール ①〇〇 ②□□ (略)
(C)PharmaX Inc. 2024 All Rights Reserve 15 単一の巨大プロンプトの分割 1つのプロンプトで行おうとしている複数のタスクを分割することができるはず ##
質問分類のルール ### 労務系 有給や休暇などの就業規則に関わる質問は労務として扱う ーーーー ### 人事系 社内の教育制度、採用活動などに関わる質問は労務として扱う (略) ーーーーーーーーーーーーーーー ## 回答作成のルール ### 労務系の質問への回答のルール ①〇〇 ②□□ ③△△ ーーーー ### 人事系の質問への回答のルール ①〇〇 ②□□ (略) ①質問分類 質問回答作 成 ②労務系質問回答作 成 ③人事系質問回答作 成
(C)PharmaX Inc. 2024 All Rights Reserve 16 フローエンジニアリングによる処理系の設計 単一の巨大プロンプトを活用したデザイン フローエンジニアリングを活用したデザイン
フローエンジニアリングでは、タスクを分割しエージェントを組合わせて最終的な目的を達成する ① ② ③
(C)PharmaX Inc. 2024 All Rights Reserve 17 投機的な並列実行による処理時間の短縮 処理結果が無駄になることを許容して投機的に実行することで、処理時間を短縮することができる ①
(C)PharmaX Inc. 2024 All Rights Reserve 18 投機的な並列実行による処理時間の短縮 処理結果が無駄になることを許容して投機的に実行することで、処理時間を短縮することができる ①
②
(C)PharmaX Inc. 2024 All Rights Reserve 19 投機的な並列実行による処理時間の短縮 処理結果が無駄になることを許容して投機的に実行することで、処理時間を短縮することができる 作成した回答は捨てる
① ② ③
(C)PharmaX Inc. 2024 All Rights Reserve 20 まとめ マルチエージェントLLMチャットボットの精度 &レスポンス速度向上戦略についてお話した
• LLMチャットボットでも精度と速度を高次元で両立させることは重要 ◦ YOJOの例では、ユーザーからの返信率・返信速度、購入率が明確に向上した • フローエンジニアリングを実践することで、精度は向上するが、処理系全体のレスポンス速度は 遅くなってしまう可能性がある • 投機的な並列処理を行うことで処理時間を短縮することができる ◦ 投機的な処理を行うことで、コストは割高になるので、リリース後にデータセットを収集し、 一部の処理のML化、あるいは安価のモデルのfine-tuningを行うことでコストダウンも狙 う