完全自律型AIエージェントとAgentic Workflow〜ワークフロー構築という現実解

by PharmaX（旧YOJO Technologies）開発チーム

Slide 1

Slide 1 text

完全自律型 AIエージェントと Agentic Workflow 〜ワークフロー構築という現実解 2025.1.14 #pharmax_tech_collabo

Slide 2

Slide 2 text

（C）PharmaX Inc. 2024 All Rights Reserve 2 自己紹介上野彰大 PharmaX共同創業者・エンジニアリング責任者好きな料理はオムライスと白湯とコーラマイブームはLLMとRust X：@ueeeeniki

Slide 3

Slide 3 text

（C）PharmaX Inc. 2024 All Rights Reserve 3 個人でも勉強会コミュニティ StudyCoも運営自己紹介

Slide 4

Slide 4 text

（C）PharmaX Inc. 2024 All Rights Reserve 4 自社としては LLMを中心に勉強会を月 1回程度開催自己紹介

Slide 5

Slide 5 text

（C）PharmaX Inc. 2024 All Rights Reserve 5 医療アドバイザーに体調のことをいつでも気軽に相談できる相談型医療体験 30種類以上の漢方薬からあなたに合ったものを月毎に提案パーソナライズ漢方薬定期的に漢方をお届けし、一人ひとりに寄り添うかかりつけ医療を提供継続的なかかりつけ一生涯にわたって寄り添うかかりつけ漢方薬局「 YOJO」

Slide 6

Slide 6 text

（C）PharmaX Inc. 2024 All Rights Reserve 6 患者向けチャットシステムと薬剤師向け管理画面を自作患者とのスムーズなコミュニケーション薬剤師向け管理画面チャット形式での診断・相談・購入患者向けチャットシステム

Slide 7

Slide 7 text

（C）PharmaX Inc. 2024 All Rights Reserve 7 今回対象とするアプリケーション ● ユーザーからのメッセージを受信したタイミングで LLMによる返信のサジェストが作られ、一部のメッセージは自動送信＆必要があれば薬剤師が確認・修正して送る ○ 自動で送る場合は当然精度が重要 ○ サジェストされる場合も、そのまま送信することができれば、返信速度が速くなる＆生産性が高くなるので精度が高いことはやはり重要 ● 管理画面上でボタンを押す（ショートカットキーをタイプする）ことでもチャットがサジェストされる薬剤師にチャットの返答をサジェッションするために LLMを活用している

Slide 8

Slide 8 text

（C）PharmaX Inc. 2024 All Rights Reserve 8 YOJOにおけるAgentic Workflow ① ② ④ ● ①ルールベースでLLM処理可能かを判定 ● ②LLMで会話を分類しLLM処理可能かを判定 ● ③LLMで次のフェーズに移るべきかどうかを判定 ● ④LLMでメッセージを作成 ● ⑤LLMで作成されたメッセージを評価（LLM-as-a-Judge）し、一定の水準を下回ったら再生成して、クリアしたもののみをサジェストする現時点では精度高くメッセージ提案できないため薬剤師が対応 ③ ⑤ ※②〜⑤： GPT-4o

Slide 9

Slide 9 text

（C）PharmaX Inc. 2024 All Rights Reserve 9 ● 適した漢方の選択 ● 漢方に関しての説明 ● 飲み合わせの判断 YOJOで自動化or半自動化されている業務 ● 購入までのオンボーディング ● パーソナライズされたプラン提案 ● 販促のためのリマインド ● 配送等の問い合わせ対応 ● 継続的な健康相談 ● 漢方の変更判断 ● 体調確認のためのリマインド ● 患者ごとのサマリーの更新 ● 副作用等への対応 YOJOではさまざまな業務の自動化 or半自動化を実現している

Slide 10

Slide 10 text

（C）PharmaX Inc. 2024 All Rights Reserve 10 LangGraphで実際に構築したグラフルール1 ルール2 LLM-メッセージ作成 _ 分類4 LLM-会話分類 LLM-メッセージ作成 _ 分類1 LLM-メッセージ作成 _ 分類2 LLM-メッセージ作成 _ 分類3 LLM-フェーズ切替 LangGraphで作成したグラフはmermaidで出力しテストにも使用している

Slide 11

Slide 11 text

（C）PharmaX Inc. 2024 All Rights Reserve 11 LangSmithによるトレーシング rule1 ① ② ③ ④ ⑤ ・・・ rule2 ④ ⑤ ① ② ④ ③ ⑤ ※②〜⑤： GPT-4o

Slide 12

Slide 12 text

12 （C）PharmaX Inc. 2024 All Rights Reserve Agentic WorkﬂowとAIエージェント

Slide 13

Slide 13 text

（C）PharmaX Inc. 2024 All Rights Reserve 13 プロンプト内にタスクのルールや選択肢を明示する Agentic Workflowとは ● Agentic WorkflowとはLLMの組み合わせをデザインし、目的とする処理系を作り上げること ● 途中で人が対応することがあってもいい ● Agentic Workflowのようにワークフローを組むパターンはエージェントと呼ばないのでは？という指摘もある分類タスクタスクA タスクB タスクC タスクD タスクE タスクF 分岐人の承認を挟む途中から人が引き継ぐ分類結果によって分岐させる

Slide 14

Slide 14 text

（C）PharmaX Inc. 2024 All Rights Reserve 14 完全自律型の AIエージェント情報の認識アクション ● 必要な情報収集もアクションの決定も完全に自律的に決め、「内部的にかなりの自由度を持ち、必要ならプログラムも書き足して外部ツールを連携して …といった振る舞いができる」レベルのものを完全自律型と呼ぶこととするアクションした結果も環境情報として認識する必要な情報を自由に収集アクションも自由に考えて決定する

Slide 15

Slide 15 text

（C）PharmaX Inc. 2024 All Rights Reserve 15 ● ユーザー目線 ○ ユーザーがタスクを指示したあとは「ほぼ放っておいても結果を出してくれる」のであれば、ユーザーからは“自律的に動いている”ように見える ○ たとえ開発者が裏でワークフローを定義していようが、ユーザーが都度コマンドや選択を指示しなくても動いてくれるのであれば、「エージェントっぽい」 ● 開発者目線 ○ “（開発者も含め）誰も行動手順を制御していないほど自由に動ける ”のがエージェント ○ 「内部的にかなりの自由度を持ち、必要ならプログラムも書き足して外部ツールを連携して …といった振る舞いができる」レベルのものをエージェントと呼ぶべき誰の目線からみて自律的なのか？という軸で整理ユーザー目線で見るか、開発者目線で見るかによって意見が変わってしまっているように感じる

Slide 16

Slide 16 text

（C）PharmaX Inc. 2024 All Rights Reserve 16 ハイブリッド型もあり得ることには注意下記のようなハイブリッドな設計自体も不可能ではない ● ワークフローで分岐させたここから先は、 “エージェント的な柔軟さ ”も混ざっている ● 基本的には、ワークフローを構築するけれども、自律的に判断できる余地も残しておく

Slide 17

Slide 17 text

（C）PharmaX Inc. 2024 All Rights Reserve 17 AIエージェントと呼ぶかどうか ● ユーザー目線で見れば、ワークフロー型もハイブリッド型も AIエージェントと呼ぶ ● 開発者目線で見れば、完全自律型しか AIエージェントとは呼ばないという整理ができそうハイブリッド型完全自律型 ◯ ◯ ✕ ◯ ユーザー目線開発者目線ワークフロー型 ✕ ◯

Slide 18

Slide 18 text

18 （C）PharmaX Inc. 2024 All Rights Reserve ルール設定・ワークフロー構築という現実解

Slide 19

Slide 19 text

（C）PharmaX Inc. 2024 All Rights Reserve 19 各LLMにルールやガードレールを定義するメリット判断に必要な情報と判断基準が与えら得れているので、判断が正確になるかつ安定する ● 性別、年齢、身長、体重などの基本情報 ● 体質に関する質問への回答 ● ユーザーの好みの剤形（顆粒か錠剤かなど） …etc {情報}を下に下記からユーザーに合った漢方を選択してください・A ・B ・C …etc ✕ 選択肢選択情報判断基準アクション情報の認識

Slide 20

Slide 20 text

（C）PharmaX Inc. 2024 All Rights Reserve 20 自律的なアクションの決定外部システムとの連携完全自律型のデメリット情報の認識過去の行動実績やDBの情報から毎度アクションを考える必要があるので不安定かつ負荷がかかる自律的な ● 状況判断 ● 判断基準の策定 ● 必要な情報収集アクション自分の状況 DB ● ユーザー情報等 ● 過去の行動ログ

Slide 21

Slide 21 text

（C）PharmaX Inc. 2024 All Rights Reserve 21 ワークフローを構築するメリット分類タスクタスクA タスクB タスクC タスクD タスクE タスクF 分岐 ✕ 落ちた時に途中から人が引き継ぐパターンに切り替えるデバッグできる遂行できなかったワークフローを構築しているので正確かつ、人間がデバッグや引き継ぎもしやすい

Slide 22

Slide 22 text

（C）PharmaX Inc. 2024 All Rights Reserve 22 完全自律型のデメリット分類タスクタスクD タスクE タスクF 分岐タスクB&C タスクA これまでの人間の想定とかけ離れたワークフロー落ちた時に途中から人が引き継げない ✕ 遂行できなかったデバッグ不可人間の想定とかけ離れた方法で作業をされると、失敗したときにデバッグや引き継ぎも難しい

Slide 23

Slide 23 text

（C）PharmaX Inc. 2024 All Rights Reserve 23 AIエージェントに関する私の個人的意見のまとめ ● ワークフローを定義するAgentic Workflow型のAIアプリケーションをAIエージェントと呼ぶべきかどうかというAIエージェント定義論争は個人的にはどちらでもいい ● 現時点の技術では、複雑な業務を安定的にこなすには、ワークフローを定義するのが現実解ではないか ● ユーザーから見て「ほぼ放っておいても結果を出してくれる」「勝手にタスクを実行してくれる」ことで実際に価値がでているのであれば、裏側がどう作られていようともいいはず裏側の仕組みはどうでもよく、最もユーザーに価値が出るように作ればいいはず