Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIエージェント開発のノウハウと課題
Search
PharmaX(旧YOJO Technologies)開発チーム
March 04, 2025
Technology
8.6k
10
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
AIエージェント開発のノウハウと課題
PharmaX(旧YOJO Technologies)開発チーム
March 04, 2025
More Decks by PharmaX(旧YOJO Technologies)開発チーム
See All by PharmaX(旧YOJO Technologies)開発チーム
PdMによるLiveバイブコーディング〜プロトタイプ開発実践〜
pharma_x_tech
1
78
2025.10.28_CodexとClaude Codeの比較検討 社内座談会
pharma_x_tech
2
620
LLMのアウトプットの評価と改善 〜DSPyによるプロンプト最適化入門によせて〜
pharma_x_tech
6
1.2k
2025.09.02_AIコーディングを利用した開発自動化を目指しての座談会
pharma_x_tech
5
350
AIコーディングを前提にした開発プロセス再設計〜開発生産性向上に向けた試行錯誤〜
pharma_x_tech
4
440
AIエージェントの評価・改善サイクル
pharma_x_tech
2
620
MCP & Computer Useをフル活用した社内効率化事例〜現在地と将来の展望
pharma_x_tech
1
460
AIエージェントの継続的改善のためオブザーバビリティ
pharma_x_tech
7
2.6k
Roo CodeとClaude Code比較してみた
pharma_x_tech
5
6.3k
Other Decks in Technology
See All in Technology
2026TECHFRESH畢業分享會 - AI 時代的人生存檔點
line_developers_tw
PRO
0
1.3k
200個のGitHubリポジトリを横断調査したかった
icck
0
140
AIのReact習熟度を測る
uhyo
2
650
SONiCの統計情報を取得したい
sonic
0
230
日本 Fintech 未来予測レポート 2027〜2028年(手動編集版)
8maki
1
2.5k
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
170
スタートアップにAmazon EKSは早すぎる? マルチプロダクト戦略を加速する Platform Engineeringの実践 / Is Amazon EKS Too Soon for Startups? Practical Platform Engineering to Accelerate a Multi-Product Strategy
elmodev09
0
370
ロボティクスの技術 / Robotics Technology
ks91
PRO
0
110
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
1.3k
Chainlitで作るお手軽チャットUI
ynt0485
0
280
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
170
攻撃者視点で考えるDetection Engineering
cryptopeg
3
2k
Featured
See All Featured
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
490
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
310
How to Talk to Developers About Accessibility
jct
2
240
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
250
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Embracing the Ebb and Flow
colly
88
5.1k
Typedesign – Prime Four
hannesfritz
42
3.1k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
390
Transcript
2025.3.4 #pharmax_tech_collabo AIエージェント開発のノウハウと課題
(C)PharmaX Inc. 2025 All Rights Reserve 2 自己紹介 上野彰大 PharmaX共同創業者・エンジニアリング責任者
好きな料理はオムライスと白湯とコーラ マイブームはLLMとRust X:@ueeeeniki
(C)PharmaX Inc. 2025 All Rights Reserve 3 個人でも勉強会コミュニティ StudyCoも運営
(C)PharmaX Inc. 2025 All Rights Reserve 4 自社としては LLMを中心に勉強会を月 1回程度開催
(C)PharmaX Inc. 2025 All Rights Reserve 5 医療アドバイザーに体調 のことをいつでも気軽に相 談できる
相談型医療体験 30種類以上の漢方薬からあ なたに合ったものを月毎に 提案 パーソナライズ漢方薬 定期的に漢方をお届けし、 一人ひとりに寄り添うかか りつけ医療を提供 継続的なかかりつけ 一生涯にわたって寄り添うかかりつけ漢方薬局「 YOJO」
(C)PharmaX Inc. 2025 All Rights Reserve 6 患者向けチャットシステムと薬剤師向け管理画面を自作 患者とのスムーズなコミュニケーション 薬剤師向け管理画面
チャット形式での診断・相談・購入 患者向けチャットシステム
(C)PharmaX Inc. 2025 All Rights Reserve 7 YOJOで稼働する OTC医薬品相談 AIエージェント
患者さまからの一次対応をすべて AIエージェントが行う(裏側では 100近いのプロンプトが稼働) 基本的にはメッセージを自動送信し、必要があれば薬剤師に承認を求める 一次的な漢方選択や、こちらから送信する体調確認などもエージェントが自律的に作成 薬剤師に重要な 返信や判断の確認を依頼 一次的な漢方選択なども行う 薬剤師が返信する場合もある AIエージェント 薬剤師 ユーザー AIが人に指示をするような体験
(C)PharmaX Inc. 2025 All Rights Reserve 8 YOJOにおけるAgentic Workflow(フローエンジニアリング) ①
② ④ • ①ルールベースでLLM処理可能かを 判定 • ②LLMで会話を分類しLLM処理可能 かを判定 • ③LLMで次のフェーズに移るべきかど うかを判定 • ④LLMでメッセージを作成 • ⑤LLMで作成されたメッセージを評価 (LLM-as-a-Judge)し、一定の水準を 下回ったら再生成して、クリアしたもの のみをサジェストする 現時点では精度高く メッセージ提案できない ため薬剤師が対応 ③ ⑤ ※②〜⑤: GPT-4o
(C)PharmaX Inc. 2025 All Rights Reserve 9 LangGraphで実際に構築したグラフ ルール1 ルール2
LLM-メッセージ作成 _ 分類4 LLM-会話分類 LLM-メッセージ作成 _ 分類1 LLM-メッセージ作成 _ 分類2 LLM-メッセージ作成 _ 分類3 LLM-フェーズ切替 LangGraphで作成したグラフはmermaidで出力しテストにも使用している
(C)PharmaX Inc. 2025 All Rights Reserve 10 LangSmithによるトレーシング rule1 ①
② ③ ④ ⑤ ・・・ rule2 ④ ⑤ ① ② ④ ③ ⑤ ※②〜⑤: GPT-4o
11 (C)PharmaX Inc. 2025 All Rights Reserve Agentic WorkflowとAIエージェント
(C)PharmaX Inc. 2025 All Rights Reserve 12 プロンプト内に タスクの計画ルールや 選択肢を明示する
Agentic Workflow(フローエンジニアリング)とは • Agentic WorkflowとはLLMの組み合わせをデザインし、目的とする処理系を作り上げること • 途中で人が対応することがあってもいい • Agentic Workflowのようにワークフローを組むパターンはエージェントと呼ばないのでは?という指摘もある 分類・計画 タスク タスクA タスクB タスクC タスクD タスクE タスクF 分岐 人の承認を挟む 途中から人が引き継ぐ 分類・計画結果に よって分岐させる
(C)PharmaX Inc. 2025 All Rights Reserve 13 プロンプト内に タスクの計画ルールや 選択肢を明示する
Agentic Workflow(フローエンジニアリング)の評価 分類・計画 タスク タスクA タスクB タスクC タスクD タスクE タスクF 分岐 人の承認を挟む 途中から人が引き継ぐ 各タスクごとに Outputを 評価する必要がある 分類・計画結果に よって分岐させる 処理系全体の 最終的な Outputも 評価する必要がある
14 (C)PharmaX Inc. 2025 All Rights Reserve AIエージェント開発のコツ
(C)PharmaX Inc. 2025 All Rights Reserve 15 AIエージェント開発のコツ① 自動化したい業務があればまずは自分たちがやってみる 参考:https://note.com/dory111111/n/ncab810c5fc21
• 社内で誰もやったことのない業務は自動化できないと思うべ し • YOJOでもすでに薬剤師さんの業務はマニュアル化されてお り、それをAIに置き換えるだけだった ◦ 漢方の選択軸や文章のライティングマニュアルなど非常 に詳細なものが作られていた • 「AIに業務を教えれば勝手に学ぶ」という世界がいずれ来な いわけではないと思うが、現時点ではワークフローを構築した り、プロンプトを工夫したりをする必要がある
(C)PharmaX Inc. 2025 All Rights Reserve 16 AIエージェント開発のコツ② まずは業務をしている方にサジェストすることから始めることも要検討 •
PharmaXのYOJOでは、薬剤師さんにメッセー ジをサジェストするところから始めた ◦ 一番最初はボタンを押すとメッセージが作 成される仕組み ◦ すでに業務をされている方の心理的ハード ルを下げるためにも重要 • サジェストした結果に対して FBを集めて精度を 向上させる
(C)PharmaX Inc. 2025 All Rights Reserve 17 一気にすべてのフローを自動化するのではなく、分割して一部の業務から自動化する AIエージェント開発のコツ③ 自動化の簡単さとインパクトとを秤にかけて、費用対効果の高いところから順番に自動化する
(C)PharmaX Inc. 2025 All Rights Reserve 18 タスクA&B&C プロンプト内に タスクの計画ルールや
選択肢を明示する AIエージェント開発のコツ④ 分類・計画 タスク タスクD タスクE タスクF 分岐 人の承認を挟む 途中から人が引き継ぐ 分類・計画結果に よって分岐させる • 各タスクは業務の塊の単位で分割する ◦ 最初は大きな粒度で設計して、精度が低ければプロンプトを分割する • 人の確認・承認を挟む必要がある場合に確実に人を挟めるようにするにはフローを設計するのが確実
19 (C)PharmaX Inc. 2025 All Rights Reserve AIエージェント開発の今後のトレンド
(C)PharmaX Inc. 2025 All Rights Reserve 20 複数業務・ツールをまたいだ AIエージェントの実現 候補者の選定からスカウトの送信というまで一連のワークフローを自動化してくれる
参考:https://algomatic.jp/news/release_recruta-ai_20250130
(C)PharmaX Inc. 2025 All Rights Reserve 21 AIエージェントは SaaSを飲み込むか •
AIエージェントがSaaSを操作するようになると、SaaSのUI/UXは人の使用を前提としていた時 ほどは競争優位性ではなくなる可能性はある ◦ SaaSは所詮データベースのラッパーに過ぎないと考えることもできる ◦ 社内業務用のSaaSを考えると、どのSaaSを使っても必要なデータが貯まれば同じという 考え方もできるようになる ◦ 一方で、人材系のマッチング(スカウト)ツールのように DBの量や質そのものに差がある 場合には、これまで通り十分価値になり得る • 既存SaaSをまたがって業務を自動化するAIエージェントの開発競争が始まる可能性 ◦ browser useやcomputer useもしばらくは安定しない上にどうしようもない業務の複雑 さは存在するので、少なくとも1〜2年程度は開発力による使い勝手の差分は発生すると 予想 browser useやcomputer useによりAPI連携せずとも複数ツールをまたいだ操作の自動化が可能に
(C)PharmaX Inc. 2025 All Rights Reserve 22 Anthropicのポケモン生配信による computer/browser useのデモ
• 利用可能なボタン操作は、 上,下,左,右 ,A,B,START,SELECT • アクションを選択する際にはどの アクションを取るのかを思考して 決定する • ゲーム内のメモリ値を渡している のではなく、画面の画像を渡して いる Claude 3.7 Sonnetにポケモンを使ってプレイさせ、ジムリーダー 3人の撃破に成功した
(C)PharmaX Inc. 2025 All Rights Reserve 23 Computer/browser Useの課題 期待も大きいComputer
Use/browserだが、実運用するには課題も多い • 現実的には動作速度もかなり遅く、ポケモンのプレイの例では、 17時間かかって(2つ目の街である)ニビ シティまでしか進んでいなかった ◦ ポケモンの例では拡張思考モードが使われており、次の行動を選ぶのに熟考を繰り返している ◦ 実際にcomputer useを使う場合には、PCを占有してしまうことになるので、処理速度の向上や仮想 環境での並列化などが求められる • コストの課題もまだ大きく、人の業務を代替させられるかはかなり怪しい水準 ◦ ポケモンの例では、3人目のジムリーダー撃破までに推定 35,000回以上のアクションを実行してお り、相当なコストがかかっているとされている • 視覚認識の精度や文脈の理解もまだ不安定なのでミスも多い ◦ Computer/browser Useでもワークフローを組む方法は引き続き有効
(C)PharmaX Inc. 2025 All Rights Reserve 24 computer/browser useは従来のRPAと同じ問題を抱えている 参考:https://x.com/tokoroten/status/1895737514046210356
computer/browser useはある程度のルールを与えたとしても画面を操作してしまうため非常に危険 AIエージェント=computer useではない認識 従来のRPAにはなかった 柔軟性を獲得できることを 目指そうとすると、 ワークフローと自律判断のバ ランスが重要
25 (C)PharmaX Inc. 2025 All Rights Reserve We're hiring!!! •
AXカンパニーのカンパニーCTO • AXカンパニーのPdM などを募集しております!! 医療・ヘルスケア業界で AIエージェントを実装していく toB事業を行うAXカンパニーを立ち上げました