Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ビジネスで活かす生成AIエージェント 〜業務利用を目指して今を俯瞰的に理解しよう〜

masatoto
February 10, 2025

ビジネスで活かす生成AIエージェント 〜業務利用を目指して今を俯瞰的に理解しよう〜

2月7日(金)にUiPathで開かれたAIエージェントウェビナーの登壇資料です。

masatoto

February 10, 2025
Tweet

More Decks by masatoto

Other Decks in Business

Transcript

  1. アジェンダ なぜ生成AIエージェントが注目されているのか  生成AIエージェントの各社のリリース状況  生成AIエージェントのブームは2回目?前回の失敗とは  今回の生成AIエージェントブームの3つの理由 生成AIエージェントを理解する 

    生成AIエージェントとは  生成AIエージェントの具体例、応用、価値  生成AIエージェントは知性と自律性が鍵 生成AIエージェントの業務利用に向けて  生成AIエージェントの事例化に向けて冷静に現状分析  生成AIエージェントの刺さる業務プロセスの特徴  生成AIエージェントの利用方法 2
  2. 太田真人  電通総研 Xイノベーション本部 AITC(AI専門部署)  2021年新卒入社〜 AIソフトウェア開発、リサーチエンジニア 経験 

    製造業の需要予測、異常検知、RAG質問応答  マルチモーダルRAG、資料レビュー、質問応答、データ分析エージェント開発 発信  研究レベルの技術動向資料を多数公開  24年12月「AIエージェントのビジネス・技術ブログ4本投稿」  24年7月「ヘルプデスクの事例から学ぶAIエージェント」  24年4月「ICLR2024のLLMエージェント研究動向」  24年1月「生成AIを用いたText-to-SQLの最前線」  23年12月「LLMマルチエージェントを俯瞰する」 X:@ottamm_190 SpeakerDeck: @masatoto Hatena Blog: masamasa59 4
  3.  ビッグテックはソフトウェア間を繋ぐエージェントを続々リリース  人間がソフトウェアを操作しなくとも、エージェントが実行する世界を目指す 会社名 プロダクト 利用用途 Google Project Mariner

    Webブラウザ操作 Project Astra デジタルアシスタント Jules コード開発支援 Vertex AI Agent Builder 社内データ、SaaSアプリ連携 Deep Research 市場調査、リサーチ Microsoft Copilot Studio Agent Builder 社内データ、Office製品、SaaSアプリ連携 SAP Joule 社内データ、ERP、SaaSアプリ連携 Salesforce Agentforce 社内データ、CRM、SaaSアプリ連携 UiPath Autopilot for Everyone UiPath Agent Builder 社内データ、RPA、SaaSアプリ連携 RPAの高度化 生成AIエージェントの各社のリリース状況 8
  4.  1回目のブームはエンジニアから始まった自律型エージェント  AIとの対話システムのChatGPTが気づけば、自律自動化システムの推論エンジンに活用される  BabyAGI、AutoGPTなど、エージェント開発のハッカソンが海外でも取り組まれる  なぜブームが鎮火したのか?  完全自律化はタスク成功率が不安定で「星に願いを」状態だった

     コードが複雑で難解だった 第一回ブームの失敗に関するブログ:https://resources.parcha.com/agents-arent-all-you-need/ 2022年11月 2023年 3月 11月 2024年 3月 5月 9月 11月 2025年 Google Microsoft エージェント発表 業務特化型エージェント 日本のSI会社から続々登場 Salesforce agentforce ChatGPT登場 AWS Agent Builder OpenAI GPTs 自律型エージェント ベンチャーを中心に登場 1回目ブーム 2回目ブーム 生成AIエージェントのブームは2回目?前回の失敗とは ビジネス層のリリース状況 9
  5.  2024の初頭に発売されたウェアラブルデバイスのAI Pinは話しかけるとタスクをこなす タスクの例  AI Pinのカメラをお店に向けてお店の評判を聞く  旅行先の現地言語の翻訳を依頼する 

    メッセージの送信やメモを依頼する 実際の結果(2024年4月時点)  5回に1回成功するか  回答までの待ち時間が長い  連携できるアプリが少ない  画面に集中する時間が減り、現実に集中できるようになった タスクの成功率と実行時間、対応するタスク数が課題だった 課題は残しつつも、ニーズや使い道の知見は得た Humane AI Pinのレビュー記事: https://www.theverge.com/24126502/humane-ai-pin-review Humane「AI Pin」が得た知見 10
  6. 今回の生成AIエージェントブームの3つの理由 1. 技術的要因:生成AIの性能アップ  タスク成功率の安定性の強化:JSON形式の構造化出力、Function Calling機能の強化  推論能力の強化:Chain of Thoughtに始まり、OpenAI

    o1のような思考能力の高いモデルの登場 2. ビジネス的要因:RAGアルゴリズムによる業務効率化の限界(国内のブーム要因)  RAGによる社内文書を用いた質問応答の可能性は一通り試され、限界も含め明らかになった  より社内文書を用いた高度なタスクの依頼が増え、検索上位k件を取得するRAGアルゴリズムでは対応できない  複数のデータソースを使い分け、OCR+条件付き検索、審査項目チェック、マルチホップ推論など 3. ビジネス的要因:ソフトウェアの付加価値創出(海外のブーム要因)  ソフトウェアを操作するエージェントが研究で盛んに  SaaSを人間でなく、エージェントが利用する 11
  7. 生成AIエージェントの動作例  タスク:アンケート分析  ユーザーはCSVをアップロードして質問する  エージェントが分析方針を立てて実行する 1. 自ら行動計画を立てる 2.

    行動ができる 3. 環境からの情報を理解できる 4. 自ら問題を認識し、計画を修正する 生成AIエージェントらしいポイント 14
  8. 生成AIエージェントの応用  エージェントの応用は、人間も複数ステップ要する「プロセス」のあるタスク 応用例 説明 レポート作成 レポートの構成決め、情報の検索、各章の執筆、データ分析、図の作成 市場調査のレポート作成 外部参照の質問応答 質問の整理、情報収集、ツール利用、回答

    企業データの分析・意思決定、RAG関連の案件 ソフトウェア開発 リポジトリ理解、テスト作成、ソースコード作成、テスト実行 プロトタイプ開発 コンピュータ操作 タスクの理解、クリック、テキスト記入、検索 社内業務アシスタント ドキュメント処理 受付、記入、審査、レビュー、登録 請求処理、金融の審査、法務レビュー 実験/研究の自動化 関連論文検索、仮説立案、実験計画、実行、論文作成 製品設計の自動化 15
  9. 生成AIエージェントの価値 不透明な業務プロセスの刷新、効率化  煩雑、面倒、時間かかる、誰もやりたくないことを人間から解放する  仕事で最も価値がある業務の質をさらに高める  RAG案件や生成AI案件の派生からプロジェクトが始まる可能性が高い 忙しい専門人材の代替で全チームを支援 

    簡単にできていますか?専門人材の採用、別の専門部署に依頼、パートナー会社に依頼  デザイナー、プロトタイプ開発、データ分析、専門指導メンター、マーケティングなど  会社に専門エージェントを一体用意し、全社からの依頼を一次対応させる世界 パーソナライズな体験の加速  ユーザーの好みをエージェントが管理し、サービスの顧客体験を改善 専門的なソフトウェアの理解と操作から人間を解放  専門的で複雑で多機能ソフトウェアをエージェントが解釈し、新人の育成や作業支援 16
  10. 生成AIエージェントは知性と自律性が鍵  知性:人間の思考能力や理解力、知識の適応力の総称的な性質  自律性:人間を介さず独立して、自ら判断しタスクを遂行する性質 自律性 知性 ソフトウェア開発 データ分析 コンピュータ操作

    レビュー業務 推薦・質問応答 意思決定支援 定型業務 簡単なアプリ操作 高度な思考と柔軟な適応力が必要 行動の選択肢が豊富 PDCAが必要でゴールまで遠い 検索や取得APIを状況に応じて使う 定められたワークフローを選ぶ 予期せぬことがなくゴールまで2ステップ程度 専門的な業務知識を要する 会社のコンテキスト理解が必要 批判的、論理的思考を求める 高い 低い 高い より従業員らしく より汎用に遠い目標へ プロダクトの主戦場 PoCの主戦場 R&Dの主戦場 Google, Microsoft OpenAI, Anthropic Microsoft, UiPath SAP, Salesforce 17
  11. 生成AIエージェントの事例化に向けて冷静に現状分析  テック企業は実用的なユースケースを探している(2025年の象徴)  市場からの高いプレッシャーがブームを熱狂させ、過大広告を生み出しているのも事実  日本の会社で働く従業員の代替を目指すならエージェントの技術はまだ成熟していない  LLMに人間のハイコンテキストな理解力が足りない(仕事を振るたびに1から考え方や進め方を教える必要がある) 

    人間側の業務ドキュメント整備(新卒に引き継ぐつもりで)、経験の再利用、業務のワークフロー化が必要  現段階で実運用に載せるなら妥協が必要  ワークフロー管理、複数ある代替業務の縮小、人間に負荷の高い業務は諦める  まずは単一部署で完結する業務から取り組む  実際に複雑な業務の代替を目指すと複数部署や子会社との協力が必要になり、相当な覚悟と社内調整が必要  業務プロセスの全体像を把握するだけで数ヶ月が過ぎてしまう  今は社内業務プロセスを素早く理解し、エージェントを作り、限界が分かるまで評価・改良をすること  現状の技術的限界を把握し、現場の方含め、AIに馴れることに今は意味がある 19
  12. 生成AIエージェントの刺さりそうな業務プロセスの特徴  最終成果物が一通りでなく、多様なパターンがある  抽出・登録できたかどうかの業務でなく、アイデア企画や調査レポートのような考えて作り出す業務  エージェントの思考から情報収集で試行錯誤が生まれ、様々な成果物パターンを作れる  試行錯誤や自己改善が必要なPDCAサイクル 

    過去の失敗と成功の経験をもとに次の方針を定めて行動する業務  実験、開発、教育、満足度向上施策、ナレッジ管理など目標に向けてPDCAをする  業務プロセスに例外や確認項目の分岐が多い  審査業務のようにモノによって審査項目が変わり、基準を満たすか調べる業務  If-thenルールでは分岐数が多く、審査基準が変わりやすく、エージェントが検索したり文書を辿る  開発も検証時間もかかる業務の代替にエージェントは期待されている 20
  13. 生成AIエージェントの利用方法 生成AIエージェントを利用する選択は3つ 1. 既存製品のエージェントを利用する  Cursor、Devinエージェント等の開発支援、GenSpark、Perplexity等の市場調査サービス 2. エージェントビルダーを使う  簡単に社内データと連携してデプロイでき、利用イメージを理解できる

     開発スキルがない方にオススメ  業務特化で作るには手が届かない部分がある 3. フルスクラッチで作る  特定の業務を効率化したい場合に有効だが、開発と検証に数ヶ月かかる  エージェントのアーキテクチャ設計やプロンプトエンジニアリング、ツール開発スキルが求められる  RAGのように簡単に作れず、相当なエンジニアリング能力が必要 21