Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20251027_マルチエージェントとは

 20251027_マルチエージェントとは

2025.10.27 Mon 12:00~ 開催の『AIエージェント進化の鍵 音声・動画 によって拓かれた未来を知る』
イベント登壇資料①

Avatar for Almondoイベント担当

Almondoイベント担当

October 26, 2025
Tweet

More Decks by Almondoイベント担当

Other Decks in Technology

Transcript

  1. お品書き 2 01 本セクションの目標 02 自己紹介 03 「AIエージェント」とは何か 05 「マルチモーダル・マルチ

    AIエージェント」とは何か 06 まとめ 04 なぜ今「AIエージェント」が盛り上がっているのか
  2. confidential AIエージェント / マルチモーダル / マルチエージェント ってなんだっけ? 普段説明されているものとは異なる切り口で説明し、 時流を含めて LLM周りのトピック全体像

    を振り返る。 本セクションの目標 4 この後のLTを楽しんでもらうために事前情報を整理する 
 他にもいい記事 /いい本がたくさんあるのでそれを知る機会にもできればと
  3. 株式会社Almondo 松本 悠秀 / Yuho Matsumoto 経歴 @YuhoMatsumoto 株式会社松尾研究所 MLエンジニア・

    PM(2年) データサイエンス/基盤モデル開発/Agent(2023年)/基礎研究など様々なプロジェクトに参画 東京大学松尾研究室 講師・講義設計( 2年) 国内最大のデータサイエンス講座であるGCIの講師・講義設計 42 Tokyo 2nd Circle 2023_07当時、最速で42 Tokyo Common Coreを突破 バックエンド > インフラ > フロントエンド 株式会社Almondo COO(2年) MLエンジニア・ソフトウェアエンジニア・PMとして参画 現在は幅広いチーム(SW/ML開発・人事・営業)の管掌や参画 6 自己紹介
  4. confidential AIエージェントとは何か 8 AIエージェントの定義は画一的なものが存在せず、さまざまな定義が存在する 「ユーザーからの指示や環境を把 握して、ユーザーの代わりに自律的 にタスクを実行してくれるAIシステ ム」(みのるんさんの本) 「目標に向けて環境と相互作用 し

    ながらタスクをこなす 知能(インテ リジェント)システム」(現場で活用 するためのAIエージェント実践入 門)
 人工知能 (AI) エージェントは、 環 境と対話し、データを収集し、その データを使用して自己決定タスク を実行して、事前に決められた目 標を達成するためのソフトウェアプ ログラムです。目標は人間が設定 しますが、その目標を達成するた めに実行する必要がある 最適なア クションは AI エージェントが独自 に選択します。
 (AWS)
  5. confidential AIエージェントとは何か 10 キーワードは「人間が目標を設定する」「目標を達成するための計画を行う」「環境と相互作用する」「自 分でタスクを実行する」ということ ①人間が目標を設定する
 「この機能を追加したい」「このエラーを解消して」という上 位目標を設定 ②目標を達成する計画 


    を自分で行う 
 「この機能を追加したい」「このエラーを解消して」という上 位目標を設定 ③環境と相互作用する 
 リポジトリを確認/リポジトリ内に書き込み・修正・削除 ④自分でタスクを 
 実行する
 コーディングを実行 Coding Agentの例 Agentだ!
  6. confidential LLMの歴史 ①特化モデル 特定タスクを精度よく解く 手法の登場 ②LLM 「汎用的な頭脳」 の登場 ③RAG 特定知識を入れ込み

    カスタマイズする活用 ④AI Agent AIが自律的に実行まで 行う時代 なぜ今AIエージェントが盛り上がっているのかを振り返るために、これまでの流れを大きく4つに分けて振 り返っていきます
  7. confidential ①特化モデル (~2022※) 特徴 1. 入力→出力が固定的 (推論プロセスが透明) 2. 目的ごとにモデルを再学習 (汎用性が低い)

    - 違反画像を分類したい - 明日の商品Aの需要を予測したい 3. 暗黙知でも学習して反映できる、「特化型頭脳」 定型の インプット 定型の アウトプット 定型データ から事前学習 プログラム ・モデル ニューラルネットをはじめとした特化型モデルは、各ケースごとに学習させてタスクを解化せていた ①特化モデル 特定タスクを精度よく解く 手法の登場 Input 
 モデル
 Output 
 ※年代はあくまで日本で盛り上がっていたと考える目安 . 厳 密ではない
  8. confidential ②LLM(2022~※) 非定型の インプット 定型の インプット LLM 大量のデータから 事前学習 Input

    
 モデル
 Output 
 非定型の インプット 定型の インプット 特徴 1. 入力→出力が自由に (言葉を自由に入力 ) 2. 1モデルで広いタスクに対応 (汎用性が高い) - 売り場案内AI - コールセンターの一次対応 3. 形式知を入れ込みやり方を伝授すれば動く「汎用的な頭脳」 LLMの登場は、「自由な入力と出力」「汎用化」が大きなインパクトに ①特化モデル 特定タスクを精度よく解く 手法の登場 ②LLM 「汎用的な頭脳」 の登場 ※年代はあくまで日本で盛り上がっていたと考える目安 . 厳 密ではない
  9. confidential ③RAG(2023~※) 非定型の インプット 定型の インプット LLM 大量のデータから 事前学習 非定型の

    インプット 定型の インプット 特徴 1. LLMに機能を外付けし「 外部データを検索してから回答 」できるように 2. 汎用モデルの知識を外付けし知識のパーソナライズ - 売り場案内AI: 商品知識を入れる - コールセンターの一次対応 : 対応ログを入れる 3. 個別ケースへの対応力の向上で、企業導入が一気に推進 RAGにより知識のパーソナライズが可能に。企業での導入が一気に推進 Input 
 モデル
 Output 
 ①特化モデル 特定タスクを精度よく解く 手法の登場 ③RAG 特定知識を入れ込み カスタマイズする活用 ↕
 独自のデータベース ※年代はあくまで日本で盛り上がっ ていたと考える目安 . 厳密ではない
  10. confidential ④AI Agent(2025~※) 「人間が目標を設定する」「目標を達成するための計画を行う」「環境と相互作用する」「自分でタスクを実 行する」AIエージェントの流行 ①特化モデル 特定タスクを精度よく解く 手法の登場 ④AI Agent

    AIが自律的に実行まで 行う時代 特徴 1. LLMが外部ツールを操作。「環境を知覚し、タスクを実行する」ように 2. 目標を達成する方針を策定するように 3. 「AIが自律し実行する」フェーズへ 環境
 ③環境の
 知覚
 ②計画
 ④環境へ の行動
 メモリ
 LLM
 ①User

  11. confidential LLMの歴史 なぜ今AI Agentがきてるのか? (概念自体は1997年からあるらしい) 質問への回答 から
 タスクの自律実行 まで
 可能に

    
 推論モデルが進化し、 
 LLMに 「計画・実行」 を
 任せやすくなった 
 モデルが賢くなり 
 “使える” 状態まで 
 持っていきやすくなった 
 LangGraph, Mastra, etcの 
 フレームワークが豊富 で
 すぐに作りやすくなった 
 「作って導入」が現実的になってきた! 
 ①
 モデルの進化 
 ②
 誰でも作りやすく 
 ※以前作り込むには知識や試行錯誤が必要 

  12. confidential ①改めて: LLMとは 非定型の インプット 定型の インプット 非定型の アウトプット 定型の

    アウトプット LLM 大量のデータから 事前学習 報告書、問い合わせ記 録、マニュアル 問い合わせへの返答、示唆 出し、意思決定 Input 
 情報交換 
 Output 
 LLMとは大量のテキストデータを学習して次単語予測するモデル
  13. confidential ①マルチモーダル LLMとは 非定型の インプット 定型の インプット 非定型の アウトプット 定型の

    アウトプット LLM 大量のデータから 事前学習 報告書、問い合わせ記 録、マニュアル 問い合わせへの返答、示唆 出し、意思決定 Input 
 情報交換 
 Output 
 今や当たり前だが、入出力に画像・動画・音声を使えるモデルとして、マルチモーダルLLMが登場した
  14. confidential ①マルチモーダルな AI Agentとは何か 23 マルチモーダルなAI AgentはここのLLMがマルチモーダルになっている。「環境の相互作用」を言語以 外で行えるような感じだ ①人間が目標を設定する
 「この機能を追加したい」「このエラーを解消して」という上

    位目標を設定 ②目標を達成する計画 
 を自分で行う 
 「この機能を追加したい」「このエラーを解消して」という上 位目標を設定 ③環境と相互作用する 
 リポジトリを確認/リポジトリ内に書き込み・修正・削除 ④自分でタスクを 
 実行する
 コーディングを実行 少し前のCursor 言語Agent
  15. confidential ①マルチモーダルな AI Agentとは何か 24 マルチモーダルなAI AgentはここのLLMがマルチモーダルになっている。「環境の相互作用」を言語以 外で行えるような感じだ ①人間が目標を設定する
 「この機能を追加したい」「このエラーを解消して」という上

    位目標を設定 ②目標を達成する計画 
 を自分で行う 
 「この機能を追加したい」「このエラーを解消して」という上 位目標を設定 ③環境と相互作用する 
 リポジトリを確認/リポジトリ内に書き込み・修正・削除 エラー画面のスクショによる画面知覚 (すでにある ) 音声対話による実装方針の理解 (未来形) ④自分でタスクを 
 実行する
 コーディングを実行 必要なクリエィティブも自分で準備 (一部で存在) マルチモーダルAgentの例 マルチモーダル 
 Agentだ!
  16. confidential まとめ 30 基本は「シングルエージェント」 
 この後には、動画や音声など、 自然言語以外のものも活用する 珍しい事例を紹介する。 
 マルチエージェントの理解を深め、シングルエージェントにも活かせると良い

    
 「人間が目標を設定する」「目標を達成するための計画を行う」 
 「環境と相互作用する」「自分でタスクを実行する」 
 AIエージェントのキーワード 
 今AIエージェントがアツい理由は、
 「モデルが賢くなったこと 」と「作りやすくなったこと 」の2つ。