生成AIと標準プロトコルの現在地 - Agentic Webの胎動 -

⽣成AIと標準プロトコルの現在地 Agentic Webの胎動

そもそも⽣成AI（LLM）とは？大規模言語モデル（LLM）ができることを（誤解を恐れずに極限まで単純化して）表現するとという、一見するととても単純な能力だけです。直前までの文章の単語の流れから「次に来る言葉を確率的に当てて」続きの文章を生成する作業を高速かつ高精度で行える

LLMのしくみ（1）– ⾔葉をつなぐ仕組み ... 予測結果: 直前までの単語から次に来る単語を予測過去の学習データから確率的に最適な単語を選択 Attentionメカニズム「⽂脈の中で各単語がどれだけ重要か」を計算 The cat
sat on the cat sat on mat 低関連性中関連性⾼関連性単語同⼠の関連性を計算し、重要度を数値化⽂脈を理解し、関連する単語に「注意」を向ける Transformerモデル「Attention Is All You Need」から⽣まれた⾰新的な構造。⾃⼰注意機構により、⽂脈中の関連性を効果的に捉える。GPT、BERT等の基礎となった技術。⽂脈理解と⾃然な出⼒数百から数千のトークンを遡って⽂脈を把握。⼈間の⾔語習得に近い仕組みで、⾃然で⼀貫性のある⽂章を⽣成する。 The ⾃⼰回帰型予測 cat sat on the mat (62%) ﬂoor (21%) chair (9%)

⽂章を⽣成できる＝考えることができる？この「文脈に沿った文章が正確かつ高速で生成できる」という一見単純な能力が、これまでのAI（機械学習モデル）では対応が難しかった数学の難問や人間の試験問題（資格試験、大学入試）の回答に圧倒的な実力を示す事例が続々と報告されていきました。人間の思考プロセスや試行錯誤を文章生成を使ってシミュレートすることで、問いかけに対していきなり答えるよりも遥かに高い精度の回答ができること。

⽣成AIのしくみ（2）– Reasoningと思考の模倣問題: ボブは8個のりんごを持っていました。5個を友達にあげて、2個買いました。今、ボブは何個のりんごを持っていますか？ Chain of Thought (CoT) Tree
of Thought (ToT) 答えを出す前に理由付けを段階的に明⽰する⼿法複数の選択肢から良い⽅向を選び取る探索⼿法考えながら選択する能⼒ AIは単純な応答から、複雑な思考プロセスを経た意思決定へと進化。問題解決において⼈間のように段階的に考え、最適解を導き出せるようになりました。 Why まず、ボブの初期状態は8個のりんごです。 Then ボブは5個をあげたので、8 - 5 = 3個になります。 Then その後、2個買ったので、3 + 2 = 5個になります。 Therefore よって、ボブは現在5個のりんごを持っています。 Reasoningの技術的発展 ChatGPT-4などの最新モデルでは、複雑な数学問題や論理的推論も可能に。プロンプトで「ステップバイステップで考えて」と指⽰することで、思考プロセスを引き出せます。初期状態問題を分析アプローチB シミュレーション計算ミス ×放棄正しい式検討継続図で整理検討継続答え: 5個 ✓ 採⽤誤解釈 ×放棄アプローチA 式を⽴てる

で..? （難しいこと考えられるからなに？）

LLMの課題⽣成AIが直⾯する障壁 LLMが真に有用な次世代のソフトウェアになるための3つの課題これらの障壁の先にあるもの社会実装されたAIエージェントには、これら3つの壁を突破するための標準的な仕組みが必要です。次のスライドでは、各課題への解決策について掘り下げていきます。幻覚∕知識の古さ存在しない情報を事実のように提⽰学習データで区切られた知識の限界最新情報へのアクセス不⾜正確性‧
信頼性の問題⻑期記憶の弱さコンテキスト制限による会話の忘却過去の指⽰や設定の維持困難⼀貫性のある⻑期的な対話の限界持続的な関係構築の壁実⾏⼒の⽋如外部システムとの連携ができない複雑なタスクを遂⾏する能⼒が低い物理世界への直接的なアクセスができない⾃律的なタスク遂⾏の限界

解決アプローチ最新情報のアクセス外部DBから最新情報を取得し、幻覚を軽減コンテキスト拡張会話履歴や⻑⽂書の保存‧検索が可能に外部システム連携 APIを通じた外部サービス、実世界への働きかけを実現 RAG 検索拡張⽣成（Retrieval-Augmented Generation）は
、AIが回答する前に関連⽂書を検索‧参照することで、最新かつ正確な情報を提供します。社内⽂書、Web情報へのアクセスユーザーの質問に関連する情報を検索ベクトルDBでの類似度検索が基盤技術外部ツール連携 AIが必要な時に適切な外部機能を呼び出し、情報取得や操作を⾏うことで、実⾏能⼒を拡張します。 APIやツールの構造化された呼び出し天気確認、予約、計算などの機能連携 AIの判断で適切なツールを選択可能マルチエージェント複数の専⾨AIエージェントが協調し、それぞれの得意分野で貢献することで、複雑なタスクを効率的に解決します。役割分担による専⾨性の発揮相互批評による品質向上タスク分解による並⾏処理の実現タスクの分担複雑なタスクを単純なタスクに分割してそれぞれを専⾨のエージェントが実⾏し、それらを統合する幻覚/知識の古さ⻑期記憶の弱さ実⾏⼒の⽋如 RAG 検索拡張⽣成 Function Calling / Tool use 外部ツール連携マルチエージェント分担協調システム

チャットボットユーザーの問いかけに応答するチャットボットからエージェントを経てネットワークへエージェントネットワーク内部で複数の専⾨エージェントが連携‧協調する⽣成AIはエージェント化単なるチャットボットから⾃律的なエージェントへと進化。外部ツールの操作や意思決定も可能に連携‧協調の時代へ
複数のAIエージェントが専⾨性を持ち、互いに協⼒してタスクを達成する時代へエージェント単純なタスクを遂⾏する現状のAIプロダクトはエージェント/ツール間、またはエージェント/エージェント間のやり取りをプロダクトごとに独自のやり方で実現している。また、各AIモデルベンダーのAPI仕様やそこでのツールの使われ方も統一されておらず、複数のモデルで複数のツールに対応しようとすると、対応モデル数x対応ツール数分のプログラムを実装しないといけない。だが、しかし…

ちなみにチラデジはまだチャットボットとエージェントの中間ぐらいの存在です LLMが関わる処理（構造化データ抽出/タグ⽣成・付与）と各種外部APIに関わる処理（OCR、位置情報取得、駅・施設情報取得）を旧来の⼿続き的なプログラムで統合しています。

なぜバラバラではダメなのか？標準化標準プロトコル導⼊による恩恵互換性の向上異なるベンダーのAIモデルでも同じツールセットを利⽤可能にセキュリティの⼀元管理認証‧権限管理の共通化によるセキュリティ向上イノベーション促進基盤技術への投資集中と⾼レベルの機能開発活性化 "標準プロトコルの登場は、かつてのHTTPとHTMLがWebに与えた影響に匹敵する転換点かも？"
個別対応の地獄再利⽤性の低さ開発‧運⽤コストの激増拡張性の⽋如標準プロトコルによる統合⾼いコンポーネント再利⽤性開発スピードの向上エコシステムの活性化

現状提案されている三つの標準プロトコル各プロトコルは独⽴した価値を持ちながらも、組み合わせることで最⼤の効果を発揮します各プロトコルはオープン標準として公開され、多くの企業が実装に着⼿しています AG-UI Agent-User Interface Protocol AIとユーザーを繋ぐの役割 MCP Model
Context Protocol AIと外部ツール‧データソースを接続する役割 • 外部ツールへのアクセス‧操作データベース‧API連携、ファイル操作‧情報収集 A2A Agent-to-Agent Protocol AIエージェント同⼠の連携を司る役割 • タスク分担‧協調作業専⾨エージェント間の知識共有意思決定‧合意形成 • リアルタイム対話インターフェース • 視覚的フィードバック • マルチモーダル⼊出⼒ AG-UI A2A A2A MCP MCP インターネットユーザー端末

MCP（Model Context Protocol）とは？ MCP（モデル・コンテキスト・プロトコル）は、AIモデルと外部のデータソースやツールを接続するためのオープン標準です。 Anthropic社によって2024年11月に初めて公開され、AIアシスタントを企業内のコンテンツリポジトリや業務ツール、開発環境など「データが存在するシステム」へ直接つなぐことを目指して設計されました。このプロトコルを使うことで、これまで各データソース毎にバラバラに実装されていたAIからのアクセス⽅法を単一の標準にまとめることができます。その結果、AIシステムに必要なデータや機能をより簡潔かつ確実に提供できるようになります。
MCPは公式ドキュメントで「AIアプリケーションにとってのUSB-Cポート」に喩えられており、さまざまなデータソースやツールに対して統⼀されたインターフェースをLLMに提供します。⾔い換えれば、 MCPに準拠することでアプリケーションはLLMへ⼀貫した⽅法でコンテキスト（外部知識やデータ）を供給できるのです。

ローカルMCPの事例 Model Context Protocol (MCP) のローカルサーバローカルMCPサーバーを使⽤すると、AIモデルはユーザー環境のファイル、データベース、開発ツールや外部APIなどに安全にアクセスできます。セキュリティとプライバシーを確保しながら、強⼒なAIアシスタント機能を実現します。プライバシー重視：機密データをクラウドに送信せず、ローカル処理ネットワーク依存なし：オフライン環境でも利⽤可能
カスタマイズ性：企業固有のツールやシステムとの統合が容易低レイテンシー：ローカル処理による⾼速レスポンスローカルファイルデータベースウェブブラウザチャットツール表計算ソフトバージョン管理ターミナルカスタムツールローカルMCPの利点 DB MCPクライアント機能を有するAIアプリケーションパソコン利用する外部ツールに対応したローカルMCPサーバ（群）インターネット

例：CursorからBigQueryにアクセス

例：ClaudeDesktopにBlenderを操作させて3D空間をモデリング

僕⾃身もローカルMCPサーバを作ってOSSとして公開しています https://github.com/modelcontextprotocol/servers MCPの公式のGitHubリポジトリにも掲載されてます https://github.com/hiromitsusasaki/raindrop-io-mcp-server

リモートMCPの事例クラウドベースのMCP連携リモートMCPサーバーは、AIモデルをShopify、Stripe、Twilioなど様々な外部SaaSサービスと連携させます。 OpenAIのResponses APIがこれらのリモートMCPサーバーをサポートし、エンタープライズシステム統合を加速しています。主要SaaSサービス連携事例 Shopify ECサイト⾃動管理ユースケース:
在庫⾃動確認‧発注顧客問い合わせAI対応商品情報の最適化 Stripe 決済処理⾃動化ユースケース: 請求書⾃動作成‧送信⽀払い状況モニタリング不正検知⽀援 Twilio コミュニケーション⾃動化ユースケース: SMS/⾳声⾃動応答マルチチャネル通知顧客サポートの強化 Zappier AIとワークフローの統合ユースケース: • 既存の⼿続き的なワークフローをAIが⾃律的に利⽤できる Z Z インターネットリモート側のサービスが直接AIエージェントとやり取りする

AIエージェントはSaasの形をかえる？サティア・ナデラ: https://www.youtube.com/watch?v=GuqAUv4UKXo 「これまで⼤きなプラットフォームシフトが起こるたびに、アプリケーションのアーキテクチャも⼤きく変わってきました。 … 同じような規模、もしくはそれ以上の変化が、AI エージェントの登場によって再び起こるでしょう。エージェントのポイントは、特定のSaaSアプリ
ケーションやそのデータに縛られないことにあります。つまり、『タスク』や『意図』を中心に、複数のSaaSの機能をまとめてオーケストレーションできるようになるのです。」

まとめ Webは「情報を読む」プラットフォームから始まり、「参加‧共有する」Web2.0を経て、「機械が意味を理解する」セマンティックWebへ進化してきました。そして現在、AIが⾃律的に動き、⼈間の代わりにタスクを実⾏する「Agentic Web」の時代へと移⾏しています。 Web 1.0 静的ウェブ閲覧のみの⼀⽅向コミュニケーション
ウェブマスターが全コンテンツを作成 HTMLの単純な静的ページ「読む」ウェブ Web 2.0 参加型ウェブユーザー⽣成コンテンツ中⼼ソーシャルメディアの台頭双⽅向コミュニケーション「書く‧共有する」ウェブセマンティックWeb 意味理解ウェブ構造化データと意味づけ機械可読なメタデータ知識グラフとオントロジー「理解する」ウェブ静的参加型⾃律⾏動 Agentic Webが注目される理由 AIエージェントが⼈間の意図を理解し、適切なサービスを⾒つけ、必要な⾏動を⾃律的に実⾏します。標準プロトコル（MCP‧A2A‧AG-UI）がこの基盤となり、インターネット上のあらゆるサービスがシームレスに連携し、ユーザーの代わりに複雑なタスクを完遂できる世界が実現しつつあります。 1990年代 2000年代 2010年代 2020年代〜 Agentic Web ⾃律⾏動ウェブ AIエージェントによるタスク実⾏標準プロトコルによる連携⼈間の意図を汲み取る⾃律⾏動「動く‧実⾏する」ウェブ意味理解

生成AIと標準プロトコルの現在地 - Agentic Webの胎動 -

生成AIと標準プロトコルの現在地 - Agentic Webの胎動 -

hiromitsusasaki

More Decks by hiromitsusasaki

Other Decks in Technology

Featured

Transcript

⽣成AIと標準プロトコルの現在地 Agentic Webの胎動

LLMのしくみ（1）– ⾔葉をつなぐ仕組み ... 予測結果: 直前までの単語から次に来る単語を予測過去の学習データから確率的に最適な単語を選択 Attentionメカニズム「⽂脈の中で各単語がどれだけ重要か」を計算 The cat

⽣成AIのしくみ（2）– Reasoningと思考の模倣問題: ボブは8個のりんごを持っていました。5個を友達にあげて、2個買いました。今、ボブは何個のりんごを持っていますか？ Chain of Thought (CoT) Tree

で..? （難しいこと考えられるからなに？）

例：CursorからBigQueryにアクセス

例：ClaudeDesktopにBlenderを操作させて3D空間をモデリング

僕⾃身もローカルMCPサーバを作ってOSSとして公開しています https://github.com/modelcontextprotocol/servers MCPの公式のGitHubリポジトリにも掲載されてます https://github.com/hiromitsusasaki/raindrop-io-mcp-server