Slide 1

Slide 1 text

2025/4/17 #StudyCo Cursor Agentによる パーソナルAIアシスタント育成入門 ―業務のプロンプト化・MCPの活用

Slide 2

Slide 2 text

自己紹介 大嶋勇樹(おおしまゆうき) https://x.com/oshima_123 株式会社ジェネラティブエージェンツ取締役CTO/Co-founder 大規模言語モデルを組み込んだアプリケーションやAIエージェントの開発を実施 個人ではエンジニア向けの勉強会開催やUdemy講座の作成など 勉強会コミュニティStudyCo運営 「ChatGPT/LangChainによるチャットシステム構築[実践]入門」(共著) 「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」(共著)

Slide 3

Slide 3 text

会社名 株式会社ジェネラティブエージェンツ (英文:Generative Agents, Inc.) 所在地 東京都港区 ※ 全社員リモート勤務 役員構成 CEO 西見 公宏 COO 吉田 真吾 CTO 大嶋 勇樹 設立年月 2024年3月14日 事業内容 AIエージェント技術を軸とした生成 AIアプリケーション開発 支援、コンサルティング、教育・研修サービスの提供 AIエージェントインテグレーションサービスの提供 AIエージェントを実業務で本当に活用するためには、AIエージェントの技術特性 と問題解決領域の両面から検討を進める必要があります。当社は「LangChain」 の公式エキスパートとして、AIエージェントを開発するための確かな技術力を活 かし、生成AIアプリケーション開発支援からコンサルティング、教育・研修サービ スまでのあらゆる方面において、AIエージェントを活用した問題解決サービスを 提供します。 インテグレーションを支えるサービス群の提供 AIエージェントを効果的に運用するためには、AIエージェントを動かすためのイ ンフラが必要です。当社はマルチエージェントのオーケストレーション基盤である 「Generative Workforce(※開発中)」をはじめ、AIエージェントのためのツール群 「middleman.ai」の提供を通して、AIエージェント活用のための基盤構築をサ ポートします。 株式会社ジェネラティブエージェンツ - 会社概要 AIエージェントが「ハブ」となり 人間とAIエージェントの協働が 当たり前になる世界を実現する

Slide 4

Slide 4 text

代表取締役CEO / Founder 西見 公宏 Masahiro Nishimi 事業会社の顧問CTOとして活動するソフトウェア開発のスペシャリス ト。AIエージェントを経営に導入することにより、あらゆる業種業態の 生産性を高めるための活動に尽力している。 「その仕事、AIエージェントがやっておきました。――ChatGPTの次に 来る自律型AI革命」(技術評論社)単著、Software Design「実践LLMア プリケーション開発」(技術評論社)連載。 主な著書 『その仕事、AIエージェントがやっておきました』 取締役COO / Co-founder 吉田 真吾 Shingo Yoshida AWS Serverless Heroとして日本におけるサーバーレスの普及を促進。 「ChatGPT/LangChainによるチャットシステム構築[実践]入門」(技 術評論社)共著、「Azure OpenAI ServiceではじめるChatGPT/LLMシス テム構築入門」(技術評論社)共著、「AWSによるサーバーレスアーキ テクチャ」(翔泳社)監修、「サーバーレスシングルページアプリケー ション」(オライリー)監訳、「AWSエキスパート養成読本」(技術評 論社)共著。ChatGPT Community(JP)主催 主な著書 『ChatGPT/LangChainによるチャットシステム構築[実践]入門』 『Azure OpenAI ServiceではじめるChatGPT/LLMシステム構築入門  エンジニア選書』 取締役CTO / Co-founder 大嶋 勇樹 Yuki Oshima 大規模言語モデルを組み込んだアプリケーションやAIエージェントの開 発を実施。 個人ではエンジニア向けの勉強会開催や教材作成など。オンラインコー スUdemyではベストセラー講座多数。 「ChatGPT/LangChainによるチャットシステム構築[実践]入門」(技 術評論社)共著。勉強会コミュニティStudyCo運営。 主な著書 『ChatGPT/LangChainによるチャットシステム構築 [実践]入門』 運営メンバー

Slide 5

Slide 5 text

2025/4/17 #StudyCo Cursor Agentによる パーソナルAIアシスタント育成入門 ―業務のプロンプト化・MCPの活用

Slide 6

Slide 6 text

はじめに Cursor・Clineなどのソフトウェア開発支援のAIツールの進化は目覚ましく、開発者の生産性に大きな 影響を与えています 実はこれらのツールの使い道はコーディングに限ったものではなく、個人のタスク管理や業務の 自動化など、様々な用途で活用できる「パーソナルAIアシスタント」として育てることもできます この勉強会では、Cursor AgentのパーソナルAIアシスタントとしての活用について紹介します マニュアル的な業務をプロンプト化してエージェント駆動で実施できるようにする例から、 最近話題のMCP(Model Context Protocol)を活用する例まで扱います

Slide 7

Slide 7 text

前提 想定対象者 ● Cursorのコーディング"以外"への活用が気になっている方 前提知識 ● 「GPT-4o」「Claude」といった単語が伝わる程度のLLMの知識 ● 「エディタ」「コマンド」が伝わる程度のソフトウェア開発の知識 ● コーディングの話が多少ありますが、詳細が理解できなくても全体には大きく影響しません ※質疑についてもコーディング以外の話題を優先して回答するつもりです ※例としてCursorを使用しますが、他のツールでも参考にできる内容だと考えています

Slide 8

Slide 8 text

● 個人的に取り組んでみていることの紹介や、個人の見解が中心的な話題になります 確立されている分野ではないですし、私もより上手な使い方がないか模索中です ● タイトル通り「入門」の勉強会になります すでに似たような使い方をしている方にとっては、当たり前の話が多いかもしれません ● Cursorの使い方の体系的な解説よりも、デモンストレーションが多めになります 使い方の解説はすでにWeb上の記事も多いので、配信という形式でこそできるデモ中心にします ● 実際に同じようなことをやってみると、おそらく苦戦する点も出てきます やってみて感じた課題点なども最後に紹介します 注意事項

Slide 9

Slide 9 text

アジェンダ ● CursorとCursor Agentの概要 ● Cursor AgentのパーソナルAIアシスタントとしての活用 ● MCPの活用

Slide 10

Slide 10 text

CursorとCursor Agentの概要

Slide 11

Slide 11 text

Cursorとは Cursorは、Visual Stuido Codeをベースとして開発された、AIとシームレスに統合されたエディタです Cursorでは、指定したファイルの内容を踏まえたチャットなどが可能です https://www.cursor.com/ja

Slide 12

Slide 12 text

Cursor Agentとは Cursorのチャットには、「Agent Mode」 「Ask Mode」「Manual Mode」といった モードが存在します ※この勉強会ではCursorのチャットの「Agent Mode」 のことを「Cursor Agent」と呼びます 「Agent Mode」では、既存のファイルの検 索やコマンドの実行をしながら、次々と コードを実装(=ファイルを編集)してい く動作になります

Slide 13

Slide 13 text

デモンストレーション Cursor Agentでのコード生成の例を見ていきます

Slide 14

Slide 14 text

デモンストレーションの様子 「staticディレクトリにhtmlとjsでリバーシを作って」 「サーバー起動してみて」

Slide 15

Slide 15 text

Cursorでのコーディングのよくある工夫 Cursor Agentにいきなり「○○を実装して」とだけ指示しても、見当違いなコードが生成されて徒労に 終わることは少なくありません まずは何をどう作ろうとしているのかCursor Agentと壁打ちしながらファイルにまとめていき、 その内容をもとにコードを実装させると、より意図に近いコードを生成してくれやすくなります Cursor AgentのパーソナルAIアシスタントとしての活用は、 Cursorにコーディング前にドキュメントを書かせることの延長と考えてもいいかもしれません ※今日はコーディングは本題ではないので、コーディングについてはこれ以上深掘りしません この機能の仕様や実装方針をdocs/example-feature.mdにまとめて @example-feature.mdの内容を実装して ここはもっとこうだよ

Slide 16

Slide 16 text

ここまでのまとめ ● Cursorは、AIとシームレスに統合されたエディタです ● Cursor Agentでは、既存のファイルの検索やコマンドの実行をしながら、次々とコードを実装 (=ファイルを編集)していく動作になります ● Cursor Agentにドキュメントのファイルを作成させて、その内容をもとにコードを生成させる、 といった流れで実装を進めることもできます CursorやCursor Agentの概要はここまでとして、 本題の「Cursor AgentのパーソナルAIアシスタントとしての活用」について見ていきます

Slide 17

Slide 17 text

補足)Cursorの設定項目 Auto-run ● Cursor Agentが提案したコマンドや編集を自動で適用する設定 ● コマンドはallowlist・denylistで許可・拒否設定が可能 例)gitコマンドは自動実行不可とする ● 参考:https://docs.cursor.com/chat/tools#auto-run Rules for AI ● Cursorのチャット(Agent含む)に自動で適用したいプロンプトの設定 ● 主にProject RulesとGlobal Rulesがある ● 参考:https://docs.cursor.com/context/rules-for-ai

Slide 18

Slide 18 text

Cursor Agentの パーソナルAIアシスタントとしての活用

Slide 19

Slide 19 text

Cursor Agentの可能性 Cursor Agentには、コーディング以外のタスク依頼もできます 例えば... ● 「○○に必要なタスクを洗い出してtodo.mdにまとめて」 ● 「イベントの書き起こしからブログ記事の下書きを作って」 ● 「YouTube Liveの配信準備して」 最近はこのようにCursor Agentをコーディング以外の用途に活用する例が増えています ※Cursorのことを「エージェント付きエディタ」ではなく「エディタ付きエージェント」だとと捉えるイメージだと思っています

Slide 20

Slide 20 text

本日の題材 デモンストレーションの題材として、 「StudyCoの勉強会アーカイブ動画の字幕からQ&Aを一覧化する」 というタスクに取り組むことにします 以下の流れでプロンプトを作成していきます 実際に取り組む様子を見た方が分かりやすいと思うので、 デモンストレーションとしてやってみます 最初のプロンプトを 書かせる プロンプトを 別セッションで実行 フィードバックして プロンプトを改善 何度か繰り返す 完成

Slide 21

Slide 21 text

デモンストレーション Cursor Agentで 「StudyCoの勉強会アーカイブ動画の字幕からQ&Aを一覧化する」 というタスクに取り組んでみます

Slide 22

Slide 22 text

デモンストレーションの様子 「./tmpに勉強会の文字起こしデータがあります。この 文字起こしからQ&Aをまとめるプロンプトを作成して ください。プロンプトはpromptsディレクトリに保存 して。」 「@qa_extractor.mdこれを実行して」 →失敗 「文字起こしデータはtmpディレクトリにあります。 このことを手順に追記して」

Slide 23

Slide 23 text

やってみたことを整理すると... 以下の流れでプロンプトを作成してみました 結果 Cursor Agentを使って、繰り返し実施するマニュアル業務をプロンプト化して、エージェント駆動で実 行できるようになりました プロンプトを実行してうまくいかなかったときにプロンプトの更新を指示できることは、 Cursor Agentの大きな特徴です(GPTsなどはできません) 最初のプロンプトを 書かせる プロンプトを 別セッションで実行 フィードバックして プロンプトを改善 何度か繰り返す 完成

Slide 24

Slide 24 text

補足)プロンプトの管理 私はGitHubに「workspace」というリポジトリを作成して、そこでプロンプトを管理しています エージェントが想定外のファイルの編集をすることも多いので、Git・GitHub等の利用は重要です ※Git:ファイルのバージョン管理ツール ※GitHub:Gitで管理したファイルを共有するサービス . ├── .cursor ... Cursorの設定ファイル ├── memory ... エージェントに覚えておいてほしい記憶 ├── prompts …プロンプト集 │ ├── example_task1.md │ └── example_task2.md └── src ... 自作のMCPサーバーや各種スクリプト

Slide 25

Slide 25 text

追加題材 追加題材として、「StudyCoの勉強会アーカイブ動画の字幕からQ&Aを一覧化する」というタスクをよ り上手に実施できるよう、長期記憶やHuman-in-the-Loopを入れてみます 長期記憶(Long-Term Memory) ● ここではチャットのスレッドを超えて記憶を保持することを「長期記憶」と呼ぶことにします Human-in-the-Loop ● エージェントが人間に質問したりレビュー依頼するこをと「Human-in-the-Loop」と呼びます 長期記憶やHuman-in-the-Loopを組み込む例として、 字幕の誤った単語を人間に確認して記憶するという処理を組み込んでみます

Slide 26

Slide 26 text

デモンストレーション 「StudyCoの勉強会アーカイブ動画の字幕からQ&Aを一覧化する」プロンプトに 長期記憶やHuman-in-the-Loopを組み込んでみます

Slide 27

Slide 27 text

デモンストレーションの様子 「@qa_extractor.mdこれやって」 「よく分からない単語はありますか?」 「○○という単語はおそらく○○のことです。 このことを記憶としてmemoryディレクトリに保存して」 「@qa_extractor.md の手順を更新してください。 - memoryディレクトリに書いた内容を確認する - QAを作成したあとで分からない単語を人間に確認して memoryを更新する」

Slide 28

Slide 28 text

ここまでのまとめ ● Cursor Agentには、コーディング以外のタスク依頼もできます ● プロンプトを実行してうまくいかなかったときにプロンプトの更新を指示できることは、 Cursor Agentの大きな特徴です ● 指示やファイル構成を工夫して、長期記憶やHuman-in-the-Loopのような挙動を入れると 役立つ場合もあります ここまではテキストファイルの操作で完結するタスクを扱いました 最後に、MCPを使ってCursor Agentにより高度なタスクを担わせる例を見ていきます

Slide 29

Slide 29 text

余談)なぜ最近流行り出したのか ※個人の見解です ● Cursorをコーディングに使用している方は1年以上前からある程度いましたが、 コーディング以外への活用は最近話題になり始めたと感じています ● 私の考えとしては、ここ1年ほどのLLMの性能向上により、以前よりも複雑なタスクを プロンプトでの指示だけで完遂しやすくなったことが大きいと考えています (以前のLLMは、プロンプトで複雑な手順を指示をすると無限ループしたりしがちでした) ● 今後もモデルの性能が向上し、プロンプトでの指示(+後述するMCPのようなツールの設定) だけでできるタスクが増えていくかもしれません

Slide 30

Slide 30 text

MCPの活用

Slide 31

Slide 31 text

MCP(Model Context Protocol)とは MCP(Model Context Protocol)は、Anthropicが提案した、LLMにコンテキストを提供する方法を 標準化したプロトコルです MCPは、「AIアプリケーション用のUSB-Cポート」のようなものだと言われています https://norahsakal.com/blog/mcp-vs-api-model-context-protocol-explained/

Slide 32

Slide 32 text

AIアプリケーション用のUSB-Cポート? MCPのようなプロトコルがない場合 MCPのようなプロトコルがある場合 ● MCPをサポートしているAIアプリが、MCPで 利用可能な外部サービス・データに接続可能に ● AIアプリ開発側も外部サービスの開発側も、 MCPさえサポートすれば接続先が多数になる Claude Desktop 他 Google Drive ローカル ファイル 他 AIアプリ 外部サービス・データ Cursor ● AIアプリによって外部サービス・データへの 接続方法が異なっていた ● AIアプリ開発側も外部サービスの開発側も、 色々な接続方法をサポートするのは大変だった ChatGPT (GPTs) 他アプリ AIアプリ 外部サービス・データ Cursor OpenAPI Specの設定で接続 独自のスクリプト等で接続 他の方法で接続

Slide 33

Slide 33 text

MCPの構成と機能 MCPの構成 MCPでは、Claude DesktopやCursorといった MCPホスト(MCPクライアント)から 「MCPサーバー」を介して 外部サービス・データに接続します MCPで定義される機能 MCPでは「Tools」「Resources」「Prompts」など いくつもの機能が定義されていますが、 よく使われるのは「Tools」機能です ※CursorはTools機能のみをサポートしています(2025/4/17時点) MCPのTools機能では、モデルが必要に応じて呼び出すツールを提供します https://modelcontextprotocol.io/introduction

Slide 34

Slide 34 text

CursorでのMCPの使い方 【A】既存のMCPサーバーを使用する 公開されている既存のMCPサーバーを使うと、MCPを簡単に使い始めることができます ※公開されているMCPサーバーの利用時は安全性に注意が必要です 【B】自作のMCPサーバーを使用する MCPサーバーはPythonなどで自作して使うこともできます 既存のMCPサーバーを使用する例と自作のMCPサーバーを使用する例を順に見ていきます https://github.com/github/github-mcp-server https://github.com/microsoft/playwright-mcp https://github.com/awslabs/mcp

Slide 35

Slide 35 text

デモンストレーション 既存のMCPサーバーの活用

Slide 36

Slide 36 text

デモンストレーションの様子 { "mcpServers": { "playwright": { "command": "npx", "args": ["@playwright/mcp@latest"] } } } .cursor/mcp.jsonの設定 参考)https://github.com/microsoft/playwright-mcp 「static以下のリバーシの動作確認をして」

Slide 37

Slide 37 text

MCPサーバーを自作するには MCPサーバーは以下のようなコードで自作できます MCPについてLLMに教えるためのllms-full.txtも提供されています https://modelcontextprotocol.io/llms-full.txt from mcp.server.fastmcp import FastMCP mcp = FastMCP("Demo") @mcp.tool() def add(a: int, b: int) -> int: """Add two numbers""" return a + b https://github.com/modelcontextprotocol/python-sdk

Slide 38

Slide 38 text

デモンストレーション 自作MCPサーバーの活用

Slide 39

Slide 39 text

デモンストレーションの様子 { "mcpServers": { "middleman": { "command": "/Users/oshima/.local/bin/uv", "args": [ "--directory", "/Users/oshima/work/workspace", "run", "src/mcp_servers/middleman/main.py" ] } } } .cursor/mcp.jsonの設定 ※自社で開発しているエージェントの  ツールサービスをMCP化したものです 「@qa_summary.mdをPDFにして」

Slide 40

Slide 40 text

ここまでのまとめ ● MCPは、LLMにコンテキストを提供する方法を標準化したプロトコルです ● MCPで主に使われているTools機能では、モデルが必要に応じて呼び出すツールを提供します ● CursorでMCPを使う時は、既存のMCPサーバーを使うか、自作のMCPサーバーを使います Cursor AgentでMCPを使用すると、テキストファイルの操作よりも さらに高度なタスクを依頼できるAIアシスタントとして活用できる可能性があります

Slide 41

Slide 41 text

全体のまとめと考察

Slide 42

Slide 42 text

全体のまとめ ● この勉強会では、Cursor AgentのパーソナルAIアシスタントとしての活用について紹介しました ● Cursor Agentにはコーディング以外のタスクを依頼することもでき、Cursor上でプロンプトを 育てながら、エージェントにできる仕事を増やしていくことができます ● 指示やファイル構成を工夫したり、MCPを活用することで、単なるテキストファイルの操作より さらに高度なタスクを担わせることもできます エージェントを活用するうえで、プロンプトは「資産」だと考えられます 今日の内容が自分なりのエージェントの育成に役立てば嬉しいです

Slide 43

Slide 43 text

考察(1/2)課題だと感じること ● プロンプトが完成すれば便利ですが、プロンプトを作る過程では時間がかかります 急ぎの仕事はいったん人手でやったほうがすぐに終わります 既存のMCPサーバーが機能不足だからと実用レベルのものを自作し始めると時間が溶けます ● 自分だけが使えるものを作るのと、社内での共有にはある程度の壁があると感じます プロンプトに反映しきれていない暗黙知まで言語化するのはなかなか大変です 自作MCPサーバーの共有にも少し手間がかかります(設定ファイルにフルパスがあるなど) ● 人間がボトルネックになり始めていることを感じます https://posfie.com/@blackstaragent/p/Joz0NwC

Slide 44

Slide 44 text

考察(2/2)重要かもしれないと感じること ● AIの可能性を信じる気持ち AIの使いこなしには、AIの可能性を信じている必要があると感じます(盲信ではなく適度に) 個人的には「多くの分野でAIは自分より賢い」と考えるようになってから使い方が変わりました ● なんでも一旦AIにやらせる 自分で手を動かしたり考えたりするよりAIを使うべきという場面が増えてきていると感じます なんでもAIにやらせるために、どうすればAIにやらせることができるかを日々考えています ● 不必要な完璧さを求めない 完璧ではなくても早く終わればよい仕事が実はたくさんあると思います 完璧な成果物を作るより、AIで素早く仕事を終わらせることが有用な場面も多いはずです

Slide 45

Slide 45 text

宣伝

Slide 46

Slide 46 text

人間が様々なソフトウェアを駆使して 仕事を進めていく AIが様々なソフトウェアを駆使して 仕事を進めていく 人間がソフトウェアを使うのではなく、 AIがソフトウェアを扱う世界へのパラダイムシフト

Slide 47

Slide 47 text

Environment(環境) Perception(知覚) Brain(思考) Action(行動) ビジネス環境におけるデータ を知覚できるか? LLMによって思考しやすい データ形式になっているか? ビジネス環境に適したデータ に変換できるか? ビジネス環境に対して、AIエージェントがどうワークできるか?

Slide 48

Slide 48 text

Environment(環境) エージェントツール いかにエージェント向けのツールを整備するかがイシュー Brain(思考) LLMによって思考しやすい データ形式になっているか? 知覚のための ツール群 出力のための ツール群

Slide 49

Slide 49 text

エージェントのリアル業務への適応性を高める middleman.ai Dify、LangChainと簡単に接続できるようにすることで、 既存LLMワークフローのケイパビリティを拡張する。 α版をクローズドで公開し、オープンβを経て一般公開予定。 MCPサーバーも提供予定。 middleman.ai α版ご案内のWaitlistはこちら https://forms.gle/z4iZW2h6nbhEzD769

Slide 50

Slide 50 text

LLMアプリケーション開発 - 最新情報セミナー&養成講座(合同研修) LLMアプリケーション開発 最新情報セミナー 日時:5/23(金)13:30〜15:30 対象者:LLMアプリ開発の最新トピックをおさえたい方 ● OpenAI、Anthropic、Google(Gemini)などの 主要なアップデートの解説 ● LangChain/LangGraphの大きなアップデート・ 破壊的変更の解説 ● 話題のプロダクト・事例の紹介 LLMアプリケーション開発者 養成講座(合同研修) 日時:5/27、6/3、6/10(火)10:00〜18:00 対象者:LLMアプリ開発を基礎から学びたい方 ● LLMアプリケーション開発の基礎から実践まで 体系的な講義とハンズオン ● LangChain・RAG・AIエージェントのベストセラー 書籍著者による解説と手厚い質疑応答 ● 合同研修として開催のため、各社1名から参加可能 最新情報セミナー&養成講座(合同研修)の詳細確認とお申し込みは以下のWebサイトから https://generative-agents.notion.site/llm-app-seminars-202505 ※どちらも基本的に法人様向けサービスとなります

Slide 51

Slide 51 text

ご清聴ありがとうございました