Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【20260226 AI×DevOpsStudy #7】Claude Code の AIエージ...

【20260226 AI×DevOpsStudy #7】Claude Code の AIエージェントやスキルの作り方

■AI×DevOps Study #7 の概要
2026年2月26日に開催した「AI×DevOps Study」第7回の勉強会資料です。

「AI×DevOps Study」は、AI駆動開発やそこに関係するマイクロサービスについて理解を深める場になります。
株式会社ScalarではAIを使ったチーム開発を進めており、参画しているメンバーや協力会社の方から、具体的なAI駆動開発を実施する方法、その中で生まれたマイクロサービスアーキテクチャを使用したAI駆動開発の事例や実際に使えるエージェントについてお話頂き、参加者の皆様と知識の共有や交換を目的としています。
(弊社製品であるScalarDBも絡んだお話も一部出てきますが、汎用的な内容となっておりますのでフラットにお楽しみいいただけます)

■今回のテーマ
「Claude Code の AIエージェントやスキルの作り方」

リアーキテクチャ、設計、コーディングなどを行うエージェントをこれまで作ってきた経験から、今のAIの能力を活かしたエージェントを開発する方法を紹介します。 また、マイクロサービスアーキテクチャを採用した設計エージェントを、具体的にどういったステップで、どのようにAIエージェントを作っているのかについてもお話いたします。

■登壇者情報(敬称略)
深津航
株式会社Scalar Founder & CEO。日本オラクル株式会社、決済系のスタートアップを経て、株式会社Scalarを創業。

■勉強会動画
Claude Code の AIエージェントやスキルの作り方【20260226 AI×DevOpsStudy #7】
https://www.youtube.com/watch?v=vkrIoOAExac

Avatar for Scalar, Inc.

Scalar, Inc.

March 08, 2026
Tweet

More Decks by Scalar, Inc.

Other Decks in Technology

Transcript

  1. ⾃⼰紹介 名前:深津航 所属:株式会社Scalar CEO, Co-Founder 主な関⼼事項 • ⽇本のIT強化 • アーキテクチャ/設計

    • DevSecOps, FinOps • AIが与える各種業界へのインパクト LinkedIn: https://www.linkedin.com/in/wataru-fukatsu-1692655/ Zenn blog: https://zenn.dev/wfukatsu 2
 ▪ IPAの専⾨委員としての活動 DADCの専⾨委員としても活動しています。 ▪ 株式会社 Scalar としての活動 株式会社Scalarは、分散トランザクションマネー ジャーのScalarDBと改ざん検知ソフトウェアの ScalarDLを展開中。マイクロサービス化におけるシ ステムの課題やAIなどのデータ基盤の信頼性を担保 するソリューションを展開しています。 ソフトウェア開発、システム開発、マーケティン グ、営業、経営など様々な役割で活動中。
  2. 100以上のエージェントやスキルの実装 3
 作ってきた代表例:システム系 • スキル‧エージェント構築エージェント • スキル‧エージェントレビューエージェント • 現⾏システム調査エージェント •

    モジュール成熟度指標計測エージェント • リファクタリングエージェント • ドメインストーリーテリングエージェント • DDDをベースにしたマイクロサービス設計 エージェント • マイクロサービス実装エージェント • テスト⽣成エージェント • コードレビューエージェント • Gitlab に対する問合せエージェント • クラウドインフラサイジングエージェント • ScalarDBを使ったシステム設計エージェント • 技術ブログ解析エージェント など、多数 作ってきた代表例:⾮システム系 • GTM作成⽀援エージェント • 企業分析エージェント • 営業⽀援エージェント • 営業コーチングエージェント • アカウントプラン作成エージェント • ファーストコール資料レビューエージェント • Triple Fit Strategy (TFS)分析エージェント • メール⽂案作成⽀援エージェント • ⽇本語コーチングエージェント • 知財分析エージェント • 物理シュミレーションエージェント • ものづくりにおける要求分析エージェント • FEMA/FTA分析エージェント • 事故再現シュミレーション‧エージェント • Google Slide, Goolge Spreadsheet ⽣成エー ジェント • 漫才エージェント など、多数
  3. ものづくり⽀援 5
 〇〇というもの を作りたい AI Agent 要求分析 エージェント △△という条件 のもと、〇〇と

    いう要件で良い ですか? ScalarDB 要求に合わせて、 必要なデータを取得し、 整理するMCP Server Skill ⾃社のノウハウ 材料の情報 コスト情報 過去実績 市場、法的 要件など
  4. ものづくり⽀援 エージェントの役割 • 顧客の曖昧な要求を分析し、要求を明確化、不⾜する情報があれば、⾃動的に 質問をし、⾜りない情報を取得する • 要求から、仮の要件を作成するために、制約条件となる物理的な諸条件、過去 の失敗などの履歴から除外条件を探し、要件を狭める • 決められた要件から、的確な物理モデルを選択し、それに必要な分析ライブラ

    リを選択し、その分析ライブラリに必要な⼊⼒条件を定める • 要求‧要件から分析条件を⼊⼒し、物理シュミレーションを実⾏する • 得られた実⾏結果と、⾃社のもつ知⾒から、考察を展開し、推敲する • 報告書を作成し、顧客に報告する 従来、何⽇もかかっていた作業が、20分〜1時間くらいで終了する 7

  5. GitLab の情報から報告書を作成する 9
 ➢ POSシステムの開発の経緯と現在の状況をまとめて ください 数値サマリー ┌──────────────┬───────────────────────────────┐ │ 指標

    │ 値 │ ├──────────────┼───────────────────────────────┤ │ 総Issue数 │ 77件(69 closed / 8 open) │ ├──────────────┼───────────────────────────────┤ │ 総MR数 │ 155件(153 merged / 2 open) │ ├──────────────┼───────────────────────────────┤ │ Milestone │ 8つ(7 closed / 1 active) │ ├──────────────┼───────────────────────────────┤ │ 開発期間 │ 約4ヶ月(2025-11 〜 2026-02) │ ├──────────────┼───────────────────────────────┤ │ 主要メンバー │ 3名(FE/BE/インフラ) │ └──────────────┴───────────────────────────────┘ 技術スタック - フロントエンド : Next.js, TypeScript, react-hook-form, Biome - バックエンド : Spring Boot, ScalarDB (2PC分散トランザクション ), MapStruct - BFF: JWT認証, Feign Client - インフラ: Docker Compose, GitLab CI/CD, SAST/依存関係スキャン - AI開発ツール : Claude Code (Skills/Rules/Subagent), agent-browser (E2E)
  6. GitLab の情報から報告書を作成する エージェントの役割 • 指定された期間に更新された、Epic, Milestone, Issue, MRs, Wikiを、指定され たプロジェクトグループのすべてに対して取得する

    Python Scriptを実⾏する • ローカルに情報の索引を構築し、MCP Server 経由で探索できるように構成す る • 作業内容を分類し、報告書を作成するための情報を整理する • あらかじめ⽤意された報告書フォーマットに取得した情報をはめ込んでレポー トを作成する • さらに、問合せがあった場合、ローカルに格納した索引からGitLabを検索し て、回答を⾏う。 従来、何⽇もかかっていた作業が、20分〜1時間くらいで終了する 10

  7. マイクロサービス‧コーディング‧エージェント エージェントの役割 • リファクタリングエージェントが、現⾏システムを調査し、DDDに基づいて再 設計する • マイクロサービス‧コーディング‧エージェントが、設計をもとに実装できる 設計にまで落とし込む • Compound

    Engineering Plugin の計画⇒実装⇒テスト⇒レビューエージェン トが、実装要件を満たすまで繰り返し実装とレビューを繰り返す 従来のAI駆動開発で4ヶ⽉近くかかっていた実装が、1⽇で終了。⼈がレビューする のに約⼀週間弱で完成 13

  8. 最初に考えるべきコト 15
 同じような処理を繰り返し⾏っている場合、Plugin化(Agent, Skill, Rules, Hookなど)すること で、作業を効率化することができます。Claude Codeは、これを効率的に⾏う仕組みを提供してい ます。 Plugin化して、⾃動化したり、AIでソフトウェアを作るべきもの

    • 法制度や規制などでルールが厳格に決まっているもの • 業務マニュアルなど、⼿順や⼿続きが決まっているもの • ノウハウ化しており、適⽤対象によって微妙に違うだけのもの • SaaSで提供されているもののうち、独⾃のデータやソフトウェアだけで実現できないものを 除いたもの AIで対応できないもの • 機能ではなく⾮機能も含み、独⾃のアルゴリズムが必要になるソフトウェア • 公開されているデータや、⾃分が持っているデータでは作れないもの
  9. AI Agent の選択を間違えない AI Agent の選択を間違えると、効率化は失敗する ⾒極め⽅ • AI Agent

    を提供している会社の開発者⾃⾝が⾃⾝の提供するAI Agentを使って 効率化に成功しているか(少ない⼈数、短い期間で機能を提供し続けている か)を⾒極める • 営業が、AIを使って営業していない会社を選ばない • モデルの性能よりも、ハーネスの使いやすさとのバランスを⾒る 現時点では、Claude Code⇒Codex⇒Gemini CLI の三択をしておけば⼤丈夫 16

  10. エージェント、スキル、ルールの効果 17
 Claude Code の Agent, Skills, Rules は、ある決まった要求に対して、適切なツール を選択し、ゴールを満たすように、これを繰り返すことが出来る。このため、適切

    なエージェント、スキル、ルールを実装できると、⼈がやっている⼤半の仕事はこ の仕組みに任せることができる。 ⼈がやるべきことは、これらのエージェントたちが実⾏してきたことが正しく⾏わ れているかをチェックするだけで、よくなるため、⼀気に効率化が進む
  11. Claude Code を選んでいる理由 • 豊富なナレッジが公開されている • ⽬的に合わせて、モデルの選択をコントロールしやすい • エージェントチームを作って、並列実⾏することができる •

    コンテキストウィンドウが⼤きい(1M) • ハーネスが強い ◦ システムプロンプトがよくできている ◦ SubAgent, Skills, Rules, Hooks などが充実している ◦ 権限管理がしっかりしている ◦ 豊富なコネクタがあり、MCP Server も充実している 19

  12. Agent, Skills 20
 🤖 Agents(サブエージェント) • メインの Claude とは別に独立したコンテキストで動く Claudeを生成する機能です。

    • タスクを並列処理したり、特定の作業(コードレビュー、リ サーチ、計画立案など)に特化したエージェントを定義でき ます。.claude/agents/ ディレクトリに配置し、メインの Claude が必要に応じて呼び出します。バックグラウンド実 行(Ctrl+B)も可能なので、作業を継続しながら別のエー ジェントに調査などを任せられます。 • 例: 「コードベースを10本の並列サブエージェントで探索し て包括的なドキュメントを生成する」など。 📚 Skills(スキル) • Claude にドメイン固有の専門知識をオンデマンドで注入 する仕組みです。 • .claude/skills/ に SKILL.md ファイルを置くと、 Claude がタスクの内容から「このスキルが必要だ」と判断 したときに自動でロードします。毎回同じ指示をプロンプト に書く必要がなくなります。 • "The Matrix でネオが「カンフーを知っている」と習得する" のに例えられており、必要な時だけ知識を読み込む点がポ イントです。 • 例: ScalarDB のベストプラクティス集をスキルとして定義し ておけば、関連する作業のたびに自動で参照される。
  13. Rules, Hooks 21
 📏 Rules(ルール) • 常に適用される行動ガイドライン です。 • .claude/rules/

    に配置し、「常にこのコーディング規約 を守る」「このファイルは絶対に変更しない」など、すべての 会話・タスクに横断的に適用したいルールを記述します。 CLAUDE.md に書く内容と近いですが、ルールとして分離 ・管理できます。 ⚙ Hooks(フック) • 特定のイベントが発生したタイミングで確定的なコードを 実行する仕組みです。 • LLM の非決定的な挙動では困る処理を、プログラムとして 確実に実行させられます。 • 主なフックのタイミング: フック タイミング PreToolUse ツール呼び出し前(ブロックも可能) PermissionRequest 権限ダイアログ表示時(許可 /拒否可能) セッション開始時 毎回実行したいスクリプト • 実用例: セッション開始時に今日の日付を自動取得して 渡す、Bash コマンド実行前に承認を求める、作業完了 時に Slack へ通知する、など。
  14. Agent, Skillなどを作るまでの流れ 24
 ⽬的の設計 達成条件の設定 調査 Agent, Skill, etcの実装指⽰ Agent,

    Skill, etcのレビュー Agent, Skill, etcの実装 テスト実⾏‧レビュー 修正指⽰ 最適化指⽰ パッケージング
  15. プラグイン開発に使っているツール群 25
 • Every.io : Compound Engineering Plugin ◦ https://github.com/EveryInc/compound-engineering-plugin

    • Monologue • Claude-mem • Serena MCP • Context7 • scalar-skill-building, scalar-skill-reviewing
  16. スキルを作るための指⽰の実際 28
 ⽬的の設計 達成条件の設定 調査 Agent, Skill, etcの実装指⽰ Agent, Skill,

    etcのレビュー Agent, Skill, etcの実装 テスト実⾏‧レビュー 修正指⽰ 最適化指⽰ パッケージング
  17. 29
 あなたは Scalar のソリューションエンジニアです。これから ScalarDB を使った汎⽤的なコーディングエージェントを Claude Code に作らせるための指⽰書を作成してください。 この指⽰書では以下の要件を満たすように

    Claude Code に指⽰する必要があります。 - マイクロサービスアーキテクチャの調査 - 各マイクロサービスはどのような要件を満たす必要があるのか - 開発、デプロイ、運⽤、監視において、どのような機能‧⾮機能を満たす必要があるのか - APIにはどのような種類があるのか、それぞれの特⻑はどのようなものなのか - ScalarDB Cluster が有効なユースケースの探索 - ScalarDBがないと、できない、あるいは⼤変なユースケースを探索し、なぜ ScalarDB が有効なのかを明確に説明できるユースケースを探し出す - ユースケースの場合分けができ、要件からユースケースを判断できるようにする - データモデル(論理モデル)の調査 - マイクロサービスアーキテクチャにおいて、どのようなデータモデルを想定する必要があるのか、パターンの洗い出し - ユースケースごとにどのようなパターンが適⽤されるのか - 機能‧⾮機能に依存して、データモデルがどう決定されるのか - データモデル(物理モデル)の調査 - PT, CK, SI はどうあるべきなのか - データモデルと機能‧⾮機能によって、データベースの選定はどのようにすればよいのか - 想定される機能要件の整理 - 想定される性能要件や可⽤性要件などの整理 - データベースの調査 - ScalarDBが対応しているデータベースの種類毎の特性の調査 - RDBMS, NoSQL, オブジェクトストレージ, Vector Index, Search Index - クラウドの種類毎、オンプレミスで使えるデータベースごとにカテゴライズ - インフラの前提の調査 - ScalarDB Cluster を動作させるためのインフラの前提条件の調査 - クラウドの種類毎、オンプレミスでの前提条件 - トランザクションモデルの調査 - マイクロサービス内でのトランザクション - マイクロサービス間でのトランザクション - ScalarDB Cluster 内でのマイクロサービス間のトランザクション - ScalarDB and 他の実装のマイクロサービスとのトランザクション - イベントソーシングなどの処理パターン - Saga, TCC, CQRS などの実装にScalarDBが⼊った場合の実装パターンの調査 - マイクロサービスで分断されたデータに対する透過的なアクセスパターンの調査 - ScalarDB配下、あるいはそうではないものを透過的に参照するパターンの調査 - バッチ処理での実装パターンの調査 - ScalarDBが有効なケース、有効なケースではどのような実装パターンになるのか - ScalarDBが無効なケース、この場合、どう実装したら良いのか 上記の調査は、調査状況を@./work ディレクトリを作成して、Markdown ファイルで保存するようにしてください。 調査が完了したら、Claude Code の Agent, Skill, Rules, Asset など、どれに実装すべきなのかを調査した上で、実装計画を策定し、Markdown で保存してください。
  18. スキルを作るための指⽰の実際 30
 ⽬的の設計 達成条件の設定 調査 Agent, Skill, etcの実装指⽰ Agent, Skill,

    etcのレビュー Agent, Skill, etcの実装 テスト実⾏‧レビュー 修正指⽰ 最適化指⽰ パッケージング
  19. スキルを作るための指⽰の実際 32
 ⽬的の設計 達成条件の設定 調査 Agent, Skill, etcの実装指⽰ Agent, Skill,

    etcのレビュー Agent, Skill, etcの実装 テスト実⾏‧レビュー 修正指⽰ 最適化指⽰ パッケージング
  20. 構築されたスキルをレビューして修正 33
 agent, skills, rules, hooks scalar skill reviewing review

    feedback 構築されたスキルをレビューし、指摘 事項を修正する。 また、実際に動かしてみて問題点を指 摘しながら修正していく。
  21. まとめ • Plugin(agents, skills, rules, hooksなど)を作る際には、⽬的と達成条件を明 確にすることが重要 • 達成条件が明確になれば、作り⽅は Claude

    Codeに調査と実装を任せ、⼈はそ れをレビューする。これにより、より深く良い実装⽅法を Claude Code が⾃ ら考えてくれる • できあがったものをあらかじめ⽤意したチェックポイントにかけて、要件を満 たすかどうかを⾃⼰レビュー、⾃⼰修正させる。これをループにして繰り返す • できあがったものを実⾏して、実際にどのような動きになるのかを確認し、⼈ によるフィードバックも与えていく ⼆回同じようなことをやってたら、Plugin を作ろうという発想が重要!! 35