Upgrade to Pro — share decks privately, control downloads, hide ads and more …

The World Has Changed — だって世界は変わってしまったんだから

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

The World Has Changed — だって世界は変わってしまったんだから

2026年2月、Opus 4.6とGPT-5.3 Codexの同日リリースを経て、Agentic Engineeringが実用段階に到達しました。本スライドでは、AI開発ツールの急速な進化の歴史を振り返りつつ、Spec駆動開発による自社プロダクト(ピアッザ チェックイン)の開発事例、個人開発での試行錯誤(AgentHive、Robloxバトルロイヤル等)、CLI +
Skillによるコーディングエージェントの開発外業務への拡張、OpenClawの衝撃とAgentic Webの萌芽、そしてセキュリティと自律性のバランスについて、実体験をベースにお話ししています。

Avatar for hiromitsusasaki

hiromitsusasaki

February 20, 2026
Tweet

More Decks by hiromitsusasaki

Other Decks in Technology

Transcript

  1. AI開発ツールの急速な進化 Macro — 業界の動き 2026年2月5日 Opus 4.6 & GPT-5.3 同日リリース

    Agentic Engineeringが実用段階に到達 Micro — 個人・PIAZZA 2025年12月〜 Agentic Engineeringによる「ピアッザ チェックイン」開発開始 2022年11月 ChatGPT公開 2ヶ月で1億ユーザー。LLM時代の幕開け 2023〜2024年 AIコーディング支援の勃興 Copilot GA、Cursor急成長、Devin発表 2025年 企業導入が本格化 AI支援採用率49%→69%。GPT-5、Opus 4.5 2022年 GPT-3でチャットボット開発、HuggingFaceでStable Diffusion。ChatGPTを触り社内で「AIすごい!」と騒ぎ出す 2023〜2024年 Papyros→チラデジリリース。CodeRabbit本格導入。Amazon 主催 生成AIイベント参加。 「ピアッザ 地域のイベント」リリース。 個人でCursor使用開始 2025年 v0で会議中にダッシュボードをプロトタイピング。矢野さんがバイ ブコーディング記事発表。GitHub Copilot全面導入。AIおじさん 爆誕 3 / 38
  2. Agentic Engineeringとは AIエージェントがコードを書き、人間はアーキテクチャと意思決定に集中する ソフトウェア開発の新しいパラダイム 従来のAIコーディング支援 人間がコードを書き、AIが補完・提案する。主導権は常に 人間側 → Agentic Engineering

    AIエージェントが計画・実装・テスト・デバッグを自律実 行。人間は監督・レビュー・方向づけを担う 開発者はAIを作業の60%に統合しつつ、委任したタスク の80〜100%を監督。完全自律ではなく「人間の専門性 の増幅」が本質。 人間が担うこと アーキテクチャ設計・技術 選定 仕様(Spec)の作成・言 語化 コードレビュー・品質判断 エージェントが担うこと Specに基づくコード実装 テスト生成・デバッグ マルチエージェント協調作 業 出典:Anthropic "Eight trends defining how software gets built in 2026" 4 / 38
  3. Spec駆動開発とは何か Spec駆動開発(SDD)は、構造化された仕様書を「正(Source of Truth) 」とし、コードをAIエージ ェントが生成・検証する開発パラダイム。Vibe Codingが会話的・即興的なのに対し、SDDは設計を先 に確定させ、実装はエージェントに委ねる点で異なる。 "Senior engineers

    articulate what the software should do, and let AI agents handle the how." — Thoughtworks, "Spec-driven development" (2025) Kiro(AWS / Amazon) VS Code forkのIDE。自然言語からユーザーストーリ ー・技術設計・タスクリストを自動生成し、仕様に基 づいてコードを生成。2025年7月プレビュー、同年12 月GA。 Planモードの普及 Claude Code、Copilot、CursorがそれぞれPlan Modeを実装。コーディング前にコードベースを探索し 計画を立てる機能。Copilotでは成功率15%向上の報 告も。 6 / 38
  4. コーディングエージェントの進化 — エージェンティック機能群 Skill / Custom Instructions エージェントにドメイン知識を与える仕組み。 CLAUDE.md、AGENTS.md、.cursorrules等のファイルで プロジェクト固有のルールや手順を定義。再利用可能なSkill

    として共有も可能に。 Subagent / Agent Teams 独立したコンテキストを持つ子エージェントを生成し、並 列・分業で作業。Claude CodeのAgent Teams、Cursor 2.4のSubagents、CodexのMulti-Agent等。2026年に各 社が本格導入。 MCP(Model Context Protocol) 外部ツール・データソースへの接続を標準化するオープンプ ロトコル。DB、API、SaaS等をエージェントの手足として統 合。Anthropic発、業界標準へ。 Hooks / Automation ツール実行の前後にカスタムスクリプトを挿入するライフサ イクル制御。自動フォーマット、型チェック、セキュリティ検 証等をエージェントの動作に組み込む。 Plan Mode + Skill + Subagent + MCP + Hooks コーディングエージェントは「補助ツール」から「自律的な開発チームメイト」へ進化した 7 / 38
  5. 事例:ピアッザチェックイン開発 1 会議内容・画面遷移・処理フローから要件をチャットAI (ChatGPT、Claude等)と整理・言語化 2 詳細設計 → スコープ分割 → タスクリスト化もAIと協働し、開発

    ドキュメントとして整理・出力 3 開発ドキュメントをリポジトリに配置し、コーディングエージェ ントに実装のプランニングをさせ、そのプランを踏襲する形で実 装を依頼 4 AIレビュー(CodeRabbit、GitHub Copilot)→ 全フィードバ ックに対応(修正 or 説明)→ 人間レビューの二段構え 5 openapi.yml を Single Source of Truth に APIインターフェースを構造化フォーマットで定義し、バックエ ンドのテストやフロントエンドのコード生成を効率化。コーディ ングエージェントの実装のブレをなくす 8 / 38
  6. 成果と課題 実感: PIAZZAチェックインの開発を通じて 成果 当初見積もり(人間ベース)より大幅に少ない工数で実装 完了(半分以下) Spec駆動ドキュメントがエージェントの精度を底上げ 課題 実装速度が上がるほど人間のレビューがボトルネックに 既存フロー・組織構成がエージェントの能力をナーフ

    業界データ 成果 AI支援でタスク完了55%高速化(OECD実験) 週次マージ数39%増(シカゴ大学調査) 課題 AI高採用チームでPRレビュー時間91%増(Faros AI) AI生成コードは人間比1.7倍の指摘(CodeRabbit) コードを書く速度は劇的に上がった。次の課題はレビュー・承認・デプロイを含む工程全体の再設計 9 / 38
  7. Disposable Systems — ソフトウェアアーキテクチャも変わ る 「作って確かめる」コストが限りなくゼロに近づくと、ソフトウェアアーキテクチャも旧来のま まではいられない。AI生成コードを前提とした新しい設計思想が提案され始めている。 "Immutable contracts. They

    must be perfect so the disposable parts can be imperfect." — tuananh.net, "Architecture for Disposable Systems" (2026) Core(中核層) ビジネスロジック、データモデル。 人間が作成し長期的に耐久す る"Source of Truth"。 Connectors(契約層) OpenAPI、gRPC等の標準スキーマ で表現される"Immutable contracts"(不変の契約) この層が完璧であることが前提。 Disposable(使い捨て層) UI、グルーコード等。契約に従う限 り内部品質は問わない。 AIで何度でも再生成可能 15 / 38
  8. コーディングエージェントの優秀さは「開発」だけ? 🇺🇸 米国 — 経営レベルで「全社導入」が進行 Shopify — Tobi Lütke CEO(2025/4)

    「AI活用は全社員の基本要件」と社内メモ。増員申請時に"AIでできない理 由"の説明を義務化 Microsoft — 非エンジニアにClaude Code導入(2025/11〜) デザイナー・PMにもClaude Codeのインストールを指示。全職種に開放 Anthropic — Coworkリリース(2026/1) Claude Codeの非エンジニア版。 「コーディングエージェントが汎用エージ ェントだった」ことの証明 🇯🇵 日本 — 先駆者が声を上げ始めた段階 梶 梶谷健人 @kajikent 385万view 「もはやClaude Codeはエンジニア以外も全員が使うべきツールになった」 角 角田剛史 / kubell 「反響がどれも凄まじい」— 会社としてアップデートすべき局面 認知ギャップの現実 米国は経営トップが全社導入を指示。日本は先駆者が発信を始めたところ。エージェ ント=エンジニアツールという認識がまだ支配的 コーディングエージェントをパーソナルアシスタントや他業務のオートメーションに使えないか? 17 / 38
  9. CLI × Skill × エージェント — 組み合わせの事例 例1: 朝の情報収集 →

    Slack要約投稿 ino RSS取得 + xar タイムライン取得 → SKILL 要約・選別 → rdrop ブクマ保存 → slac 投稿 inoでRSS、xarでXのタイムラインの2つのデータソースから情報取得 → SKILLで重要度評価・要約 → Raindropに保存 → Slackの#tech-news に投稿 例2: SwitchBot CO2モニター → Discord換気通知 swibo CO2値取得 → SKILL 閾値判断 → disco 換気通知 SwitchBotのCO2モニターを監視 → SKILLがCO2濃度の閾値を判断 → 基準超過時にDiscordへ「換気したほうが良いよ」と通知 例3: Gmailチェック → Skillで重要度判断 → 自動アーカイブ/通知 gmail 受信取得 → SKILL 重要度判断 → gmail / slac アーカイブ or 通知 Gmailの未読をチェック → SKILLが重要度を判断 → 低優先度はアーカイブ、高優先度はSlackで即時通知 20 / 38
  10. AI時代の新アーキテクチャーとの適合 前述のDisposable Systemsアーキテクチャと、このCLI + Skillの仕組みは親和性が極めて高い Core Skill定義 「何をなぜやるか」というドメイン知識・判断基準。SKILL.mdに言語化。 業務固有知識のカプセル化。めったに変わらない。 Connectors

    CLIツール 安定した入出力契約。エージェントと外部サービスの接点。 引数・出力フォーマットが明確で不変。 Disposable ヒューマンIF Web UI、Slackボット、ダッシュボード等。 Skill + CLIが堅牢なら、UI層はエージェントが自在に生成・破棄できる。 エージェントの役割 CLI + Skillで最小単位の業務実行能力を担保。 エージェントはそれらを状況に応じて繋ぎ合わせる役割を担う(ワークフローの構成、UI生成、判断の連鎖) 。 かつてはここをPerl・Python等のグルーコードとして人間が書き、保守していた。 エージェントはこれを文脈に応じて動的に再構成でき、状況が変わっても、CoreとConnectorsが堅牢なら繋ぎ方を変えるだけで対応でき る。繋ぎの部分こそがDisposableであることとがこの構造の強さ。 21 / 38
  11. OpenClawの衝撃 Peter Steinberger(PSPDFKit創業者)が2025年11月に公開し たオープンソース自律型AIエージェント。GitHub Stars 18万 超。Discord・Slack等をUIとし、LLMを通じてタスクを自律実 行、自らスキルを書いて能力を拡張する。 なぜ衝撃的なのか 従来のAIエージェントは決められたことしかできなかった。OpenClawは自分で考え、

    自分でスキルを作り、自分で行動範囲を広げる。これは「道具」から「自律的な存在」 への質的転換。 Sam Altman @sama "Peter Steinberger is joining OpenAI to drive the next generation of personal agents. He is a genius with a lot of amazing ideas..." 公開からわずか3ヶ月 — 個人が作ったOSSエージェントが世界最 大のAI企業を動かした。この速度感が、 今の時代。 23 / 38
  12. RentAHuman — 「AIが人間を雇う」世界の可能性 AIエージェントが人間を雇うマーケットプレイス。AIがタスクを定 義し、人間に発注する。 「主従が逆転する世界」を鮮やかに示す実 験。 "AN AI PAID

    ME TO HOLD THIS SIGN" Alex @AlexanderTw33ts · 25.5万 views WIRED Japan 「人間がAIに雇われる時代?RentAHuman を試してみた」 Agentic Webの全体像 OpenClawが「自律的に行動する」ことを実証 → Moltbook/SpaceMoltで「エージェ ント同士が社会を作る」段階へ → RentAHumanで「AIが人間に仕事を依頼する」逆転が 発生。この3段階がわずか半年で進行している。 25 / 38
  13. 個人でのOpenClaw活用 — 3体のエージェントと一緒に生活 現在、用途別に3体のOpenClawを日常的に稼働させている(更に2体をセットアップ中) バディ(ボケナス) 汎用エージェント。RSS巡回、Slack整理、スケジュール確認、情報収集などを自律的に 実行。プロダクト案の壁打ちやアイデア出し、リサーチや分析も行う。彼と要件定義や大 枠の設計までを行い、開発はコーディングエージェントに移譲する流れが多い。 コーチ 習慣づくりやフィードバック。Fitbit

    CLIで活動データを取得し、生活改善提案を行う。 毎日の伝えるとNotionのデータベースに記録し、1週間単位で活動量と食事の振り返り をしてくれる。 トラベラー(ホデナス) Moltbook・SpaceMoltで活動する実験枠。エージェント同士の交流やSkillの試行錯 誤。他のエージェントとの交流が発生するので、クラウド上のSandboxに隔離して最低 限の権限を与えて運用中。 26 / 38
  14. OpenClawとの体験を会社業務にもちこめないか試行錯誤中 OpenClawとの生活で実感した「日常の雑事を自律的に自動化してくれる」パーソナルエージェント体験。 この体験を業務にも持ち込みたいが、セキュリティと自律性のバランスの設計について試行錯誤中 (詳細は個人的な取り組みにて) 自律性がはらむリスク 自律的なコード実行 → インジェクション攻撃のリスク APIキー・シークレットの管理が曖昧になる 「勝手にやってくれる」=制御を委譲するということ

    エージェントが開発者を攻撃した事例も報告されている 考えられる対応策 サンドボックス環境での実行 人間の承認を最終ゲートにする (自動実行の境界を明確化) 明示的なポリシーと実行権限の宣言 監査ログの徹底 セキュリティ・リスク管理を前提に、自律実行の能力を最大限解放する 正解はまだない。試行錯誤しながら、この相反する2つのバランスをとる設計を模索中 27 / 38
  15. AIによるプレゼン資料自動生成 実はこのスライドはClaude Codeが7割ぐらいまで作ってくれました スライドの骨子は自身のnote記事 「だって世界が変わってしまったんだから」 を元に構成。 @hirokidaichi氏の記事を参考に、コーディングエージェント + Marp +

    Tailwind CSS + Remotionによるプレゼンスライ ド・動画自動生成の基盤環境を構築(というか当該記事を Claude codeに投げて構築してもらいました) AIエージェントに指示するだけでスライドを生成。 Marp + Tailwind CSS: 複雑なレイアウトを実現 レイアウトパターン: 事前定義のカタログ Skill定義: スタイルガイド・配色ルールを言語化 AIはパターンを選択・組み合わせるだけ 29 / 38
  16. ai-rules 多種多様なコーディングエージェント向けのルール生成・運用ツール AIエージェントへの指示(ルール)をYAML形式で一元管理し、 Claude Code・Copilot・Cursor・Gemini・Codexなど多数のコー ディングエージェント向けのカスタマイズ・配備を行うCLIツールを 作成し、OSSとして公開。 エージェントごとに異なるファイル、内容を ingest ルール取

    り込み → propose 提案生成 → approve 人間が承 認 → build 各形式に 変換 → install 各ツール に配置 ルールをatoms/*.yaml で管理し、Single Source of Truthとして運用。取り 込んだ内容はレビューワークフローを経て承認後に統合される。グローバルモー ド(個人ルール)とプロジェクトモード(リポジトリ固有)の2つのモードに対 応。 GitHub hiromitsusasaki/ai-rules npm @hiromitsusasaki/ai-rules 対応プラットフォーム Claude Code / Copilot / Cursor / Gemini / Codex / その他 30 / 38
  17. ambient-ops セキュリティを前提とした自律エージェントによる業務自動化の模索 コーディングエージェントにCLI + Skillを組み合わせれば、それ自体が業務自動化エージェン トになる。さらにそこにOpenClawに見せつけられたアンビエントなユーザー体験(フレキシ ブルなワークフロー定義と組み換え)とセキュリティ・リスク管理(責任境界の定義、承認の 仕組み、監査ログ)のバランスを持ち込むための統合ツールを開発中。 Event Slackメンション

    DM / Cron → Agent Claude Code / Codex + CLI + Skill → Output 通知 / レポート Draft PR / Slack返信 例えば... Slackでのデータ集計を依頼投稿を感知したら、エージェントが内容を調査・確認し、必要なクエリを用意し た上で、人間に実行の承認を求める Slackの通知でエラーの発生を確認したら、そのエラーをRolbarをエラーアイテムを確認し、原因を分析・ レポートし修正のためのPullRequestを作成して人間にレビュー求める Notionでタスクにアサインされたら、タスクの内容を確認し、小さなものであればエージェントが自分でこ なし事後承認を求める。複雑なものであれば、手順を作成して人間の確認を求める。 31 / 38
  18. LPもAgentic Engineeringの成果物を流用してAI生成 ambloのランディングページは、Agentic Engineering用の開発ドキュメントを そのままFigma Makeに読み込ませて生成した。 1 Spec駆動で書いたPRD・技術設計書・ユーザーストーリーをFigma Makeにインプ ット

    2 Figma MakeがLPデザインを自動生成 → Figmaで微調整 3 Figmaサイトとしてそのまま公開 開発ドキュメントがブランディング・マーケティングにも使えるというSpec駆動開発によ るAgentic Engineeringの副次効果を証明 33 / 38
  19. 2025年11月〜2026年2月で見えてきたこと 1 人間が直接コードを書かなくてよい時代が来ている LLMの能力がしきい値を超え(Opus 4.6 / GPT-5.3 Codex) 、コーディングエージェント運用のノウハウも急速に蓄 積。この2つがAgentic

    Engineeringの前提条件 2 開発プロセスとアーキテクチャの見直しが迫られている AI前提のフロー設計なしではエージェントの能力がナーフされる。 「作って捨てる」が容易になった今、Disposable Systemsのようなアーキテクチャ変革も進行中 3 コーディングエージェントは多目的エージェントになり得る CLI + Skillの仕組みで開発以外の業務効率化も実現可能。コードが書けるということは、あらゆるデジタル業務を自動 化できるということ 4 アンビエントエージェントの時代が始まった OpenClaw、Moltbook、A2A通信 — 新しいインターネットの萌芽 35 / 38
  20. ソフトウェア開発の大きな変化が始まっている RD Ryan Dahl @rough__sea The era of humans writing

    code is over. Writing syntax directly is not it. Node.js / Deno 作者 落 落合陽一 @ochyai 半日でサービスができ て,数時間で新サービス になって,やはりすごい 速度だと思う. メディアアーティスト / 筑波大教授 伊 naoya @naoya_ito 明らかに潮目が変わった 感じがある…この劇的で 加速度的な変化に対して 精神的にどう付き合って いくか哲学を確立しない と病んじゃう な なべっつ @nabettu このツイートを印刷して 貼っておいて歯を食いし ばろうかな… 引用「ソフトウェア作れるのはあ と1,2年くらいだから悔いないよ うに」 Node.js作者からAI研究者、国内で著名なCTOから個人開発者まで ソフトウェア開発の在り方が根本から変わり始めているという実感が広がっている 36 / 38
  21. The World Has Changed LLMの能力がしきい値を超え、コーディングエージェントは実用的な開発パートナーになった。 Spec駆動開発を前提としてAgentic Engineeringにより、 「作ってみる」コストが圧倒的に低下し、 デジタルプロダクトの開発プロセスやプロダクトのアーキテクチャーそのものの再設計が要請されて いる。

    また、AIエージェントは開発以外にも活動領域を広げつつあり、OpenClawの登場がアンビエントエ ージェントの可能性を鮮烈に証明した。 まだまだ試行錯誤の最中ですが、この変化の中に身を置き、受け入れ、踊らされ続けることが今現在 の僕にとって最良の戦略なのだと思いました。 だって世界が変わってしまったんだから 37 / 38