Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレ...

Avatar for KoheiOgawa KoheiOgawa
September 12, 2025
6

Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレイクスルーの鍵を握るのはデータ領域」

Generative AI Japan会員様向けコミュニティ『生成AI実践研究会』の第一回でお話しさせていただきました資料です。
Agenda’
・AI駆動開発の定義と境界線
・2025年9月現在、AI駆動開発の領域に変化を及ぼした技術6選は?
・SDLCで見るAI駆動開発ツールの市場とこれからの課題
・生成の速度(NL→Code/SQL/Docs)はもう十分。解決すべき課題はデータの意味づけ/接続性/安全/評価を対象とした制御・測定の処理能力
▼ Generative AI JapanのHP
https://generativeaijapan.or.jp/

Avatar for KoheiOgawa

KoheiOgawa

September 12, 2025
Tweet

More Decks by KoheiOgawa

Transcript

  1. AI駆動開発の現在地 Kohei Ogawa Principal AI Data Software Solution Developer Cloud

    X, Cloud Business Unit September 10th, 2025 ──ブレイクスルーの鍵を握るのはデータ領域 10分で理解する!
  2. 自己紹介 2 Copyright © 2025, Oracle and/or its affiliates |

    Confidential: Internal/Restricted/Highly Restricted 小川航平 Principal AI Data Software Solution Developer, Cloud X, Cloud Business Unit, Oracle Corporation Japan ✓ 大学・大学院で図書館情報学/情報検索/AIを専攻し、 データの収集・蓄積・活用を体系的に学ぶ ✓ 1万人以上のメンバー数を抱える AIを社会実装するためのコミュニティのLeadを担う ✓ AIの研究者と研究者向けのChatGPTに関する書籍を出版 ✓ 様々な業界のエンタープライズ企業の Data&AIシステムの課題解決・設計開発・利活用をご支援 (Business Architect/Cloud Architect/ AI PM/Advocate/Developer) 高専 R&D 元MicrosoftのData&AI領域のAzure Architect 元スタートアップの開発チームのLead (AWS FullStack Engineer) 落合陽一研究室出身 AI
  3. 3 Copyright © 2025, Oracle and/or its affiliates | Confidential:

    Internal/Restricted/Highly Restricted ”本研究会でAI駆動開発におけるデータ領域も共に模索したい“/”関心がある方を知りたい” 本日お伝えしたいこと “作る速さは十分。 『測る・つなぐ・守る』 の質が大事”
  4. AI駆動開発の定義と境界線 4 Copyright © 2025, Oracle and/or its affiliates |

    Confidential: Internal/Restricted/Highly Restricted 要件定義 改善 設計 実装 評価 テスト リリース AI駆動開発を導入した ソフトウェア開発のライフサイクル ✓ 1.AIが複数工程に常時組み込まれている (例:設計/実装/テスト/運用) ✓ 2. 評価→改善のループ(自動 or 半自動)が回っている ✓ 3. データの段取り(Contract/Lineage/Eval=CLE)が 最低限ある ✓ 4. 再現性(プロンプト/設定/データ・評価の版管理)が 担保されている AIを常時組み込み、プロンプト → 動く機能 → 価値のサイクルを短縮する開発様式。 AI駆動開発の最低条件:これができないとAI支援止まり ・人とAIの協創により、想像の具体化/具現化速度が速くなった。 ・また、生産活動できるユーザ層に変化を及ぼしている。 “作る速さはもう十分、重要なのは修正ループと信頼”
  5. 2025年9月現在、AI駆動開発の領域に変化を及ぼした技術6選は? 5 Copyright © 2025, Oracle and/or its affiliates |

    Confidential: Internal/Restricted/Highly Restricted CLI/CI常駐のAIエージェント化 Gemini CLI / Codex CLI / Claude Codeの登場により、チャットでの補助から、 スクリプト実行できるCLIに進化。 CIから呼べるので、コード生成・修正・調査をパイプラインに直結できる 1 “リポジトリ全体”を見通す長文脈 (~100万トークン級) Gemini CLIなどの登場により、マルチファイルの一括編集や大規模リファクタが現実的に。 コード変更をPR風に提示するワークフローも登場。 2 設計→フロントコードの“距離ゼロ化” Google Stitchの登場により、 スケッチ/画像→UI設計→実装コードを数分で自動生成、Figmaへ直接出力し手戻りを削減。 3 標準化された接続(MCP)で |“配線コスト”激減 MCP技術の浸透が進み、ログ/チケット/評価基盤などの 外部ツールを標準プロトコルで接続可能に。工程横断の再現性と監査性が向上。 4 OSSの最先端コーディングモデルによる “内製可能性” Qwen3-Coderなどの登場により、高性能なオープンソースのコーディングモデルが実用域に。 コスト/データ統制/カスタマイズ性が向上。 5 IDEレベルの“差分提示&承認”まで一気通貫 Gemini CLIなどの登場によりエージェントが差分を可視化→確認→適用まで誘導。 開発者はPRレビューに近い体験で安全に導入。 CodexはIDE拡張あり 6 2025年の革新性は「生成」から“実行・統合・標準化”へ主役が移ったこと 1度に扱えるデータ量が増えた 標準化により扱える外部データの種類が増えた データをLLMに渡しやすくなった データ視点
  6. SDLCで見るAI駆動開発ツールの市場とこれからの課題 6 Copyright © 2025, Oracle and/or its affiliates |

    Confidential: Internal/Restricted/Highly Restricted 要件定義 設計 実装 テスト 評価 改善 リリース ✓ 開発者向けLLM(Codex CLI/Claude Code/Gemini CLI )/汎用チャットLLM ✓ Bolt.new ✓ GitHub Copilot Chat/Amazon Q Developer Chat ✓ Playwright 使用可能な 具体的な ツール例 濃=主用途/淡=副用途(工程ごと) 生成される データ例 AI駆動の ポイントの例 PRDのたたき台を5分で 作り、根拠リンクも自 動添付 市場習熟度予想 ※厳密ではない アーキ/ドメインの候補 3案を自動比較し、抜 け・リスクを先出し ルーティンはAIに任せ、 難所へ集中。PRの往復 を半減。 仕様からユニット/E2E雛 形を自動生成。失敗時は 要約と次の一手を提示。 RAG/LLMの正当性・再 現性を数値化 本番データから毎週の 改善案を自動抽出し、 小さく検証 CI/CDを自動配線し、カ ナリア&ロールバック を標準化。 ・概算確認用のクエリ ・製品要件書(PRD) ・プロトタイプUI ・スキーマDDL ・仕様書/アーキテクチャ ・OpenAPI仕様書 ・スキーマ変更用のSQL ・README(実装の説明書) ・実装コード ・テストデータ投入用SQL ・テスト計画書 ・ユニットテスト(自動テスト) ・メトリクス集計SQL ・評価仕様書 ・評価スクリプト(ベン チ/プロ ンプト テスト ) ・コホート分析クエリ ・ポストモーテム(振り返り文書) ・フィーチャーフラグ設定(実験構成) ・本番移行DDL ・リリースノート ・インフラ定義(IaC: Terraform/CDK) NL2Docs NL2Code NL2SQL ✓ Vercel v0 ✓ Create.xyz ✓ Figma AI ✓ Autify ✓ Playwright ✓ Create.xyz ✓ Cursor/Cursor-Agent ✓ Vercel v0 ✓ Bolt “測る・つなぐ”のツールが 相対的に手薄、ツールが少ない プロトタイピングの壁 ! Software Development Lifecycle ※有名どころだとDevinも 全工程いける
  7. NL2Code 作る NL2SQL 抽出する NL2DOCS 説明する ルータ Agent 数値/集計 説明/根拠

    作る/変える 生成の速度(NL→Code/SQL/Docs)はもう十分。 解決すべき課題はデータの意味づけ/接続性/安全/評価を対象とした制御・測定の処理能力 7 Copyright © 2025, Oracle and/or its affiliates | Confidential: Internal/Restricted/Highly Restricted AI駆動開発ツール内のAgent機構 Presentation層 (UI/フロント) Application層 (ビジネスロジック/ オーケストレーション) Data層 NL Prompt • コンテキスト情報をツールの機能間で 適切に渡してあげれてるか • 対応しているLLMが最新か (単体の精度) • DBのスキーマ情報の強化(=LLMへの解釈性を高める) ! • 高頻度に呼び出されることによるLLM費用 • 呼び出し制限による開発UXの低下。 開発ロードマップからのずれ データ量による呼び出しコストの課題 コンテキストとその連携性によるデータの質 回答の正確さ/安全性/再現性 • 数値不一致 • 本番だけ落ちる • 全表スキャン • 根拠不在 • 許可ビュー • EXPLAIN • 件数/時間上限 • 監査 席課金(ユーザ/月) LLM従量(トークン/リクエスト) ワークフロー/エージェント実行従量 AI駆動開発 ツールの 課金体系の例 データの中身だけ教えられても 何のデータか雰囲気でしか分からんから 雰囲気な回答になるよ? 正確に回答して欲しいなら データの説明欲しい・・・ AI駆動開発中の システム AI駆動開発中の エンジニア DB/SQLに関しては微妙に まだ惜しいんだよなぁ ✓ コンテキストをどのくらい考慮できる NL2SQLエンジンか ! ✓ アプリ層-データ層の 連携性/更新性 1. 2. 3. ツール内 ツール-各生産物の層 DB-APP層間 !
  8. 8 Copyright © 2025, Oracle and/or its affiliates | Confidential:

    Internal/Restricted/Highly Restricted ”作る速さより、『測る・つなぐ・守る』 の質が大事“ まとめ
  9. Appendix 10 Copyright © 2025, Oracle and/or its affiliates |

    Confidential: Internal/Restricted/Highly Restricted
  10. Appendix:2024年まで vs 2025年9月現在:AI駆動開発により何が効率化された? 11 Copyright © 2025, Oracle and/or its

    affiliates | Confidential: Internal/Restricted/Highly Restricted 要件定義 改善 リリース 設計 評価 実装 テスト 2024年まで 2025年9月現在 議事録・既存資料の要約で要件ドラフトを作成 テキスト→アーキ図/API雛形の自動生成 IDE補完、単一ファイルのNL→SQL/スニペット 手動のプロンプト検証や小規模オフライン評価 ユニットテスト雛形や契約テストの生成 プロンプト微調整、手動でRetriever調整 人手のGo/No-Go、カナリア展開 MCPでログ/チケットを標準接続から実データ起点で 要件/BDD自動化(配線工数↓・再現性↑)可能へ Stitchでスケッチ→UI+コードを数分で生成。 Figma連携で設計→実装の手戻りが少なくなる Gemini CLI(~1M文脈)でCLIから生成/修正をCI化。 Qwen3-CoderでOSS拡張可能へ CLI非対話実行でテスト生成・実行をCI自動化。 MCPで外部テスト基盤に接続可能へ MCPでログ/指標統合→CLI経由で品質・コスト・ 安全を自動評価(ゲート運用しやすい)へ Qwen3-Coderを内製調整+MCPで収集→再評価 →反映の閉ループ化(サイクル短縮)可能へ MCP×CI/CDで監査・秘密管理・品質チェックを 標準配線。基準未達は自動ロールバックへ