Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレイクスルーの鍵を握るのはデータ領域」

AI駆動開発の現在地 Kohei Ogawa Principal AI Data Software Solution Developer Cloud
X, Cloud Business Unit September 10th, 2025 ──ブレイクスルーの鍵を握るのはデータ領域 10分で理解する！

自己紹介 3 小川航平 Principal AI Data Software Solution Developer, Cloud
X, Cloud Business Unit, Oracle Corporation Japan ✓ 大学・大学院で図書館情報学/情報検索/AIを専攻し、データの収集・蓄積・活用を体系的に学ぶ ✓ １万人以上のメンバー数を抱える AIを社会実装するためのコミュニティのLeadを担う ✓ AIの研究者と研究者向けのChatGPTに関する書籍を出版 ✓ 様々な業界のエンタープライズ企業の Data&AIシステムの課題解決・設計開発・利活用をご支援 (Business Architect/Cloud Architect/ AI PM/Advocate/Developer) 高専 R＆D 元MicrosoftのData&AI領域のAzure Architect 元スタートアップの開発チームのLead (AWS FullStack Engineer) 落合陽一研究室出身 AI ※slide公開用に詳細部分は割愛 @shisyu_gaku in/koheiogawa/ フォロー&DM Welcomeです！

4 ”本研究会でAI駆動開発におけるデータ領域も共に模索したい“/”関心がある方を知りたい” 本日お伝えしたいこと “作る速さは十分。『測る・つなぐ・守る』の質が大事”

AI駆動開発の定義と境界線 5 要件定義改善設計実装評価テストリリース AI駆動開発を導入した
ソフトウェア開発のライフサイクル ✓ 1.AIが複数工程に常時組み込まれている（例：設計/実装/テスト/運用） ✓ 2. 評価→改善のループ（自動 or 半自動）が回っている ✓ 3. データの段取り（Contract/Lineage/Eval＝CLE）が最低限ある ✓ 4. 再現性（プロンプト/設定/データ・評価の版管理）が担保されている AIを常時組み込み、プロンプト → 動く機能 → 価値のサイクルを短縮する開発様式。 AI駆動開発の最低条件：これができないとAI支援止まり・人とAIの協創により、想像の具体化/具現化速度が速くなった。・また、生産活動できるユーザ層に変化を及ぼしている。 “作る速さはもう十分、重要なのは修正ループと信頼”

2025年9月現在、AI駆動開発の領域に変化を及ぼした技術6選は？ 6 CLI/CI常駐のAIエージェント化 Gemini CLI / Codex CLI / Claude
Codeの登場により、チャットでの補助から、スクリプト実行できるCLIに進化。 CIから呼べるので、コード生成・修正・調査をパイプラインに直結できる 1 “リポジトリ全体”を見通す長文脈（～100万トークン級） Gemini CLIなどの登場により、マルチファイルの一括編集や大規模リファクタが現実的に。コード変更をPR風に提示するワークフローも登場。 2 設計→フロントコードの“距離ゼロ化” Google Stitchの登場により、スケッチ/画像→UI設計→実装コードを数分で自動生成、Figmaへ直接出力し手戻りを削減。 3 標準化された接続（MCP）で |“配線コスト”激減 MCP技術の浸透が進み、ログ/チケット/評価基盤などの外部ツールを標準プロトコルで接続可能に。工程横断の再現性と監査性が向上。 4 OSSの最先端コーディングモデルによる “内製可能性” Qwen3-Coderなどの登場により、高性能なオープンソースのコーディングモデルが実用域に。コスト/データ統制/カスタマイズ性が向上。 5 IDEレベルの“差分提示&承認”まで一気通貫 Gemini CLIなどの登場によりエージェントが差分を可視化→確認→適用まで誘導。開発者はPRレビューに近い体験で安全に導入。 CodexはIDE拡張あり 6 2025年の革新性は「生成」から“実行・統合・標準化”へ主役が移ったこと 1度に扱えるデータ量が増えた標準化により扱える外部データの種類が増えたデータをLLMに渡しやすくなったデータ視点

SDLCで見るAI駆動開発ツールの市場とこれからの課題 7 要件定義設計実装テスト評価改善リリース ✓
開発者向けLLM（Codex CLI/Claude Code/Gemini CLI ）/汎用チャットLLM ✓ Bolt.new ✓ GitHub Copilot Chat/Amazon Q Developer Chat ✓ Playwright 使用可能な具体的なツール例濃=主用途／淡=副用途（工程ごと) 生成されるデータ例 AI駆動のポイントの例 PRDのたたき台を5分で作り、根拠リンクも自動添付市場習熟度予想 ※厳密ではないアーキ/ドメインの候補 3案を自動比較し、抜け・リスクを先出しルーティンはAIに任せ、難所へ集中。PRの往復を半減。仕様からユニット/E2E雛形を自動生成。失敗時は要約と次の一手を提示。 RAG/LLMの正当性・再現性を数値化本番データから毎週の改善案を自動抽出し、小さく検証 CI/CDを自動配線し、カナリア＆ロールバックを標準化。・概算確認用のクエリ・製品要件書（PRD）・プロトタイプUI ・スキーマDDL ・仕様書/アーキテクチャ・OpenAPI仕様書・スキーマ変更用のSQL ・README（実装の説明書）・実装コード・テストデータ投入用SQL ・テスト計画書・ユニットテスト(自動テスト) ・メトリクス集計SQL ・評価仕様書・評価スクリプト(ベンチ/プロンプトテスト）・コホート分析クエリ・ポストモーテム（振り返り文書）・フィーチャーフラグ設定（実験構成）・本番移行DDL ・リリースノート・インフラ定義（IaC: Terraform/CDK） NL2Docs NL2Code NL2SQL ✓ Vercel v0 ✓ Create.xyz ✓ Figma AI ✓ Autify ✓ Playwright ✓ Create.xyz ✓ Cursor/Cursor-Agent ✓ Vercel v0 ✓ Bolt “測る・つなぐ”のツールが相対的に手薄、ツールが少ないプロトタイピングの壁！ Software Development Lifecycle ※有名どころだとDevinも全工程いける

NL2Code 作る NL2SQL 抽出する NL2DOCS 説明するルータ Agent 数値/集計説明/根拠
作る/変える生成の速度（NL→Code/SQL/Docs）はもう十分。解決すべき課題はデータの意味づけ／接続性／安全／評価を対象とした制御・測定の処理能力 8 AI駆動開発ツール内のAgent機構 Presentation層 (UI/フロント) Application層 (ビジネスロジック/ オーケストレーション) Data層 NL Prompt • コンテキスト情報をツールの機能間で適切に渡してあげれてるか • 対応しているLLMが最新か (単体の精度) • DBのスキーマ情報の強化(=LLMへの解釈性を高める) ！ • 高頻度に呼び出されることによるLLM費用 • 呼び出し制限による開発UXの低下。開発ロードマップからのずれデータ量による呼び出しコストの課題コンテキストとその連携性によるデータの質回答の正確さ/安全性/再現性 • 数値不一致 • 本番だけ落ちる • 全表スキャン • 根拠不在 • 許可ビュー • EXPLAIN • 件数/時間上限 • 監査席課金(ユーザ/月) LLM従量（トークン／リクエスト）ワークフロー／エージェント実行従量 AI駆動開発ツールの課金体系の例データの中身だけ教えられても何のデータか雰囲気でしか分からんから雰囲気な回答になるよ？正確に回答して欲しいならデータの説明欲しい・・・ AI駆動開発中のシステム AI駆動開発中のエンジニア DB/SQLに関しては微妙にまだ惜しいんだよなぁ ✓ コンテキストをどのくらい考慮できる NL2SQLエンジンか！ ✓ アプリ層-データ層の連携性/更新性 1. 2. 3. ツール内ツール-各生産物の層 DB-APP層間！

9 ”作る速さより、『測る・つなぐ・守る』の質が大事“ まとめ

Appendix 11

Appendix：2024年まで vs 2025年9月現在：AI駆動開発により何が効率化された？ 12 要件定義改善リリース設計評価実装
テスト 2024年まで 2025年9月現在議事録・既存資料の要約で要件ドラフトを作成テキスト→アーキ図/API雛形の自動生成 IDE補完、単一ファイルのNL→SQL/スニペット手動のプロンプト検証や小規模オフライン評価ユニットテスト雛形や契約テストの生成プロンプト微調整、手動でRetriever調整人手のGo/No-Go、カナリア展開 MCPでログ/チケットを標準接続から実データ起点で要件/BDD自動化（配線工数↓・再現性↑）可能へ Stitchでスケッチ→UI+コードを数分で生成。 Figma連携で設計→実装の手戻りが少なくなる Gemini CLI（~1M文脈）でCLIから生成/修正をCI化。 Qwen3-CoderでOSS拡張可能へ CLI非対話実行でテスト生成・実行をCI自動化。 MCPで外部テスト基盤に接続可能へ MCPでログ/指標統合→CLI経由で品質・コスト・安全を自動評価（ゲート運用しやすい）へ Qwen3-Coderを内製調整＋MCPで収集→再評価 →反映の閉ループ化（サイクル短縮）可能へ MCP×CI/CDで監査・秘密管理・品質チェックを標準配線。基準未達は自動ロールバックへ

Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレ...

Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレイクスルーの鍵を握るのはデータ領域」

KoheiOgawa

More Decks by KoheiOgawa

Other Decks in Technology

Featured

Transcript

AI駆動開発の現在地 Kohei Ogawa Principal AI Data Software Solution Developer Cloud

自己紹介 3 小川航平 Principal AI Data Software Solution Developer, Cloud

4 ”本研究会でAI駆動開発におけるデータ領域も共に模索したい“/”関心がある方を知りたい” 本日お伝えしたいこと “作る速さは十分。『測る・つなぐ・守る』の質が大事”

AI駆動開発の定義と境界線 5 要件定義改善設計実装評価テストリリース AI駆動開発を導入した

2025年9月現在、AI駆動開発の領域に変化を及ぼした技術6選は？ 6 CLI/CI常駐のAIエージェント化 Gemini CLI / Codex CLI / Claude

SDLCで見るAI駆動開発ツールの市場とこれからの課題 7 要件定義設計実装テスト評価改善リリース ✓

NL2Code 作る NL2SQL 抽出する NL2DOCS 説明するルータ Agent 数値/集計説明/根拠

9 ”作る速さより、『測る・つなぐ・守る』の質が大事“ まとめ

Appendix 11

Appendix：2024年まで vs 2025年9月現在：AI駆動開発により何が効率化された？ 12 要件定義改善リリース設計評価実装