Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GitHub Copilot 最新アップデート – 「一歩先」の実践活用術

GitHub Copilot 最新アップデート – 「一歩先」の実践活用術

Avatar for zhang.william

zhang.william

June 22, 2026

Other Decks in Technology

Transcript

  1. slide expiration _ END OF JULY 2025 自己紹介 / Speaker

    William Zhang AI GTM Lead | GitHub Copilot GitHub Inc. 東京 / Tokyo, Japan 何をしている人か GitHub Copilot の製品担当として GitHub の AI 領域をカバー。日本のために GitHub Copilot を より良くする人 ハイライト GitHub の公式ウェビナーでよくお話をしています。 最近ハマっていること Duolingo で韓国語を勉強中 つながりましょう / Let’s connect X (Twitter) @moulongbcd LinkedIn in/wiizhang
  2. AGENT-NATIVE AT ENTERPRISE SCALE GitHub Copilot の歴史 Copilot Chat Ask

    Mode LLM による コード補完 Copilot Chat Edit Mode GitHub Copilot Agent Mode 「副操縦⼠」(copilot) の時代 Agent の台頭 コード補完だけ ⾔われたことに応答する ⾃律的に動く IDE 以外での GitHub Copilot IDE 以外への展開 Cloud Agent / CLI / SDK etc. IDE 外でも利⽤可能 CLOUD AGENT Agent の台頭
  3. GitHub:2.4億ユーザー GitHub Copilot:4900万ユーザー Gartner: Magic Quadrant, Leader in Enterprise AI

    Coding Agents GitHub White Paper: https://github.com/resources/whitepapers/gartner-magic- quadrant-for-enterprise-ai-coding-agents?locale=ja Gartner Report: https://www.gartner.com/doc/reprints?id=1- 2NEACZCW&ct=260520&st=sb
  4. MAI-Code-1-Flash マイクロソフト独自開発の新AIモデル 「MAI」ファミリの一つ モデル 1M コンテキストウィンドウ 推論レベル Claude Sonnet 4.6

    Claude Opus 4.6 Claude Opus 4.6 (fast mode) (preview) Claude Opus 4.7 Claude Opus 4.8 Claude Fable 5 GPT-5.3-Codex GPT-5.4 GPT-5.5 より大きなコンテキストウィンドウと 設定可能な推論レベル +9.3 pts 平均Pass率 -24% 平均トークン使⽤量 SWE-Bench Verified, SWE-Bench Pro, SWE-Bench Multilingual, Terminal Bench 2
  5. SWE-Bench Pro Sonnet-4.6 + Rubber Duck (GPT-5.4) → +3.8% pts

    異なるモデル を掛け合わせ、 違う視点で 見直してくれる 仕組み Rubber Duck
  6. 新しいUI(experimental) • タブでIssue・Pull Request・Gistを切り替え(CLIを離れず閲覧) • クリーンなレイアウトとテーマ対応のセマンティックカラー • カラーモード追加とスクリーンリーダー対応でアクセシビリティ向上 • 「/experimental

    on」で有効化 ボイスモード(一般提供) • スペースキー長押しでハンズフリー音声入力 • Ctrl+X → V でも録音の開始/停止が可能 • 音声はローカル処理で端末内に保持(プライバシー配慮)
  7. デモシナリオ – ウェブサイトのテーマカラーを変更する 1. Voice Modeで新しいIssueの起票を依頼 2. タブでIssueに切り替え、作成したissueを閲覧 • 「A」で自分のissueとリポジトリ全てのissue

    の表示切り替え • 「O」でGitHub.comのissueページに移動 • 「C」でCopilot CLIのセッションコンテキスト に追加 3. 実装完了後に、PRを作成し、タブでPRを閲覧 • 「A」で自分のPRとリポジトリ全てのPRの表 示切り替え • 「O」でGitHub.comのPRページに移動 • 「C」でCopilot CLIのセッションコンテキスト に追加 4. Copilot CLIから離れることなく実装いただくデモ をご覧いただきます、
  8. Three product features 1 エージェントセッションの起動から並行実行、PRのレビュー・マージまでを1つにまとめたアプリ エージェントに委任 Issue やプロンプト、進行中の PR か

    ら、そのままセッションを開始。 自動化ワークフロー スキルやプロンプトを繰り返し実行 できる作業に変え、定期的に自動実 行。 レビューとマージ 差分のレビュー、CI 確認、失敗チェッ クの修正、マージまで。エージェント と同じウィンドウで完結。 GitHub Copilot App
  9. GitHub App Agents GitHub App Agentsとは • GitHubマーケットプレイスからインストール できる、パートナー製AIエージェント •

    Issueのアサイン・PRコメントへのメンショ ン・Agents UIの3つから起動可能 • Copilotサブスクリプションで動作し、追加 の認証情報管理が不要 「誰でも自分のエージェントアプリを作れるよう 順次開放予定」
  10. 概要 • GitHub Actions上でAIエージェントが作業を自動化 • 現在パブリックプレビュー中(2026年6月11日発表) 何ができるか • issue自動トリアージ •

    PRレビュー • CIエラー分析 • ドキュメント管理など 主なメリット • 自然言語で記述 → AIが処理内容を判断 • スケジュール実行、イベントトリガー、コメントコマンドなど柔軟なトリ ガー 始め方 • gh aw CLI拡張機能をインストール • Markdownファイルを作成 → コンパイル → コミット • サンプルユースケースは「Peli's Agent Factory」を参照 セキュリティ(Security-first by design) • デフォルトで読み取り専用権限で実行 • サンドボックス+Agent Workflow Firewallで隔離 • Safe outputsで生成物を検証してから適用 • 脅威検出ジョブが変更内容をスキャン
  11. GitHub Copilot Code Review のアップデート 2025年 • 4月4日にコードレビュー がGA •

    6月13日にカスタマイズ指示をサポート .github/copilot-instructions.mdを使用 • 9月3日にカスタム指示のパス指定をサポート 特定のフォルダやファイルにカスタム指示が可能 • 9月10日にPull Request作成時、Push時 の自動レビューをサポート • 10月28日: Reviewスコープをプロジェクト全体に拡張 • 12月11日:GitHub Copilotのユーザーライセンスなしでも実行可能に 2026年 • 3月5日:GitHub Actions上で動作するように • 3月11日:GitHub Copilot CLIからCopilot Code Reviewの呼び出しを サポート • 6月2日:Agent Skills&MCP ServerのサポートとLowティア/Medium ティアのサポート(パブリックプレビュー) • 6月12日:組織レベルのランナー制御・コンテンツ除外・カスタム指示の 文字数制限撤廃に対応
  12. エージェント実行モデル:オープンアクセスから完全分離まで サンドボックスなし パワーユーザー エージェントはユーザーのマシン上で直接 実行され、ファイルシステム・ネットワーク ・インストール済みツールにフルアクセス できます。 サンドボックス化 安全なツール実行 メインのエージェントループは低権限で

    ホスト上で動作し、ツールの実行は分離 されたコンテナに委譲します。 完全分離 プラットフォームサービス サンドボックス内で実行されるエージェ ントは、使用されるリソースやIDをほと んど把握しません。 ユーザーID コンピュート ローカルディスク コンテナ ユーザーID コンピュート 推論プロバイダー CLI SDK ホスト ランタイム ローカルディスク ツール セッション 推論プロバイダー CLI SDK ホスト ランタイム ツール セッション フ ィ ル タ ー コンピュート コンテナ エージェン トID 推論プロバイダー CLI SD K ホスト ランタイム ツール セッション プ ロ キ シ 認証情報ストア プ ロ キ シ
  13. 変更詳細は 5/12 のウェビナー録画、トークンの最適化については 6/16 のウェビナー録画 https://github.ondemand.goldcast.io/on-demand/b212af94- 8978-4d04-aa72-4c0b1222453c 5/12 Usage-Based Billing移行ウェビナー

    https://github.registration.goldcast.io/events/04d8b78c-7149- 48df-91a1- 68029e126c4a?utm_medium=email&utm_source=ent&utm_c ampaign=701Kg000000Pj6vIAC 6/16 エージェントの品質とトークンの最適化ウェビナー
  14. 推論モデル(Opus、GPT-5.5) 計画立案・アーキテクチャ設計・デバッグなどの同期タスク ミッドティアモデル(Sonnet、GPT-5.4) 非同期での実装に用いる。 ローティア(Haiku、GPT-mini) 小規模なリファクタリング、反復作業、ドキュメント更新 迷ったら Auto Mode をデフォルトとして使う。

    品質とトークンを最適化する 2つのアプローチ モデル選択と Auto モード ① GitHub Copilotの機能活用 • セッションの /compact でコンテキストを圧縮 • 新しいタスクごとに /clear をこまめに使う • /chronicle cost-tipsでGitHub Copilotからアドバイスをもらう ② コンテキストエンジニアリングに取り組む • プロンプトの改善 • 実装フェーズごとにセッションを分ける (調査→計画→実装) • 決定論的なコントロール (テスト) • 非決定論的なコントロール (エージェント設定) 関連するコンテキストだけを与える
  15. /chronicle • /chronicle standup — 直近約24時間の作業内容を、最近のセッション(PR・Issue・コミットに紐づかない 作業も含む)から抽出し、簡潔なスタンドアップ形式のレポートを生成します。 • /chronicle search

    <query> — すべてのセッション内容をキーワードやトピックで検索し、該当するセッ ションを表示します。 • /chronicle tips — 利用パターンを分析し、Copilotをより活用するためのCLI機能や習慣について個別最 適化された推奨事項を提示します。 • /chronicle cost-tips — セッション履歴を分析し、トークン使用量とコストを削減する具体的かつ根拠に基 づく方法(一般的なチェックリストではなく実データに基づくもの)を提示します。 • /chronicle improve — セッション全体でエージェントが苦戦した箇所や修正が必要だった箇所を確認 し、.github/copilot-instructions.md への改善案を提案します。 • /chronicle reindex — セッションストアのインデックスを再読み込み・再構築します(セッションがまだイン デックス化されていない場合は、まずこれを実行してください)。
  16. ① プロンプトの改善 あなたのプロンプト 常時オン 常時オン システム & ツール プロンプト 具体的に書く。

    説明を添える。 停止条件を加える。 「Xの場合は停止」と書く。 既知のコンテキストを事 前に与える。 ファイル、フォルダ、Webサイト等
  17. ② 実装フェーズごとにセッションを分ける 中盤の情報抜け (Lost in the Middle) モデルはコンテキストの先頭と末尾の トークンを重視する傾向がある。 50%未満時

    コンテキストウィンドウを 埋められるからといって、 埋めるべきとは限らない。 参考: https://www.producttalk.or g/context-rot/ 直近バイアス (Recency Bias) モデルはコンテキストの末尾のトークン を重視する傾向がある。 50%超時 コンテキス トの劣化 (Context Rot)
  18. ② 実装フェーズごとにセッションを分ける (調査→計画→実装) 調査 → 計画 → 実装 システム プロンプ

    ト プロンプト 推論 ファイル 変更呼び出し /RESEARCH GEMINI 2.5 PRO システム プロンプ ト プロンプト 計画の入力 ファイ ル /PLAN OPUS 4.8 /FLEET GPT 5.4 ファイ ル ファイ ル ファイ ル ファイ ル ファイ ル 計画の入力 ファイル 精緻な仕様 システム プロンプ ト プロンプト 精緻な仕様 ファイル ファイル 「Xを変更したい。関係するファイ ルはどれ?」 /rubber-duck
  19. ③ 決定論的なコントロール (テスト) エージェント内部のループにも、複数エー ジェントを束ねるワークフロー全体にも当 てはまる。 エージェントの失敗 確率は急速に積み上 がる 95%

    36% 8% 99% 82% 61% 0% 20% 40% 60% 80% 100% 1 5 10 15 20 30 40 50 Steps 95% per step 99% per step The Compound Error Problem 1ステップあたり99%の精度でも、50ステッ プのワークフローでは最終精度は約60%にま で低下する。
  20. ③ 決定論的なコントロール (テスト) 決定論的なコントロール ユニットテス トあり システム & ツール プロンプト

    バグありの変 更 ユニットテス トなし デバッグセッ ション インシデント 失敗するテス ト 修正の変更 変更 2 成功するテスト システム & ツール プロンプト バグありの変 更 バグありの変 更 2 バグありの変 更 3 バグありの変 更 4 システム & ツール プロンプト 誤った調査 バグ修正 無駄になる CI/CD 時間、 COPILOT レビューのサイクル 、人の時間など。
  21. Persistent instructions COPILOT-INSTRUCTIONS.MD Custom Agents. ./GITHUB/AGENTS/*.AGENT.MD Skills ./GITHUB/SKILLS/*/SKILL.MD MCP Subagents

    Scoped instructions. ./GITHUB/INSTRUCTIONS/*.INSTRUCTIONS.MD Prompt Files ./.GITHUB/PROMPTS/*.PROMPT.MD Copilot Memory エージェント設定 ④ 非決定論的なコントロール (エージェント設定)
  22. 常時有効なエージェントへの指示 Persistent Instructions 常時オン システム & ツール INSTRUCTIONS ./.GITHUB/COPILOT-INSTRUCTIONS.MD ./AGENTS.MD

    記載する内容: • プロジェクトで譲れない事項 • 繰り返し発⽣するエージェントの失敗を記録する • 出⼒を絞る指⽰(「簡潔に」など) 内容は極⼒⼩さく保つ。 AIに⽣成させない。 定期的に⾒直し、保守し、必要に応じて作り直す。
  23. ワークフローと振る舞いを設計する Custom Agents システム & ツール INSTRUCTIONS カスタムエージェント プロンプト ハーネス

    エージェントファイルを 取得する ハーネス カスタムエージェント定 義を組み込む ハーネス 利用可能な ツールを調 整する ハーネス プロンプ トを追記 する ユーザー 「/TDD-RED ADD API ENDPOINT」 カスタムエージェント プロンプト
  24. 条件付きの能力を追加する Skills システム & ツール INSTRUCTIONS Skillドキュメン ト プロンプト Skillの説明

    Skillの要 求 ハーネス すべてのSkillの説明をコンテ キストに投入する ユーザー 「APIに 取り組ん で」 LLM → ハーネス APIのSkillが必要 ハーネス Skill全文をコンテキス トに読み込む
  25. サードパーティ製ツールと連携する MCP システム & ツール INSTRUCTIONS Issue #45 プロンプト ツールの説明

    MCPツール 呼び出し ハーネス Issueを読むための MCPツール 「GET ISSUE」が利用可能 ユーザー 「Issue #45を読んで 」 LLM ツールを使用: Issue #45を読む ハーネス MCP APIを呼び出し、 Issue #45を渡す
  26. タスク固有のコンテキストを切り出す Subagents メインセッシ ョン システム & ツール プロンプト サマリー サブエージェ

    ント システム & ツール ドキュメント 1 LLM → ハーネス 「サブエージェントを作成 」 INSTRUCTIONS プロンプト サマリー INSTRUCTIONS ドキュメント 2 ドキュメント 3 ハーネス サマリーをメインコンテキストに戻す 「該当の機能を探して」
  27. アクションのロードマップ パワーユーザー向 けガイダンス 指標 コードで考える ファイル解析はAIに丸投げするより、スクリプトを書いて処理する⽅が好ましい。 これらのヒントは条件付きであったりトレ ードオフを伴ったりするため、⼗分な知識 と時間の投資が必要です。 CLI

    と MCP を使い分ける 静的トークンが少ないため、状況によっては CLI ツールの⽅が最適となる。 シェル出⼒を改善する シェル出⼒は⾮常に⻑くなることがあるため、https://github.com/rtk-ai/rtk の ようなツールで出⼒量を抑える。 ツール呼び出しをまとめる https://github.com/jsturtevant/copilot-codeact-plugin のようなツールを使う と、複数のツール呼び出しを1つにまとめられる。 モデル別のコンテキスト最適化 モデルごとに振る舞いは異なり、それぞれに合わせた調整ができる。 さらに詳しいシナリオ集 トークンが膨らむ典型パターンとその抑え⽅をまとめている。https://ashy- dune-0b4215a0f.7.azurestaticapps.net/detailed/index.html#/scenarios