Timee-event-Copilot

開発⽣産性をあげるを徹底解剖！ Yuki Hattori Customer Success Architect GitHub Japan

開発者の⽣産性向上本当の問題に集中でき、満⾜度も向上イノベーションを加速より速くプロトタイプやイノベーションを実現スキルギャップを埋める新しい開発⾔語や技術を習得開発者に⼤きなアドバンテージを提供

55% 46% 74% のコードがCopilotによるもの速くタスクを完了がより満⾜する仕事に集中できたと証⾔プロジェクトの⽂脈に即したコードを提案

OpenAI Model 文脈提案

今後のGitHub Copilot リファクタリング (コード翻訳) コードレビュー (コード解説) ドキュメント化今後のGitHub Copilot ユニットテスト
コードエラー検知デバッグコードレビュー AI による Pull Request 現在のGitHub Copilot コメントをコードに変換繰り返すコードを補完代替⼿段を表⽰ 1 計画 2 分析 3 設計 4 実装 5 テストと統合 6 メンテナンス X エディタを⾶び出し SDLC 全体を AI で⽀援

GitHub Copilot X Copilot for Pull Requests Copilot for Docs
Copilot for the CLI Copilot Chat

GitHub Copilot Future コードやドキュメントから、ユニットテストを自動生成 TestPilot Codespaces上に存在するすべてのコードを使うことで提案を改善 GitHub Copilot
for *Your* Codebase キーボードを使わずにコードを書く Copilot Voice https://githubnext.com/

December, 2022 GitHub Copilot GitHub Copilot Behind the curtain

GitHub Copilot の裏側 • GitHub Copilot の仕組み • GitHub Copilot
がエディタの情報をどのように取るのか = GitHub Copilot Prompt Crafting • Tips and Tricks

GitHub Copilot の 3 Layer Copilot Platform Copilot Client OpenAI
Model API * 上記は GitHub Copilot のアーキテクチャを抽象化した図です Githubによって開発及び保守。認証、セキュリティ、プライバシー Githubによって開発及び保守。カスタムプロンプト作成と自動補完ユーザーエクスペリエンスを提供 OpenAI によって開発 Azure でホストスケーラブルなデリバリー

GitHub Copilot のモデル GitHub Copilot のモデル選定重要事項 • 精度 • 速度
←とても重要現在は GPT3.5-turbo の派生版である Sahara-base を利用 Codex は今は利用しておりません今後モデルは変わる可能性があります

Large Language Models LLM To k 1. Attention 2. Tokenization
3. Autoregressive（自己回帰型） Very Very …. Very Large Neural Network To,k ens To,k,ens in To,k,ens, in . Tokens in. To,k,ens, in, . テキストはトークンに分割され、モデルに1つずつ供給されます。前のトークンに基づいて次のトークンを予測する、訓練済のモデルです。

Prompt Crafting • Language Marker: プログラミング⾔語情報 • Path Marker: 現在のファイルへのパス
• Neighboring Tabs: ⾮アクティブなオープンしているタブ Language Marker の例 "html": "<!DOCTYPE html>", "python": "#\!/usr/bin/env python3", "ruby": "#\!/usr/bin/env ruby",

Prompt Crafting: Markers Path: foo/foo.py Language Marker HTML: <!DOCTYPE html>
Python: #\!/usr/bin/env python3 Ruby: #\!/usr/bin/env ruby ファイルパスおよび言語マーカーは、強力なシグナルを言語モデルに提供し、出力の構文と文法を調整します。

Prompt Crafting: 隣接ファイル Open Tab 1 Open Tab 2 他のオープンタブからのコード
スニペットは類似性を検索し、プロンプトに追加のコンテキストとして注入されます。

Snippet Inclusion – 隣接するタブ • 最⼤で 20 ファイルまで過去の履歴 (FIFO)
を遡り読み込む • 同じ⾔語のファイルを読み込む

文字の類似性でファイル内を検索 • GitHub Copilot は現在⽂字の類似性を活⽤して類似性を求める • 関数名はシンプルかつ、意味のあるものにする必要性 •
AB テストなどでこの⽅法は変わります / カーソル履歴など • ⼀貫して⾔えること • ⼀貫性のある命名規則ときれいなコード • 現在何をしているのかにフォーカスしながら作業

GitHub Copilot の制限 • プロンプトの制限トークン数 • トークンが無限に渡せるわけではない • 渡せるトークンの数は増加中 •
より多くの情報を渡すには…? • ⽇本語よりも英語を使う • 短く、わかりやすい変数名 • ⼀⽅でトークンが多ければ確実に精度が上がるわけではないのでご注意を https://platform.openai.com/tokenizer

December, 2022 GitHub Copilot GitHub Copilot Tips and Tricks BJOBUJWFEFW

まとめ: あまり気にしすぎない • 「知っている」と「知らない」では GitHub Copilot の飼い慣らしに差はでますが、 GitHub ではそれを意識しないでも高いコード提案ができるようにプロダクトを作っています。 •
結局のところ「良いコーディング」をすれば、提案されるコードも「良いコード」になります。 • 人間にとって良いコーディング • 文脈を知らない人でもわかるようなコーディング • ミスを誘発しないような確かなコーディング

Timee-event-Copilot

Timee-event-Copilot

Yuki Hattori

More Decks by Yuki Hattori

Other Decks in Technology

Featured

Transcript

開発⽣産性をあげるを徹底解剖！ Yuki Hattori Customer Success Architect GitHub Japan

開発者の⽣産性向上本当の問題に集中でき、満⾜度も向上イノベーションを加速より速くプロトタイプやイノベーションを実現スキルギャップを埋める新しい開発⾔語や技術を習得開発者に⼤きなアドバンテージを提供

55% 46% 74% のコードがCopilotによるもの速くタスクを完了がより満⾜する仕事に集中できたと証⾔プロジェクトの⽂脈に即したコードを提案

OpenAI Model 文脈提案

今後のGitHub Copilot リファクタリング (コード翻訳) コードレビュー (コード解説) ドキュメント化今後のGitHub Copilot ユニットテスト

GitHub Copilot X Copilot for Pull Requests Copilot for Docs

GitHub Copilot Future コードやドキュメントから、ユニットテストを自動生成 TestPilot Codespaces上に存在するすべてのコードを使うことで提案を改善 GitHub Copilot

December, 2022 GitHub Copilot GitHub Copilot Behind the curtain

GitHub Copilot の裏側 • GitHub Copilot の仕組み • GitHub Copilot

GitHub Copilot の 3 Layer Copilot Platform Copilot Client OpenAI

GitHub Copilot のモデル GitHub Copilot のモデル選定重要事項 • 精度 • 速度

Large Language Models LLM To k 1. Attention 2. Tokenization

Prompt Crafting • Language Marker: プログラミング⾔語情報 • Path Marker: 現在のファイルへのパス

Prompt Crafting: Markers Path: foo/foo.py Language Marker HTML: <!DOCTYPE html>

Prompt Crafting: 隣接ファイル Open Tab 1 Open Tab 2 他のオープンタブからのコード

Snippet Inclusion – 隣接するタブ • 最⼤で 20 ファイルまで過去の履歴 (FIFO)

文字の類似性でファイル内を検索 • GitHub Copilot は現在⽂字の類似性を活⽤して類似性を求める • 関数名はシンプルかつ、意味のあるものにする必要性 •

GitHub Copilot の制限 • プロンプトの制限トークン数 • トークンが無限に渡せるわけではない • 渡せるトークンの数は増加中 •

December, 2022 GitHub Copilot GitHub Copilot Tips and Tricks BJOBUJWFEFW

まとめ: あまり気にしすぎない • 「知っている」と「知らない」では GitHub Copilot の飼い慣らしに差はでますが、 GitHub ではそれを意識しないでも高いコード提案ができるようにプロダクトを作っています。 •