Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI駆動開発 〜 生成AIが導く未来の開発手法
Search
Ikko Eltociear Ashimine
August 22, 2024
Technology
0
66
AI駆動開発 〜 生成AIが導く未来の開発手法
第11回 GenAI 勉強会での登壇資料です
(
https://gais.jp/gais11/
)
Ikko Eltociear Ashimine
August 22, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
OSS活動はいいぞ
eltociear
0
48
初めての管理職での大失敗談
eltociear
0
70
上半期でやったこと
eltociear
0
63
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
61
深海微生物の結晶セルロース分解酵素に関する研究
eltociear
0
25
伊豆赤沢海洋深層水から分離された微生物が生産するアラビノキシラン分解酵素に関する研究
eltociear
0
22
外国語文献購読 (Purification and properties of phenolic acid decarboxylase from Candida guilliermondii)
eltociear
0
14
Boost The Performance with Codon
eltociear
0
110
Copilot Workspaceで“管制官”になろう!
eltociear
0
750
Other Decks in Technology
See All in Technology
Slackbot × RAG で実現する社内情報検索の最適化
howdy39
2
330
TypeScript x Raycast x AIで変える開発者体験
nagauta
1
240
【shownet.conf_】3Dアプローチで守るセキュリティ
shownet
PRO
0
380
【swonet.conf_】NOCメンバーが語るSTMの実態!! ~ShowNetから若者への贈り物~
shownet
PRO
0
310
LeSSはスクラムではない!?LeSSにおけるスクラムマスターの振る舞い方とは / Scrum Master Behavior in LeSS
toma_sm
0
200
業務ヒアリングと知識の呪い
tamai_63
0
280
I tried the newly introduced certification "Applied Skills" on Microsoft Learn
mappie_kochi
0
150
【shownet.conf_】放送局とShowNetが共創する、未来の放送システム ~Media over IP 特別企画の裏側~
shownet
PRO
0
350
kube-vipとkube-proxy置き換えCiliumを積んだ究極のK3sクラスタを建てる
logica0419
4
210
Qdrant を用いた検索改善施策の紹介 / Search Engineering Tech Talk 2024 Summer
visional_engineering_and_design
0
110
【shownet.conf_】多様化するネットワーク環境を柔軟に統合するルーティングテクノロジー
shownet
PRO
0
390
スモールスタート、不都合な真実 〜 耳当たりの良い言葉に現場が振り回されないために/20240930-ssmjp-small-start
opelab
13
1.8k
Featured
See All Featured
Git: the NoSQL Database
bkeepers
PRO
425
64k
A Modern Web Designer's Workflow
chriscoyier
692
190k
Code Review Best Practice
trishagee
62
16k
The Cult of Friendly URLs
andyhume
77
6k
Navigating Team Friction
lara
183
14k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
28
7.5k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.7k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
225
22k
What's in a price? How to price your products and services
michaelherold
243
11k
Ruby is Unlike a Banana
tanoku
96
11k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
46
2k
Transcript
AI駆動開発 〜 生成AIが導く未来の開発手法 Ikko Eltociear Ashimine GitHub: @eltociear X: @eltociear
2024/8/21 第11回 GenAI 勉強会
1. 自己紹介 2. AI駆動開発とは 3. 開発に於いて AIが担える範囲 4. AI駆動開発ツールの一例 5.
GitHub Copilot Workspace 6. AI駆動開発勉強会について Agenda
Ikko Ashimine / 一功 安次嶺 AI駆動開発勉強会 LLM-jp 勉強会 株式会社I-Tecnology 取締役
株式会社Oshibloom GitHub: @eltociear Facebook: IkkoEltociearAshimine LinkedIn: ikko-ashimine X: @eltociear
My business card
AI駆動開発とは
AI駆動開発とは AI-Driven Development(AI 駆動開発)は従来のソフトウェ ア開発を大きくかえる開発手法・開発思想です。 プロダクト企画、要件定義、ソフトウェア設計、 コーディング、テスト、リリースのすべてのフェーズにおいて、 生成AI・LLMを主導的に利用することで、 プロダクトの企画からリリースまでのサイクルを統合し、開発 スピードの向上と、品質の統一、プロダクトのリリースタイム
の高速化を行います。 refs: https://www.ai-driven.dev/
開発に於いて AIが担える範囲
開発に於いて AIが担える範囲( 1) 企画 要件定義 設計 実装 テスト リリース 保守運用
Claude ChatGPT
開発に於いて AIが担える範囲( 2) 企画 要件定義 設計 実装 テスト リリース 保守運用
CodeRabbit GitHub Copilot Autify Genesis Amazon Q Developer
開発に於いて AIが担える範囲( 3) 企画 要件定義 設計 実装 テスト リリース 保守運用
Devin Merlinn
開発に於いて AIが担える範囲( まとめ) 企画 要件定義 設計 実装 テスト リリース 保守運用
AI駆動開発ツールの一例
SWE-bench (ベンチマーク)で 新たな最先端技術を確立 値は13.86% 世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-bench とは refs: https://arxiv.org/abs/2310.06770 GitHub Issue をどれほど解決 できるか見る評価指標
1. OpenHands (旧OpenDevin ) https://github.com/All-Hands-AI/OpenHand s ・2024/3/13 GitHub 公開 ・ベンチマークは未測定
・GPT-4 、Claude 3 、Llama 等をサポート ・商用利用可能 ・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロン トエンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 GitHub 公開 ・ベンチマークは未測定 ・Claude 3 、GPT-4
、GPT-3.5 、そして Ollama 経由のローカル LLMをサポート ・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
3. Devon https://github.com/entropy-research/Devon ・2024/3/15 GitHub 公開 ・ベンチマークは未測定 ・Claude 3.5 、GPT-4o
そしてOllama 経由の ローカルLLMをサポート ・コードベースの調査、バグ修正、テストコード 記述等が可能
4. SWE-agent https://github.com/princeton-nlp/SWE-agen t ・2024/4/2 GitHub 公開 ・ベンチマークが 12.29% でDevin
に肉薄 ・G itHub リポジトリのバグや issue を修正する エンジニアリングエージェントに変更 ・GPT-4 、Claude3 、ローカル推論の Ollama 等をサポート ・プルリクエストを自動作成
5. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 GitHub 公開 ・ベンチマークで約 15.95% ・実際にDjango(Python のWeb
FW) のIssue を解決した実績あり ・テストケースがある場合、それを読み込むこ とでさらに高精度に修正可能
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
8/21現在のSWE-bench リーダーボード refs: https://www.swebench.com/
AI駆動開発の OSSを集めています( 62 projects ) refs: https://github.com/eltociear/awesome-AI-driven-development
GitHub Copilot Workspace
Copilot Workspace のTPが開始されてます refs: https://githubnext.com/projects/copilot-workspace
Copilot の機能の所感 ・GitHub Copilot →一緒にコーディングしてくれるペアプログラマー 自分のコーディング量が 30-40% ぐらい減った感触 ・GitHub Copilot
Chat →コードの解説 /修正をしてくれるメンター ・Copilot Workspace →指示をもとに上流から下流工程までやってくれる SE 自分のコーディング量が 70-80% ぐらい減らせるかも?
一行のプロンプトでも簡単なものを作ってくれる refs: https://github.com/eltociear/copilot-workspace-web/issues/3
動かない場合は別途、 Session で修正依頼
出来上がっているものにも Session で改善依頼
枚数の多い資料作成にも使える
仕事にも・・・?
デモ
現在のモデルは GPT-4 Turbo refs: Copilot Workspace は GPT-4 Turbo を搭載しています。私たちは常に新しいモ
デルを評価して、ニーズに最適なものを使用していることを確認していますが、現 時点では GPT-4 Turbo が使用されているモデルです。
ということは refs: https://x.com/tradernewsai/status/1793095855442129039 NOW THEN
refs: https://qiita.com/tags/copilotworkspace
AI駆動開発勉強会について
AI駆動開発とは refs: https://www.facebook.com/groups/700738895539654/
AI駆動開発 勉強会とは refs: https://aid.connpass.com/ 第1回 2024/2/2 第2回 2024/5/29
AI駆動開発 勉強会 #3は9/11(水)開催です refs: https://aid.connpass.com/event/327682/
Thank you for your attention 🐈