Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
Search
Ikko Eltociear Ashimine
April 16, 2024
Technology
0
270
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
【4/16(火)19:00~】春のクリエイター大交流会の登壇資料です
(
https://creator-square.connpass.com/event/314073/
)
Ikko Eltociear Ashimine
April 16, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
Cursorハンズオン実践!
eltociear
2
1.1k
AIエージェント就活入門 - MCPが履歴書になる未来
eltociear
0
780
pre-AI全盛時代で君たちはどう生きるか
eltociear
0
90
AI駆動開発、 猫からシーサーへ進化中。 現場での実践と未来
eltociear
0
530
OSS活動はいいぞ
eltociear
0
130
AI駆動開発 〜 生成AIが導く未来の開発手法
eltociear
0
390
初めての管理職での大失敗談
eltociear
0
350
上半期でやったこと
eltociear
0
130
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
120
Other Decks in Technology
See All in Technology
ソフトウェアエンジニアの生成AI活用と、これから
lycorptech_jp
PRO
0
290
[Codex Meetup Japan #1] Codex-Powered Mobile Apps Development
korodroid
2
950
Performance Insights 廃止から Database Insights 利用へ/transition-from-performance-insights-to-database-insights
emiki
0
300
新規事業におけるGORM+SQLx併用アーキテクチャ
hacomono
PRO
0
320
速習AGENTS.md:5分で精度を上げる "3ブロック" テンプレ
ismk
6
1.7k
【Kaigi on Rails 事後勉強会LT】MeはどうしてGirlsに? 私とRubyを繋いだRail(s)
joyfrommasara
0
270
Introdução a Service Mesh usando o Istio
aeciopires
0
190
カンファレンスに託児サポートがあるということ / Having Childcare Support at Conferences
nobu09
1
600
生成AI時代のセキュアコーディングとDevSecOps
yuriemori
0
120
防災デジタル分野での官民共創の取り組み (2)DIT/CCとD-CERTについて
ditccsugii
0
310
それでも私が品質保証プロセスを作り続ける理由 #テストラジオ / Why I still continue to create QA process
pineapplecandy
0
120
Railsの話をしよう
yahonda
0
160
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
84
9.2k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.2k
Making the Leap to Tech Lead
cromwellryan
135
9.6k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Fireside Chat
paigeccino
40
3.7k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.2k
Become a Pro
speakerdeck
PRO
29
5.6k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
10
870
Statistics for Hackers
jakevdp
799
220k
Keith and Marios Guide to Fast Websites
keithpitt
411
23k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
How to Ace a Technical Interview
jacobian
280
24k
Transcript
→🤖と移りゆく アプリ開発 - 1.5 Ikko Eltociear Ashimine GitHub: @eltociear X:
@eltociear 2024/4/16 【4/16(火)19:00~】春のクリエイター大交流会
Ikko Ashimine / 一功 安次嶺 株式会社I-Tecnology 取締役 #AI #Web3.0 #OSS #ネコ #生物学 #ゲーム #登山 #筋トレ #散歩 #海 #山 #外国料理 #カレー #酒 #投資
GitHub: @eltociear Connpass: @eltociear X: @eltociear YouTube: @eltociear
IKKOです
My business card
参考URL: https://speakerdeck.com/eltociear/toyi-riyukuapurikai-fa
「◦◦までに××作って」 「はい!(まじかよ、、、)」 「◦◦までに××作って」 「オケマル」 偉い人 私 偉くなった私 かしこなAI(※イメージ)
直近のアプリ開発AI
SWE-bench(ベンチマーク)で新 たな最先端技術を確立 その値、驚愕の13.86% 世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-benchって何? 参考URL: https://arxiv.org/abs/2310.06770 GitHub Issueをどれだけ解決 できるか見る評価指標
とは言えさ Devinはまだ非公開 (WL申請のみ)
直近のアプリ開発AI (OSS)
1. OpenDevin https://github.com/OpenDevin/OpenDevin ・2024/3/13 (1ヶ月前) GitHub公開 ・ベンチマークは未測定(準備中と報告) ・GPT-4、Claude 3、Llama等をサポート ・商用利用可能
・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロント エンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 (3週間前) GitHub公開 ・ベンチマークは未測定 ・Claude 3、GPT-4、GPT-3.5、そしてOllama 経由のローカルLLMをサポート
・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
2. Devika 参考URL: https://github.com/stitionai/devika?tab=readme-ov-file#demos
3. SWE-agent https://github.com/princeton-nlp/SWE-agent ・2024/4/2 (2週間前) GitHub公開 ・ベンチマークが12.29%でDevinに肉薄 ・G itHubリポジトリのバグやissueを修正するエ ンジニアリングエージェントに変更
・GPT-4、Claude3、ローカル推論のOllama等 をサポート ・プルリクエストを自動作成
3. SWE-agent 参考URL: https://github.com/princeton-nlp/SWE-agent
4. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 (1週間前) GitHub公開 ・ベンチマークで約15.95% ・実際にDjango(PythonのFW)のIssueを解決 した実績あり ・テストケースがある場合、それを読み込むこと
でさらに高精度に修正可能
参考URL: https://github.com/nus-apr/auto-code-rover 4. AutoCodeRover
まとめ 現状、解決率は十数% かなりの速さで人間に追いつきつ つある
Thank you for your attention🐈