Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
Search
Ikko Eltociear Ashimine
April 16, 2024
Technology
0
290
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
【4/16(火)19:00~】春のクリエイター大交流会の登壇資料です
(
https://creator-square.connpass.com/event/314073/
)
Ikko Eltociear Ashimine
April 16, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
AI駆動開発の実践とその未来
eltociear
2
630
乗りこなせAI駆動開発の波
eltociear
1
1.4k
AIファーストな開発プロセスへ:AI駆動開発の核心を解説する
eltociear
1
210
AIと人間が一緒に書く時代へ〜AI駆動開発のゆるい入り口〜
eltociear
0
70
Cursorハンズオン実践!
eltociear
2
1.5k
AIエージェント就活入門 - MCPが履歴書になる未来
eltociear
0
930
pre-AI全盛時代で君たちはどう生きるか
eltociear
0
110
AI駆動開発、 猫からシーサーへ進化中。 現場での実践と未来
eltociear
0
600
OSS活動はいいぞ
eltociear
0
150
Other Decks in Technology
See All in Technology
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
330
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
500
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
540
顧客の言葉を、そのまま信じない勇気
yamatai1212
1
360
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
2k
日本の85%が使う公共SaaSは、どう育ったのか
taketakekaho
1
240
pool.ntp.orgに ⾃宅サーバーで 参加してみたら...
tanyorg
0
570
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
490
OWASP Top 10:2025 リリースと 少しの日本語化にまつわる裏話
okdt
PRO
3
840
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践 〜
bwkw
3
1k
仕様書駆動AI開発の実践: Issue→Skill→PRテンプレで 再現性を作る
knishioka
2
680
マネージャー視点で考えるプロダクトエンジニアの評価 / Evaluating Product Engineers from a Manager's Perspective
hiro_torii
0
180
Featured
See All Featured
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
1
57
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
330
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
170
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
750
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
250
Everyday Curiosity
cassininazir
0
130
Evolving SEO for Evolving Search Engines
ryanjones
0
130
Discover your Explorer Soul
emna__ayadi
2
1.1k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.6k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.2k
Transcript
→🤖と移りゆく アプリ開発 - 1.5 Ikko Eltociear Ashimine GitHub: @eltociear X:
@eltociear 2024/4/16 【4/16(火)19:00~】春のクリエイター大交流会
Ikko Ashimine / 一功 安次嶺 株式会社I-Tecnology 取締役 #AI #Web3.0 #OSS #ネコ #生物学 #ゲーム #登山 #筋トレ #散歩 #海 #山 #外国料理 #カレー #酒 #投資
GitHub: @eltociear Connpass: @eltociear X: @eltociear YouTube: @eltociear
IKKOです
My business card
参考URL: https://speakerdeck.com/eltociear/toyi-riyukuapurikai-fa
「◦◦までに××作って」 「はい!(まじかよ、、、)」 「◦◦までに××作って」 「オケマル」 偉い人 私 偉くなった私 かしこなAI(※イメージ)
直近のアプリ開発AI
SWE-bench(ベンチマーク)で新 たな最先端技術を確立 その値、驚愕の13.86% 世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-benchって何? 参考URL: https://arxiv.org/abs/2310.06770 GitHub Issueをどれだけ解決 できるか見る評価指標
とは言えさ Devinはまだ非公開 (WL申請のみ)
直近のアプリ開発AI (OSS)
1. OpenDevin https://github.com/OpenDevin/OpenDevin ・2024/3/13 (1ヶ月前) GitHub公開 ・ベンチマークは未測定(準備中と報告) ・GPT-4、Claude 3、Llama等をサポート ・商用利用可能
・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロント エンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 (3週間前) GitHub公開 ・ベンチマークは未測定 ・Claude 3、GPT-4、GPT-3.5、そしてOllama 経由のローカルLLMをサポート
・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
2. Devika 参考URL: https://github.com/stitionai/devika?tab=readme-ov-file#demos
3. SWE-agent https://github.com/princeton-nlp/SWE-agent ・2024/4/2 (2週間前) GitHub公開 ・ベンチマークが12.29%でDevinに肉薄 ・G itHubリポジトリのバグやissueを修正するエ ンジニアリングエージェントに変更
・GPT-4、Claude3、ローカル推論のOllama等 をサポート ・プルリクエストを自動作成
3. SWE-agent 参考URL: https://github.com/princeton-nlp/SWE-agent
4. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 (1週間前) GitHub公開 ・ベンチマークで約15.95% ・実際にDjango(PythonのFW)のIssueを解決 した実績あり ・テストケースがある場合、それを読み込むこと
でさらに高精度に修正可能
参考URL: https://github.com/nus-apr/auto-code-rover 4. AutoCodeRover
まとめ 現状、解決率は十数% かなりの速さで人間に追いつきつ つある
Thank you for your attention🐈