$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
Search
Ikko Eltociear Ashimine
April 16, 2024
Technology
0
230
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
【4/16(火)19:00~】春のクリエイター大交流会の登壇資料です
(
https://creator-square.connpass.com/event/314073/
)
Ikko Eltociear Ashimine
April 16, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
OSS活動はいいぞ
eltociear
0
59
AI駆動開発 〜 生成AIが導く未来の開発手法
eltociear
0
100
初めての管理職での大失敗談
eltociear
0
100
上半期でやったこと
eltociear
0
75
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
70
深海微生物の結晶セルロース分解酵素に関する研究
eltociear
0
28
伊豆赤沢海洋深層水から分離された微生物が生産するアラビノキシラン分解酵素に関する研究
eltociear
0
25
外国語文献購読 (Purification and properties of phenolic acid decarboxylase from Candida guilliermondii)
eltociear
0
19
Boost The Performance with Codon
eltociear
0
130
Other Decks in Technology
See All in Technology
ミスが許されない領域にAIを溶け込ませる プロダクトマネジメントの裏側
t01062sy
6
4.2k
LY Accessibility Guidelines @fukuoka_a11yconf_前夜祭
lycorptech_jp
PRO
1
140
クラウドネイティブなNewSQLで実現するミッションクリティカルなアプリケーションの運用
yuyu_hf
PRO
1
170
深層学習のリペア技術の最新動向と実際 / DNN Repair Techniques for AI Performance Alignment for Safety Requirements
ishikawafyu
0
280
【ASW21-01】STAMPSTPAで導き出した課題に対する対策立案手法の提案
hianraku9498
0
380
asumikamというカンファレンスオーガナイザの凄さを語る / The Brilliance of Asumikam
tomzoh
1
280
Raspberry Pi 秋の新製品をチェックしてみよう / 20231202-rpi-jam-tokyo
akkiesoft
0
310
農業用ダム監視を目的とした衛星SAR 干渉解析の適用性について
osgeojp
0
130
「品質とスピードはトレード・オンできる」に向き合い続けた2年半を振り返る / Quality and speed can be traded on.
mii3king
0
550
そろそろOn-Callの通知音について考えてみよう (PagerDuty編)
tk3fftk
1
310
TimeTreeが経た3つの転換点 ー プロダクト成長過程でその時、その瞬間、何を考えてたか
ysmtysts
1
1.9k
間違いだらけのポストモーテム - ホントに役立つレビューはこうだ!
jacopen
5
940
Featured
See All Featured
Mobile First: as difficult as doing things right
swwweet
222
8.9k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
Designing for humans not robots
tammielis
250
25k
It's Worth the Effort
3n
183
27k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
229
52k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
48k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
126
18k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.8k
Designing for Performance
lara
604
68k
Transcript
→🤖と移りゆく アプリ開発 - 1.5 Ikko Eltociear Ashimine GitHub: @eltociear X:
@eltociear 2024/4/16 【4/16(火)19:00~】春のクリエイター大交流会
Ikko Ashimine / 一功 安次嶺 株式会社I-Tecnology 取締役 #AI #Web3.0 #OSS #ネコ #生物学 #ゲーム #登山 #筋トレ #散歩 #海 #山 #外国料理 #カレー #酒 #投資
GitHub: @eltociear Connpass: @eltociear X: @eltociear YouTube: @eltociear
IKKOです
My business card
参考URL: https://speakerdeck.com/eltociear/toyi-riyukuapurikai-fa
「◦◦までに××作って」 「はい!(まじかよ、、、)」 「◦◦までに××作って」 「オケマル」 偉い人 私 偉くなった私 かしこなAI(※イメージ)
直近のアプリ開発AI
SWE-bench(ベンチマーク)で新 たな最先端技術を確立 その値、驚愕の13.86% 世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-benchって何? 参考URL: https://arxiv.org/abs/2310.06770 GitHub Issueをどれだけ解決 できるか見る評価指標
とは言えさ Devinはまだ非公開 (WL申請のみ)
直近のアプリ開発AI (OSS)
1. OpenDevin https://github.com/OpenDevin/OpenDevin ・2024/3/13 (1ヶ月前) GitHub公開 ・ベンチマークは未測定(準備中と報告) ・GPT-4、Claude 3、Llama等をサポート ・商用利用可能
・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロント エンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 (3週間前) GitHub公開 ・ベンチマークは未測定 ・Claude 3、GPT-4、GPT-3.5、そしてOllama 経由のローカルLLMをサポート
・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
2. Devika 参考URL: https://github.com/stitionai/devika?tab=readme-ov-file#demos
3. SWE-agent https://github.com/princeton-nlp/SWE-agent ・2024/4/2 (2週間前) GitHub公開 ・ベンチマークが12.29%でDevinに肉薄 ・G itHubリポジトリのバグやissueを修正するエ ンジニアリングエージェントに変更
・GPT-4、Claude3、ローカル推論のOllama等 をサポート ・プルリクエストを自動作成
3. SWE-agent 参考URL: https://github.com/princeton-nlp/SWE-agent
4. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 (1週間前) GitHub公開 ・ベンチマークで約15.95% ・実際にDjango(PythonのFW)のIssueを解決 した実績あり ・テストケースがある場合、それを読み込むこと
でさらに高精度に修正可能
参考URL: https://github.com/nus-apr/auto-code-rover 4. AutoCodeRover
まとめ 現状、解決率は十数% かなりの速さで人間に追いつきつ つある
Thank you for your attention🐈