Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
Search
Ikko Eltociear Ashimine
April 16, 2024
Technology
0
260
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
【4/16(火)19:00~】春のクリエイター大交流会の登壇資料です
(
https://creator-square.connpass.com/event/314073/
)
Ikko Eltociear Ashimine
April 16, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
AI駆動開発、 猫からシーサーへ進化中。 現場での実践と未来
eltociear
0
420
OSS活動はいいぞ
eltociear
0
120
AI駆動開発 〜 生成AIが導く未来の開発手法
eltociear
0
350
初めての管理職での大失敗談
eltociear
0
320
上半期でやったこと
eltociear
0
110
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
110
深海微生物の結晶セルロース分解酵素に関する研究
eltociear
0
87
伊豆赤沢海洋深層水から分離された微生物が生産するアラビノキシラン分解酵素に関する研究
eltociear
0
67
外国語文献購読 (Purification and properties of phenolic acid decarboxylase from Candida guilliermondii)
eltociear
0
63
Other Decks in Technology
See All in Technology
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
50
20k
自律的なスケーリング手法FASTにおけるVPoEとしてのアカウンタビリティ / dev-productivity-con-2025
yoshikiiida
1
17k
How Do I Contact HP Printer Support? [Full 2025 Guide for U.S. Businesses]
harrry1211
0
120
LLM時代の検索
shibuiwilliam
2
170
Yahoo!しごとカタログ 新しい境地を創るエンジニア募集!
lycorptech_jp
PRO
0
110
AI時代の開発生産性を加速させるアーキテクチャ設計
plaidtech
PRO
3
160
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
27k
Getting to Know Your Legacy (System) with AI-Driven Software Archeology (WeAreDevelopers World Congress 2025)
feststelltaste
1
130
LangChain Interrupt & LangChain Ambassadors meetingレポート
os1ma
2
320
Delta airlines Customer®️ USA Contact Numbers: Complete 2025 Support Guide
deltahelp
0
710
関数型プログラミングで 「脳がバグる」を乗り越える
manabeai
1
190
OSSのSNSツール「Misskey」をさわってみよう(右下ワイプで私のOSCの20年を振り返ります) / 20250705-osc2025-do
akkiesoft
0
170
Featured
See All Featured
Automating Front-end Workflow
addyosmani
1370
200k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.7k
Six Lessons from altMBA
skipperchong
28
3.9k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.4k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
690
Navigating Team Friction
lara
187
15k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
138
34k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.8k
Rebuilding a faster, lazier Slack
samanthasiow
82
9.1k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
How to Think Like a Performance Engineer
csswizardry
25
1.7k
Transcript
→🤖と移りゆく アプリ開発 - 1.5 Ikko Eltociear Ashimine GitHub: @eltociear X:
@eltociear 2024/4/16 【4/16(火)19:00~】春のクリエイター大交流会
Ikko Ashimine / 一功 安次嶺 株式会社I-Tecnology 取締役 #AI #Web3.0 #OSS #ネコ #生物学 #ゲーム #登山 #筋トレ #散歩 #海 #山 #外国料理 #カレー #酒 #投資
GitHub: @eltociear Connpass: @eltociear X: @eltociear YouTube: @eltociear
IKKOです
My business card
参考URL: https://speakerdeck.com/eltociear/toyi-riyukuapurikai-fa
「◦◦までに××作って」 「はい!(まじかよ、、、)」 「◦◦までに××作って」 「オケマル」 偉い人 私 偉くなった私 かしこなAI(※イメージ)
直近のアプリ開発AI
SWE-bench(ベンチマーク)で新 たな最先端技術を確立 その値、驚愕の13.86% 世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-benchって何? 参考URL: https://arxiv.org/abs/2310.06770 GitHub Issueをどれだけ解決 できるか見る評価指標
とは言えさ Devinはまだ非公開 (WL申請のみ)
直近のアプリ開発AI (OSS)
1. OpenDevin https://github.com/OpenDevin/OpenDevin ・2024/3/13 (1ヶ月前) GitHub公開 ・ベンチマークは未測定(準備中と報告) ・GPT-4、Claude 3、Llama等をサポート ・商用利用可能
・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロント エンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 (3週間前) GitHub公開 ・ベンチマークは未測定 ・Claude 3、GPT-4、GPT-3.5、そしてOllama 経由のローカルLLMをサポート
・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
2. Devika 参考URL: https://github.com/stitionai/devika?tab=readme-ov-file#demos
3. SWE-agent https://github.com/princeton-nlp/SWE-agent ・2024/4/2 (2週間前) GitHub公開 ・ベンチマークが12.29%でDevinに肉薄 ・G itHubリポジトリのバグやissueを修正するエ ンジニアリングエージェントに変更
・GPT-4、Claude3、ローカル推論のOllama等 をサポート ・プルリクエストを自動作成
3. SWE-agent 参考URL: https://github.com/princeton-nlp/SWE-agent
4. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 (1週間前) GitHub公開 ・ベンチマークで約15.95% ・実際にDjango(PythonのFW)のIssueを解決 した実績あり ・テストケースがある場合、それを読み込むこと
でさらに高精度に修正可能
参考URL: https://github.com/nus-apr/auto-code-rover 4. AutoCodeRover
まとめ 現状、解決率は十数% かなりの速さで人間に追いつきつ つある
Thank you for your attention🐈