Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
→🤖と移りゆく アプリ開発 - 1.5 Ikko Eltociear Ashimine GitHub: @eltociear X: @eltociear 2024/4/16 【4/16(火)19:00~】春のクリエイター大交流会
Slide 2
Slide 2 text
Ikko Ashimine / 一功 安次嶺 株式会社I-Tecnology 取締役 #AI #Web3.0 #OSS #ネコ #生物学 #ゲーム #登山 #筋トレ #散歩 #海 #山 #外国料理 #カレー #酒 #投資 GitHub: @eltociear Connpass: @eltociear X: @eltociear YouTube: @eltociear
Slide 3
Slide 3 text
IKKOです
Slide 4
Slide 4 text
My business card
Slide 5
Slide 5 text
参考URL: https://speakerdeck.com/eltociear/toyi-riyukuapurikai-fa
Slide 6
Slide 6 text
「○○までに××作って」 「はい!(まじかよ、、、)」 「○○までに××作って」 「オケマル」 偉い人 私 偉くなった私 かしこなAI(※イメージ)
Slide 7
Slide 7 text
直近のアプリ開発AI
Slide 8
Slide 8 text
SWE-bench(ベンチマーク)で新 たな最先端技術を確立 その値、驚愕の13.86% 世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/introducing-devin
Slide 9
Slide 9 text
世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/post/swe-bench-technical-report
Slide 10
Slide 10 text
SWE-benchって何? 参考URL: https://arxiv.org/abs/2310.06770 GitHub Issueをどれだけ解決 できるか見る評価指標
Slide 11
Slide 11 text
とは言えさ Devinはまだ非公開 (WL申請のみ)
Slide 12
Slide 12 text
直近のアプリ開発AI (OSS)
Slide 13
Slide 13 text
1. OpenDevin https://github.com/OpenDevin/OpenDevin ・2024/3/13 (1ヶ月前) GitHub公開 ・ベンチマークは未測定(準備中と報告) ・GPT-4、Claude 3、Llama等をサポート ・商用利用可能 ・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロント エンドIF
Slide 14
Slide 14 text
2. Devika https://github.com/stitionai/devika ・2024/3/21 (3週間前) GitHub公開 ・ベンチマークは未測定 ・Claude 3、GPT-4、GPT-3.5、そしてOllama 経由のローカルLLMをサポート ・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
Slide 15
Slide 15 text
2. Devika 参考URL: https://github.com/stitionai/devika?tab=readme-ov-file#demos
Slide 16
Slide 16 text
3. SWE-agent https://github.com/princeton-nlp/SWE-agent ・2024/4/2 (2週間前) GitHub公開 ・ベンチマークが12.29%でDevinに肉薄 ・G itHubリポジトリのバグやissueを修正するエ ンジニアリングエージェントに変更 ・GPT-4、Claude3、ローカル推論のOllama等 をサポート ・プルリクエストを自動作成
Slide 17
Slide 17 text
3. SWE-agent 参考URL: https://github.com/princeton-nlp/SWE-agent
Slide 18
Slide 18 text
4. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 (1週間前) GitHub公開 ・ベンチマークで約15.95% ・実際にDjango(PythonのFW)のIssueを解決 した実績あり ・テストケースがある場合、それを読み込むこと でさらに高精度に修正可能
Slide 19
Slide 19 text
参考URL: https://github.com/nus-apr/auto-code-rover 4. AutoCodeRover
Slide 20
Slide 20 text
まとめ 現状、解決率は十数% かなりの速さで人間に追いつきつ つある
Slide 21
Slide 21 text
Thank you for your attention🐈