Slide 1

Slide 1 text

󰰁→🤖と移りゆく アプリ開発 - 1.5 Ikko Eltociear Ashimine GitHub: @eltociear X: @eltociear 2024/4/16 【4/16(火)19:00~】春のクリエイター大交流会

Slide 2

Slide 2 text

Ikko Ashimine / 一功 安次嶺 株式会社I-Tecnology 取締役 #AI #Web3.0 #OSS #ネコ #生物学 #ゲーム #登山 #筋トレ #散歩  #海 #山 #外国料理 #カレー #酒 #投資 GitHub: @eltociear Connpass: @eltociear X: @eltociear YouTube: @eltociear

Slide 3

Slide 3 text

IKKOです


Slide 4

Slide 4 text

My business card

Slide 5

Slide 5 text

参考URL: https://speakerdeck.com/eltociear/toyi-riyukuapurikai-fa

Slide 6

Slide 6 text

「○○までに××作って」 「はい!(まじかよ、、、)」 「○○までに××作って」 「オケマル」 偉い人 私 偉くなった私 かしこなAI(※イメージ)

Slide 7

Slide 7 text

直近のアプリ開発AI

Slide 8

Slide 8 text

SWE-bench(ベンチマーク)で新 たな最先端技術を確立 その値、驚愕の13.86% 世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/introducing-devin

Slide 9

Slide 9 text

世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/post/swe-bench-technical-report

Slide 10

Slide 10 text

SWE-benchって何? 参考URL: https://arxiv.org/abs/2310.06770 GitHub Issueをどれだけ解決 できるか見る評価指標

Slide 11

Slide 11 text

とは言えさ Devinはまだ非公開 (WL申請のみ)

Slide 12

Slide 12 text

直近のアプリ開発AI (OSS)

Slide 13

Slide 13 text

1. OpenDevin https://github.com/OpenDevin/OpenDevin ・2024/3/13 (1ヶ月前) GitHub公開 ・ベンチマークは未測定(準備中と報告) ・GPT-4、Claude 3、Llama等をサポート ・商用利用可能 ・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロント エンドIF

Slide 14

Slide 14 text

2. Devika https://github.com/stitionai/devika ・2024/3/21 (3週間前) GitHub公開 ・ベンチマークは未測定 ・Claude 3、GPT-4、GPT-3.5、そしてOllama 経由のローカルLLMをサポート ・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理

Slide 15

Slide 15 text

2. Devika 参考URL: https://github.com/stitionai/devika?tab=readme-ov-file#demos

Slide 16

Slide 16 text

3. SWE-agent https://github.com/princeton-nlp/SWE-agent ・2024/4/2 (2週間前) GitHub公開 ・ベンチマークが12.29%でDevinに肉薄 ・G itHubリポジトリのバグやissueを修正するエ ンジニアリングエージェントに変更 ・GPT-4、Claude3、ローカル推論のOllama等 をサポート ・プルリクエストを自動作成

Slide 17

Slide 17 text

3. SWE-agent 参考URL: https://github.com/princeton-nlp/SWE-agent

Slide 18

Slide 18 text

4. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 (1週間前) GitHub公開 ・ベンチマークで約15.95% ・実際にDjango(PythonのFW)のIssueを解決 した実績あり ・テストケースがある場合、それを読み込むこと でさらに高精度に修正可能

Slide 19

Slide 19 text

参考URL: https://github.com/nus-apr/auto-code-rover 4. AutoCodeRover

Slide 20

Slide 20 text

まとめ 現状、解決率は十数% かなりの速さで人間に追いつきつ つある

Slide 21

Slide 21 text

Thank you for your attention🐈