Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Vibe Coding 天下一武道会!! どのAIツールが最強か
Search
Taiga Mikami
July 23, 2025
760
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Vibe Coding 天下一武道会!! どのAIツールが最強か
Taiga Mikami
July 23, 2025
More Decks by Taiga Mikami
See All by Taiga Mikami
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
270
「とりあえず作る」がすべてを加速させる
taigamikami
4
2.6k
ts-patternで型安全なパターンマッチングを!!
taigamikami
2
2.2k
How2ImproveFrontendPerformance
taigamikami
0
920
How2WinHackathon
taigamikami
0
120
mixleap_ハッカソンLT.pdf
taigamikami
0
1.2k
ShowTime_Hack_U.pdf
taigamikami
0
590
高専キャリア #2 俺の進捗
taigamikami
0
380
Featured
See All Featured
Discover your Explorer Soul
emna__ayadi
2
1.1k
Exploring anti-patterns in Rails
aemeredith
3
410
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
430
Art, The Web, and Tiny UX
lynnandtonic
304
22k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
160
How to make the Groovebox
asonas
2
2.2k
How to build a perfect <img>
jonoalderson
1
5.6k
Paper Plane
katiecoart
PRO
1
51k
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
Typedesign – Prime Four
hannesfritz
42
3.1k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
210
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
Transcript
Vibe Coding 天下⼀武道会!! どのAIツールが最強か★ バクラク事業部 プロダクト開発部 バクラク勤怠 tiger DAY01 topic
ツールの選択 Speaker
2 © LayerX Inc. ⾃⼰紹介 ★ tiger (@ta1m1kam) ★ バクラク勤怠SWE
★ 戦闘⺠族 ★ 戦闘⼒ 7くらい(農夫が5) Read Me
3 © LayerX Inc. ★ Vibe Coding とは Vibe:「雰囲気」、「ノリ」 AIに
“ノリ” で指⽰して開発を進めるコーディング⽅法 つまり 雰囲気プログラミング だ!! What is Vibe Coding 天下⼀武道会 ★ Vibe Coding 天下⼀武道会とは!? ドラゴンボールのアレ 最も強い Vibe Codingツールを決めること
参加選⼿発表!
5 © LayerX Inc. 参加選⼿紹介! 選⼿⼊場 Cursor (Auto-Run mode) GitHub
Copilot (autoApprove) Cline Roo Code Claude Code ⾃律型IDE拡張 ⾃律型CLI Windsurf IDE統合型 augment code
6 © LayerX Inc. 課題:マークダウンエディターを作れ! ⼤会レギュレーション 機能要件 ★ エディター機能 ★
リアルタイムプレビュー ★ キーワード検索 ★ ⾃動保存機能 ★ タグのフィルター ★ ダークモード ★ Frontend: Next.js ★ Backend: Express ★ 公平な戦いのために... ★ モデル:Claude sonnet 4で統⼀ ★ 同じプロンプトを⽤いた1プロンプト実⾏ ★ 初期状態(コンテキスト等の情報はなし) 「app.mdの仕様に基づいて、マークダウンノートアプリケーションを作成してください」 実⾏プロンプト システム要件
7 © LayerX Inc. レギュレーション
8 © LayerX Inc. 評価 勝敗の決め⽅ 実装時間 (5点) 8分内の実装を5点とする playwright-mcpを⽤いた
ベンチマークプロンプト実⾏ (100点) 私の独断と偏⾒による 定性評価 (5点) 計110点満点
結果発表〜! ※ 特定のレギュレーション内の結果なので今回はそうだったというN1事例結果です 全てのツールは素晴らしいです
10 © LayerX Inc. 第7位 Cursor 結果 ビルドエラーのため 機能テストがすべて実施できず... 基本機能テスト
0/25 レスポンシブデザイン 0/15 パフォーマンス 5/20 エラーハンドリング 0/10 アクセシビリティ 0/10 セキュリティ 0/10 ユーザビリティ 0/10 合計点 5/100 総合点:8点 ★ ベンチマークテスト 0点 動かないので評価できず ★ 定性評価 3点 (12分42秒) ★ 実装時間 1プロンプトだと⼒が発揮できなかった感
11 © LayerX Inc. 第6位 Claude Code 結果 総合点:77点 ★
ベンチマークテスト 2点 (分割型) ★ 定性評価 3点 (13分38秒) ★ 実装時間 基本機能テスト 18/25 レスポンシブデザイン 13/15 パフォーマンス 14/20 エラーハンドリング 5/10 アクセシビリティ 7/10 セキュリティ 6/10 ユーザビリティ 9/10 総合点 72/100 完成度は⾼いが、 裏でNext.jsのコンソールエラーが残る... タグのフィルター機能が未実装‧ユーザーFBが弱い
12 © LayerX Inc. 第5位 Github Copilot 結果 総合点:90点 ★
ベンチマークテスト 4点 (⼀体型) ★ 定性評価 4点 (11分22秒) ★ 実装時間 基本的な機能はすべてクリア! コードブロックが プレビューでも 反映されず改善の余地あり! ノート⼀覧とプレビューが同じ画⾯にあるので体験が良い(⼀体型) 基本機能テスト 21/25 レスポンシブデザイン 13/15 パフォーマンス 16/20 エラーハンドリング 8/10 アクセシビリティ 8/10 セキュリティ 8/10 ユーザビリティ 8/10 総合点 82/100
13 © LayerX Inc. 第4位 Roo Code 結果 総合点:91点 ★
ベンチマークテスト 5点 (⼀体型) ★ 定性評価 1点 (35分19秒) ★ 実装時間 基本機能テスト 23/25 レスポンシブデザイン 14/15 パフォーマンス 16/20 エラーハンドリング 8/10 アクセシビリティ 8/10 セキュリティ 8/10 ユーザビリティ 8/10 総合点 85/100 基本的な機能はすべてクリア! 空⽂字タイトルなどのバリデーション未実装、変なタイミングでのリレン ダリングのため減点 ノート⼀覧とプレビューが同じ画⾯にあるので体験が良い(⼀体型)
14 © LayerX Inc. 第3位 Cline 結果 総合点:93点 ★ ベンチマークテスト
3点 (分割型) ★ 定性評価 3点 (14分03秒) ★ 実装時間 基本機能テスト 23/25 レスポンシブデザイン 14/15 パフォーマンス 17/20 エラーハンドリング 8/10 アクセシビリティ 8/10 セキュリティ 8/10 ユーザビリティ 10/10 総合点 88/100 基本的な機能はすべてクリア! アラートやローディングなどユーザーへのフィードバックが考慮され ており⾼得点に! タグフィルターのUIは良いが機能が動かず...
15 © LayerX Inc. 第2位 Windsurf 結果 総合点:96点 ★ ベンチマークテスト
2点 (分割型) ★ 定性評価 4点 (9分44秒) ★ 実装時間 基本機能テスト 24/25 レスポンシブデザイン 15/15 パフォーマンス 19/20 エラーハンドリング 9/10 アクセシビリティ 8/10 セキュリティ 7/10 ユーザビリティ 8/10 総合点 90/100 基本的な機能はすべてクリア! アラートやローディングなどユーザーへのフィードバックが考慮され ており⾼得点に! どうやって⼀覧に戻れば良いかわからず定性評価は低め
16 © LayerX Inc. 第1位 augument code 結果 総合点:97点 ★
ベンチマークテスト 4点 (分割型) ★ 定性評価 2点 (21分00秒) ★ 実装時間 基本機能テスト 25/25 レスポンシブデザイン 14/15 パフォーマンス 19/20 エラーハンドリング 9/10 アクセシビリティ 8/10 セキュリティ 8/10 ユーザビリティ 9/10 総合点 91/100 何も変更がない場合はSaveボタンがdisabledになり体験が良い マルチタグ検索に対応している Confirmなどのユーザーフィードバックが適切 しかし、ダークモードが視覚的には動作しておらず改善余地あり
17 © LayerX Inc. 結果 🥇 🥈 🥉 4位 5位
6位 7位 augment code Windsurf Cline Roo Code GitHub Copilot Claude Code Cursor ほぼ全てのツールで使⽤できるアプリが実装できる ⾃律型IDE拡張プラグイン系が強かった(4位以上はほぼ同点数) 上位層は全てブラウザテストを実施していたため精度が⾼くなる傾向 (Windsurfも独⾃ブラウザ機能があるため⾃律的にテストを実施していた) Clineのブラウザテスト例