Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIのバカさ加減に怒る前にやっておくこと
Search
k2moons
October 29, 2025
Programming
0
210
AIのバカさ加減に怒る前にやっておくこと
存在しないAPIを捏造したり、実装を忘れたりする生成AIにモヤモヤする日々、指示を明確に出し、読むべき文書を体系化し、履歴を記録・共有することで、生成AIとの改善を目指す
k2moons
October 29, 2025
Tweet
Share
More Decks by k2moons
See All by k2moons
AI開発の精度を決める「4つの入力」
blueeventhorizon
0
83
Other Decks in Programming
See All in Programming
モジュラモノリスにおける境界をGoのinternalパッケージで守る
magavel
0
3.5k
受け入れテスト駆動開発(ATDD)×AI駆動開発 AI時代のATDDの取り組み方を考える
kztakasaki
2
550
今更考える「単一責任原則」 / Thinking about the Single Responsibility Principle
tooppoo
3
1.6k
grapheme_strrev関数が採択されました(あと雑感)
youkidearitai
PRO
1
210
new(1.26) ← これすき / kamakura.go #8
utgwkk
0
1.9k
Claude Code、ちょっとした工夫で開発体験が変わる
tigertora7571
0
200
CSC307 Lecture 13
javiergs
PRO
0
310
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
460
AI時代のソフトウェア開発でも「人が仕様を書く」から始めよう-医療IT現場での実践とこれから
koukimiura
0
140
TipKitTips
ktcryomm
0
160
nilとは何か 〜interfaceの構造とnil!=nilから理解する〜
kuro_kurorrr
3
1.8k
オブザーバビリティ駆動開発って実際どうなの?
yohfee
3
780
Featured
See All Featured
Claude Code のすすめ
schroneko
67
220k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.7k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
130
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Marketing to machines
jonoalderson
1
5k
Music & Morning Musume
bryan
47
7.1k
Designing for Timeless Needs
cassininazir
0
150
Paper Plane
katiecoart
PRO
0
47k
HDC tutorial
michielstock
1
520
Color Theory Basics | Prateek | Gurzu
gurzu
0
240
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.8k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
340
Transcript
AI のバカさ加減に怒る前に、 やっておくこと とらさん(k2moons ) AI を“ 相棒” にするための勉強会 2025/10/29
自己紹介 名前:とらさん(k2moons ) 所属: 株式会社ゆめみ 仕事:iOS エンジニア X : k2_moons
Github : BlueEventHorizon 好きな生成AI : Claude Code
バカさ加減に怒った事例
存在しないAPI を捏造して認めない Gemini 「XXXX(...) というメソッドがあります」と回答 公式ドキュメントに存在しない 「 無いからちゃんと読め 」 →「
公式ドキュメントにあります 」 → 「 無いからちゃんと読め 」の 無限ループ に陥る
やったこと Ctl+C
呼び出す関数を、推測で決め打ちして実装 Claude Code 「fetchAllResults(sortedBy: .date) 」という架空の便利関数を呼び 出す 実際は getAll() と
sort() を組み合わせる必要があった
やったこと ビルドエラーを指摘して、 「ちゃんとコードを読んだのか」と説教 「コードを読んでいませんでした」と謝罪したのでモヤモヤしなが ら許す
やったことを忘れる問題 実装済みのクラスや関数を忘れて、もう一回同じやつを実装 設計書に書いてあるルールを守らない 余計な機能や実装を入れてくる
やったこと レビューで指示を出しまくる 疲れる
Gemini は論外 今は進化してちゃんとしてます!(たぶん) なるべく楽したいと思っている 言われないと文書を読まない もの忘れが激しい
どうする?
毎回やるべきことを提示し直す? 文書をきっちり指定する? やったことを記録する?
毎回やるべきことを提示し直す? 文書をきっちり指定する? まず文書体系を考える やったことを記録する?
> Project ├─ docs/ … プロジェクト横断の開発基盤 │ ├─ rules/ …
開発ルール │ │ ├─ project_rule.md … AIの役割 │ │ ├─ common/ … アーキテクチャ │ │ ├─ layers/ … レイヤー毎の実装ルールなど │ ├─ workflow/ … 作業手順 │ │ ├─ plan/ … 要件抽出→設計→計画作成 │ │ ├─ dev/ … タスク制御とAgent実装手順 │ │ └─ refactoring/ … リファクタリング │ └─ format/ … 要件/設計/計画/ヘッダーのテンプレート │ └─ project_docs/ … プロジェクト固有の知識・計画 ├─ spec/ … 要件定義カタログ │ ├─ architecture/ … アーキテクチャ │ ├─ business_logic/ … ビジネスロジック仕様 │ ├─ functions/ … 機能横断要件 │ ├─ screens/ … 画面仕様 │ ├─ ui_components/ … 再利用UI要件 │ └─ non_functional/ … 非機能要件 ├─ design/ … 設計書 ├─ plan/ │ └─ main_plan.md … 計画書 └─ history/ … 会話記録
None
特徴 iOS 開発汎用の文書と、アプリ固有の文書に分かれている ルールとワークフロー 要件定義、設計書、計画書をリンク 課題 非常に数が多い
毎回やるべきことを提示し直す? 指示を出す 文書をきっちり指定する? やったことを記録する?
Claud Code の場合 Sub Agents を使うと便利です。
便利だけど大変です。 親の Claude Code から Context を渡せるので 親の Calude Code
向けのワークフローを用意する 受け取った Sub Agent のワークフローを用意する Sub Agent 毎に必読文書リストを定義
書き方 絶対に読んでもらわないといけない文書は、 [CRITICAL] 下記の文書を全て読み込み、深く理解すること - `docs/workflow/dev/task_execution_workflow.md`
課題 文書が増えてくるとメンテナンスできない
毎回やるべきことを提示し直す? 文書をきっちり指定する? やったことを記録する? 記録する
検討してきた内容、対話した内容を記録する # 検討してきた内容、対話した内容を簡潔に履歴にまとめる ## CONVERSATION_HISTORY 今まで検討してきた内容、対話した内容を簡潔に履歴にまとめてください。 ファイルは、`project/history/CONVERSATION_HISTORY.md` です。 存在する場合は、追記して下さい。 存在しない場合は作成して記入
してください。 ## LATEST_CONVERSATION_HISTORY `project/history/CONVERSATION_HISTORY.md` の中から、新しい生成AIに必ず知って貰いたい開発の経緯を、 `project/history/LATEST_CONVERSATION_HISTORY.md` として 2000文字以内でピックアップして記録してください。 存在する場合は、削除して構いません。編集してもOKです。
今まで検討してきた内容、対話した重要内容を読み込 む # 今まで検討してきた内容、対話した重要内容を読み込む `project/history/LATEST_CONVERSATION_HISTORY.md` を読んで、深く理解してください。 不明点は、`project/history/CONVERSATION_HISTORY.md` を読むと分かるかもしれません。
文書をきっちり指定する? PageIndex https://github.com/VectifyAI/PageIndex に触発される
RAG (Retrieval-Augmented Generation ) は、文書検索で「意味的 な類似性」に依存。しかし、類似性は必ずしも関連性を意味しない。 専門的で長文の文書を扱う場合、単なる類似検索では、重要な情報を 取り出すことが難しい。 推論型RAG システムを提案。PageIndex
は、人間の専門家が長文ドキ ュメントを読む際の「探索と推論」の過程を模倣し、ツリー探索を通 じて最も関連性の高い部分を特定する。 1. ドキュメント全体から「目次(Table of Contents ) 」に相当するツ リー構造のインデックスを生成する。 2. そのツリー構造上で 推論に基づく探索(ツリーサーチ)を行い 、 最も関連性の高い箇所を取得する。
# 開発文書検索インデックス --- name: 開発文書検索インデックス description: AI活用iOS開発における、要件定義から実装までの全工程で参照すべき ルール・ワークフロー・フォーマット文書を体系的に整理した検索インデックス。 Clean Architecture、Actor並行性、Protocol-based
DIに基づく開発指針を提供。 --- ## このTOCの使い方 1. **Quick Reference**: 最重要文書を特定(常に参照すべき文書、実装時に参照する文書) 2. **カテゴリ別概要**: 開発工程ごとの文書分類(rules/workflow/format) 3. **キーワードインデックス**: 具体的な実装内容を検索(Service実装、Entity定義、データフロー等) 4. **ディレクトリ別詳細目次**: 全文書の要約と主要トピック 5. **文書間の関係性マップ**: 要件定義→設計→計画→実装の流れ 6. **タグ別インデックス**: 実装層別検索(#Domain, #UI, #Infrastructure, #Architecture等)
Claud Code の場合 Skills を使うと便利です。
コードは、どう読ませる?問題
Serene https://github.com/oraios/serena
Swift-Selena 自作しました https://github.com/BlueEventHorizon/Swift-Selena
まとめ 何を読ませる どう読ませる まだまだ試行錯誤してます