Upgrade to Pro — share decks privately, control downloads, hide ads and more …

生成AIの「現在地」だけでなく「速度」も見よう

 生成AIの「現在地」だけでなく「速度」も見よう

🎯 概要
GEEKLAB.NAGANO での25分間の技術発表資料。生成AIの評価において「今できること・できないこと」という現在地だけでなく、「変化の速度」と「加速度」に注目することの重要性を解説。
💻 主なトピック

コーディングエージェントの実例: Claude Codeを例に、この半年で起きた劇的な変化とその要因
他分野での証拠: 画像・動画生成、AI知能(IQ推移:GPT-3.5の64→o3の135)での限界突破パターン
未来予測: 「微分思考」による半年後のコーディング現場予測
実体験: 発表者自身のAI活用変遷(2023年→2025年)による説得力

🚀 キーメッセージ
現在の「限界」ではなく、半年後・1年後の「限界」を予想して考えよう。「今の不可能」は半年後の「基本スキル」になる。

Avatar for SATOH Kiyoshi

SATOH Kiyoshi

July 19, 2025
Tweet

More Decks by SATOH Kiyoshi

Other Decks in Programming

Transcript

  1. 自己紹介 さとう きよし 白馬村在住でジーワークスという小さな会社をやってます 1990 年代前半: ネオコグニトロンで文字認識をする研究室で眼球運動を測定していた 2022 年から1 年半くらい:

    VR メタバース内での音声変換(VC) とニューラル圧縮 ここ1 年半くらい: LLM を利用した社内システムやPJ マネジメントツールの研究開発 以前は迷惑メール対策とかよくやってました
  2. 本日の流れ 25 分で駆け抜ける生成AI 速度論 時間 内容 2 分 今日話したいこと -

    「速度」と「加速度」に注目 6 分 コーディングエージェントの実例 - 限界・工夫・変化 6 分 他分野での証拠 - 画像生成・AI 知能の進化 4 分 未来予測と提案 - 半年後の現場・心構え 2 分 おまけ - 実体験で説得力アップ
  3. Claude Code で工夫が必要なこと 限界を乗り越えるための実践的アプローチ 設計書をLLM と一緒に作成 Claude Code の質問モードやo3 等と会話で技術選定・構成決め

    詳細設計まで含めたドキュメントを事前作成 自走するための環境を作る devcontainer 内で安全実行、許可リスト整備でセキュリティ確保 MCP でplaywright 使用、TDD でバグ即発見環境 規模が大きくなっても対応できる環境 詳細ログ取得、設計書修正もLLM 自身に任せる
  4. 閾値突破を支えた要因 1. LLM の性能向上(根本原因) コーディング力・コンテキスト長の量的変化が閾値突破 何かブレークスルーがあったわけではなく、量的変化の蓄積 2. MAX プラン導入(心理的・経済的転換) 「使い放題→

    使わないと損」 の意識変化 「失敗してもタダ→ 大胆実験」 でリスクテイクが可能に 「コスト意識→ 成果最大化」 への価値観シフト 技術向上を活かすための環境整備が完了 技術的可能性と心理的障壁の除去が同時発生
  5. 他分野での「限界突破」実例 画像・動画生成の連続進化 2017 年GAN 時代 「全身描けるようになったら言ってね〜w 」と言われていた 2022 年MidJourney 、Stable

    Diffusion 登場 手が描けない、画質がイマイチ、同じキャラを描けない → 現在は解決済み 1 年前の動画生成の進化 研究者しか触れない状況だった → 普通の人が動画生成できる時代 一貫性の問題などあり実用には厳しい → 急速に改善
  6. AI 知能の進化スピード 30 年間の加速度 1990 年 : ネオコグニトロン → 数字認識

    2012 年 : AlexNet → 犬と猫認識 2017 年 : Transformer → ニューラル翻訳 2019 年 : GPT-2 → 園児程度 2022 年 GPT-3.5 : IQ 70 以下(人間以下) 2024 年末 o3 : IQ 130 (天才レベル) 全分野で同じ速度感で進化
  7. だから、コーディングエージェントも 同じパターンで限界突破される 画像生成: 「手が描けない」→ 普通の言葉で高品質生成 動画生成: 「触れない」→ 普通の人が動画制作 GPT: 園児レベル

    → 天才レベル ↓ コーディングエージェント: 現在の限界 → ? 根拠となる共通要素 deeplearning 系は同じ速度感で進化 技術課題はほぼクリア済み(インフラ整備段階) 心理的・経済的障壁も除去済み
  8. 進化パターン: 閾値突破 → 横展開 満足レベル到達後の展開法則 画像生成 → 動画生成 ボイスチェンジ →

    リアルタイムボイスチェンジ コーディング → プロジェクトマネジメント・設計 現在進行中の兆候 Teams 、リモート会議情報の統合進展 PM 補助ツール、秘書システム化 「十分なコンテキスト情報があれば、全ての仕事をLLM に」 プログラマの仕事はどう変わる? 条件整備 → 要求定義 → アーキテクチャ設計 → ?
  9. おまけ:実体験で見る「速度感」 この発表自体が「速度と加速度」の証拠 今回のプレゼン資料 - 全部Claude と相談で完成 https://claude.ai/share/8fa8a635-6b2d-4430-9e5a-b09bed13b693 https://claude.ai/share/f698829c-81da-4952-8319-7462b828ff8e 1 年半前(2023

    年) - 「イマイチ書けない」でタイトル決め程度 音声変換と生成AI :開発者視点からの1.5 年の振り返り 1 年前(2024 年) - 「ロングコンテキスト使えない」と発表 RAG の仕組みとよくある課題 現在(2025 年) - ロングコンテキストが「中期記憶」レベル 発表者自身が体験した「半年で世界が変わる」リアル