Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI との良い付き合い方を僕らは誰も知らない (WSS 2026 静岡版)

AI との良い付き合い方を僕らは誰も知らない (WSS 2026 静岡版)

ウィンターワークショップ 2026・イン・静岡での発表資料です
https://wws.sigse.jp/2026/

Avatar for Asei Sugiyama

Asei Sugiyama

January 09, 2026
Tweet

More Decks by Asei Sugiyama

Other Decks in Technology

Transcript

  1. 自己紹介 杉山 阿聖 (@K_Ryuichirou) Software Engineer @ Citadel AI Google

    Developer Expert @ Cloud, AI MLSE GenAIOps WG 機械学習図鑑 共著 事例でわかる MLOps 共著
  2. 目次 1. 生成 AI を活用する技術 <- 2. AI 活用の現在地と期待 3.

    直面する「生産性のパラドックス」 4. 「良い付き合い方」を見つけるために 5. まとめ
  3. AI Agent がビジネスに Algomatic: アポドリ、リクルタAI などエージェントを利用したサー ビスを次々展開 LayerX: バクラクシリーズに加え、 生成AIプラットフォーム

    Ai Workforce を展開 複数 AI エージェント同時立ち上げで「打席数」を重視——DMM が用意した20億円でスター トアップスタジオ展開する Algomatic #取材会 - BRIDGE(ブリッジ) https://thebridge.jp/2025/06/algomatic-launches-startup-studio-with-¥2-billion- investment-from-dmm LayerX、総額150億円の資金を調達。エンジニアを中心とした人材採用強化やさらなる事業 拡大へ https://aismiley.co.jp/ai_news/layerx-ai-saas-fintech/
  4. Demo hell デモまでは行き着くもの の、本番化が著しく困難 品質を評価し、担保する ことが極めて困難 Escaping AI Demo Hell:

    Why Eval-Driven Development Is Your Path To Production https://www.forbes.com/councils/forbestechcouncil/2025/04/04/escaping- ai-demo-hell-why-eval-driven-development-is-your-path-to-production/
  5. 評価に基づく LLMOps 最近の潮流 不確実性の高い分野に対 する開発のノウハウ集 MLOps というよりは「高 速 DevOps」 How

    to Solve the #1 Blocker for Getting AI Agents in Production | LangChain Interrupt https://interrupt.langchain.com/videos/building-reliable-agents- agent-evaluations
  6. 実践 AI セーフティ リスクマネジメントの手法を応用 1. ユースケースを列挙 2. ユースケースごとにリスクを分析 3. ユースケースごとに対応

    (回避・低減・移転・受容) を決定 4. 安全だと判断できるユースケースに限ってサービスを提供 5. サービスの利用状況をモニタリング
  7. 目次 1. 生成 AI を活用する技術 2. AI 活用の現在地と期待 <- 3.

    直面する「生産性のパラドックス」 4. 「良い付き合い方」を見つけるために 5. まとめ
  8. 日本でも大企業を中心に活用が進 んでいる 企業規模による格差: 1,001人以上 は96.1%が取組、100人以下は 46.8% 生成AI導入の加速: 大企業の75%以 上が導入・試験利用、本導入へ移 行中

    国際的なリード: 大企業の導入済割 合は日米独の比較で日本が最高 DX動向2025 https://www.ipa.go.jp/digital/chousa/dx-trend/dx-trend-2025.html
  9. AI に対する期待は高い 巨大な経済インパクト: 2035年ま での累積GDPを約140兆円押し上 げる予測 人手不足の解消: 労働時間を約17% 削減し、850万人規模の労働不足 をカバー

    生産性改善の加速: 効率化と高付加 価値化により、年平均1.3%の生産 性向上 みずほリサーチ&テクノロジーズ https://www.mizuho- rt.co.jp/publication/2025/pdf/report250129.pdf
  10. AI の効果 調査によって異なるが 1.2 - 1.6倍 程度 飛び杼のもたらした効果にはまっ たく及んでいない RIETI

    - 日本企業・労働者のAI利用と生産性 https://www.rieti.go.jp/jp/publications/summary/24030022.html
  11. DORA の調査結果 AI の導入が 25% 増加すると 個人としては早くなり、 組織としては遅くなる コードレビューの速度は 3.1%

    増加 承認の速度は 1.3% 増加 リリース速度は 1.5% 低下 安定性は 7.2% 低下 DORA | Impact of Generative AI in Software Development https://dora.dev/research/ai/gen-ai-report/ (fig.2, fig.3)
  12. Algorithmic vs. Holistic Evaluation 2つの大規模なOSSリポジ トリから18個の実際の issue を抽出 Claude 3.7

    Sonnet を使用 38% が自動テストをパス レビュー結果、マージで きるものはなかった Research Update: Algorithmic vs. Holistic Evaluation - METR https://metr.org/blog/2025-08-12-research-update-towards-reconciling- slowdown-with-time-horizons/
  13. Writing Code Was Never The Bottleneck 「人間が頭を使う作業」がボトル ネックになりがち コードレビュー 知識の伝達

    テストとデバッグ 調整とコミュニケーション Writing Code Was Never The Bottleneck - ordep.dev https://ordep.dev/posts/writing-code-was-never-the-bottleneck
  14. 問題解決手法 PDCA サイクルを回すため のフレームワーク データの収集と KPI の設 定を行い、対策前後での 比較で効果測定を行う データサイエンスのフレ

    ームワークに等価 第5回:新作研修「問題解決研修 基礎編 ~8ステップと考え方~」は「風土 改革」 ・ 「人財育成」に直結する! | 社員・企業研修のトヨタエンタプライズ https://kensyu.toyota-ep.co.jp/column/4880/
  15. まとめ AI エージェントを活用するために、開発と評価を繰り返すループは DevOps の原則の応用とみなせる AI活用の普及と期待: 全世代でAI活用が進み、140兆円という試算が 示すように社会からの期待も極めて大きい 二極化とパラドックス: 成果を出せる企業とそうでない企業の格差

    が広がり、個人の効率化が組織の成果に直結しない現状がある 未知へのアプローチ: 誰も正解を持たない今、普遍的なエンジニア リングの学習とコミュニティでの対話を通じて、最適解を探求し続 ける姿勢こそが必要である