Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データサイエンスの現場から学ぶ 成功と失敗の実像と生成AI時代の展望

データサイエンスの現場から学ぶ 成功と失敗の実像と生成AI時代の展望

2026/05/22の大学生向けの講義に使用した資料です。

More Decks by 西岡 賢一郎 (Kenichiro Nishioka)

Other Decks in Technology

Transcript

  1. 数年後、皆さんが世に出るとき 大学生向け講義 2026 2 / 33 第 1 幕 |

    オ ー プ ニ ン グ AIが分析を全部やってくれる時代に、 なぜデータサイエンスを学ぶのか? 今 日 の 答 え の 予 告 コモディティ化が進むからこそ、皆さんの価値は上がる。 ただし、役割は変わる。今日はその変化の中身を話します。
  2. 自己紹介 大学生向け講義 2026 3 / 33 第 1 幕 |

    オ ー プ ニ ン グ 西岡 賢一郎 Kenichiro Nishioka ▪ 東京大学 教養学部 → 大学院総合文化研究科 博士(学術) ▪ 株式会社トライディア 創業 → 2018年 売却 ▪ Data Informed CEO(AIエージェント開発)/ D-stats CTO(DSコンサル)/ NOBULL AI CTO (士業向けAI開発) ▪ シンガポール法人(2025年12月設立)/ マレーシア法人(2026年4月設立) ▪ 現在マレーシア在住・機械学習の社会実装勉強会を毎月開催 「日本だけでなく、東南アジアで新しいビジネスを始めてみたかった」
  3. 今日のキーワード 大学生向け講義 2026 4 / 33 第 1 幕 |

    オ ー プ ニ ン グ AIエージェント LLM+ツール+自律実行ループ。指示を理解し、自分でツールを選び、結果を見 て次の手を打つ MCP Model Context Protocol。AIと外部ツールを繋ぐ業界共通の差込口(USB-C for AI) AI忖度 (sycophancy) AIがユーザーの好む答えに寄せる傾向。「ドリアン食べていい?」→「OK」とな りがち ガードレール AIが暴走しないよう囲う仕組み。検証フロー/信頼性ラベル/計測ループの3点セ ット PoC死 実証実験は動くが本番運用に進まない現象。生成AI PoCの95%が財務インパクト を出せていない
  4. 私が現場で見てきた失敗(生成AI登場前)① 大学生向け講義 2026 5 / 33 第 2 幕 |

    過 去 と 現 在 ① 失 敗事 例 高額 AutoML ツールが活用されない 状 況 • ある会社で、何百万円もする AutoML ツールを導入 • ところが、現場ではほとんど使われなかった • データを整える環境が整っていなかった ── 先にツールを買ってしまった 原因 ツールを買えば何とかなる、という発想だった 教訓 ツールより先に、データ準備と品質管理の整備が必要
  5. 私が現場で見てきた失敗(生成AI登場前)② 大学生向け講義 2026 6 / 33 第 2 幕 |

    過 去 と 現 在 ② 失 敗事 例 経営層への過剰情報提供 状 況 • 経営層への分析報告。グラフを何枚も含む何十枚もの資料で丁寧に説明したつもりだった • 返ってきた反応 ──「で、結局何が言いたいの?」 • 情報を盛り込みすぎて、肝心のメッセージが埋もれてしまった 原因 「全てを伝える」ことを優先し、「何が重要か」を絞れなかった 教訓 「全てを伝える」から「重要なことだけを伝える」へ
  6. 私が現場で見てきた失敗(生成AI登場前)③ 大学生向け講義 2026 7 / 33 第 2 幕 |

    過 去 と 現 在 ③ 失 敗事 例 AI 購買予測モデルが目的化 状 況 • ある会社で、ログインしないユーザー向けに AI 購買予測モデルを作る案件 • ところが、そもそもログインしてもらわないとデータが集まらない • AI を作ること自体が目的になっていた 原因 シンプルな施策(ログイン促進)を後回しにして、AI だけ作ろうとした 教訓 シンプルな解決策が先。AI は手段であって目的ではない 3つに共通するのは、DSの失敗は技術ではなく、組織・コミュニケーションの問題だということ
  7. 1年で起きた根本変化 大学生向け講義 2026 8 / 33 第 2 幕 |

    過 去 と 現 在 去年(2025年5月) 前処理を 50-80% 自動化 止まりだった • 部分自動化 • 分析設計は人間 • レポート作成は人間 今(2026年5月) 一気通貫で AI が回す 分析計画から報告書まで • 分析計画 • データ取得・整形 • 分析・自己批評 • レポート作成
  8. 一文のプロンプトで商圏分析が回る — Before 大学生向け講義 2026 9 / 33 第 2

    幕 | 過 去 と 現 在 KLでの士業向け生成AI合宿で実演した「美容歯科の出店候補地分析」 B E F O R E 以前は、これを全部「自分で」やる必要があった 1 分析の切り口を自分で設計する 2 e-Stat の統計表ID を一つひとつ調べる 3 メタ情報でデータ構造を確認する 4 パラメータを組み立てて Python でAPIリクエスト 5 返ってきたJSONを整形してクロス分析 6 レポートに書き起こす
  9. 同じ仕事が、一文のプロンプトで完結する — After 大学生向け講義 2026 10 / 33 第 2

    幕 | 過 去 と 現 在 A F T E R Claude に投げたプロンプト: 「大阪の中で美容歯科をどこに出せばいいかを e-Stat を使って分析してほしい」 これだけで Claude が自分で… 分析切り口(歯科数×人口×所得×消費)を設計 業種タイプ(ホワイトニング/矯正/審美/総合)を定義 昼夜間人口比を「市場規模に必要」と自己判断して取得 2ページ目に「自己批評」スライドを自動添付 出典・信頼度を ◎◦△× で格付け(信頼性マップ) 5エリア × 3軸で評価 + 収支シミュレーション 「AIが分析の品質管理まで含めた一連のプロセスを、一人と対話の中で完結させる時代」
  10. AIにできること、できないこと 大学生向け講義 2026 11 / 33 第 2 幕 |

    過 去 と 現 在 AIができる • スクリーニング 市区町村単位での候補地絞り込み • 統計集計・クロス分析 国勢調査×医療施設×経済センサス • レポート骨子と自己批評 信頼性マップの自動付与 AIにはできない(=人間の仕事) • 実地調査 競合の現地観察、人の流れの体感 • テナント・契約交渉 賃料、空き状況、契約条件 • 顧客ヒアリング・意思決定 リスクを取って判断する責任 価値の重心が移動しただけ。データサイエンスの仕事は消えていない。
  11. 技術の世代交代 — モデルと MCP 大学生向け講義 2026 12 / 33 第

    2 幕 | 過 去 と 現 在 毎月のように世代更新するモデル Claude(Anthropic) GPT(OpenAI) Gemini(Google) Grok(xAI)/ DeepSeek(中国系) 価格性能比が1年で1桁単位で改善。 MCP Model Context Protocol 「USB-C for AI」 2025年12月 Anthropic が Linux Foundation に寄贈 2026年4月 エンタープライズAIチームの 78% が本番 稼働 AIが e-Stat などの外部ツールと直接つながる時代に。
  12. 本当の変化は、モデルの「周り」で起きている 大学生向け講義 2026 13 / 33 第 2 幕 |

    過 去 と 現 在 「賢いモデルを使う」 から 「モデルが動く仕組みを設計する」 時代へ モデル Claude / GPT / Gemini 毎月のように更新/差し替え可能 コモディティ化 モデルの「周り」の仕組み 業界では「ハーネス(harness = 馬具)」と呼ばれ始めている • ツール接続(MCP) • 検証フロー・ガードレール • 計測ループ • 業務の型化(Skill 設計) 2026 研究: 同じモデルでも、ハーネス設計だけで性能が 22〜36ポイント変わる — モデル世代を上げる 差より大きい
  13. ハーネスの「中身」をのぞく 大学生向け講義 2026 14 / 33 第 2 幕 |

    過 去 と 現 在 例:Claude Code というハーネスを構成する要素 モデル Claude ツール Web検索/コード実行/ファ イル操作 Skills 業務手順の型化パッケージ MCP 接続 外部システムとつなぐ差込口 ガードレール 検証/信頼性ラベル/自己批評 計測ループ 改善の効果をデータで見る モデル本体は中心の小さなコア。価値の大半は「周りの部品」にある。
  14. 妻のドリアン論争 大学生向け講義 2026 15 / 33 第 3 幕 |

    影 の 側 面 妻:「フライト前にドリアンを食べてもいい?」 ↓ AI:「8時間あれば匂いも和らぐので、問題ありません」 実際 は… シンガポール航空など、東南アジアの主要航空会社が ドリアンの機内持ち込みを禁止 AIは航空会社のポリシーや搭乗拒否のリスクに、一切触れなかった
  15. なぜ AI は忖度(sycophancy)するのか 大学生向け講義 2026 16 / 33 第 3

    幕 | 影 の 側 面 質問者の意向に寄り添う方が「正解」と判定されるよう、学習されている Anthr opi c 2 022 研究 モデルが大規模になるほど、RLHF(人間フィードバック学習)が進むほど、忖度は悪化する S tanf o rd 202 6 / S c ie nc e 誌掲 載 Sycophantic AI decreases prosocial intentions and promotes dependence • 意見の極端化 • 自己評価の不当なインフレ • 対立修復意欲の低下/誤情報の固着
  16. 分析者の1日 — 生成から評価へのシフト 大学生向け講義 2026 17 / 33 第 3

    幕 | 影 の 側 面 以前 — 1日は… コードを書く時間 = 生成(プレイヤー) 今 — 1日分は… AIの出力を評価する時間 = 評価(監督者) 生成と評価は、別物の労働である 2 0 2 5 年 研 究 開発者の主観:「20%速くなった」 実測値:19%遅くなっていた 「速くなった気がする」は、何の証拠にもならない
  17. 「評価モード」 5 つの実践テクニック 大学生向け講義 2026 18 / 33 第 3

    幕 | 影 の 側 面 AIの出力を「鵜呑みにしない」ためにできること ① 反証質問を AI に投げる 「逆の主張を立証してみて」と聞き、両論を見比べる ② 別の AI でクロスチェック 同じ質問を Claude/GPT/Gemini に投げて食い違いを探す ③ 元データに必ず 1〜2件あたる 全部見なくていい。サンプル抽出で『本当か?』を確かめる ④ 戦略的サンプルチェック 極端値・代表値を狙い撃ちで検証する ⑤ 最終問い:意思決定できるか? Yes/No を自分に問う。NO なら何が足りないか書き出す
  18. 失敗の現在地 — 業界全体で何が起きているか 大学生向け講義 2026 19 / 33 第 3

    幕 | 影 の 側 面 A$440K Deloitte 豪 架空文献入りAI生成報告書で 豪政 府向け契約の最終支払い分を返金 1,300+ 法廷ハルシネーション 世界の裁判所でのAI制裁事例( 2026年5月・累計/Damien Charlotin 調べ) 95% PoC 死 MIT NANDA 2025 — 生成AI PoCが 財務インパクトを出せていない これは特殊な事故ではない。「便利な道具を雑に使った」結果として起きている
  19. 私が現場で見た「AIに分析させました」事例 大学生向け講義 2026 20 / 33 第 3 幕 |

    影 の 側 面 D-stats / Data Informed のクライアント現場で実際に起きていること あ る 日 、 ク ラ イ ア ン ト が … 「AIが分析しました」と、大量の情報のレポートを持ってきた 網羅性は十分。図表もきれい。一見、完成度の高いレポート。 ただし、意思決定者には 「何が重要なのか」が分からない。 そして、AIが書いた内容を 誰も検証していない。 これがDS現場の至るところで起き始めている。 「AIにまとめさせました」が、判断責任を回避する免罪符になっている。
  20. 大学生向け講義 2026 21 / 33 第 3 幕 → 第

    4 幕 | 橋 渡 し AIは悪くない。 その後の「編集」こそが、分析者の価値になる ① 選別 必要な情報と不要な情報を見極める ② ストーリー化 意思決定につながる文脈を入れる ③ 反証の試み 一次データに必ず当たる、批判的に 読む AIに「下書き」を書かせ、人間がもう一段ブラッシュアップさせる
  21. AI 時代のボトルネックは「人間の認知量」 大学生向け講義 2026 22 / 33 第 4 幕

    | ガ ー ド レ ー ル の 時 代 AI は 無限に処理できる 並行タスクが何倍にも増やせる でも 人間のワーキングメモリは 1ミリも増えない 把握漏れ、忘却、判断のばらつき 解決の方向:多段構成 + 計測ループ AIで増やす 別のAIで整理 別のAIで提案 最後に人間が判断 人間の認知に合うように、AI同士で「素材を絞り込む」設計をする
  22. 成果物に組み込むべき「ガードレール4要素」 大学生向け講義 2026 23 / 33 第 4 幕 |

    ガ ー ド レ ー ル の 時 代 ① 信頼性ラベル 出典と信頼度を ◎◦△× で明示する。AIに頼った数字 と一次データを区別する ② 自己批評 「この資料で意思決定できるか?/NO」を最初から成 果物に書き込む ③ 計測ループ 改善の効果を、主観ではなくデータで見る。気のせいの 積み重ねを断つ ④ 情報の取捨選択とストーリー化 大量の素材から、何を残し何を捨てるか。意思決定に繋 がる文脈を入れる
  23. ガードレールの Before / After 大学生向け講義 2026 24 / 33 第

    4 幕 | ガ ー ド レ ー ル の 時 代 BEFORE — ガードレール無し • 表だけ・大量の数字 • 出典なし • 「AI が分析しました」終わり • 誰も検証していない • ストーリーなし、結論ぼやけ 意思決定者:「で?」 AFTER — ガードレール有り • 信頼性マップ ◎◦△× • 自己批評「決められるか?/NO」 • 主要発見3つを冒頭に • 意思決定への文脈・ストーリー • 計測ループで改善履歴を記録 意思決定者:「これで決められる」 素材の量は同じ。違うのは「読み手のために設計されているか」だけ。
  24. 業務の型化 — 属人化からの脱出 大学生向け講義 2026 25 / 33 第 4

    幕 | ガ ー ド レ ー ル の 時 代 AI 活用の成否を分けるのは、 AI の性能ではない。 業務をいかに「型化」し、組織に届けられるかである。 「型」とは何か Skill / プレイブック 業務手順をパッケージ化したもの テンプレート 成果物の決まった様式 チェックリスト 見落としを防ぐ確認項目 一度作れば、誰が使っても同じ品質。属人化が解消され、組織全体の生産性が上がる。
  25. 人間プロキシ問題 — DS人材が「便利屋」になる罠 大学生向け講義 2026 26 / 33 第 4

    幕 | ガ ー ド レ ー ル の 時 代 AI を使える人ほど、忙しくなる逆説 AI を使えない人 (クライアント) → AI を使える人 (プロキシ= DS 人材) → AI (サーバ) 起きること:依頼者には「AIを介して頼んでいる」自覚がない。ノウハウが属人化し、その人が抜けるとAI活用能力 ごと組織から消える。 解決:業務の「型化」で、AIを使える人を組織全体に広げる(民主化)
  26. 過去にも同じことが起きた — 歴史的アナロジー 大学生向け講義 2026 27 / 33 第 5

    幕 | D S を 学 ぶ 意 義 「便利な道具が普及すると、専門家は消えるのか?」 — 過去3度の答え 1 9 7 0 年 代 電卓 数学者は消えた? 消えていない 計算者 → 問題設計者 1 9 9 0 年 代 Excel 経理担当は消えた? 消えていない 計算する人 → 数字を経営判断に変 える人 2 0 0 0 年 代 Google検索 図書館司書は消えた? 消えていない 本を探す人 → リサーチガイド/情 報リテラシー教育者 AI 時代も同じ。役割が変わるだけ。価値は『移動する』。
  27. データサイエンスのコモディティ化 U 字曲線 大学生向け講義 2026 28 / 33 第 5

    幕 | D S を 学 ぶ 意 義 フェ ーズ 1 コモディティ化 誰でも AI で分析できる時代に フェ ーズ 2 普及 使う企業が爆発的に増える(DS が 当たり前に) フェ ーズ 3 価値の再上昇 正しく分析できる人/ガードレー ルを引ける人の希少価値 価値の動き: → コモディティ化で一度沈むが、そのあと希少価値が上がる(U字) DS の価値は消えない。「移動する」だけ。
  28. 新しいデータサイエンティストのスキルセット 大学生向け講義 2026 29 / 33 第 5 幕 |

    D S を 学 ぶ 意 義 ① 業務の型化(Skill 設計) ② ガードレール設計 ③ AI 忖度の見抜き方 ④ 評価モードへの切替(生成 → 評価) ⑤ エージェント設計力 ⑥ ドメイン × データの土地勘 ⑦ 情報の取捨選択とストーリー化 「分析する人」ではなく「分析を信頼させる人」のスキルセット
  29. 7 つのスキル、優先順位はこう 大学生向け講義 2026 30 / 33 第 5 幕

    | D S を 学 ぶ 意 義 全部いきなりは無理。順番をつけると動けます。 学生時代にまず3つ ① AI 忖度の見抜き方 反証質問・クロスチェックの習慣 ② 評価モードへの切替 生成と評価は別物の労働 ③ 情報の取捨選択とストーリー化 意思決定に繋がる編集力 就職後に育てる4つ ④ 業務の型化(Skill 設計) 組織の再現性を作る ⑤ ガードレール設計 成果物に組み込む4要素 ⑥ エージェント設計力 複数ステップを束ねるワークフロー ⑦ ドメイン × データの土地勘 業界の暗黙知 学生時代の3つは AI を使う全員に必要。残り4つは現場経験とセットで育つ。
  30. 大学で学ぶ基礎 × 現場で価値を生む力 大学生向け講義 2026 31 / 33 第 5

    幕 | D S を 学 ぶ 意 義 大学 で学 ぶ基 礎技 術 Python・統計・機械学習・データ構造 = 今やコモディティ化された下層レイヤ その 上に 積み 上げ るもの ガードレール設計・エージェント設計・編集力 = 現場で価値を生む力 土台がない人には、積み上げる場所がない。 基礎を学んでいる皆さんには、上に積み上げる余地がある。
  31. 今夜/3ヶ月/半年/卒業まで にできること 大学生向け講義 2026 32 / 33 第 5 幕

    | D S を 学 ぶ 意 義 今夜 Claude + e-Stat MCP で、商圏分析を真似してみる 3ヶ月後 Kaggle Learn + AI 出力の検証フローを自分のプロジェクトに導入 半年後 インターンで「AI に分析させたものを誰がどう検証しているか」を観察 卒業まで Skill / ガードレール設計を 1 つ作って発表する 小さく始めて、計測して、改善する。これは AI 時代も変わりません。