Slide 1

Slide 1 text

© LayerX Inc. ⽣成AIを作るエンジニアリングと 使うエンジニアリング 2025/06/18 Yusuke Shibui AI Engineering Summit

Slide 2

Slide 2 text

⾃⼰紹介 shibui yusuke ● いろいろ → Stability AI → LayerX(いまここ) ● MLOpsコミュニティ運営 ● MLOps & データ & バックエンド & インフラ & その他諸々エンジニア ● 検索チームとR&Dチームを⽴ち上げ中 ● 最近やりたいこと ⽣成AIの⽣成AI以外のエンジニアリング ● Github: @shibuiwilliam ● FB: yusuke.shibui cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知

Slide 3

Slide 3 text

機械学習を本番システムに組み込む方法を デザインパターンとして整理! 機械学習を組み込んだ本番システムを 実際にハンズオンで作る! 【共著】大企業からスタートアップまで、 MLOpsの実践例を集約! 乞うご期待! ???

Slide 4

Slide 4 text

変わる 技術は

Slide 5

Slide 5 text

毎年数回イノベーションが発⽣する世界 Machine learning Deep learning Generative AI Platform 2011 2012 2013 2023 2022 2021 2020 2014 2015 2016 2017 2019 2018 BigQuery dbt Kubeflow AlexNet DCGAN TensorFlow DQN AlphaGo AlphaZero XGBoost LightGBM ONNX PyTorch Anaconda GoogleNet ResNet Kaggle SageMaker Keras Core ML MediaPipe TensorRT Nvidia K80 Jupyter Notebook Google Colab Word2Vec Vertex AI MLflow Spark CLIP BERT GPT-3 OpenAI Hidden debt paper Diffusion model HuggingFace AutoML Optuna Katib ChatGPT Snowflake Airflow Cycle GAN Style GAN Magenta VAE CatBoost Jax/Flax TFServing TorchServe Stable Diffusion Nvidia A100 TPU Transformer イノベーション イノベーション イノベーション イノベーション イノベーション イノベーション イノベーション イノベーション イノベーション イノベーション イノベーション CodeX BQML 2024 Llama LoRA DeepSpeed GPT4 Gemini Nvidia H100 AnimateDiff イノベーション Copilot Amazon Bedrock 2025 langchain dify mastra Nvidia H200 vllm Flux Claude Cursor Devin ModernBERT DeepSeek イノベーション イノベーション

Slide 6

Slide 6 text

変わる ⼈は

Slide 7

Slide 7 text

● ⽣成AIを作るエンジニアリング ● ⽣成AIを使うエンジニアリング ● 流れは作るもの

Slide 8

Slide 8 text

© LayerX Inc. 8 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 開発する⽣成AIモデルとリリースターゲットを決め、 採⽤するモデルアーキテクチャやデータ、学習レシピを計画 学習済み⽣成AIモデルを⾃動または⼈間が評価 ⽣成AIモデルの品質、ハルシネーション、機能をフィードバック 既存のデータを整理し、追加で必要なデータや変換処理を定義 データ収集、変換、フィルタリング、保存管理 ⽣成AIモデルのアーキテクチャを開発し、GPUを確保して学習 学習プロセスと結果を実験管理し、必要に応じてFine tune

Slide 9

Slide 9 text

© LayerX Inc. 9 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 ビジネスプラン 要件定義 リリースターゲット GPU確保 チーム組成

Slide 10

Slide 10 text

© LayerX Inc. 10 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 収集、購⼊ 前処理 分析 フィルター

Slide 11

Slide 11 text

© LayerX Inc. 11 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 収集、購⼊ 前処理 分析 フィルター データの要件定義 動画⽣成AIの例 課題を持ったユーザ 解決したい課題 必要なデータ 事前学習データ Fine Tuningデータ データの存在有無

Slide 12

Slide 12 text

© LayerX Inc. 12 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 収集、購⼊ 前処理 分析 フィルター シーン検知、シーン分割 Resolution / Aspect ratio / jittery Text detection / Scoring Embedding Captioning 動画⽣成AIの例 Ref. Meta Movie Gen https://ai.meta.com/research/movie-gen/

Slide 13

Slide 13 text

CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! シーン検知、シーン分割 CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! Text detection Motion scoring & aesthetic scoring ms 0.2 as 0.2 ms 0.8 as 0.4 ms 0.6 as 0.5 Captioning A graceful cat walks elegantly, then finds a cozy spot, curls up, and peacefully drifts off to a deep sleep A black cat energetically jups and runs around the garden An orange cat playfully bats a ball around on a bed

Slide 14

Slide 14 text

© LayerX Inc. 14 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 収集、購⼊ 前処理 分析 フィルター データ基盤 検索システム テーマ分析 マトリックス分析 不⾜領域の把握 動画⽣成AIの例 Ref. Meta Movie Gen https://ai.meta.com/research/movie-gen/

Slide 15

Slide 15 text

© LayerX Inc. 15 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 収集、購⼊ 前処理 分析 フィルター 動画⽣成AIの例 Storage DWH & Full text search Vector Store Multimodal data search platform データ本体 ID Storage path Metadata Caption… ID Video vector Text vector UI

Slide 16

Slide 16 text

© LayerX Inc. 16 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 収集、購⼊ 前処理 分析 フィルター 動画⽣成AIの例 データ収集 シーン分割 Text & score 重複 意味 result

Slide 17

Slide 17 text

© LayerX Inc. 17 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 学習レシピ データローダー 学習並列性 事前学習 Fine tuning

Slide 18

Slide 18 text

© LayerX Inc. 18 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 品質 ハルシネーション コスト

Slide 19

Slide 19 text

© LayerX Inc. 19 ⽣成AIを作るためのエンジニアリング 計画 データ 学習 評価 やり直すことを考慮したエンジニアリング ⼤規模⾮構造化マルチモーダルデータを検索可能にする 限りあるGPU利⽤を時系列で計画する ⼈間による評価を指標含めて定義する ⽬標を⾒失わない、⽬標を判ずる審美眼

Slide 20

Slide 20 text

© LayerX Inc. 20 神は細部に宿る 


Slide 21

Slide 21 text

© LayerX Inc. 21 審美眼を磨く

Slide 22

Slide 22 text

© LayerX Inc. 22 ソフトウェアエンジニアの審美眼 AI MLOps ⽣成AI AI Agent 次に来るもの

Slide 23

Slide 23 text

© LayerX Inc. 23 ソフトウェアエンジニアの審美眼 AI MLOps ⽣成AI AI Agent 次に賭けるもの

Slide 24

Slide 24 text

時流は 変わる

Slide 25

Slide 25 text

● ⽣成AIを作るエンジニアリング ● ⽣成AIを使うエンジニアリング ● 流れは作るもの

Slide 26

Slide 26 text

© LayerX Inc. 26 ⽣成AIを使うエンジニアリング LLM コード プロンプト LLM コード プロンプト AIコーディング AIアプリケーション

Slide 27

Slide 27 text

© LayerX Inc. 27 ⽣成AIで作るエンジニアリング LLM コード プロンプト AIコーディング 機能 メンテナンス性 可⽤性 構造化 アーキテクチャ Test First 実装 Dev First or Product First?

Slide 28

Slide 28 text

© LayerX Inc. 28 ⽣成AIで作るエンジニアリング No, this is a cat. Dev First or Product First?

Slide 29

Slide 29 text

© LayerX Inc. 29 今はここから始められる ⽣成AIで作るエンジニアリング 従来はここから始まった

Slide 30

Slide 30 text

© LayerX Inc. 30 ⽣成AIで作るエンジニアリング LLM コード プロンプト AIコーディング 機能 メンテナンス性 可⽤性 構造化 アーキテクチャ Test First 実装 レビュー リファクタリング

Slide 31

Slide 31 text

作るを 変える

Slide 32

Slide 32 text

© LayerX Inc. 32 LLMを使うソフトウェアのエンジニアリング AIアプリケーション 確率的アウトプット ハルシネーション ⼊⼒の⾃由度 ⾃然⾔語 LLM コード プロンプト 不確実性

Slide 33

Slide 33 text

© LayerX Inc. 33 LLMを使うソフトウェアのエンジニアリング ビジネス ロジック LLM スキーマ コンテキスト 構造化 出⼒ LLM as a Judge ルール化 記録 プロンプト 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 34

Slide 34 text

© LayerX Inc. 34 LLMを使うソフトウェアのエンジニアリング ビジネス ロジック LLM スキーマ コンテキスト 構造化 出⼒ LLM as a Judge ルール化 記録 プロンプト 不確実性のFirewall 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 35

Slide 35 text

© LayerX Inc. 35 構造化 LLMを使うソフトウェアのエンジニアリング 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 不確実性 評価指標 評価指標 評価指標 要素分解

Slide 36

Slide 36 text

© LayerX Inc. 36 LLMを使うソフトウェアのエンジニアリング ビジネス ロジック LLM スキーマ コンテキスト 構造化 出⼒ LLM as a Judge ルール化 記録 プロンプト ⼊⼒の不確実性 出⼒の不確実性 結果の不確実性 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 37

Slide 37 text

© LayerX Inc. 37 LLMを使うソフトウェアのエンジニアリング ビジネス ロジック コンテキスト プロンプト ⼊⼒の不確実性 ユーザリクエスト理解 コンテキスト検索 プロンプト管理 分解、発展、計画 時系列と意味の情報整理 分解と評価 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 38

Slide 38 text

© LayerX Inc. 38 LLMを使うソフトウェアのエンジニアリング ユーザリクエスト理解 コンテキスト検索 プロンプト管理 分解、発展、計画 時系列と意味の情報整理 分解と評価 あなたはLLMに詳しいソフトウェアエンジニアです。 Webアプリを⾃動コーディングする「Auto-web」の 機能を改善します。これまでのコミットヒストリと レビューを考慮してリファクタリングしてください。 Few shot‧‧‧ 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 39

Slide 39 text

© LayerX Inc. 39 あなたはLLMに詳しいソフトウェアエンジニアです。 Webアプリを⾃動コーディングする「Auto-web」の 機能を改善します。これまでのコミットヒストリと レビューを考慮してリファクタリングしてください。 Few shot‧‧‧ LLMを使うソフトウェアのエンジニアリング ユーザリクエスト理解 コンテキスト検索 プロンプト管理 分解、発展、計画 時系列と意味の情報整理 分解と評価 Auto-web Webアプリ⾃動コーディング 機能改善 リファクタリング コミット‧レビュー Specification Understanding Underspecification analysis Search Filter Plan and rewrite 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 40

Slide 40 text

© LayerX Inc. 40 LLMを使うソフトウェアのエンジニアリング ユーザリクエスト理解 プロンプト管理 分解、発展、計画 分解と評価 Auto-web Webアプリ⾃動コーディング 機能改善 リファクタリング コミット‧レビュー Search Filter Plan and rewrite commit history コンテキスト検索 時系列と意味の情報整理 コンテキスト 時系列で変わるルールと状況 コメントと⽭盾 ⾮⾃明な情報 セマンティクスと属性 ‧‧‧ 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 41

Slide 41 text

© LayerX Inc. 41 class CodingPrompt role_prompt = “” order_prompt = “” reasoning_prompt = “” def context_builder(): … def few_shot_builder(): … あなたはLLMに詳しいソフトウェアエンジニアです。 Webアプリを⾃動コーディングする「Auto-web」の 機能を改善します。これまでのコミットヒストリと レビューを考慮してリファクタリングしてください。 Few shot‧‧‧ LLMを使うソフトウェアのエンジニアリング ユーザリクエスト理解 コンテキスト検索 分解、発展、計画 時系列と意味の情報整理 プロンプト管理 分解と評価 E2E testcase A E2E testcase B E2E testcase C E2E testcase D Prompt変更と統計的テスト失敗率の分析 90% 80% 95% 85% 70% 90% 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 42

Slide 42 text

© LayerX Inc. 42 LLMを使うソフトウェアのエンジニアリング ビジネス ロジック LLM スキーマ コンテキスト 構造化 出⼒ LLM as a Judge ルール化 記録 プロンプト ⼊⼒の不確実性 出⼒の不確実性 結果の不確実性 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 43

Slide 43 text

© LayerX Inc. 43 LLMを使うソフトウェアのエンジニアリング LLM スキーマ 構造化 出⼒ 出⼒の不確実性 ⾃然⾔語を排除 Reasoningの活⽤ 構造化、Tool call 推論の⾃⼰評価 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 44

Slide 44 text

© LayerX Inc. 44 LLMを使うソフトウェアのエンジニアリング ⾃然⾔語を排除 Reasoningの活⽤ 構造化、Tool call 推論の⾃⼰評価 答えは「⼈⼯知能」です。 なぜならAIは⼀般的にArtificial Intelligenceの省略で 使⽤され、Artificial Intelligenceは⽇本語で ⼈⼯知能と翻訳されるからです。 AIが⼈⼯知能の意味で使われる可能性は95%です。 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 AIってなんで すか?

Slide 45

Slide 45 text

© LayerX Inc. 45 LLMを使うソフトウェアのエンジニアリング ⾃然⾔語を排除 Reasoningの活⽤ 構造化、Tool call 推論の⾃⼰評価 答えは「⼈⼯知能」です。 なぜならAIは⼀般的にArtificial Intelligenceの省略で 使⽤され、Artificial Intelligenceは⽇本語で ⼈⼯知能と翻訳されるからです。 AIが⼈⼯知能の意味で使われる可能性は95%です。 { “answer”: “⼈⼯知能”, “reasons”: { “reason_0”: “AIは⼀般的にArtificial Intelligenceの省略”, “reason_1”: “Artificial Intelligenceは⽇本語で⼈⼯知能”, }, “probability”: 0.95 } 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 46

Slide 46 text

© LayerX Inc. 46 LLMを使うソフトウェアのエンジニアリング ⾃然⾔語を排除 構造化、Tool call { “reasons”: { “reason_0”: “AIは⼀般的にArtificial Intelligenceの省略”, “reason_1”: “Artificial Intelligenceは⽇本語で⼈⼯知能”, }, “answer”: “⼈⼯知能”, “probability”: 0.95 } Reasoningの活⽤ 推論の⾃⼰評価 class Answer(pydantic.BaseModel): reasons: list[str] = Fields(“論理的理由”) answer: str = Fields(“回答”) probability: float = Fields(“確率”) 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 47

Slide 47 text

© LayerX Inc. 47 LLMを使うソフトウェアのエンジニアリング ビジネス ロジック LLM スキーマ コンテキスト 構造化 出⼒ LLM as a Judge ルール化 記録 プロンプト ⼊⼒の不確実性 出⼒の不確実性 結果の不確実性 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 48

Slide 48 text

© LayerX Inc. 48 LLMを使うソフトウェアのエンジニアリング LLM as a Judge ルール化 記録 結果の不確実性 LLM as a Judge 固定値化 Observability Judgeの妥当性確率 グラデーションから範囲 監視と分析 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

Slide 49

Slide 49 text

© LayerX Inc. 49 LLMを使うソフトウェアのエンジニアリング LLM as a Judge 固定値化 Observability Judgeの妥当性確率 グラデーションから範囲 監視と分析 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 LLM時代のソフト ウェアエンジニアリ ングのパラダイムを 深く考察して提案し てください。 LLM時代のソフト ウェアエンジニアリ ングではAIを⽤いた コーディングと、AI を使ったソフトウェ アが重要です。 質問に対する回答の 妥当性を評価し、そ の理由と評価点 (0~100点)を説明 してください。 理由:LLMの発達に よってソフトウェア 開発の現場は変化し ます。 評価点:100点 ←妥当性評価 LLM as a Judge 信頼性 95.6% プロンプト レスポンス LLM-as-a-Judge プロンプト LLM-as-a-Judge

Slide 50

Slide 50 text

© LayerX Inc. 50 LLMを使うソフトウェアのエンジニアリング LLM as a Judge 固定値化 Observability Judgeの妥当性確率 グラデーションから範囲 監視と分析 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 LLM時代のソフト ウェアエンジニアリ ングのパラダイムを 深く考察して提案し てください。 AIコーディング AIアプリケーション その他 否定的 肯定的 否定的 肯定的 肯定的 否定的 LLM-as-a-Judgeの ⼈間との⼀致率 レスポンス評価分析 99% 50% 70% 98% 60% 80% ⾃動化 Human-in-the-loop

Slide 51

Slide 51 text

© LayerX Inc. 51 LLMを使うソフトウェアのエンジニアリング LLM as a Judge 固定値化 Observability Judgeの妥当性確率 グラデーションから範囲 監視と分析 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 LLM時代のソフト ウェアエンジニアリ ングのパラダイムを 深く考察して提案し てください。 Rewrite Response Reflection Final answer User feedback Token Duration Complexity Log System log Prompt log System log Prompt log System log Prompt log System log Prompt log System log

Slide 52

Slide 52 text

作る 変化を

Slide 53

Slide 53 text

● ⽣成AIを作るエンジニアリング ● ⽣成AIを使うエンジニアリング ● 流れは作るもの

Slide 54

Slide 54 text

© LayerX Inc. 54 流れは作るもの Software engineering Object-oriented programming Design patterns TDD Waterfall Agile DDD DevOps

Slide 55

Slide 55 text

© LayerX Inc. 55 流れは作るもの Cloud computing Infrastructure as Code Microservice architecture Modular monolith Serverless Container

Slide 56

Slide 56 text

© LayerX Inc. 56 次の流れを探し、作る ML/AI LLM LLMOps? Eval centric? Agentic Workflow? MLOps DevOps AI Agent

Slide 57

Slide 57 text

流れに乗る


Slide 58

Slide 58 text

流れを作る


Slide 59

Slide 59 text

⽣成AIを作るエンジニアリングと 使うエンジニアリング ありがとうございました!