生成AIを作るエンジニアリングと使うエンジニアリング

© LayerX Inc. ⽣成AIを作るエンジニアリングと使うエンジニアリング 2025/06/18 Yusuke Shibui AI Engineering
Summit

⾃⼰紹介 shibui yusuke • いろいろ → Stability AI → LayerX（いまここ）
• MLOpsコミュニティ運営 • MLOps & データ & バックエンド & インフラ & その他諸々エンジニア • 検索チームとR&Dチームを⽴ち上げ中 • 最近やりたいこと⽣成AIの⽣成AI以外のエンジニアリング • Github: @shibuiwilliam • FB: yusuke.shibui cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知

機械学習を本番システムに組み込む方法をデザインパターンとして整理！機械学習を組み込んだ本番システムを実際にハンズオンで作る！【共著】大企業からスタートアップまで、 MLOpsの実践例を集約！乞うご期待！？？？

変わる技術は

毎年数回イノベーションが発⽣する世界 Machine learning Deep learning Generative AI Platform 2011 2012
2013 2023 2022 2021 2020 2014 2015 2016 2017 2019 2018 BigQuery dbt Kubeflow AlexNet DCGAN TensorFlow DQN AlphaGo AlphaZero XGBoost LightGBM ONNX PyTorch Anaconda GoogleNet ResNet Kaggle SageMaker Keras Core ML MediaPipe TensorRT Nvidia K80 Jupyter Notebook Google Colab Word2Vec Vertex AI MLflow Spark CLIP BERT GPT-3 OpenAI Hidden debt paper Diffusion model HuggingFace AutoML Optuna Katib ChatGPT Snowflake Airflow Cycle GAN Style GAN Magenta VAE CatBoost Jax/Flax TFServing TorchServe Stable Diffusion Nvidia A100 TPU Transformer イノベーションイノベーションイノベーションイノベーションイノベーションイノベーションイノベーションイノベーションイノベーションイノベーションイノベーション CodeX BQML 2024 Llama LoRA DeepSpeed GPT4 Gemini Nvidia H100 AnimateDiff イノベーション Copilot Amazon Bedrock 2025 langchain dify mastra Nvidia H200 vllm Flux Claude Cursor Devin ModernBERT DeepSeek イノベーションイノベーション

変わる⼈は

• ⽣成AIを作るエンジニアリング • ⽣成AIを使うエンジニアリング • 流れは作るもの

© LayerX Inc. 8 ⽣成AIを作るためのエンジニアリング計画データ学習評価開発する⽣成AIモデルとリリースターゲットを決め、
採⽤するモデルアーキテクチャやデータ、学習レシピを計画学習済み⽣成AIモデルを⾃動または⼈間が評価⽣成AIモデルの品質、ハルシネーション、機能をフィードバック既存のデータを整理し、追加で必要なデータや変換処理を定義データ収集、変換、フィルタリング、保存管理⽣成AIモデルのアーキテクチャを開発し、GPUを確保して学習学習プロセスと結果を実験管理し、必要に応じてFine tune

© LayerX Inc. 9 ⽣成AIを作るためのエンジニアリング計画データ学習評価ビジネスプラン
要件定義リリースターゲット GPU確保チーム組成

© LayerX Inc. 10 ⽣成AIを作るためのエンジニアリング計画データ学習評価収集、購⼊
前処理分析フィルター

前処理分析フィルターデータの要件定義動画⽣成AIの例課題を持ったユーザ解決したい課題必要なデータ事前学習データ Fine Tuningデータデータの存在有無

前処理分析フィルターシーン検知、シーン分割 Resolution / Aspect ratio / jittery Text detection / Scoring Embedding Captioning 動画⽣成AIの例 Ref. Meta Movie Gen https://ai.meta.com/research/movie-gen/

CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE!
CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! シーン検知、シーン分割 CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! CAT MOVIE! Text detection Motion scoring & aesthetic scoring ms 0.2 as 0.2 ms 0.8 as 0.4 ms 0.6 as 0.5 Captioning A graceful cat walks elegantly, then ﬁnds a cozy spot, curls up, and peacefully drifts oﬀ to a deep sleep A black cat energetically jups and runs around the garden An orange cat playfully bats a ball around on a bed

前処理分析フィルターデータ基盤検索システムテーマ分析マトリックス分析不⾜領域の把握動画⽣成AIの例 Ref. Meta Movie Gen https://ai.meta.com/research/movie-gen/

前処理分析フィルター動画⽣成AIの例 Storage DWH & Full text search Vector Store Multimodal data search platform データ本体 ID Storage path Metadata Caption… ID Video vector Text vector UI

前処理分析フィルター動画⽣成AIの例データ収集シーン分割 Text & score 重複意味 result

© LayerX Inc. 17 ⽣成AIを作るためのエンジニアリング計画データ学習評価学習レシピ
データローダー学習並列性事前学習 Fine tuning

© LayerX Inc. 18 ⽣成AIを作るためのエンジニアリング計画データ学習評価品質
ハルシネーションコスト

© LayerX Inc. 19 ⽣成AIを作るためのエンジニアリング計画データ学習評価やり直すことを考慮したエンジニアリング
⼤規模⾮構造化マルチモーダルデータを検索可能にする限りあるGPU利⽤を時系列で計画する⼈間による評価を指標含めて定義する⽬標を⾒失わない、⽬標を判ずる審美眼

© LayerX Inc. 22 ソフトウェアエンジニアの審美眼 AI MLOps ⽣成AI AI Agent
次に来るもの

© LayerX Inc. 23 ソフトウェアエンジニアの審美眼 AI MLOps ⽣成AI AI Agent
次に賭けるもの

時流は変わる

© LayerX Inc. 26 ⽣成AIを使うエンジニアリング LLM コードプロンプト LLM コード
プロンプト AIコーディング AIアプリケーション

© LayerX Inc. 27 ⽣成AIで作るエンジニアリング LLM コードプロンプト AIコーディング機能
メンテナンス性可⽤性構造化アーキテクチャ Test First 実装 Dev First or Product First?

© LayerX Inc. 28 ⽣成AIで作るエンジニアリング No, this is a cat.
Dev First or Product First?

© LayerX Inc. 30 ⽣成AIで作るエンジニアリング LLM コードプロンプト AIコーディング機能
メンテナンス性可⽤性構造化アーキテクチャ Test First 実装レビューリファクタリング

作るを変える

© LayerX Inc. 32 LLMを使うソフトウェアのエンジニアリング AIアプリケーション確率的アウトプットハルシネーション⼊⼒の⾃由度⾃然⾔語
LLM コードプロンプト不確実性

© LayerX Inc. 33 LLMを使うソフトウェアのエンジニアリングビジネスロジック LLM スキーマコンテキスト
構造化出⼒ LLM as a Judge ルール化記録プロンプト不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

構造化出⼒ LLM as a Judge ルール化記録プロンプト不確実性のFirewall 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 35 構造化 LLMを使うソフトウェアのエンジニアリング不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。不確実性評価指標評価指標
評価指標要素分解

構造化出⼒ LLM as a Judge ルール化記録プロンプト⼊⼒の不確実性出⼒の不確実性結果の不確実性不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 37 LLMを使うソフトウェアのエンジニアリングビジネスロジックコンテキストプロンプト⼊⼒の不確実性
ユーザリクエスト理解コンテキスト検索プロンプト管理分解、発展、計画時系列と意味の情報整理分解と評価不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 38 LLMを使うソフトウェアのエンジニアリングユーザリクエスト理解コンテキスト検索プロンプト管理分解、発展、計画時系列と意味の情報整理
分解と評価あなたはLLMに詳しいソフトウェアエンジニアです。 Webアプリを⾃動コーディングする「Auto-web」の機能を改善します。これまでのコミットヒストリとレビューを考慮してリファクタリングしてください。 Few shot‧‧‧ 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 39 あなたはLLMに詳しいソフトウェアエンジニアです。 Webアプリを⾃動コーディングする「Auto-web」の機能を改善します。これまでのコミットヒストリとレビューを考慮してリファクタリングしてください。 Few shot‧‧‧
LLMを使うソフトウェアのエンジニアリングユーザリクエスト理解コンテキスト検索プロンプト管理分解、発展、計画時系列と意味の情報整理分解と評価 Auto-web Webアプリ⾃動コーディング機能改善リファクタリングコミット‧レビュー Speciﬁcation Understanding Underspeciﬁcation analysis Search Filter Plan and rewrite 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 40 LLMを使うソフトウェアのエンジニアリングユーザリクエスト理解プロンプト管理分解、発展、計画分解と評価 Auto-web
Webアプリ⾃動コーディング機能改善リファクタリングコミット‧レビュー Search Filter Plan and rewrite commit history コンテキスト検索時系列と意味の情報整理コンテキスト時系列で変わるルールと状況コメントと⽭盾⾮⾃明な情報セマンティクスと属性 ‧‧‧ 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 41 class CodingPrompt role_prompt = “” order_prompt
= “” reasoning_prompt = “” def context_builder(): … def few_shot_builder(): … あなたはLLMに詳しいソフトウェアエンジニアです。 Webアプリを⾃動コーディングする「Auto-web」の機能を改善します。これまでのコミットヒストリとレビューを考慮してリファクタリングしてください。 Few shot‧‧‧ LLMを使うソフトウェアのエンジニアリングユーザリクエスト理解コンテキスト検索分解、発展、計画時系列と意味の情報整理プロンプト管理分解と評価 E2E testcase A E2E testcase B E2E testcase C E2E testcase D Prompt変更と統計的テスト失敗率の分析 90％ 80％ 95％ 85％ 70％ 90％不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 43 LLMを使うソフトウェアのエンジニアリング LLM スキーマ構造化出⼒出⼒の不確実性
⾃然⾔語を排除 Reasoningの活⽤構造化、Tool call 推論の⾃⼰評価不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 44 LLMを使うソフトウェアのエンジニアリング⾃然⾔語を排除 Reasoningの活⽤構造化、Tool call 推論の⾃⼰評価
答えは「⼈⼯知能」です。なぜならAIは⼀般的にArtiﬁcial Intelligenceの省略で使⽤され、Artiﬁcial Intelligenceは⽇本語で⼈⼯知能と翻訳されるからです。 AIが⼈⼯知能の意味で使われる可能性は95%です。不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 AIってなんですか？

© LayerX Inc. 45 LLMを使うソフトウェアのエンジニアリング⾃然⾔語を排除 Reasoningの活⽤構造化、Tool call 推論の⾃⼰評価
答えは「⼈⼯知能」です。なぜならAIは⼀般的にArtificial Intelligenceの省略で使⽤され、Artificial Intelligenceは⽇本語で⼈⼯知能と翻訳されるからです。 AIが⼈⼯知能の意味で使われる可能性は95%です。 { “answer”: “⼈⼯知能”, “reasons”: { “reason_0”: “AIは⼀般的にArtificial Intelligenceの省略”, “reason_1”: “Artificial Intelligenceは⽇本語で⼈⼯知能”, }, “probability”: 0.95 } 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 46 LLMを使うソフトウェアのエンジニアリング⾃然⾔語を排除構造化、Tool call { “reasons”:
{ “reason_0”: “AIは⼀般的にArtificial Intelligenceの省略”, “reason_1”: “Artificial Intelligenceは⽇本語で⼈⼯知能”, }, “answer”: “⼈⼯知能”, “probability”: 0.95 } Reasoningの活⽤推論の⾃⼰評価 class Answer(pydantic.BaseModel): reasons: list[str] = Fields(“論理的理由”) answer: str = Fields(“回答”) probability: float = Fields(“確率”) 不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 48 LLMを使うソフトウェアのエンジニアリング LLM as a Judge ルール化
記録結果の不確実性 LLM as a Judge 固定値化 Observability Judgeの妥当性確率グラデーションから範囲監視と分析不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。

© LayerX Inc. 49 LLMを使うソフトウェアのエンジニアリング LLM as a Judge 固定値化
Observability Judgeの妥当性確率グラデーションから範囲監視と分析不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 LLM時代のソフトウェアエンジニアリングのパラダイムを深く考察して提案してください。 LLM時代のソフトウェアエンジニアリングではAIを⽤いたコーディングと、AI を使ったソフトウェアが重要です。質問に対する回答の妥当性を評価し、その理由と評価点（0~100点）を説明してください。理由：LLMの発達によってソフトウェア開発の現場は変化します。評価点：100点 ←妥当性評価 LLM as a Judge 信頼性 95.6% プロンプトレスポンス LLM-as-a-Judge プロンプト LLM-as-a-Judge

Observability Judgeの妥当性確率グラデーションから範囲監視と分析不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 LLM時代のソフトウェアエンジニアリングのパラダイムを深く考察して提案してください。 AIコーディング AIアプリケーションその他否定的肯定的否定的肯定的肯定的否定的 LLM-as-a-Judgeの⼈間との⼀致率レスポンス評価分析 99% 50% 70% 98% 60% 80% ⾃動化 Human-in-the-loop

Observability Judgeの妥当性確率グラデーションから範囲監視と分析不確実性に対処する鉄則は、不確実な要素を局所化して制限すること。そして評価すること。 LLM時代のソフトウェアエンジニアリングのパラダイムを深く考察して提案してください。 Rewrite Response Reﬂection Final answer User feedback Token Duration Complexity Log System log Prompt log System log Prompt log System log Prompt log System log Prompt log System log

作る変化を

© LayerX Inc. 55 流れは作るもの Cloud computing Infrastructure as Code
Microservice architecture Modular monolith Serverless Container

流れに乗る 

流れを作る 

⽣成AIを作るエンジニアリングと使うエンジニアリングありがとうございました！

生成AIを作るエンジニアリングと使うエンジニアリング

生成AIを作るエンジニアリングと使うエンジニアリング

More Decks by shibuiwilliam

Other Decks in Technology

Featured

Transcript