AIの本格活用を加速させるPrivate LLM

#HPEDiscover AIの本格活用を加速させる Private LLM Jan 28, 2025 サービスデリバリー統括本部トランスフォーメーションコンサルティング本部テクノロジーアーキテクト部
杉山禎夫

2022 Explosion 2023-2024 Experimentation 2025- Production • ChatGPT 公開 •
2ヶ月で1億ユーザーに APIサービスやオープンモデルによるPoCが盛んに AIの本番環境への活用が進む生成AIの本格活用

4 PoCから本番環境へ展開されるのは1割生産性向上に到達できない要件の定義、データの整備、AIのチューニングなどに時間を要し、 PoCのタイムリミットまでに成果を出すことができない。 Brand and reputation
risks Security and data privacy concerns Lack of specialized skills and expertise Infrastructure challenges from PoC to Production データプライバシーアクセス性とコントロールサイロ化したデータへのアクセス、AIが利用するデータとユーザー権限のコントロールが複雑で管理しきれない。 AIの進歩の早さ企業の中でどんなモデル、ツール、ユースケースを採用すればよいのか決めることが難しい。

Agenda AIの企画・課題設定の考え方 AIシステムの評価と改善のサイクル AI本格活用を実現するプラットフォーム

6 AI本格活用へのステップサービス運用・保守、目標達成状況確認、モデル改善・チューニング SLA・SLO、認証認可、可用性など運用品質、製品品質に関わる開発、テスト全体アーキテクチャ設計、セキュリティ要件確定、プロトタイプ開発アジャイルによるアルゴリズム・モデル開発と評価データ収集、データ理解、基礎解析、技術選定ビジネス要件の分析、課題ヒアリング、事業インパクトのある課題を選定課題選定データ収集
プロトタイプ・トライアル本開発・大規模展開 PoC (解法検証) 運用

AIの企画・課題設定の考え方 7

8 生成AIの特徴 AI (人工知能) Machine Learning (機械学習) Deep Learning (深層学習)
生成AI ミスの許容度合い入出力の複雑さ入出力が定形入出力が不定形入力が不定形出力が定形許容不能許容可能プログラミング士業機械学習深層学習生成AI

9 生成AIでできること • ルール、フォーマットに沿った文章を生成する。定型ライティング • アイデアのブレスト、壁打ち相手になる。提案
• 定性データ（自由記述など）を定量評価に変換する。定量評価 • 文章からキーワードを抽出する。文章を複数の要素に分解する。抽出・分解 • 文章を翻訳する。 • プログラムを別の言語に変換する。変換 • 自然言語の文章を分類する。条件分岐

10 生成AI ユースケースコード生成文書作成情報検索カスタマーサービスチャットボット SWエンジニアの「Co-pilot」として、
コーディング規約を自社で管理しながら、より迅速にコードを生成。保険、処方箋など、フォームへの入力作業を自動化。マーケティング資料、部品マニュアルなどを作成。社内文書や情報を検索結果に追加して強化する。独自のデータを使用して社内サポートチャットボットを作成し、ナレッジベースを強化し、より迅速な問題解決を実現。最適化されたコールセンターで顧客サービスチームの生産性を向上させ、顧客体験を改善。

11 業務フローの可視化工程分岐インプットアウトプット例: コールセンター業務オペレーターがヒアリング
FAQ確認 FAQから回答 YES NO 質問ヒアリング結果参照文書確認参照文書から回答 YES エスカレーション NO FAQ有無質問 FAQ 顧客への回答質問 FAQ 質問参照文書参照文書有無質問参照文書顧客への回答質問対応履歴

12 生成AIに合わせた業務フロー工程分岐インプットアウトプット例: コールセンター業務オペレーターがヒアリング
AIがFAQと参照文書を確認 AIが回答を生成 YES 質問ヒアリング結果オペレーターが回答を確認エスカレーション NO 回答可否質問 FAQ 顧客への回答ドラフト質問 FAQ 参照文書顧客への回答質問対応履歴参照文書顧客への回答ドラフト

13 評価指標・基準 • 許容される処理時間 • 出力の正確さ要件充足 • 業務時間削減 •
売上、収益向上業務改善効果 • AIの知見の蓄積 • PoCサイクルの短縮間接的な価値

14 生成AIの特性を理解する生成AIに合わせた業務フローを具体的な評価基準を考える AIの企画・課題設定の考え方

15 AI本格活用へのステップサービス運用・保守、目標達成状況確認、モデル改善・チューニング SLA・SLO、認証認可、可用性など運用品質、製品品質に関わる開発、テスト全体アーキテクチャ設計、セキュリティ要件確定、プロトタイプ開発アジャイルによるアルゴリズム・モデル開発と評価データ収集、データ理解、基礎解析、技術選定ビジネス要件の分析、課題ヒアリング、事業インパクトのある課題を選定課題選定データ収集
プロトタイプ・トライアル本開発・大規模展開 PoC (解法検証) 運用再掲

AIシステムの評価と改善のサイクル 16

17 オフライン評価生成AIシステム開発時人間による評価ユーザー目線に近い、比較的正確な評価ができる。一方、工数がかかる。 LLMによる自動評価 (LLM as a
Judge) 一貫した、効率的な評価ができる。一方、精度が劣る。オフライン評価 (事前評価) システム構築時に、作成、収集したデータを用いて評価する手法。

18 オンライン評価 1. 生成AIシステム運用 • ユーザーが実際に入力したデータとフィードバックの収集 2. データ収集・分析
オンライン評価 (事後評価) 本番環境でユーザーが入力したデータを用いて評価する手法。

19 評価からの改善のサイクル 1. 生成AIシステム運用 • ユーザーが実際に入力したデータとフィードバックの収集 2. データ収集・分析
• 評価用データ更新 • チューニング用データ作成 3. データ選別・加工 • LLM as a Judge、手動評価を併用 5. 評価テスト・デプロイ • 生成AIシステム、データ、モデルのチューニング 4. チューニング最終評価 AIシステム導入によって課題策定時に設定した目標を達成できているか

20 NVIDIA AI Enterprise (NeMo, NIM) 1. 生成AIシステム運用 • ユーザーが実際に入力
したデータとフィードバックの収集 2. データ収集・分析 • 評価用データ更新 • チューニング用データ作成 3. データ選別・加工 • LLM as a Judge、手動評価を併用 5. 評価テスト・デプロイ • 生成AIシステム、データ、モデルのチューニング 4. チューニング

21 AI Agent 汎用的なAI 用途特化型のAI チャットボット特定業務の代替サービス・製品への組み込み • 指示を出せる人にしか
使えない • 何ができるかわからない状態で使いづらい • 用途が明確になることで使いやすく End to EndのAI 複数のAIやツールを利用して動く与えられた目標に基づいてプランニングして行動 • 人間の介在が減り、求める結果に対して利用できるように

22 生成AIに合わせた業務フロー例: コールセンター業務オペレーターがヒアリング AIがFAQと参照文書を確認 AIが回答を生成 YES
オペレーターが回答を確認エスカレーション NO 再掲

23 AI Agent 例: コールセンター業務オペレーターがヒアリング回答に必要な情報収集 AIが回答を生成
YES オペレーターが回答を確認エスカレーション NO 顧客の契約状況確認 FAQや参照文書を確認対応履歴を確認

24 生成AIシステムの評価のアプローチ評価からの改善のサイクル End to Endの AI Agent
AIシステムの評価と改善のサイクル

AI本格活用を実現するプラットフォーム 25 の前に、

26 Edge to Cloud with AI 体験コーナー HPE GreenLake for
Private Cloud EnterpriseでNewオンプレミスへ Private AI Chat Search ソリューション RAGの精度向上を実現するオンプレミスLLMソリューション OpsRampで体感するハイブリッド・マルチクラウド環境の統合管理

27 データ処理とパイプラインモデル学習とチューニングモデルデプロイとモニタリングコンテナプラットフォーム GPUインフラ分散ファイル
& オブジェクトストア探索的データ分析ビジネス価値創出 AI本格活用に必要なものデータエンジニアインフラエンジニアデータサイエンティスト機械学習エンジニアアプリケーションエンジニアビジネスアナリスト

28 Public Clouds • 便利：一方、コントロールできない部分もある • 透明性が低い：ブラック
ボックスなAPI • 高額：規模が大きくなると • 狭い範囲：プラットフォームによって制御される Private Cloud • データ：管理され、安全 • コスト：安定しており、予測可能 • ワークフロー：シンプルかつ透明性 • 堅牢かつ技術的に高度：オプション性と予測可能な結果 DIY Open Source • 継続的なリスク：社内にAI の専門家が必要 • 後手に回る：機能が遅れ、先導できない • ユーザーの不満：通常、ユーザーにとってより困難 AIプラットフォームのアプローチ

29 NVIDIA GPUs NVIDIA Spectrum-X Networking Private Cloud Liquid Cooling
Innovation AI Lifecycle Services HPE GreenLake cloud control plane: Manage, monitor, observe, expand Advisory, Support and Managed Services Solution Design, Deployment, Data Governance, and Integration Vertical-specific solutions and consulting AI Models AI Software NVIDIA AI Enterprise NeMo Curator NeMo Customizer NeMo Evaluator NeMo Retriever NeMo Guardrails HPE AI Essentials Data pipeline Orchestration MLOps NVIDIA NIM Community Models Partner Models Custom Models AI Optimized infrastructure HPE Data Lakehouse AI Servers and Storage Certified by NVIDIA NVIDIA AI Computing by HPE

30 NVIDIA AI Computing by HPE HPE Private Cloud AI

AIの本格活用を加速させるPrivate LLM

AIの本格活用を加速させるPrivate LLM

Yoshio Sugiyama

More Decks by Yoshio Sugiyama

Other Decks in Technology

Featured

Transcript

#HPEDiscover AIの本格活用を加速させる Private LLM Jan 28, 2025 サービスデリバリー統括本部トランスフォーメーションコンサルティング本部テクノロジーアーキテクト部

2022 Explosion 2023-2024 Experimentation 2025- Production • ChatGPT 公開 •

4 PoCから本番環境へ展開されるのは1割生産性向上に到達できない要件の定義、データの整備、AIのチューニングなどに時間を要し、 PoCのタイムリミットまでに成果を出すことができない。 Brand and reputation

Agenda AIの企画・課題設定の考え方 AIシステムの評価と改善のサイクル AI本格活用を実現するプラットフォーム

AIの企画・課題設定の考え方 7

8 生成AIの特徴 AI (人工知能) Machine Learning (機械学習) Deep Learning (深層学習)

9 生成AIでできること • ルール、フォーマットに沿った文章を生成する。定型ライティング • アイデアのブレスト、壁打ち相手になる。提案

10 生成AI ユースケースコード生成文書作成情報検索カスタマーサービスチャットボット SWエンジニアの「Co-pilot」として、

11 業務フローの可視化工程分岐インプットアウトプット例: コールセンター業務オペレーターがヒアリング

12 生成AIに合わせた業務フロー工程分岐インプットアウトプット例: コールセンター業務オペレーターがヒアリング

13 評価指標・基準 • 許容される処理時間 • 出力の正確さ要件充足 • 業務時間削減 •

14 生成AIの特性を理解する生成AIに合わせた業務フローを具体的な評価基準を考える AIの企画・課題設定の考え方

AIシステムの評価と改善のサイクル 16

17 オフライン評価生成AIシステム開発時人間による評価ユーザー目線に近い、比較的正確な評価ができる。一方、工数がかかる。 LLMによる自動評価 (LLM as a

18 オンライン評価 1. 生成AIシステム運用 • ユーザーが実際に入力したデータとフィードバックの収集 2. データ収集・分析

19 評価からの改善のサイクル 1. 生成AIシステム運用 • ユーザーが実際に入力したデータとフィードバックの収集 2. データ収集・分析

20 NVIDIA AI Enterprise (NeMo, NIM) 1. 生成AIシステム運用 • ユーザーが実際に入力

21 AI Agent 汎用的なAI 用途特化型のAI チャットボット特定業務の代替サービス・製品への組み込み • 指示を出せる人にしか

22 生成AIに合わせた業務フロー例: コールセンター業務オペレーターがヒアリング AIがFAQと参照文書を確認 AIが回答を生成 YES

23 AI Agent 例: コールセンター業務オペレーターがヒアリング回答に必要な情報収集 AIが回答を生成

24 生成AIシステムの評価のアプローチ評価からの改善のサイクル End to Endの AI Agent

AI本格活用を実現するプラットフォーム 25 の前に、

26 Edge to Cloud with AI 体験コーナー HPE GreenLake for

27 データ処理とパイプラインモデル学習とチューニングモデルデプロイとモニタリングコンテナプラットフォーム GPUインフラ分散ファイル

28 Public Clouds • 便利：一方、コントロールできない部分もある • 透明性が低い：ブラック

29 NVIDIA GPUs NVIDIA Spectrum-X Networking Private Cloud Liquid Cooling

30 NVIDIA AI Computing by HPE HPE Private Cloud AI

© 2025 Hewlett Packard Enterprise Development LP Thank you