Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Bedrockで実現する堅牢なデータエンジニアリング
Search
為藤アキラ
March 04, 2025
Technology
120
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon Bedrockで実現する堅牢なデータエンジニアリング
為藤アキラ
March 04, 2025
More Decks by 為藤アキラ
See All by 為藤アキラ
Agent ServerはWeb Serverではない。ADKで考えるAgentOps
akiratameto
0
190
AI Agent Vertex AI Agent Builder × A2A × ADKで繋げるマルチエージェント
akiratameto
1
140
[OpsJAWS Meetup33 AIOps] Amazon Bedrockガードレールで守る安全なAI運用
akiratameto
2
380
Bedrock カスタムモデルvs汎用モデルの比較
akiratameto
1
160
Vertex AIで実現するLLMデータアノテーションの効率化と自動化
akiratameto
0
210
Amazon Bedrock Agents (ナレッジベースの種類)
akiratameto
1
310
DeepSeek-R1をカスタムモデルとしてAmazon Bedrockにインポートし活用
akiratameto
0
260
Amazon Bedrock Agents (基本編)
akiratameto
0
240
SageMaker Feature Storeを活かしたLLM推論
akiratameto
1
120
Other Decks in Technology
See All in Technology
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
MUSUBI 田中裕一『AIと共に行う「しごとのリデザイン」- スモールバックオフィス編』AI Ops Lab #4
musubi
0
200
アジャイルな経理と Claude Code と経営の未来
kawaguti
PRO
3
130
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
150
AAIFに入ってみた ~内から見えるコミュニティ動向~
sato4
0
240
現地で盛り上がった WWDC26 Keynote
zozotech
PRO
1
250
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
230
2026TECHFRESH畢業分享會 - AI 時代的人生存檔點
line_developers_tw
PRO
0
1.1k
Disciplined Vibes: Scaling AI-Assisted Engineering
sheharyar
0
150
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
1.1k
AIっぽい文章を採点して人間らしく直すアプリを作ってみた
yama3133
2
200
Chainlitで作るお手軽チャットUI
ynt0485
0
260
Featured
See All Featured
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.2k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
250
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
160
Designing for Timeless Needs
cassininazir
1
260
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
Thoughts on Productivity
jonyablonski
76
5.2k
What's in a price? How to price your products and services
michaelherold
247
13k
Optimizing for Happiness
mojombo
378
71k
How STYLIGHT went responsive
nonsquared
100
6.2k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
230
Transcript
AWS活用 AI/ML/LLM #5 機械学習/大規模言語モデル データエンジニアリング Amazon Bedrockで実現する 堅牢なデータエンジニアリング 株式会社BLUEISH 代表取締役CEO兼CTO
為藤アキラ @AkiraTameto
為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・AWS歴12年 ・直近のAIプロジェクト マルチAIエージェントサービス
「BLUEISH Agents」の開発 自己紹介
データエンジニアリングとは? データエンジニアリングの定義 大規模データを収集 / 加工 / 保管 / 配信するためのシステムやインフラを設計 /
開発 / 運用し、 組織の意思決定やデータ活用を支える基盤を構築する分野 データエンジニアリングの目2 1 大規模データを扱い、後続(分析・AI活用など)で使いやすい形にす 1 データ品質・セキュリティ・パフォーマンスを担保する
AI / ML観点でのデータエンジニアリングとは? 基本的なデータエンジニアリングのプロセス 生データの収集 ① 変換 ② 提供 ④
保存 ③
データ分析観点でのデータエンジニアリングとは? データ分析観点でのデータエンジニアリングのプロセス 生データの収集 ① 変換 (ETL/ELT処理) ② 提供 ④ 保存
(データウェアハウス/ データレイク) ③
データ分析観点でのデータエンジニアリングをAWS運用で当てはめると データ分析観点でのデータエンジニアリングのプロセス (AWS) 生データの収集 ① 変換 (ETL/ELT処理) ② 提供 ④
保存 (データウェアハウス/ データレイク) ③ { Amazon Kinesij { AWS Data Migration Servics { AWS IoT Core { AWS Glus { EM { Data Pipelins { Athena { Amazon S¢ { Amazon Redshif { AWS Lake Formation { Amazon QuickSigh { API Gatewaº { AWS Glue Data Catalog
AI / ML観点でのデータエンジニアリングをAWS運用で当てはめると AI / ML観点でのデータエンジニアリングのプロセス 生データの収集 ① 変換 →
前処理 (特徴量抽出 / ラベリング) ② 提供 (推論エンドポイント) ④ 保存 (学習用データセット) ③
AI / ML観点でのデータエンジニアリングをAWS運用で当てはめると AI / ML観点でのデータエンジニアリングのプロセス (AWS) 生データの収集 ① 変換
(ETL/ELT処理) ② 提供 ④ 保存 (データウェアハウス/ データレイク) ③ Amazon Kinesio AWS Data Migration Servicx S3 AWS Glux EM SageMaker Processing S3 + SageMaker Ground Truth SageMaker Endpoint
LLM観点でのデータエンジニアリングとは? LLM観点でのデータエンジニアリングのプロセス + LLM特有の工程非構造化データが多い! 生データの収集 ① 変換 → 前処理 (PIIマスキング/
トークナイゼーション) ② 提供 (LLM推論エンドポイント / チャットサービス) ④ 保存 (データレイク/ ベクトル系のDB) ③
LLM観点でのデータエンジニアリングをAWS運用で当てはめると LLM観点でのデータエンジニアリングのプロセス (AWS) 生データの収集 ① 変換 (ETL/ELT処理) ② 提供 ④
保存 (データウェアハウス/ データレイク) ③ x Kinesis Firehosm x Glue Crawler x S3 x AWS Glum x EM x Amazon Comprehend x S3 x Amazon OpenSearch x Amazon Bedrock
生成AI時代のデータ課題やデータエンジニアリングの重要性 • 大規模言語モデル(LLM)の活用が企業で急増 • 不適切コンテンツ / 機密漏洩リスクが企業が抱える大きな課題 • 監視 /
アラート / ポリシー管理が必須 • インシデントが起きると信用問題 / 法的リスクに直結
Amazon Bedrock ガードレールとは? • Amazon Bedrock のエンタープライズ向け機能の一つ • 生成AIの不適切な入力・出力を制御し、企業ポリシーに合わせてフィルタリングする仕組み •
モデル種類にかかわらず一貫した安全対策を適用可能 アプリケーション ユーザー ガードレール Amazon Bedrock LLMモデル 不適切な入力をブロック フィルタ 出力 入力
ガードレールの4つのフィルター 1. Denied topics → 回答してはいけないトピックを自然言語ベースで設定 2. Content filters
→ ヘイト・差別・暴力などを検知し自動遮断 3. Sensitive information filters (PIIフィルター) → 個人情報・機密情報が出力されそうになったらブロック/マスク 4. Word filters → 特定の単語やフレーズを指定してフィルタリング
LLMに関する、データパイプラインにおける主要課題 生データからのデータパイプラインは様々な課題がある (1) 機密情報を含む生データの扱い ↓ (2) 不適切コンテンツ混入 ↓ (3) マルチモデル運用のポリシー管理負担
↓ (4) インシデント対応の難しさ
データパイプラインにおける主要課題 生データからのデータパイプラインは様々な課題がある (1) 機密情報を含む生データの扱い → 「 」 で個人情報を自動マスキング (2)
不適切コンテンツ混入 → 「 」 でリアルタイムでヘイト・差別・暴力を検出 (3) マルチモデル運用のポリシー管理負担 → 「 」 で回答禁止領域をシステム的にブロック (4) インシデント対応の難しさ → 「 」で解決! Sensitive information filters Content filters Denied topics 安全なAI Ops
Amazon Bedrock ガードレールの強みは「事前防御」 Amazon Bedrockのガードレールは、この「 」を複数モデルに対して統一ポリシーで実 行できるのが強みです。 「 」とは、LLMに不適切な回答を渡す前に、不適切なやり取りや危険な内容が存在しな いかを自動的にフィルタリング・ブロックする仕組みを指します。
事前防御 事前防御 アプリケーション ユーザー カードレール Amazon Bedrock LLMモデル 不適切な入力をブロック フィルタ 出力 入力 事前防御!
Amazon Bedrock ガードレールによる保護体制の比較 vs 事前防御(Proactive Defense) 事後防御(Reactive Defense) 入力ガードレール 出力ガードレール
LLMモデル 安全な応答 事前防御の特 ユーザーに不適切なコンテンツが届く前に遮x 入出力の両方でフィルタリングを実m 問題が発生する前にリスクを低 レビュテーションと信頼の保護に効果的 事後防御の課Ú 不適切なコンテンツが既にユーザーに届いた後の対¹ 肥大が発生した後の修復は信頼回復が困º 問題検出までのタイムラグが発生する可能¤ レビュテーションリスクと法的リスクが高い 応答(未フィルタ) 潜在的リスクあり インシデント対応 LLMモデル 問題への対応タイミングが 異なる モニタリングで問題検出!
AI Opsとしての設計から運用までの流れ ガードレールをきちんと生かすには設計から運用まで多層的に考えるのが重要。 e` 初期設計で安全策を組み込む y` 多層防御と継続モニタリング Bedrock Guardrails+
IAM/ネットワーク 制御+定期アセスメンo CloudWatchなどでコンテンツブロック数 を監視、異常値を即発見 ` ハルシネーション対策・PII保護 RAG(検索拡張型)との併用や幻覚検出設 定、PIIマスク設定のテスト Ç` インシデント対応計画 もし不適切回答が漏れた場合、どのように 修正・ユーザー通知・再発防止するかまで ルール化 ú` 権限管理と変更管理の徹底 ガードレールの設定変更には承認フローを 導入し、CloudTrailでログを追跡 システム全体でガードレールの導入を 前提にし、セキュリティ要件を明確化
AI Opsとしての設計から運用までの流れ (データエンジニアリング観点) ガードレールをきちんと生かすには設計から運用まで多層的に考えるのが重要。 yt 初期設計で安全策を組み込む t 多層防御と継続モニタリング Bedrock
Guardrails+ IAM/ネットワーク 制御+定期アセスメン} CloudWatchなどでコンテンツブロック数 を監視、異常値を即発見 §t ハルシネーション対策・PII保護 RAG(検索拡張型)との併用や幻覚検出設 定、PIIマスク設定のテスト Õt インシデント対応計画 もし不適切回答が漏れた場合、どのように 修正・ユーザー通知・再発防止するかまで ルール化 t 権限管理と変更管理の徹底 ガードレールの設定変更には承認フローを 導入し、CloudTrailでログを追跡 システム全体でガードレールの導入を 前提にし、セキュリティ要件を明確化
まとめ fg データ分析 / ML / LLM でのデータエンジニアリングのアプローチの違G 2g Amazon
Bedrock ガードレール + 他サービスで安全なLLMのデータ運 g AI OpsにおけるデータエンジニアリングでのAI運用成功の為のサイクル
Thank You!