Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
re:Infrastructure_for the NextGen AI/ML and Beyond
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ICHICHI
December 17, 2024
Business
710
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
re:Infrastructure_for the NextGen AI/ML and Beyond
ICHICHI
December 17, 2024
More Decks by ICHICHI
See All by ICHICHI
AP-21_Kyndryl_AWS-Summit-JP-2025
ichichi
0
27
re:Connect_NW&SecurityでAWSとの接続を再考する
ichichi
0
140
Hybrid NW Infra Design Review: Classic Pattern including Outposts & Route 53 Profile
ichichi
2
820
PetiteSRE_GenAIEraにおけるインフラのあり方観察
ichichi
0
440
Other Decks in Business
See All in Business
“使われているハーネス/使われていないハーネス”を可視化するところから始めた話
sugamoto
0
220
Agent Skills 完全ガイド
mickey_kubo
0
120
パーソルクロステクノロジー_グループソリューション本部のご紹介 / Introduction_of_gs
pxt_gs_ssol
0
3.4k
ネクストビートコーポレートガイド/corporate-guide
nextbeat
3
86k
SimpleForm 会社紹介資料
simpleform
2
54k
パーソルクロステクノロジー_DXソリューション本部のご紹介 / Introduction_of_dx
pxt_gs_ssol
0
2k
株式会社SHO-CASE_会社案内20260525
20201001
0
190
コミュニケーション術を強化するのにオススメな本9冊
zashii
0
460
経営管理について / About Corporate Planning
loglass2019
1
35k
株式会社リバイブル 会社説明資料
rebible
0
910
今こそアナログスキルを磨こう
madai0517
0
120
ITが何の略なのかも知らないままエンジニアになっちゃったのでインターネットに生き恥を晒してみた話
m_k__77
1
270
Featured
See All Featured
Amusing Abliteration
ianozsvald
1
200
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.7k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
Are puppies a ranking factor?
jonoalderson
1
3.5k
My Coaching Mixtape
mlcsv
0
140
Context Engineering - Making Every Token Count
addyosmani
9
960
Optimising Largest Contentful Paint
csswizardry
37
3.7k
BBQ
matthewcrist
89
10k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
360
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
240
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
Being A Developer After 40
akosma
91
590k
Transcript
: キンドリルジャパン株式会社 叶 奕池( )
自己紹介 叶 奕池(ICHICHI) キンドリルジャパン株式会社 Infrastructure/Cloud Architect Japan AWS Junior.Champion 2023
略歴: 2024年6月ー現在 大手カード会社様 生成AI基盤開発案件 Lead Architect, Tech Lead • GPU-Basedコンテナ基盤、AI/MLデータベース、自動化設計・開発 • Full Stackスクラム開発支援 2024年6月ー現在 大手自動車産業のお客様 DX基盤開発案件 Associate Architect • Over 2000+サーバを有する大規模AWS基盤設計・構築 • スクラム開発推進 2022年4月ー2024年6月 大手保険会社様 アウトソーシング案件 AWS Team Lead, Architect • Over 1000+サーバーを有する大規模ハイブリッドクラウド基盤構築・運用管理自動化設計 • 先端ソリューション開発:Outposts、オンプレミスへのAWSエージェント統合、など • 日米協同クラウド活用推進 2021年4月ー2022年3月 IBM Cloud Advanced Customer Support セキュリティサポートエンジニア 2021年4月 新卒入社 よう えきち
1. クラウドインフラ : スタック、ビルディングブロック、そしてプロセス 2. AWSからのメッセージと現実にあるボトルネック • •
1. クラウドインフラ : スタック、ビルディングブロック、そしてプロセス ❶アプリケーション ❷データ ❸ランタイムまたはアプリを実行する ❹アプリをモニタリングする または ❺アプリが実行される
❻仮想化テクノロジー ➐サーバーマシン ❽ストレージデバイス ❾ネットワークアプライアンス アプリ 開発ツール ❶アプリケーション統合 ❷データベース & 分析 ❸システム管理 & ガバナンス ❹モニタリング & ロギング ❺セキュリティ, 認証認可, コンプライアンス ❻ストレージ ➐ネットワーク ❽コンピューティング 構築 運用 出典: 1. IaaS とは - Infrastructure as a Service の説明 – AWS 2. Gartner Generative AI Predictions for 2024-2028
2. AWSからのメッセージと現実にあるボトルネック 出典: 1. AWS Monday Night Live 2024: Innovations
in Compute, Security, and AI Infrastructure – AWS 2. AWS-Announces-New-Data-Center-Components-to-Support-AI-Innovation-and-Further-Improve-Energy-Efficiency - US Press Center ❶ • ベンダーロックイン対策としてのAWSサー ビスとOSSの組み合わせは、バージョン管 理の複雑さを増加 ❷ AI/MLアプリの開発速度と需要に対応可能 なインフラの効果的な実装には技術ツール の活用を超えた取り組みが必要 ❸ • 現在のクラウドAI/MLインフラは、AIワー クロード向けに適応された従来のクラウド サービス設計に依存しており、AI専用には まだシフトしていない
• 各コンポーネントが相互に連携し、全体とし て機能する動的で統合されたネットワーク • このエコシステム型アプローチでは、個々の 要素だけでなく、それらの相互作用や全体の 進化を重視 • これにより、AIソリューションの開発、導入、 運用、そして継続的な進化を、持続可能で効
率的な環境でサポート 「SOFT」Infrastructure Re: Infrastructure 「HARD」Infrastructure • コンピュート、ストレージ、ネットワーク、クラウド 施設といった物理的・従来型のコンポーネントを指す • データ処理・分析機能、モデルの展開や学習フレーム ワーク、AIワークロード向けに特化した運用ツールと いった機能的な側面を指す ( )
「 」 「 」 ( ) ❶ • 16基のTrainium2でピーク時最大20.8PFLOPSの計算能⼒を提供 •
64 基 の Trainium を NeuronLink で 接 続 し た Amazon EC2 Trn2UltraServersのプレビュー開始 • Trn2単体の4倍となるピーク時最大83.2PFLOPSを提供し最大規 模のモデル学習やデプロイに適する ❷ • クラウドでの実行と同じクラスタで手元のハードウェアで稼働す るアプリケーションを管理・運用 • 低レイテンシや規制への対応が必要な場合もEKSによるアプリ ケーション管理が可能に ❸ • EC2ベアメタルインスタンスで稼働 • VMwareソフトウェアへの管理者アクセスが可能 • セルフマネージド型&パートナーによるマネージド型 ❶ • AWSの最新Foundation Model ❷Amazon SageMaker Unified Studio • データ処理、SQLによる分析、AI/MLモデル開発、⽣成AIアプリ 開発に利用されるAWSのツールを統合 ❸ • Amazon SageMaker Unified Studioに統合され、その⼀部とし て提供 • ⽣成AIアプリケーションを素早く構築・カスタマイズするための インタフェースを提供 ❹ • ユーザからのリクエストに基づいて、最も低いコストで必要な品 質の応答が期待できるモデルにリクエストを動的にルーティング する ❺Amazon Bedrock Prompt Caching • 複数回呼び出されるプロンプトとその応答をキャッシュすること で効率化する
1.従来の境界を超えるAI/ML Innovationのためのクラウドインフラの提供: • スタック、ビルディングブロック、プロセスなどの固定概念からの脱却 • 「SOFT」インフラと「HARD」インフラが効率よく動作するためのエコシステムの形成 2.真のAIインフラへのシフト: • AWSサービスのイノベーションから見られるように、AI専用インフラストラクチャが進化中 •
従来型のクラウドリソースの転用から、真のAI最適化ソリューションへのシフトがトレンド
1.AIOps:可観測性、耐障害性、拡張性 • Amazon BedrockのAutomated Reasoning Check & Multimodal toxicity detection
with image supportを活用した高度なAPM分析 • Amazon Qによる包括的なシステムインサイトを活用したAI駆動の運用管理 2.NextGenのクラウドマイグレーションとクラウドインフラの再考: • EKS Hybrid Nodesを活用し、ハイブリッドAI/ML基盤を実現 • モデル配信を最適化するためのインテリジェントなワークロードルーティングとキャッ シング戦略の実装 • クラウドネイティブの原則を取り入れつつ運用効率を維持する移行パターンの開発
ありがとうございました キンドリルジャパン株式会社 叶 奕池(ICHICHI) Infrastructure/Cloud Architect