Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
5分でわかる! Snowpark Container Service
Search
あれ
December 15, 2024
0
190
5分でわかる! Snowpark Container Service
2024/12/13「
Snowflake女子会 #3 ~新しい出会いとアイディア満載! 男女問わずの懇親会!!~
」 での発表スライドです。
あれ
December 15, 2024
Tweet
Share
More Decks by あれ
See All by あれ
Python と Snowflake はズッ友だょ!~ Snowflake の Python 関連機能をふりかえる ~
__allllllllez__
2
260
私が trocco を推す理由
__allllllllez__
2
640
SPCS で実現する dbt All in Snowflake の世界
__allllllllez__
3
420
External Network AccessとStreamlitでデータロードアプリ作ってみた
__allllllllez__
0
390
異形頭の作りかた
__allllllllez__
0
890
💰年度末予算消化祭💰 Large Memory Instance で 画像分類してみた
__allllllllez__
0
430
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
44
13k
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Testing 201, or: Great Expectations
jmmastey
40
7.1k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.9k
4 Signs Your Business is Dying
shpigford
181
21k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
Being A Developer After 40
akosma
87
590k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Designing for humans not robots
tammielis
250
25k
Writing Fast Ruby
sferik
628
61k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
247
1.3M
Transcript
Snowpark Container Service 2024/12/13 5分でわかる! あれ(kajiya) / DATUM STUDIO株式会社
© 2024 DATUM STUDIO Co. Ltd. 2 自己紹介 【名前】 梶谷
美帆 / Miho Kajiya X→あれ(@__allllllllez__) 広報さんにカッコよく撮影していただいた 【所属】 DATUM STUDIO株式会社 データエンジニアリング本部 データエンジニア部 GL/プリンシパルエンジニア 【ユーザーコミュニティ】 • Snowflake ユーザーグループ(SnowVillage) コンテナグループ リーダー / 女子会幹事 • primeNumber User Group(pUG) リーダー そして 2024 Data Superheroes Data Superhero のすがた
© 2024 DATUM STUDIO Co. Ltd. 5分でわかる! Snowpark Container Service
(SPCS)
© 2024 DATUM STUDIO Co. Ltd. コンテンツ • 基本編 •
SPCS 概要 • SPCS って何が嬉しいの? • 応用編 • Snowflake アプリケーションの進化 • Native Apps Framework と SPCS の統合 • Snowflake Trail によるオブザーバビリティ • Architecture Deep Diveと今後の展望
© 2024 DATUM STUDIO Co. Ltd. SPCS 基本編
© 2024 DATUM STUDIO Co. Ltd. 6 SPCS 概要 Snowpark
Container Services(以下 SPCS) は、Snowflake で簡単にコンテナアプリ ケーションを運用するために設計されたフルマネージドなコンテナサービスです。 概要 ✓ Snowflake アカウント内でコンテナアプリケーションを実行する、 フルマネージドコンテナサービス ✓ 任意の言語で作成したアプリケーションをSnowflakeに持ち込め る(例:C/C++、Node.js、Python、Rなど) ✓ 使い慣れたSQLやPython API、CLIでデプロイや実行などの操作 が可能 ✓ vCPU数・メモリが小さく低コストなインスタンスから、強力な GPU搭載インスタンスまで、用途に合わせて選択可能 引用:Snowflakeブログ(https://www.snowflake.com/en/blog/snowpark-container-services-deploy-genai-full- stack-apps/) 概略図 特徴③ Native Appsとの統合 ✓ 任意の言語で書かれたアプリケーションをマーケットプレイスで入手可能 ✓ dbt、sas など多様なアプリケーションがリリースされている 引用: https://docs.getdbt.com/docs/cloud- integrations/set-up-snowflake-native- app 特徴② 学習コストが低く、手がかからない ✓ アプリケーションの構成はyamlで記述するだけ ✓ コンテナ環境のネットワーク等の構成、セキュリティ設定などは自動的に行わ れ、ユーザーはアプリケーションの開発に専念できる 特徴① Snowflakeのデータをセキュアに扱える ✓ アプリケーションは Snowflake 環境内で実行される ✓ Snowflake のデータをアプリケーションで扱うためにSnowflake外にデータ が出てしまう心配ナシ
© 2024 DATUM STUDIO Co. Ltd SPCS 概要 SPCS を構成する主な要素は、イメージレジストリ・コンピューティングプール・
サービス/ジョブの3つ アプリケーション イメージの保存先 コンピューティング プール ジョブ/サービスを実行する 仮想マシン ノード コレクション 継続しない アプリケーション 継続して稼働する アプリケーション サービスで定義した 処理を呼び出すUDF ジョブ サービス関数 サービス コマンドに直接 書いてもいい push SQL・CLIなどで操作 イメージ pull 作成 コマンド 操作 サービス/ジョブ操作 インタフェース イメージ レジストリ サービス構成 yaml
© 2024 DATUM STUDIO Co. Ltd. 8 SPCS 概要 実際のクエリはこんな感じ
CREATE COMPUTE POOL tutorial_compute_pool MIN_NODES = 1 MAX_NODES = 1 INSTANCE_FAMILY = CPU_X64_XS; CREATE IMAGE REPOSITORY tutorial_repository; CREATE SERVICE echo_service IN COMPUTE POOL tutorial_compute_pool FROM @tutorial_stage SPECIFICATION_FILE = 'echo_spec.yaml'; コンピューティング プール イメージレジストリ サービス/ジョブ ※必要に応じて Security Integration 等の作成も発生します。 が、難易度的には誤差だよ誤差
© 2024 DATUM STUDIO Co. Ltd SPCS って何が嬉しいの? SPCSを使うことで、データ漏洩リスクを軽減しながら、使い慣れた言語やツールで のデータ活用や大規模なAI・MLの利用が可能に!
LLMを用いたアプリケーションの作成 ✓ JupyterLab や Rstudio のような分析IDEを利用する場合、 Snowflake の外にIDEを建てなければならなかった ✓ Snowflake 環境外にデータを持ち出すリスクが発生 https://zenn.dev/t_koreeda/articles/06de768b7d1fb3 より引用 セキュアな環境で、使い慣れた言語での分析 ✓ 任意の言語のアプリケーションを Snowflake 内で建てられる ✓ データをIDEで扱うためにSnowflake外にデータが出てしまう心配 ナシ ✓ Snowflake のウェアハウスには GPU インスタンスが無かったため、 LLMなどの大型 GPU が必要な場合、インスタンスを外部に用意す る必要があった ✓ やっぱりデータ持ち出しリスクが発生 ✓ 大型のGPU(最大スペック:92 vCPU、1152 GB RAM、40 GB VRAM NVIDIA A100 GPU)が利用可能 ✓ 外部にデータを持ち出すことなく、社内データを利用したLLMアプ リケーション(RAGアプリなど)を作成可能 https://speakerdeck.com/sino20023/spcsxrokarullmdeying-ye-dan-dang-xiang- ke-shi-suo-chu-siapurizuo-rinitiao-zhan-sitemita より引用
© 2024 DATUM STUDIO Co. Ltd. SPCS って何が嬉しいの? つまり、 こういうこと
データインジェスト ワークフローエンジン お好きな言語の データアプリケーション データウェアハウス データ変換フレームワーク データカタログ AI/MLプラットフォーム ビジネスインテリジェンス 分析環境 https://speakerdeck.com/__allllllllez__/spcs-deshi-xian-suru-dbt-all-in-snowflake-noshi-jie より
© 2024 DATUM STUDIO Co. Ltd. SPCS って何が嬉しいの? つまり、 こういうこと
データウェアハウス データインジェスト データ変換フレームワー ク データカタログ AI/MLプラットフォーム ビジネスインテリジェンス 分析環境 ワークフローエンジン お好きな言語の データアプリケーション https://speakerdeck.com/__allllllllez__/spcs-deshi-xian-suru-dbt-all-in-snowflake-noshi-jie より
© 2024 DATUM STUDIO Co. Ltd. ちなみに 割とマジでできます(2024/09 SWT Tokyo
にて) https://zenn.dev/datum_studio/articles/1058d49960f006 より
© 2024 DATUM STUDIO Co. Ltd. SPCS 応用編
© 2024 DATUM STUDIO Co. Ltd. 14 Snowflake アプリケーションの進化 Summit
2024で、アプリケーションの構築と配布および DevOps に関して多くの アップデートが発表されました 超超超盛り上がった アプリデモ3連発 フルスタックアプリケーション • Snowpark Container Services (一般提供、GCPはちょっと待ってね) • Snowflake Native Apps と Snowpark Container Services の統合(2024/11、BULDでGA) Snowflake Trailによるオブザーバビリティ • 分散型トレース for Snowpark • Snowpark Container Services のメトリクス • データパイプラインのオブザーバビリティ(GA) • OpenTelemetry統合(GA) DevOpsとオーケストレーション • サーバーレスタスク(GA) • サーバーレスタスクフレックス • Git統合 • Snowflake CLI • Python API • データベース変更管理
© 2024 DATUM STUDIO Co. Ltd. 15 Native Apps Framework
と SPCS の統合 • テーブルやビューなどのデータと、UDFやス トアドプロシージャなどで作成したロジック をまとめて「アプリケーション」として共有す るもの • Streamlit でUI作成も可能 • 有償化も可能 • Snowflake で不労所得を得る方法 • 日本の企業では truestar、NTTデータ、 RAKUDEJI などがAppを公開(↓) ※敬称略 Native Apps Framework とは、データと関連するロジックをアプリケーションにま とめて、他のSnowflakeアカウントと共有できる機能 https://docs.snowflake.com/ja/developer-guide/native-apps/native-apps-about
© 2024 DATUM STUDIO Co. Ltd Native Apps Framework と
SPCS の統合 こんなアプリがSnowflake Marketplace経由で入手できるようになります
© 2024 DATUM STUDIO Co. Ltd. 17 Snowflake Trail によるオブザーバビリティ
これまで • ログとトレース、監視系の機能はいくつか公開済 • しかし、Native App のログや SPCS サービスのモニタリ ングなど、細かい(?)ところに手が届いていない 機能 • Snowpark メトリクス...CPU使用率、メモリ使用量を観測 • Python コードプロファイラー ... プロファイラが時間が かかる箇所を調査、最適化が可能に • Snowsight にオブザーバビリティUIが追加 • ...etc 使い方 • Snowsight で使うもよし • OpenTelemetry準拠なので、Datadog、Grafana などの 外部ツールでも利用可能 データパイプラインとアプリケーション、データ品質を対象に可観測性を強化する 一連のSnowflake機能
© 2024 DATUM STUDIO Co. Ltd. 18 Architecture Deep Diveとロードマップ
Summit 2024「Snowpark Container Services Security Deep Dive and best practices」では、詳細なアーキテクチャ解説とロードマップ提示がありました
© 2024 DATUM STUDIO Co. Ltd. 5分でわかる! Snowpark Container Service
(SPCS)
© 2024 DATUM STUDIO Co. Ltd. 5分でわかりましたか? わかりましたよね????
© 2024 DATUM STUDIO Co. Ltd. どんどん使おう!SPCS!
© 2024 DATUM STUDIO Co. Ltd. おしまい