Slide 24
Slide 24 text
Feature Store Open-
Source
Point-in-time
Support
Data Source Feature Transformation Feature
materialization
Performance Feature Type
Feathr Yes Point-in-time対応。
様々なタイムスタン
プフォーマットをサ
ポート。
主要なソースとファイ
ル形式(csv, parquet,
avro, orc, delta lake)
をサポート
declarativeフレームワークによるネ
イティブな変換のサポート
• 行レベル、ウィンドウ集計変換
• オフライン、ストリーミング、
オンライン変換をサポート
Python API and
configuration files +
CLIをサポート
• スケールあり。
• 低レベルのSpark
最適化が組み込ま
れており、パ
フォーマンスが高
い。
テンソル型(for deep
learning/ML) +
プリミティブ型
Databricks Feature
Store
No time-travelのみ
(point-in-timeは未対
応)
オフライン:
・Delta Lake
オンライン:
・Azure Database for
MySQL
・Azure SQL Database
・Amazon Aurora
・Amazon RDS MySQL
etc…
ネイティブな変換は未サポート
• PySpark notebookによる一般的
なデータ処理のみ。
• PySparkの知識が必要
• オンライン機能変換ができない
• Sparkにベンダロックされてい
る。
Notebookで手動管理 Sparkの最適化機能
はないが、スケール
あり
プリミティブ型
Feast Yes • Point-in-timeで、
タイムスタンプ
のフォーマット
が固定されてい
る必要あり
• 時系列でない
データでもタイ
ムスタンプは必
ず必要
主要なソースに対応。
ただ、CSVは未対応。
詳細はここに記載あり。
feast-dev/feast:
Feature Store for
Machine Learning
(github.com)
・Pandas(Pythonライブラリ)を用
いた行レベル変換のみ
CLIサポート • シングルノード
• インメモリ
• スケールしない
プリミティブ型
Google Vertex AI
Feature Store
No time-travelのみ
(point-in-timeは未対
応)
googleのデータソース
のみ。
Not available GCP UI経由のみ BigQueryの性能に依
存
プリミティブ型