* IDC, Data Age 2025: The Evolution of Data to Life-Critical: Donʼt Focus on Big Data, Focus on the Data Thatʼs Big, April 2017. データ 5年毎 想像を超えるデータ量 15年 運⽤期間 データプラットフォーム 1,000倍 スケール 10倍以上 成⻑率 より多様なデータ
Audience Studio Real-time user activities ~ 200+k qps ~ 17B data points/day S3 Storage ~ 70+PB Users Application Application metrics ~ 2.0M/sec Offline log ingestion ~ 10s of TB/day User activation ~ 10s of billions of user segments EMR Clusters ~ 2500 clusters/day EMR Instances > 200k instance hours per day 85%+ on EC2 Spot
のインスタンスフリートに最適な スポットインスタンス ü ノードは、オンデマンドインスタンスとスポット インスタンスが混在するように設定可能 ü 最も低い価格で最⼤容量のインスタンスに最適化 されます ü タスクノード内のスポットインスタンスが再利⽤ されると、フリート内の別のインスタンスによっ て置き換えられます
l EMR でスポットインスタンスを利⽤するメリットと、スポットインスタ ンスを効率的に利⽤するインスタンスフリートについて紹介 l 新しい機能(Allocation Strategy/Managed Scaling) を利⽤することで より効果的にスポットインスタンスを利⽤いただけることを紹介 l スポットインスタンスを利⽤する効果をベンチマークで確認