Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DX実現の第一歩!クラウド技術を活かしたデータ分析、成功のヒント_第2回_投影資料

Sagara
November 26, 2021

 DX実現の第一歩!クラウド技術を活かしたデータ分析、成功のヒント_第2回_投影資料

DX実現の第一歩!クラウド技術を活かしたデータ分析、成功のヒント
https://dev.classmethod.jp/news/snowflake-webinar/

第2回 2021/11/11 投影資料

Sagara

November 26, 2021
Tweet

More Decks by Sagara

Other Decks in Technology

Transcript

  1. 2 本ウェビナーについて 開催 セッション名 登壇者 第1回 2021年10月28日(木) Tableau×Snowflakeで、コーディング・サーバー管理 いらずのデータ分析を実現! Snowflake株式会社

    KT クラスメソッド株式会社 相樂悟 第2回 2021年11月11日(木) 「クラウドって何か不安...」そんなあなたの不安を 解消します! Snowflake株式会社 KT クラスメソッド株式会社 相樂悟 第3回 2021年11月25日(木) SQL?NoSQL?各技術の違いをハッキリさせて 目的に合ったデータ分析基盤を構築しよう! Snowflake株式会社 KT クラスメソッド株式会社 甲木洋介 第4回 2021年12月9日(木) クラウドDWHの良さとは?DWHに留まらない ”データプラットフォーム”の魅力をお話します! Snowflake株式会社 KT クラスメソッド株式会社 甲木洋介
  2. 3 自己紹介 氏名 相樂 悟 (サガラ サトシ) 所属 クラスメソッド株式会社 アライアンス統括部

    主な担当 モダンデータスタックのプロサービス・プリセールス
  3. 4 自己紹介 氏名 KT (ケイティ) 所属 Snowflake株式会社 プロダクトマーケティング 主な担当 Snowflakeデータクラウドをみんなに広めて

    データドリブン文化を作る!! その他の活動 Grand Master of DATA Saber Tableau User Group Ambassador 著書「データドリブンの極意」
  4. 8 Snowflakeを導入している企業の例 より多くのユーザーが より速く分析 より大きなワークロードと データセット より多くのクエリと より良い分析 より高速でスケーラブルな 分析アプリ

    スケーラビリティとパフォーマンス の要件を満たしながら、より多くの ユーザーのワークロードとデータセ ットを簡単に取り込む 同時実行による競合の問題を解決 し、10個以上の基幹業務をタイム リーに分析 1日あたり100倍のクエリを実行 し、より迅速で優れた分析を実行 クエリのパフォーマンスが150倍向 上した新しい分析アプリケーション を10,000以上の薬局に提供 4,990社を超えるお客様 *2021年11月11日時点
  5. 11 クラウドを使うことのメリット - サーバー管理からの解放 - GUIの設定だけでスペックの良いサーバーが使える - SaaSならば、ソフトバージョン管理も不要 - 失敗してもコストは使用した分だけ

    - オンプレミスの場合、ハードウェア費用が重く失敗 できない。追加投資の判断にも慎重になってしまう - クラウドなら、仮に失敗してもコストを抑えられる
  6. 15 例:AWSのデータセンターについて - 防御: 物理的なアクセスを防ぐ仕組み - インフラストラクチャー: 緊急時のリカバリ対応用、 バックアック電源など -

    データ: 物理的、技術的な侵入防止 - 環境: 自然災害に強い立地、 1つのAZに複数のデータセンター 引用元:AWSのデータセンター
  7. 17 オンプレミスとクラウドで対応策を比較してみる オンプレミス クラウド ネットワークの設定ミス ネットワーク管理は全て自身で 行う必要あり SnowflakeのようなSaaSであれば、 基本的にはネットワーク設定不要 パスワード管理の甘さ

    サーバー用のユーザー、DWHの ユーザー、その他ソフトでの ユーザー管理が必要 SaaSならば、そのソフトウェア内で のユーザー管理だけが必要 サーバーやソフトの脆弱性 サーバーやソフトのバージョン管理 を行って、脆弱性が出たら自身で 対策をしないといけない SaaSならば、脆弱性に対する対応は サービス提供側が実施してくれる ウイルス感染 ウイルス対策のソフト導入や対策は 自身で行う必要あり。万が一、感染 した場合は自身で対応する必要あり SaaSがホストされたサーバーでの ウイルス対策は、サービス提供側が 実施してくれる クラウド(特にSaaS)であれば、管理することはオンプレミスより少ない
  8. 19 Snowflakeで対策しないといけないことは何か? - ユーザーのIDとPW管理 - URL・ID・PWが漏れると、アクセスされてしまう - 必要に応じて多要素認証(MFA)の設定をしましょう - 適切なデータアクセス権限の設定

    - 全ユーザーに全データを見せる運用は基本NG (特にデータシェアリングで社外へ展開する場合) - 各ユーザーに適切なアクセス権限を設定しましょう
  9. 20 サービスの提供元にデータを見られるのでは? - Snowflakeでは… - Snowflake の従業員は、顧客データへの 不正アクセスを行いません - Snowflake

    の従業員は、顧客データを収集、 削除、更新、開示、または使用しません ⭕️:プラットフォームのメンテナンス ✖:コンテンツ(顧客データ)へのアクセス
  10. 25 オンプレミスより高くなることもあるのでは? - 何も考えずにオンプレ同様に24時間365日で 稼働し続けると、もちろんお金はかかります - 使用しない間は一時停止すれば、お金はかからない! - ”オンプレミスでのみ”かかるコスト -

    サーバー導入の初期費用 - 導入製品のライセンス費用 - 日々サーバーを運用・監視するための人件費 - バージョンアップ費(人件費、ライセンス費) - サーバー更新・追加投資の費用
  11. 27 いつ障害が発生して止まってしまうか不安 - 「障害」について、クラウドプロバイダーのリージョン 全落ちを想像していませんか? →未曾有の大災害 - クラウドの「障害」はサービス全体が止まるというより、 一部の機能レベルでの影響が大多数を占めている -

    加えて過去の障害は、ほとんど数時間内に復旧している - かつ、クラウドサービスでのインフラ関係の障害は サービス提供側が確認・対応してくれる - どのくらいのスピードで対応してくれるのか?(次頁)
  12. 28 改めて、障害対応に関する用語を整理してみる - 可用性(Availability): - 稼働時間。サービス使用不可とならない時間のこと - 99.9%などと表現(1月あたり稼働分÷1月の分数合計) - 耐久性(Durability)

    - データロスが起きない度合いのこと - 99.9999999999%などと表現 年で計算 - Recovery Point Objective (RPO) - 障害発生時にどこまでデータを復旧させるかの目標値 - Recovery Time Objective (RTO) - 障害発生時にどのくらいの時間で復旧できるかの目標値 - Service Level Agreement (SLA) - サービス提供者と利用者の間で結ばれるサービスのレベルの合意。 満たされなかった場合には利用料の減額などがある
  13. 29 SnowflakeのSLA SUPPORT POLICY AND SERVICE LEVEL AGREEMENT - 上記ページの中部に「II.

    Service Level Agreement」があります ※以下抜粋 - Monthly Availability Percentage:99.9% もし満たさない場合、使用量に応じてクレジットが付与 - 「I. Support」:Snowflakeのサポート対応に関する説明 「III. Policy Exclusions」:サポートとSLAの対象外となる項目 ※プレビュー機能など
  14. 30 参考:クラウドプロバイダー各社のSLA Amazon Compute サービスレベルアグリーメント Amazon S3 Service Level Agreement

    Microsoft Azure SLA for Virtual Machines Microsoft Azure SLA for Storage Accounts Google Cloud Compute Engine Service Level Agreement (SLA) Google Cloud Storage Service Level Agreement (SLA)
  15. 36 必要なパフォーマンスが出せるのか - 昨今のパフォーマンスを考える上での懸念事項 - アプリケーションサーバー - ニーズの変化による急激なアクセス増減 - データ分析

    - 分析対象のデータは量も種類も日々増える - いつクエリが多く発行されるかも不確定 - 正直、事前にどれだけのリソースが必要になるか予想 できない