Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Redash で踏み出す BI 導入はじめの一歩 / DataEngineeringStudy Redash

Redash で踏み出す BI 導入はじめの一歩 / DataEngineeringStudy Redash

Data Engineering Study #8「BIツール特集-OSS・商用の上手い使い分け」の発表資料です
https://forkwell.connpass.com/event/209803/

3a622e726b35fe71480166a16edcb66e?s=128

Takuya Arita

June 02, 2021
Tweet

Transcript

  1. Redash で踏み出す BI 導入はじめの一歩 Data Engineering Study #8 Takuya Arita

    / @ariarijp
  2. • Redash の紹介 • Redash 導入あるある • Redash 導入チェックリスト •

    デモ • まとめ アジェンダ
  3. • @ariarijp / 有田拓哉 / Takuya Arita • 株式会社オープンエイト テクノロジー開発部所属

    • Redash が好きでブログを書いたり、 個人で Redash Meetup というイベントを主催しています 自己紹介 https://open8.com/
  4. Redash の紹介

  5. • Arik Fraimovich 氏が中心となって開発している BI ツール • 最大の特徴は「オープンソースソフトウェア(OSS)」であること • クエリーエディタ、可視化、ダッシュボードなど、

    BI ツールに求められる機能を幅広くサポートしている • サーバーの管理などが不要な SaaS 版も提供されている(有償) Redash について
  6. • 低コストで使用でき、スモールスタートに向いている • クラウド、オンプレなどの環境によらず導入できる • 多くのデータソースをサポートしている • SQL など、よく知られたクエリー言語を利用するため、 Redash

    自体の学習コストは低い • SQL に不慣れでも、条件を変えたクエリーを発行できるため、 エンジニアでなくても利用しやすい Redash のうれしいところ
  7. • 導入や運用について、ドキュメントやコミュニティなどからの 情報収集が必要になる • UI やドキュメントは基本的にすべて英語 • クエリーやダッシュボードの乱立が課題になりがち • 細やかな権限管理は苦手

    Redash の苦手なところ
  8. Redash 導入あるある

  9. • データは DB や DWH に蓄積されているが、 SQL を書けるのはエンジニアのみ • データ抽出はエンジニアに依頼する

    • 抽出条件を変えるだけのようなものでも依頼が必要で、 エンジニアの稼働やリードタイムが課題になる Redash 導入あるある / 導入前
  10. • エンジニアが SQL を書き、データの利用者はその SQL を 利用して、誰でもデータ抽出ができる • パラメーターを利用して、期間やキーワードなどの 条件変更したデータ抽出ができる

    • 可視化や通知を利用し、データの活用をすすめられる • (応用編)Redash を使って、社内 SQL 勉強会を実施し、 SQL を書ける・データベース設計を理解するメンバーを増やす Redash 導入あるある / 導入後
  11. Redash 導入チェックリスト

  12. • 分析・活用したいデータは十分にあるか • 接続先のデータソースはどこにあるか • データの利用者とデータ特性があっているか • Self-hosting する場合、運用の社内調整がついているか Redash

    導入前に確認したいこと
  13. • Redash の公式イメージを使用する ◦ AWS, GCP を利用している場合は公式イメージを利用する ◦ 性能要件はメモリ 2GB

    以上、ストレージ 20GB 以上が基準 • 公式のセットアップスクリプトを利用する ◦ 公開されているスクリプトを利用し、任意の環境に導入する ◦ OS は Ubuntu 前提。性能要件は公式イメージと同様 • SaaS を利用する ◦ クラウド上の DWH を利用している場合は選択肢に入る ◦ SaaS の利用コストがかかる($49〜/月) Redash 導入パターン
  14. • Self-hosting には少なくとも以下のコストがかかる ◦ Redash が動作するサーバーのコスト ▪ AWS EC2 t2.small

    の場合、約3,000円〜/月 ◦ Redash を初期構築・運用するエンジニアの稼働 • Self-hosting している事例が多いが、エンジニア組織が 社内にない場合は運用が難しいため、Self-hosting をおすすめしない よくある誤解: Redash は無料で利用できる
  15. Redash デモ

  16. • データソースに接続する • クエリーを作成する • クエリーを Fork する • パラメータを使う

    • 可視化する • ダッシュボードを作成する • Python データソース、Query Results データソース デモの内容
  17. まとめ

  18. • Redash は低コストかつ高機能。クラウド・オンプレによらず 導入することができ、スモールスタートにも向いている • データ抽出には SQL を利用するため、 Redash の使い方自体を学ぶ必要はほとんど無い

    • コスト面・環境面での導入容易性は大きなメリットではあるが、 導入前のデータ整備状況確認や、運用についての検討は入念に Takeaways
  19. Happy Querying!

  20. • Redash ◦ https://redash.io/ • Redash Meetup ◦ https://redash-meetup.connpass.com/ •

    Redash ユーザーフォーラム(日本語) ◦ https://discuss.redash.io/c/japanese/12 • ariarijp’s blog(ほぼ Redash ブログです) ◦ https://ariarijp.hatenablog.com/ Appendix: リンク集