Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Redash で踏み出す BI 導入はじめの一歩 / DataEngineeringStudy Redash

Redash で踏み出す BI 導入はじめの一歩 / DataEngineeringStudy Redash

Data Engineering Study #8「BIツール特集-OSS・商用の上手い使い分け」の発表資料です
https://forkwell.connpass.com/event/209803/

Takuya Arita

June 02, 2021
Tweet

More Decks by Takuya Arita

Other Decks in Programming

Transcript

  1. Redash で踏み出す
    BI 導入はじめの一歩
    Data Engineering Study #8
    Takuya Arita / @ariarijp

    View Slide

  2. ● Redash の紹介
    ● Redash 導入あるある
    ● Redash 導入チェックリスト
    ● デモ
    ● まとめ
    アジェンダ

    View Slide

  3. ● @ariarijp / 有田拓哉 / Takuya Arita
    ● 株式会社オープンエイト テクノロジー開発部所属
    ● Redash が好きでブログを書いたり、
    個人で Redash Meetup というイベントを主催しています
    自己紹介
    https://open8.com/

    View Slide

  4. Redash の紹介

    View Slide

  5. ● Arik Fraimovich 氏が中心となって開発している BI ツール
    ● 最大の特徴は「オープンソースソフトウェア(OSS)」であること
    ● クエリーエディタ、可視化、ダッシュボードなど、
    BI ツールに求められる機能を幅広くサポートしている
    ● サーバーの管理などが不要な SaaS 版も提供されている(有償)
    Redash について

    View Slide

  6. ● 低コストで使用でき、スモールスタートに向いている
    ● クラウド、オンプレなどの環境によらず導入できる
    ● 多くのデータソースをサポートしている
    ● SQL など、よく知られたクエリー言語を利用するため、
    Redash 自体の学習コストは低い
    ● SQL に不慣れでも、条件を変えたクエリーを発行できるため、
    エンジニアでなくても利用しやすい
    Redash のうれしいところ

    View Slide

  7. ● 導入や運用について、ドキュメントやコミュニティなどからの
    情報収集が必要になる
    ● UI やドキュメントは基本的にすべて英語
    ● クエリーやダッシュボードの乱立が課題になりがち
    ● 細やかな権限管理は苦手
    Redash の苦手なところ

    View Slide

  8. Redash 導入あるある

    View Slide

  9. ● データは DB や DWH に蓄積されているが、
    SQL を書けるのはエンジニアのみ
    ● データ抽出はエンジニアに依頼する
    ● 抽出条件を変えるだけのようなものでも依頼が必要で、
    エンジニアの稼働やリードタイムが課題になる
    Redash 導入あるある / 導入前

    View Slide

  10. ● エンジニアが SQL を書き、データの利用者はその SQL を
    利用して、誰でもデータ抽出ができる
    ● パラメーターを利用して、期間やキーワードなどの
    条件変更したデータ抽出ができる
    ● 可視化や通知を利用し、データの活用をすすめられる
    ● (応用編)Redash を使って、社内 SQL 勉強会を実施し、
    SQL を書ける・データベース設計を理解するメンバーを増やす
    Redash 導入あるある / 導入後

    View Slide

  11. Redash 導入チェックリスト

    View Slide

  12. ● 分析・活用したいデータは十分にあるか
    ● 接続先のデータソースはどこにあるか
    ● データの利用者とデータ特性があっているか
    ● Self-hosting する場合、運用の社内調整がついているか
    Redash 導入前に確認したいこと

    View Slide

  13. ● Redash の公式イメージを使用する
    ○ AWS, GCP を利用している場合は公式イメージを利用する
    ○ 性能要件はメモリ 2GB 以上、ストレージ 20GB 以上が基準
    ● 公式のセットアップスクリプトを利用する
    ○ 公開されているスクリプトを利用し、任意の環境に導入する
    ○ OS は Ubuntu 前提。性能要件は公式イメージと同様
    ● SaaS を利用する
    ○ クラウド上の DWH を利用している場合は選択肢に入る
    ○ SaaS の利用コストがかかる($49〜/月)
    Redash 導入パターン

    View Slide

  14. ● Self-hosting には少なくとも以下のコストがかかる
    ○ Redash が動作するサーバーのコスト
    ■ AWS EC2 t2.small の場合、約3,000円〜/月
    ○ Redash を初期構築・運用するエンジニアの稼働
    ● Self-hosting している事例が多いが、エンジニア組織が
    社内にない場合は運用が難しいため、Self-hosting をおすすめしない
    よくある誤解: Redash は無料で利用できる

    View Slide

  15. Redash デモ

    View Slide

  16. ● データソースに接続する
    ● クエリーを作成する
    ● クエリーを Fork する
    ● パラメータを使う
    ● 可視化する
    ● ダッシュボードを作成する
    ● Python データソース、Query Results データソース
    デモの内容

    View Slide

  17. まとめ

    View Slide

  18. ● Redash は低コストかつ高機能。クラウド・オンプレによらず
    導入することができ、スモールスタートにも向いている
    ● データ抽出には SQL を利用するため、
    Redash の使い方自体を学ぶ必要はほとんど無い
    ● コスト面・環境面での導入容易性は大きなメリットではあるが、
    導入前のデータ整備状況確認や、運用についての検討は入念に
    Takeaways

    View Slide

  19. Happy Querying!

    View Slide

  20. ● Redash
    ○ https://redash.io/
    ● Redash Meetup
    ○ https://redash-meetup.connpass.com/
    ● Redash ユーザーフォーラム(日本語)
    ○ https://discuss.redash.io/c/japanese/12
    ● ariarijp’s blog(ほぼ Redash ブログです)
    ○ https://ariarijp.hatenablog.com/
    Appendix: リンク集

    View Slide