Slide 1

Slide 1 text

Redash で踏み出す BI 導入はじめの一歩 Data Engineering Study #8 Takuya Arita / @ariarijp

Slide 2

Slide 2 text

● Redash の紹介 ● Redash 導入あるある ● Redash 導入チェックリスト ● デモ ● まとめ アジェンダ

Slide 3

Slide 3 text

● @ariarijp / 有田拓哉 / Takuya Arita ● 株式会社オープンエイト テクノロジー開発部所属 ● Redash が好きでブログを書いたり、 個人で Redash Meetup というイベントを主催しています 自己紹介 https://open8.com/

Slide 4

Slide 4 text

Redash の紹介

Slide 5

Slide 5 text

● Arik Fraimovich 氏が中心となって開発している BI ツール ● 最大の特徴は「オープンソースソフトウェア(OSS)」であること ● クエリーエディタ、可視化、ダッシュボードなど、 BI ツールに求められる機能を幅広くサポートしている ● サーバーの管理などが不要な SaaS 版も提供されている(有償) Redash について

Slide 6

Slide 6 text

● 低コストで使用でき、スモールスタートに向いている ● クラウド、オンプレなどの環境によらず導入できる ● 多くのデータソースをサポートしている ● SQL など、よく知られたクエリー言語を利用するため、 Redash 自体の学習コストは低い ● SQL に不慣れでも、条件を変えたクエリーを発行できるため、 エンジニアでなくても利用しやすい Redash のうれしいところ

Slide 7

Slide 7 text

● 導入や運用について、ドキュメントやコミュニティなどからの 情報収集が必要になる ● UI やドキュメントは基本的にすべて英語 ● クエリーやダッシュボードの乱立が課題になりがち ● 細やかな権限管理は苦手 Redash の苦手なところ

Slide 8

Slide 8 text

Redash 導入あるある

Slide 9

Slide 9 text

● データは DB や DWH に蓄積されているが、 SQL を書けるのはエンジニアのみ ● データ抽出はエンジニアに依頼する ● 抽出条件を変えるだけのようなものでも依頼が必要で、 エンジニアの稼働やリードタイムが課題になる Redash 導入あるある / 導入前

Slide 10

Slide 10 text

● エンジニアが SQL を書き、データの利用者はその SQL を 利用して、誰でもデータ抽出ができる ● パラメーターを利用して、期間やキーワードなどの 条件変更したデータ抽出ができる ● 可視化や通知を利用し、データの活用をすすめられる ● (応用編)Redash を使って、社内 SQL 勉強会を実施し、 SQL を書ける・データベース設計を理解するメンバーを増やす Redash 導入あるある / 導入後

Slide 11

Slide 11 text

Redash 導入チェックリスト

Slide 12

Slide 12 text

● 分析・活用したいデータは十分にあるか ● 接続先のデータソースはどこにあるか ● データの利用者とデータ特性があっているか ● Self-hosting する場合、運用の社内調整がついているか Redash 導入前に確認したいこと

Slide 13

Slide 13 text

● Redash の公式イメージを使用する ○ AWS, GCP を利用している場合は公式イメージを利用する ○ 性能要件はメモリ 2GB 以上、ストレージ 20GB 以上が基準 ● 公式のセットアップスクリプトを利用する ○ 公開されているスクリプトを利用し、任意の環境に導入する ○ OS は Ubuntu 前提。性能要件は公式イメージと同様 ● SaaS を利用する ○ クラウド上の DWH を利用している場合は選択肢に入る ○ SaaS の利用コストがかかる($49〜/月) Redash 導入パターン

Slide 14

Slide 14 text

● Self-hosting には少なくとも以下のコストがかかる ○ Redash が動作するサーバーのコスト ■ AWS EC2 t2.small の場合、約3,000円〜/月 ○ Redash を初期構築・運用するエンジニアの稼働 ● Self-hosting している事例が多いが、エンジニア組織が 社内にない場合は運用が難しいため、Self-hosting をおすすめしない よくある誤解: Redash は無料で利用できる

Slide 15

Slide 15 text

Redash デモ

Slide 16

Slide 16 text

● データソースに接続する ● クエリーを作成する ● クエリーを Fork する ● パラメータを使う ● 可視化する ● ダッシュボードを作成する ● Python データソース、Query Results データソース デモの内容

Slide 17

Slide 17 text

まとめ

Slide 18

Slide 18 text

● Redash は低コストかつ高機能。クラウド・オンプレによらず 導入することができ、スモールスタートにも向いている ● データ抽出には SQL を利用するため、 Redash の使い方自体を学ぶ必要はほとんど無い ● コスト面・環境面での導入容易性は大きなメリットではあるが、 導入前のデータ整備状況確認や、運用についての検討は入念に Takeaways

Slide 19

Slide 19 text

Happy Querying!

Slide 20

Slide 20 text

● Redash ○ https://redash.io/ ● Redash Meetup ○ https://redash-meetup.connpass.com/ ● Redash ユーザーフォーラム(日本語) ○ https://discuss.redash.io/c/japanese/12 ● ariarijp’s blog(ほぼ Redash ブログです) ○ https://ariarijp.hatenablog.com/ Appendix: リンク集