Data Engineering Study #8「BIツール特集-OSS・商用の上手い使い分け」の発表資料です https://forkwell.connpass.com/event/209803/
Redash で踏み出すBI 導入はじめの一歩Data Engineering Study #8Takuya Arita / @ariarijp
View Slide
● Redash の紹介● Redash 導入あるある● Redash 導入チェックリスト● デモ● まとめアジェンダ
● @ariarijp / 有田拓哉 / Takuya Arita● 株式会社オープンエイト テクノロジー開発部所属● Redash が好きでブログを書いたり、個人で Redash Meetup というイベントを主催しています自己紹介https://open8.com/
Redash の紹介
● Arik Fraimovich 氏が中心となって開発している BI ツール● 最大の特徴は「オープンソースソフトウェア(OSS)」であること● クエリーエディタ、可視化、ダッシュボードなど、BI ツールに求められる機能を幅広くサポートしている● サーバーの管理などが不要な SaaS 版も提供されている(有償)Redash について
● 低コストで使用でき、スモールスタートに向いている● クラウド、オンプレなどの環境によらず導入できる● 多くのデータソースをサポートしている● SQL など、よく知られたクエリー言語を利用するため、Redash 自体の学習コストは低い● SQL に不慣れでも、条件を変えたクエリーを発行できるため、エンジニアでなくても利用しやすいRedash のうれしいところ
● 導入や運用について、ドキュメントやコミュニティなどからの情報収集が必要になる● UI やドキュメントは基本的にすべて英語● クエリーやダッシュボードの乱立が課題になりがち● 細やかな権限管理は苦手Redash の苦手なところ
Redash 導入あるある
● データは DB や DWH に蓄積されているが、SQL を書けるのはエンジニアのみ● データ抽出はエンジニアに依頼する● 抽出条件を変えるだけのようなものでも依頼が必要で、エンジニアの稼働やリードタイムが課題になるRedash 導入あるある / 導入前
● エンジニアが SQL を書き、データの利用者はその SQL を利用して、誰でもデータ抽出ができる● パラメーターを利用して、期間やキーワードなどの条件変更したデータ抽出ができる● 可視化や通知を利用し、データの活用をすすめられる● (応用編)Redash を使って、社内 SQL 勉強会を実施し、SQL を書ける・データベース設計を理解するメンバーを増やすRedash 導入あるある / 導入後
Redash 導入チェックリスト
● 分析・活用したいデータは十分にあるか● 接続先のデータソースはどこにあるか● データの利用者とデータ特性があっているか● Self-hosting する場合、運用の社内調整がついているかRedash 導入前に確認したいこと
● Redash の公式イメージを使用する○ AWS, GCP を利用している場合は公式イメージを利用する○ 性能要件はメモリ 2GB 以上、ストレージ 20GB 以上が基準● 公式のセットアップスクリプトを利用する○ 公開されているスクリプトを利用し、任意の環境に導入する○ OS は Ubuntu 前提。性能要件は公式イメージと同様● SaaS を利用する○ クラウド上の DWH を利用している場合は選択肢に入る○ SaaS の利用コストがかかる($49〜/月)Redash 導入パターン
● Self-hosting には少なくとも以下のコストがかかる○ Redash が動作するサーバーのコスト■ AWS EC2 t2.small の場合、約3,000円〜/月○ Redash を初期構築・運用するエンジニアの稼働● Self-hosting している事例が多いが、エンジニア組織が社内にない場合は運用が難しいため、Self-hosting をおすすめしないよくある誤解: Redash は無料で利用できる
Redash デモ
● データソースに接続する● クエリーを作成する● クエリーを Fork する● パラメータを使う● 可視化する● ダッシュボードを作成する● Python データソース、Query Results データソースデモの内容
まとめ
● Redash は低コストかつ高機能。クラウド・オンプレによらず導入することができ、スモールスタートにも向いている● データ抽出には SQL を利用するため、Redash の使い方自体を学ぶ必要はほとんど無い● コスト面・環境面での導入容易性は大きなメリットではあるが、導入前のデータ整備状況確認や、運用についての検討は入念にTakeaways
Happy Querying!
● Redash○ https://redash.io/● Redash Meetup○ https://redash-meetup.connpass.com/● Redash ユーザーフォーラム(日本語)○ https://discuss.redash.io/c/japanese/12● ariarijp’s blog(ほぼ Redash ブログです)○ https://ariarijp.hatenablog.com/Appendix: リンク集