Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Redash で踏み出す BI 導入はじめの一歩 / DataEngineeringStudy Redash
Search
Takuya Arita
June 02, 2021
Programming
1
1.5k
Redash で踏み出す BI 導入はじめの一歩 / DataEngineeringStudy Redash
Data Engineering Study #8「BIツール特集-OSS・商用の上手い使い分け」の発表資料です
https://forkwell.connpass.com/event/209803/
Takuya Arita
June 02, 2021
Tweet
Share
More Decks by Takuya Arita
See All by Takuya Arita
Hosted Redash の EOL と移行ツール redash-migrate / You should know about Hosted Redash EOL and redash-migrate
ariarijp
0
2.7k
Redash のいま / Redash in 2021
ariarijp
2
910
Redash 導入・運用を4年ぐらいやって変わったこと・変わらなかったこと / Changed and unchanged things with Redash and me
ariarijp
0
1.2k
5年前の自分に伝えたい広告 API 周辺の歩き方 / SOT Tech Night vol.1
ariarijp
1
400
使われていない、を知る / How do we know unused things in the real world?
ariarijp
0
360
MULTI_ORG について / What is MULTI_ORG in Redash
ariarijp
1
2.9k
あらためて振り返る Redash の使いどころ / Why I strongly recommend Redash
ariarijp
2
1.1k
PHP Data Structures
ariarijp
1
490
サーバー監視[自作]入門 / How to build monitoring system with Redash
ariarijp
0
620
Other Decks in Programming
See All in Programming
Dockerで始めるAWS Lambda開発
stutkhd0709
13
2.5k
WebComponentsで フレームワークを1ページに共存させる
webuilder240
0
150
Deno に Web 標準 API を実装する / Implementing Web Standard API to Deno
petamoriken
0
350
Enhancing Applications with Accessibility API
kishikawakatsumi
3
890
もうすぐ新年度、Babylon.jsがお勧めな3個の理由
hideg
0
160
ONE WEDGE_Company_Information
1wedge
0
170
設計の知識と技能で駆動するソフトウェア開発
masuda220
PRO
18
10k
ファイル先頭の use の意味、説明できますか? 〜PHP の namespace と autoloading の関係を正しく理解しよう〜 / namespace and autoloading in php
okashoi
2
470
Ruby製社内ツールのGo移行
bgpat
2
260
自作ソフト(VMagicMirror)がVRMA対応してる話+実装のTips
bakudreameater
0
110
TCAの Shared Stateって どういう仕組みになってんの?
yimajo
0
330
実践!RDRAを活用した既存システムの仕様変更 / Specification Changes in Existing Systems Utilizing RDRA
imamotohikaru
0
2.5k
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
8
8.2k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3k
Building Flexible Design Systems
yeseniaperezcruz
317
37k
Designing with Data
zakiwarfel
94
4.8k
StorybookのUI Testing Handbookを読んだ
zakiyama
10
4.5k
4 Signs Your Business is Dying
shpigford
174
21k
The MySQL Ecosystem @ GitHub 2015
samlambert
242
12k
Intergalactic Javascript Robots from Outer Space
tanoku
266
26k
The Illustrated Children's Guide to Kubernetes
chrisshort
28
46k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
242
20k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
185
15k
Into the Great Unknown - MozCon
thekraken
10
830
Transcript
Redash で踏み出す BI 導入はじめの一歩 Data Engineering Study #8 Takuya Arita
/ @ariarijp
• Redash の紹介 • Redash 導入あるある • Redash 導入チェックリスト •
デモ • まとめ アジェンダ
• @ariarijp / 有田拓哉 / Takuya Arita • 株式会社オープンエイト テクノロジー開発部所属
• Redash が好きでブログを書いたり、 個人で Redash Meetup というイベントを主催しています 自己紹介 https://open8.com/
Redash の紹介
• Arik Fraimovich 氏が中心となって開発している BI ツール • 最大の特徴は「オープンソースソフトウェア(OSS)」であること • クエリーエディタ、可視化、ダッシュボードなど、
BI ツールに求められる機能を幅広くサポートしている • サーバーの管理などが不要な SaaS 版も提供されている(有償) Redash について
• 低コストで使用でき、スモールスタートに向いている • クラウド、オンプレなどの環境によらず導入できる • 多くのデータソースをサポートしている • SQL など、よく知られたクエリー言語を利用するため、 Redash
自体の学習コストは低い • SQL に不慣れでも、条件を変えたクエリーを発行できるため、 エンジニアでなくても利用しやすい Redash のうれしいところ
• 導入や運用について、ドキュメントやコミュニティなどからの 情報収集が必要になる • UI やドキュメントは基本的にすべて英語 • クエリーやダッシュボードの乱立が課題になりがち • 細やかな権限管理は苦手
Redash の苦手なところ
Redash 導入あるある
• データは DB や DWH に蓄積されているが、 SQL を書けるのはエンジニアのみ • データ抽出はエンジニアに依頼する
• 抽出条件を変えるだけのようなものでも依頼が必要で、 エンジニアの稼働やリードタイムが課題になる Redash 導入あるある / 導入前
• エンジニアが SQL を書き、データの利用者はその SQL を 利用して、誰でもデータ抽出ができる • パラメーターを利用して、期間やキーワードなどの 条件変更したデータ抽出ができる
• 可視化や通知を利用し、データの活用をすすめられる • (応用編)Redash を使って、社内 SQL 勉強会を実施し、 SQL を書ける・データベース設計を理解するメンバーを増やす Redash 導入あるある / 導入後
Redash 導入チェックリスト
• 分析・活用したいデータは十分にあるか • 接続先のデータソースはどこにあるか • データの利用者とデータ特性があっているか • Self-hosting する場合、運用の社内調整がついているか Redash
導入前に確認したいこと
• Redash の公式イメージを使用する ◦ AWS, GCP を利用している場合は公式イメージを利用する ◦ 性能要件はメモリ 2GB
以上、ストレージ 20GB 以上が基準 • 公式のセットアップスクリプトを利用する ◦ 公開されているスクリプトを利用し、任意の環境に導入する ◦ OS は Ubuntu 前提。性能要件は公式イメージと同様 • SaaS を利用する ◦ クラウド上の DWH を利用している場合は選択肢に入る ◦ SaaS の利用コストがかかる($49〜/月) Redash 導入パターン
• Self-hosting には少なくとも以下のコストがかかる ◦ Redash が動作するサーバーのコスト ▪ AWS EC2 t2.small
の場合、約3,000円〜/月 ◦ Redash を初期構築・運用するエンジニアの稼働 • Self-hosting している事例が多いが、エンジニア組織が 社内にない場合は運用が難しいため、Self-hosting をおすすめしない よくある誤解: Redash は無料で利用できる
Redash デモ
• データソースに接続する • クエリーを作成する • クエリーを Fork する • パラメータを使う
• 可視化する • ダッシュボードを作成する • Python データソース、Query Results データソース デモの内容
まとめ
• Redash は低コストかつ高機能。クラウド・オンプレによらず 導入することができ、スモールスタートにも向いている • データ抽出には SQL を利用するため、 Redash の使い方自体を学ぶ必要はほとんど無い
• コスト面・環境面での導入容易性は大きなメリットではあるが、 導入前のデータ整備状況確認や、運用についての検討は入念に Takeaways
Happy Querying!
• Redash ◦ https://redash.io/ • Redash Meetup ◦ https://redash-meetup.connpass.com/ •
Redash ユーザーフォーラム(日本語) ◦ https://discuss.redash.io/c/japanese/12 • ariarijp’s blog(ほぼ Redash ブログです) ◦ https://ariarijp.hatenablog.com/ Appendix: リンク集