Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NIFTY Tech Talk #08 ニフティのデータ基盤の話
Search
ニフティ株式会社
PRO
January 10, 2023
Video
Resources
Technology
0
120
NIFTY Tech Talk #08 ニフティのデータ基盤の話
ニフティ株式会社
PRO
January 10, 2023
Tweet
Share
Video
Resources
NIFTY Tech Talk #8 ニフティのデータ分析を語る会
https://nifty.connpass.com/event/268829/
More Decks by ニフティ株式会社
See All by ニフティ株式会社
Visual Studio Code Dev Containers ススメ Python編 - NIFTY Tech Talk #17
niftycorp
PRO
1
66
dotfilesを作ろう - NIFTY Tech Talk #17
niftycorp
PRO
1
70
フロントエンドを始める前に どうしていっぱいツールがあるの? - NIFTY Tech Talk #17
niftycorp
PRO
1
78
サービスシステム監視 (シフト例)
niftycorp
PRO
0
49
スクラムマスターの技を磨く! ニフティのスクラムトーク vol. 1 - NIFTY Tech Talk #16
niftycorp
PRO
1
96
AWS基礎 / 2023 ニフティ新人研修
niftycorp
PRO
0
200
データベース / 2023 ニフティ新人研修
niftycorp
PRO
0
110
フレームワーク フロントエンド / 2023 ニフティ新人研修
niftycorp
PRO
0
140
フレームワーク バックエンド / 2023 ニフティ新人研修
niftycorp
PRO
0
120
Other Decks in Technology
See All in Technology
サービス成長と共に肥大化するモノレポ、長くなるCI時間 / As services grow, monorepos get bigger and CI time gets longer
kohbis
5
2.1k
期待しすぎずに取り組む両面 TypeScript
shozawa
2
290
プッシュ型子育てサービスを、先行プロジェクト実施自治体において開始します
govtechtokyo
0
240
どう買う?Azure
kuniteru
1
190
TypeScript Quiz (Encraft #12 Frontend Quiz Night)
uhyo
2
340
オブジェクトのおしゃべり大失敗 メッセージングアンチパターン集 / messaging anti-pattern collection
ytake
0
330
「XX試験の環境作ってよ」と言われた時によく使うAWSのソリューションについて
bun913
0
120
GitHub最新情報キャッチアップ 2024年3月
dzeyelid
16
3.2k
Introduction to Jetpack Compose
pohjus
1
110
チーム単位で保守性を高める:独自指標と向上にむけた実践
tarappo
0
300
これまでのキャリアとこれからMLエンジニアとしてどう動くか
masatakashiwagi
0
290
既存プロセスからの脱却と変化に適応するために必要なこと
cybozuinsideout
PRO
2
170
Featured
See All Featured
The World Runs on Bad Software
bkeepers
PRO
60
6.6k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
19
1.9k
Done Done
chrislema
178
15k
Designing with Data
zakiwarfel
94
4.8k
Visualization
eitanlees
135
14k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
8
8.2k
A designer walks into a library…
pauljervisheath
199
23k
The Brand Is Dead. Long Live the Brand.
mthomps
48
21k
Testing 201, or: Great Expectations
jmmastey
27
6.3k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
240
1.2M
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
101
6.6k
GraphQLとの向き合い方2022年版
quramy
28
12k
Transcript
ニフティの データ基盤の話 2022.12.20 会員システムグループ/第三開発チーム 黒羽 孝夫
自己紹介
黒羽 孝夫 (くろばね たかお)
N1!データアーキテクト https://recruit.nifty.co.jp/interview/kurobane.htm
今回は データエンジニアとしての 話
目次 1. お伝えしたいこと 2. データ基盤の紹介 3. 抱えてる課題と今後の戦略 4. さいごに
1. お伝えしたいこと 2. データ基盤の紹介 3. 抱えてる課題と今後の戦略 4. さいごに
データ分析を始めたい データ基盤作りたい お伝えしたいことは・・・ 1つです
データ分析を始めるときに は データ基盤を進めるといい よ
用途が見えない状態で データ基盤を作るのは良くな い
データ基盤は 単体では価値が出しづら い
データ分析は 単体で価値は出せるけど 安定や高速化ってしづらい
データ分析とデータ基盤は 片方だけではなく、 どちらも考えておくのが良 い
ここに行き着いた理由につい て 触れさせてください
データを集めること は 目的ではない
集めることに 注力したことで 次のようなことが・・・
終わらないデータ収 集
あったら使う・便利か も (使わない)
長い目で見ると大事だけど、 重要でもないものまで 手をつけた
結果、活用は進まず 時間も溶けてしまった
部分的な成果を追って 失敗したことを共有したかっ た
今度こそ ニフティのデータ基盤のご紹 介
1. お伝えしたいこと 2. データ基盤の紹介 3. 抱えてる課題と今後の戦略 4. さいごに
立ち上げ時
データ基盤 立ち上げ前のフ ロー
収集するところを 改善
ココ
このときのポイントは2つ
(1)
既存資産の Tableauを活かす
(2)
データ収集は最低限
最低限ってどこよ?
どの粒度で 取得するか
範囲を限定して 立ち上げを優先
立ち上げ当初の構成
None
活用の事例も増加、 収集するデータも 順調に増やしていった
None
やりたいことが増えれば、 痒いところに手が届かなっ た
• データ追加に人手が不足 • テーブル同士の関係性が不明 • 特定のタイミングの スナップショットを取りたい • レスポンス低下 •
スロークエリ多発 ︙
現在の構成図
None
無加工のデータを蓄積
External Table定義と データ変換はdbtに集約
Reverse ETLは dbtで変換したテーブルを使用
レポーティングはTableau アドホックはRedash
1. お伝えしたいこと 2. データ基盤の紹介 3. 現在の課題と今後の戦略 4. まとめ
• メタデータがスプレッドシート • ワークロード管理が面倒 • BIの中がブラックボックス • データ収集の追加・変更が手間 • データ自体の品質が未計測
︙
• メタデータがスプレッドシート • ワークロード管理が面倒 • BIの中がブラックボックス • データ収集の追加・変更が手間 • データ自体の品質が未計測
︙
メタデータがスプレッドシート テーブルの定義や意味を手動管理していた。 更新が放置されたり、忘れたり、フォーマットを変えられたり、、、 信頼性はとても低い状態になっている。
メタデータがスプレッドシート テーブルの定義や意味を手動管理していた。 更新が放置されたり、忘れたり、フォーマットを変えられたり、、、 信頼性はとても低い状態になっている。 → テーブル定義やリネージは、dbtのドキュメント生成で賄えるか検 討。 実行後にドキュメントも合わせて更新させることで、 メタデータの品質を担保する。
データ収集の追加・変更が手間 テーブルの追加、変更などの作業、障害時の復旧、 サービス毎にお作法が異なるため学習コスト必要。
データ収集の追加・変更が手間 テーブルの追加、変更などの作業、障害時の復旧、 サービス毎にお作法が異なるため学習コスト必要。 → OSSのAirbyteや SaaSのFivetran, troccoも含めて検討。
1. お伝えしたいこと 2. データ基盤の紹介 3. 抱えてる課題と今後の戦略 4. さいごに
周辺技術が進歩したことで、 データエンジニアを始める際 に 下駄が履きやすい
新しいチャレンジを ニフティではやりやすい環境 が 整備されている
ニフティでは、 新しい仲間を募集しています https://recruit.nifty.co.jp/?utm_source=connpass&utm_medium=web&utm_campaign=2022122 0-techtalk
THANK YOU
QAタイム