Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NIFTY Tech Talk #08 ニフティのデータ基盤の話
Search
ニフティ株式会社
PRO
January 10, 2023
Video
Resources
Technology
0
290
NIFTY Tech Talk #08 ニフティのデータ基盤の話
ニフティ株式会社
PRO
January 10, 2023
Tweet
Share
Video
Resources
NIFTY Tech Talk #8 ニフティのデータ分析を語る会
https://nifty.connpass.com/event/268829/
More Decks by ニフティ株式会社
See All by ニフティ株式会社
なぜISPでオリジナルカードゲームを作ったのか?制作者と対談 - NIFTY Tech Talk #25
niftycorp
PRO
0
41
「なぜかネットが遅い」を“見える化”する 〜マイ ニフティが繋ぐサポートと暮らし〜 - NIKKEI Tech Talk #39
niftycorp
PRO
0
100
InnerSource Summit 2025 Three points that promoted innersource activities
niftycorp
PRO
0
140
Maker Faire Tokyo 2025 出展うらばなし - NIFTY Tech Talk #25
niftycorp
PRO
0
75
Private Status Pageの設定と活用 〜インシデントレスポンスへの活用とStatus Page運用をどうするか?〜
niftycorp
PRO
0
110
ニフティのPagerDuty活用状況
niftycorp
PRO
0
110
会員管理基盤をオンプレからクラウド移行した時に起きた障害たち - asken tech talk vol.13
niftycorp
PRO
0
2.6k
モニタリング統一への道のり - 分散モニタリングツール統合のためのオブザーバビリティプロジェクト
niftycorp
PRO
1
1k
2025-07-08 InnerSource Commons Japan Meetup #14 【OST】チームの壁、ぶっ壊そ!壁の乗り越え方、一緒に考えよう!
niftycorp
PRO
0
110
Other Decks in Technology
See All in Technology
AIの長期記憶と短期記憶の違いについてAgentCoreを例に深掘ってみた
yakumo
4
460
regrowth_tokyo_2025_securityagent
hiashisan
0
260
AWSを使う上で最低限知っておきたいセキュリティ研修を社内で実施した話 ~みんなでやるセキュリティ~
maimyyym
2
1.8k
Amazon Quick Suite で始める手軽な AI エージェント
shimy
0
830
Strands Agents × インタリーブ思考 で変わるAIエージェント設計 / Strands Agents x Interleaved Thinking AI Agents
takanorig
3
940
AWS re:Invent 2025で見たGrafana最新機能の紹介
hamadakoji
0
430
寫了幾年 Code,然後呢?軟體工程師必須重新認識的 DevOps
cheng_wei_chen
1
1.5k
AI時代の新規LLMプロダクト開発: Findy Insightsを3ヶ月で立ち上げた舞台裏と振り返り
dakuon
0
260
AI 駆動開発勉強会 フロントエンド支部 #1 w/あずもば
1ftseabass
PRO
0
410
SREには開発組織全体で向き合う
koh_naga
0
390
「図面」から「法則」へ 〜メタ視点で読み解く現代のソフトウェアアーキテクチャ〜
scova0731
0
390
[デモです] NotebookLM で作ったスライドの例
kongmingstrap
0
170
Featured
See All Featured
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.7k
[RailsConf 2023] Rails as a piece of cake
palkan
58
6.2k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
115
91k
We Are The Robots
honzajavorek
0
110
Rails Girls Zürich Keynote
gr2m
95
14k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.3k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
The World Runs on Bad Software
bkeepers
PRO
72
12k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.8k
Navigating Team Friction
lara
191
16k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
46
Transcript
ニフティの データ基盤の話 2022.12.20 会員システムグループ/第三開発チーム 黒羽 孝夫
自己紹介
黒羽 孝夫 (くろばね たかお)
N1!データアーキテクト https://recruit.nifty.co.jp/interview/kurobane.htm
今回は データエンジニアとしての 話
目次 1. お伝えしたいこと 2. データ基盤の紹介 3. 抱えてる課題と今後の戦略 4. さいごに
1. お伝えしたいこと 2. データ基盤の紹介 3. 抱えてる課題と今後の戦略 4. さいごに
データ分析を始めたい データ基盤作りたい お伝えしたいことは・・・ 1つです
データ分析を始めるときに は データ基盤を進めるといい よ
用途が見えない状態で データ基盤を作るのは良くな い
データ基盤は 単体では価値が出しづら い
データ分析は 単体で価値は出せるけど 安定や高速化ってしづらい
データ分析とデータ基盤は 片方だけではなく、 どちらも考えておくのが良 い
ここに行き着いた理由につい て 触れさせてください
データを集めること は 目的ではない
集めることに 注力したことで 次のようなことが・・・
終わらないデータ収 集
あったら使う・便利か も (使わない)
長い目で見ると大事だけど、 重要でもないものまで 手をつけた
結果、活用は進まず 時間も溶けてしまった
部分的な成果を追って 失敗したことを共有したかっ た
今度こそ ニフティのデータ基盤のご紹 介
1. お伝えしたいこと 2. データ基盤の紹介 3. 抱えてる課題と今後の戦略 4. さいごに
立ち上げ時
データ基盤 立ち上げ前のフ ロー
収集するところを 改善
ココ
このときのポイントは2つ
(1)
既存資産の Tableauを活かす
(2)
データ収集は最低限
最低限ってどこよ?
どの粒度で 取得するか
範囲を限定して 立ち上げを優先
立ち上げ当初の構成
None
活用の事例も増加、 収集するデータも 順調に増やしていった
None
やりたいことが増えれば、 痒いところに手が届かなっ た
• データ追加に人手が不足 • テーブル同士の関係性が不明 • 特定のタイミングの スナップショットを取りたい • レスポンス低下 •
スロークエリ多発 ︙
現在の構成図
None
無加工のデータを蓄積
External Table定義と データ変換はdbtに集約
Reverse ETLは dbtで変換したテーブルを使用
レポーティングはTableau アドホックはRedash
1. お伝えしたいこと 2. データ基盤の紹介 3. 現在の課題と今後の戦略 4. まとめ
• メタデータがスプレッドシート • ワークロード管理が面倒 • BIの中がブラックボックス • データ収集の追加・変更が手間 • データ自体の品質が未計測
︙
• メタデータがスプレッドシート • ワークロード管理が面倒 • BIの中がブラックボックス • データ収集の追加・変更が手間 • データ自体の品質が未計測
︙
メタデータがスプレッドシート テーブルの定義や意味を手動管理していた。 更新が放置されたり、忘れたり、フォーマットを変えられたり、、、 信頼性はとても低い状態になっている。
メタデータがスプレッドシート テーブルの定義や意味を手動管理していた。 更新が放置されたり、忘れたり、フォーマットを変えられたり、、、 信頼性はとても低い状態になっている。 → テーブル定義やリネージは、dbtのドキュメント生成で賄えるか検 討。 実行後にドキュメントも合わせて更新させることで、 メタデータの品質を担保する。
データ収集の追加・変更が手間 テーブルの追加、変更などの作業、障害時の復旧、 サービス毎にお作法が異なるため学習コスト必要。
データ収集の追加・変更が手間 テーブルの追加、変更などの作業、障害時の復旧、 サービス毎にお作法が異なるため学習コスト必要。 → OSSのAirbyteや SaaSのFivetran, troccoも含めて検討。
1. お伝えしたいこと 2. データ基盤の紹介 3. 抱えてる課題と今後の戦略 4. さいごに
周辺技術が進歩したことで、 データエンジニアを始める際 に 下駄が履きやすい
新しいチャレンジを ニフティではやりやすい環境 が 整備されている
ニフティでは、 新しい仲間を募集しています https://recruit.nifty.co.jp/?utm_source=connpass&utm_medium=web&utm_campaign=2022122 0-techtalk
THANK YOU
QAタイム