Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
『エンタープライズ』という言葉の重さ 〜Data Vault 2.0をやめた2022年冬〜
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ikeda-masashi
December 14, 2022
Technology
2
5.8k
『エンタープライズ』という言葉の重さ 〜Data Vault 2.0をやめた2022年冬〜
https://forkwell.connpass.com/event/263245/
こちらのイベントの登壇内容です。
ikeda-masashi
December 14, 2022
Tweet
Share
More Decks by ikeda-masashi
See All by ikeda-masashi
コーディングエージェントに 独自Extension書かせてみた
mashiike
0
66
Redshiftを中心としたAWSでのデータ基盤
mashiike
0
310
運用の役立たないダッシュボードの作り方。
mashiike
3
1.2k
Amazon Aurora MySQL と Amazon Redshift の Zero-ETL Integration について使い所を考えてみた!
mashiike
0
990
Warningアラートを放置しない!アラート駆動でログやメトリックを自動収集する仕組みによる恩恵
mashiike
6
4.8k
Prepalert ~Mackerelアラートにログや集計値を貼り付けてくれるトイル削減ツール~
mashiike
0
2.1k
人狼ゲームで考えるデータ基盤 〜データとはいったい・・・〜
mashiike
0
440
Redshift ServerlessとProvisioned Cluster のちょっとした違い
mashiike
0
7.1k
「北欧、暮らしの道具店」のデータ基盤の変遷
mashiike
1
3.7k
Other Decks in Technology
See All in Technology
最強のAIエージェントを諦めたら品質が上がった話 / how quality improved after giving up on the strongest AI agent
kt2mikan
0
160
2026-03-11 JAWS-UG 茨城 #12 改めてALBを便利に使う
masasuzu
2
370
堅牢.py#2 LT資料
t3tra
0
140
事例に見るスマートファクトリーへの道筋〜工場データをAI Readyにする実践ステップ〜
hamadakoji
1
300
AIエージェント、 社内展開の前に知っておきたいこと
oracle4engineer
PRO
2
110
オレ達はAWS管理をやりたいんじゃない!開発の生産性を爆アゲしたいんだ!!
wkm2
4
500
Claude Code のコード品質がばらつくので AI に品質保証させる仕組みを作った話 / A story about building a mechanism to have AI ensure quality, because the code quality from Claude Code was inconsistent
nrslib
13
7.1k
Datadog の RBAC のすべて
nulabinc
PRO
3
450
S3はフラットである –AWS公式SDKにも存在した、 署名付きURLにおけるパストラバーサル脆弱性– / JAWS DAYS 2026
flatt_security
0
1.7k
製造業ドメインにおける LLMプロダクト構築: 複雑な文脈へのアプローチ
caddi_eng
1
560
Claude Codeの進化と各機能の活かし方
oikon48
22
12k
モブプログラミング再入門 ー 基本から見直す、AI時代のチーム開発の選択肢 ー / A Re-introduction of Mob Programming
takaking22
5
1.3k
Featured
See All Featured
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.5k
The Language of Interfaces
destraynor
162
26k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
140
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Amusing Abliteration
ianozsvald
0
130
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
210
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
140
First, design no harm
axbom
PRO
2
1.1k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
110
Transcript
『エンタープライズ』という言葉の重さ 〜 Data Vault 2.0をやめた2022年冬〜 2022/12/14 Data Engineering Study #17
18:25〜 池田将士
自己紹介 池田 将士 (@mashiike) 面白法人カヤック その他事業部 SREチーム所属 データエンジニア/サーバーサイドエンジニア 出身: 千葉県
趣味: オンラインゲームと食べ比べ、飲み比べ
会社紹介 鎌倉の地にて、主にWeb技術を用いて 人の印象に深く残るような面白コンテンツを作る会社 ゲームからWebサービス、ミュージアムetc… 様々なことに挑戦 ※幅広く挑戦しすぎて、 中の人も何の会社なのかよくわからないことも・・・
皆様 Data Vault 2.0 って知っていますか?
スケーラブルなエンタープライズ・ データウェアハウスを設計できるモ デリング手法Hub,Link, Satelliteと いう3つの構成要素で3NF系で・・・ (以下略
要は Agileに、 監査性のあって、 スケールしやすい データウェアハウス を構築できる手法!? (暴論)
約1年と4半期前(15ヶ月前) https://speakerdeck.com/mashiike/tonamelfalsedetaji-pan-detamoderingubian
15ヶ月前の状況 (2021/09頃) プロダクト側 • サーバーサイドエンジニア: 約3人 • サービス数(データソース数): 2個 データ基盤側
• データエンジニア: 約0.6人 (1人が他案件と兼務)
DataVault2.0いいぞ!!!
1年前の状況 (2022/01頃) プロダクト側 • サーバーサイドエンジニア: 約3人 => 約4人 • サービス数(データソース数):
2個 => 4個 データ基盤側 • データエンジニア: 約0.6人 (1人が他案件と兼務)
連携先(DB)が増えても 楽に対応できる!!いいね!
半年前の状況 (2022/06頃) プロダクト側 • サーバーサイドエンジニア: 約4人 => 約5人 • サービス数(データソース数):
4個 => 5個+α データ基盤側 • データエンジニア: 約0.6人 (1人が他案件と兼務)
ん?ちょっとまって・・・ プロダクトの開発早くない?
ちょっと前の状況 (2022/09頃) プロダクト側 • サーバーサイドエンジニア: 約6人 • サービス数(データソース数): 5個+α データ基盤側
• データエンジニア: 約0.6人 (1人が他案件と兼務)
お気づきだろうか? プロダクトの開発チームは スケールするが データチームは スケールしていない
そして、、、 データ基盤の保守! 手が回りません!!
どうしてこうなった!?
データチームの人を 採用できなかった・・・
というのもありますが、
スケーラブルなエンタープライズ・ データウェアハウスを設計できるモ デリング手法Hub,Link, Satelliteと いう3つの構成要素で3NF系で・・・ (以下略
スケーラブルなエンタープライズ・ データウェアハウスを設計できるモ デリング手法Hub,Link, Satelliteと いう3つの構成要素で3NF系で・・・ (以下略
https://e-words.jp/w/%E3%82%A8%E3%83%B3%E3%82%BF%E3%83%BC%E3%83%97%E3%83%A9% E3%82%A4%E3%82%BA.html
ウチは中小企業だ!!(エッ 従業員数:約300人くらい
どこがエンタープライズ向け?
どこがエンタープライズ向け? 3NFにしてモデルを疎結合な状態に するのが高コスト
どこがエンタープライズ向け? 3NFにしてモデルを疎結合な状態に するのが高コスト Sattelliteの履歴を保守管理するのが 高コスト
どこがエンタープライズ向け? 時間が立つにつれて Vault領域の保守難度が 爆発的に高くなる。 物量も多くなるので 1つのソースシステムに 少なくとも0.5人くらいはほしい。
で、どうする?
データ基盤の開発効率 ≒生産性を上げたい
ソフトウェアエンジニアリングの世界には ViewとModelを密結合させることで、 生産性を上げたフレームワークがある そう、Rails ※ただし、柔軟性に難が出てくる
そうだ! 柔軟性に関しては妥協 データマートと Stagingを密結合させよう!
None
None
None
DataVault 2.0 やめました。 2022年冬
で、これって・・・
https://zenn.dev/tenajima/articles/64caed131ba961 dbt style guide 通りじゃん!
まとめ 中小企業(データエンジニア1人未満)で Data Vault 2.0を導入した結果…
まとめ 中小企業(データエンジニア1人未満)で Data Vault 2.0を導入した結果… 手が回らなくなったので、やめた 気がついたらdbt style guide通りになっていた。
まとめ 中小企業(データエンジニア1人未満)で Data Vault 2.0を導入した結果… 手が回らなくなったので、やめた 気がついたらdbt style guide通りになっていた。 『エンタープライズ』と名がついているものは
データチームがスケールするなら良い選択肢 スケールしないなら、覚悟しよう。
広報活動 \カヤックに興味を持ってくださった方へ/ カヤック社員がどんな風に働いているか? どんな制作実績があるか? などの情報を定期的に配信しています! ニュースレターへ登録しませんか? https://hubspot.kayac.com/we_are_kayac
ありがとうございました。