Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2024年に描く青写真(データアーキテクチャ) / strongest-data-archit...
Search
pei0804
January 16, 2024
Technology
2
4k
2024年に描く青写真(データアーキテクチャ) / strongest-data-architecture-discussion-2024
みんなの考えた最強のデータアーキテクチャ'24新春-最新版SP!
https://datatech-jp.connpass.com/event/301807/
pei0804
January 16, 2024
Tweet
Share
More Decks by pei0804
See All by pei0804
Snowflakeでデータ基盤を もう一度作り直すなら / rebuilding-data-platform-with-snowflake
pei0804
9
2.1k
RevOps実践で学んだ俺が最強のデータ基盤になることの重要性 / revops-practice-learned
pei0804
1
1.7k
Terraformで構築する セルフサービス型データプラットフォーム / terraform-self-service-data-platform
pei0804
1
360
使えるデータ基盤を作る技術選定の秘訣 / selecting-the-right-data-technology
pei0804
11
4.8k
事業をデータエンジニアリングする / data-engineering-for-business
pei0804
10
1.8k
進化を加速させる データ基盤CI/CDの実践 / accelerating-data-platform-ci-cd
pei0804
1
820
RevOpsへ至る道 データ活用による事業革新への挑戦 / path-to-revops
pei0804
6
1.7k
ビジネスに必要な全てを担い、 自分の専門性を見つけ出す フルサイクル開発者のあり方@技育祭 秋 / how-find-own-speciality-in-full-cycle
pei0804
8
1.4k
データドリブン経営への転換 / transforming-to-data-driven
pei0804
10
4.2k
Other Decks in Technology
See All in Technology
DatabricksホストモデルでAIコーディング環境を構築する
databricksjapan
0
220
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践 〜
bwkw
2
750
データ民主化のための LLM 活用状況と課題紹介(IVRy の場合)
wxyzzz
2
580
usermode linux without MMU - fosdem2026 kernel devroom
thehajime
0
190
小さく始めるBCP ― 多プロダクト環境で始める最初の一歩
kekke_n
0
270
入社1ヶ月でデータパイプライン講座を作った話
waiwai2111
1
210
エンジニアとマネジメントの距離/Engineering and Management
ikuodanaka
3
700
2026年はチャンキングを極める!
shibuiwilliam
8
1.8k
日本語テキストと音楽の対照学習の技術とその応用
lycorptech_jp
PRO
1
400
オープンウェイトのLLMリランカーを契約書で評価する / searchtechjp
sansan_randd
3
550
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1k
2026年、サーバーレスの現在地 -「制約と戦う技術」から「当たり前の実行基盤」へ- /serverless2026
slsops
2
140
Featured
See All Featured
[SF Ruby Conf 2025] Rails X
palkan
0
740
My Coaching Mixtape
mlcsv
0
45
What does AI have to do with Human Rights?
axbom
PRO
0
2k
Paper Plane (Part 1)
katiecoart
PRO
0
3.8k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.9k
Abbi's Birthday
coloredviolet
1
4.6k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
150
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
440
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
170
Transcript
2024年に 描く青写真(データアーキテクチャ) データ基盤のこれまでとこれから。 みんなの考えた最強のデータアーキテクチャ '24新春-最新版SP!
自己紹介 ぺい @pei0804 近森淳平(チカモリ ジュンペイ) CARTA HOLDINGS CARTA MARKETING FIRM 開発局
データ部 部長
本日の発表は、 前回の発表で紹介した データ基盤が題材。 既存のデータ基盤と別に 2022年8月から構築開始し、 現在に至ります。 DWHはSnowflake。 データ変換にdbtを使っています。 https://speakerdeck.com/pei0804/strongest-data-architecture-discussion
2023年やったこと • 各種プロダクトで、新データ基盤の利用開始。 • 旧データ基盤の利用箇所を減らして、コスト削減。 ◦ まだ、全撤退はできてない。コストクリティカルなとこは完了。 • Elementary Cloud、SELECT
SaaSの採用。 ◦ 便利 x 続いてほしいサービスにお金を落とす。 • 守りの施策をたくさん打った。 ◦ どんだけ便利でも、不安定なデータ基盤は流行らない。 • 新卒のデータエンジニアをチームに迎え入れた。 • 開発体制の変更。 ◦ 中央集権体制からDataOpsへ。
もっと詳しく!人向け。
Snowflakeと共に 過ごした一年間。 その進化過程と 未来へのVision データ基盤を1から作り、 使われる過程で、どのような変化を 遂げていったかをまとめてます。 https://techblog.cartaholdings.co.jp/entry/snowflake-data-platform-vision
Snowflakeの力を 引き出すためのdbtを 活用したデータ基盤 開発の全貌 dbt-snowflakeを使った開発を、 これでもかってくらい大公開。 便利マクロから、CI/CD、運用まで。 https://techblog.cartaholdings.co.jp/entry/snowflake-dbt-data-platform-vision
SELECTを使った 手間なしSnowflake コスト最適化 コスト下げたい!けど、コスト下げるコス トが高い! そんなジレンマを解決するべく Snowflakeのコスト最適化ツール SELECTを導入した話。 https://techblog.cartaholdings.co.jp/entry/select-cloud-cost-optimize-cmf
アドテクのビッグデータ を制するSnowflakeの 力 がっつりと使った上で見えた Snowflakeの良さを語りました。 みんな気になるデータ基盤移行話 も少しだけ公開。 https://speakerdeck.com/pei0804/data-cloud-world-tour-tokyo-2023
dbt x snowflakeで 使っていないモデルを 安全に一括で削除する dbtモデルは定義は消えてるけど、 残っちゃってるTableとかを削除。 新卒データエンジニアの@harukiが さくっとやってくれました https://techblog.cartaholdings.co.jp/entry/2024/01/15/113000
2023年時点で、 使われるデータ基盤にはなった。
2024年は、 事業の正のレバレッジになることが目標。
2024年やりたいこと(抜粋) • DataOpsを強化する。 ◦ 色々テコ入れ。Data Observability、Cost Observability、 ドキュメンテーション。 • 攻めの施策を増やす。(2023年は守りが多かった)
◦ 例えば、Snowflakeの新しい機能を使った課題解決の可能性模索。 要はもっとワクワクすることやりたい。 • 仲間を増やす。育てる。高め合う。 ◦ 遠くへ行きたければみんなで行け。今年は、もっと遠くに行く。 • 既存データ関連の業務を、抜本的に見直す。 ◦ 見えてる伸びしろがたくさんある!
めっちゃ面白そうでしょ?
弊社では、データでゴリゴリに価値出したい シニアデータサイエンティストを探しています。 一緒に面白いことしたい人居れば、 こっそり Xの@pei0804でDMください。