Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データエンジニアリングことはじめ
Search
Yuno_nekoisland
February 09, 2025
Technology
0
11
データエンジニアリングことはじめ
Yuno_nekoisland
February 09, 2025
Tweet
Share
More Decks by Yuno_nekoisland
See All by Yuno_nekoisland
IaC完全に理解した()
yunoyyxy
0
76
Other Decks in Technology
See All in Technology
MC906491 を見据えた Microsoft Entra Connect アップグレード対応
tamaiyutaro
1
540
ホワイトボードチャレンジ 説明&実行資料
ichimichi
0
130
データの品質が低いと何が困るのか
kzykmyzw
6
1.1k
Datadog APM におけるトレース収集の流れ及び Retention Filters のはなし / datadog-apm-trace-retention-filters
k6s4i53rx
0
330
Helm , Kustomize に代わる !? 次世代 k8s パッケージマネージャー Glasskube 入門 / glasskube-entry
parupappa2929
0
250
Classmethod AI Talks(CATs) #16 司会進行スライド(2025.02.12) / classmethod-ai-talks-aka-cats_moderator-slides_vol16_2025-02-12
shinyaa31
0
100
アジャイル開発とスクラム
araihara
0
170
N=1から解き明かすAWS ソリューションアーキテクトの魅力
kiiwami
0
130
明日からできる!技術的負債の返済を加速するための実践ガイド~『ホットペッパービューティー』の事例をもとに~
recruitengineers
PRO
3
380
目の前の仕事と向き合うことで成長できる - 仕事とスキルを広げる / Every little bit counts
soudai
24
7k
OpenID Connect for Identity Assurance の概要と翻訳版のご紹介 / 20250219-BizDay17-OIDC4IDA-Intro
oidfj
0
270
Datadogとともにオブザーバビリティを布教しよう
mego2221
0
140
Featured
See All Featured
Speed Design
sergeychernyshev
27
790
Rails Girls Zürich Keynote
gr2m
94
13k
The Invisible Side of Design
smashingmag
299
50k
The Pragmatic Product Professional
lauravandoore
32
6.4k
A Tale of Four Properties
chriscoyier
158
23k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Writing Fast Ruby
sferik
628
61k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.6k
A Philosophy of Restraint
colly
203
16k
Bootstrapping a Software Product
garrettdimon
PRO
306
110k
Transcript
データエンジニアリング ことはじめ 話す人:ゆの @Yuno_yyxy 2023/01/28 エンジニア作業飲み集会 LT会 #1 1
目次 2023/01/28 エンジニア作業飲み集会 LT会 #1 2 1. つかみ(Netflixを添えて) 2. データ周辺の絵図
3. データを取り扱う登場人物
0.何者???? 2023/01/28 エンジニア作業飲み集会 LT会 #1 3 名前:ゆの(@Yuno_yyxy) • 職業システム屋さん(SIerの人間) •
日がなAWS触ってる • 法学部卒なので技術わからん まだNewUserなのでおてやわで。。
0.何者???? 2023/01/28 エンジニア作業飲み集会 LT会 #1 4 趣味ピックアップ 少女漫画や青年誌、ジャンプも購読してます 読め!!!!!!!!
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 5 世はまさに、大DX時代……
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 6 Netflixは、DXを4度変遷
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 7 https://digital-shift.jp/platformer/211110
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 8 オリジナルコンテンツも制作
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 9 https://digital-shift.jp/platformer/211110 • 視聴履歴 •
個人情報 ex… ⇒データを収集・分析することで、 バズるであろう要素を洞察 ex)俳優×ジャンル
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 10 どうやらデータが重要そうだ。。。
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 11 お 前 も デ
ー タ に な ら な い か ?
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 12 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 13 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 世の中にはたくさんの情報がある ⇒何のために存在しているか 用途を理解することで、ユースケースにつなげられる
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 14 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 情報分析用の基盤を構築(概略図) • データレイク:データソースからくる生データを蓄積 • データウェアハウス:生データを整理整頓 • データマート:ユースケース用に集約/集計
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 15 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BIツール ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス データを分析/解析することで、洞察(インサイト)を得る • Tableauでバスケット分析 • MLさせていろいろするとか?
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 16 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 上記3領域をよしなにする職能領域
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 17 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス データ利活用の全域を統括する。 ⇒顧客のビジネス方針を主導できる人間がやってそう
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 18 • データサイエンティスト • データエンジニア
• データスチュワード
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 19 データサイエンティスト ・世のデータを分析・解析する人 その結果から洞察を得て、ビジネスへ反映する ・機械学習(ML)もここ?
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 20 データエンジニア ・データ基盤 構築・運用・保守を担当 ユースケースに耐えうる基盤整備
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 21 データスチュワード ・データ整備の推進 ・問い合わせへの対応 ・データサイエンティストとデータエンジニアの橋渡し役
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 22 データ基盤 データ サイエンティスト データ組織
データソース ・基幹システム ・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ組織を俯瞰する・統括 データ収集 保守・運用・監視 データエンジニア データスチュワード
参考文献 2023/01/28 エンジニア作業飲み集会 LT会 #1 23 【書籍】 • 実践的データ基盤への処方箋 •
データマネジメントが30分でわかる本 【Web上の記事】 • 今からはじめる、データエンジニアリング・ロードマップ • 「実践的データ基盤への処方箋」から読み解く「データを扱うビジネスパーソン」のキャリアパス