Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データエンジニアリングことはじめ
Search
Yuno_nekoisland
February 09, 2025
Technology
0
8
データエンジニアリングことはじめ
Yuno_nekoisland
February 09, 2025
Tweet
Share
More Decks by Yuno_nekoisland
See All by Yuno_nekoisland
IaC完全に理解した()
yunoyyxy
0
75
Other Decks in Technology
See All in Technology
マルチデータプロダクト開発・運用に耐えるためのデータ組織・アーキテクチャの遷移
mtpooh
1
360
Fin-JAWS第38回reInvent2024_全金融系セッションをライトにまとめてみた
mhrtech
1
160
アンチパターンのアーキテクチャと組織 / Anti-Pattern Software Architecture and Organization
oztick139
0
140
教師なし学習の基礎
kanojikajino
4
380
Autify Company Deck
autifyhq
2
41k
Power BI は、レポート テーマにこだわろう!テーマのティア表付き
ohata_ds
0
140
君はPostScriptなウィンドウシステム 「NeWS」をご存知か?/sunnews
koyhoge
0
610
個人開発発表 LT - Shinjuku.rb #97
kozy4324
0
110
BLEAでAWSアカウントのセキュリティレベルを向上させよう
koheiyoshikawa
0
170
[2025クラウドガバナンスはこう変わる!マルチアカウント運用のre:Invent最新情報と活用例] re:Invent 2024 から見る AWS マルチアカウントガバナンスのこれまでとこれから
0nihajim
0
110
re:Invent Recap (January 2025)
scalefactory
0
340
まだ間に合う! エンジニアのための生成AIアプリ開発入門 on AWS
minorun365
PRO
4
460
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
620
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Build The Right Thing And Hit Your Dates
maggiecrowley
34
2.5k
GraphQLの誤解/rethinking-graphql
sonatard
68
10k
Unsuck your backbone
ammeep
669
57k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
175
51k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.4k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Designing on Purpose - Digital PM Summit 2013
jponch
117
7.1k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.3k
Transcript
データエンジニアリング ことはじめ 話す人:ゆの @Yuno_yyxy 2023/01/28 エンジニア作業飲み集会 LT会 #1 1
目次 2023/01/28 エンジニア作業飲み集会 LT会 #1 2 1. つかみ(Netflixを添えて) 2. データ周辺の絵図
3. データを取り扱う登場人物
0.何者???? 2023/01/28 エンジニア作業飲み集会 LT会 #1 3 名前:ゆの(@Yuno_yyxy) • 職業システム屋さん(SIerの人間) •
日がなAWS触ってる • 法学部卒なので技術わからん まだNewUserなのでおてやわで。。
0.何者???? 2023/01/28 エンジニア作業飲み集会 LT会 #1 4 趣味ピックアップ 少女漫画や青年誌、ジャンプも購読してます 読め!!!!!!!!
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 5 世はまさに、大DX時代……
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 6 Netflixは、DXを4度変遷
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 7 https://digital-shift.jp/platformer/211110
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 8 オリジナルコンテンツも制作
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 9 https://digital-shift.jp/platformer/211110 • 視聴履歴 •
個人情報 ex… ⇒データを収集・分析することで、 バズるであろう要素を洞察 ex)俳優×ジャンル
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 10 どうやらデータが重要そうだ。。。
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 11 お 前 も デ
ー タ に な ら な い か ?
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 12 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 13 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 世の中にはたくさんの情報がある ⇒何のために存在しているか 用途を理解することで、ユースケースにつなげられる
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 14 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 情報分析用の基盤を構築(概略図) • データレイク:データソースからくる生データを蓄積 • データウェアハウス:生データを整理整頓 • データマート:ユースケース用に集約/集計
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 15 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BIツール ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス データを分析/解析することで、洞察(インサイト)を得る • Tableauでバスケット分析 • MLさせていろいろするとか?
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 16 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 上記3領域をよしなにする職能領域
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 17 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス データ利活用の全域を統括する。 ⇒顧客のビジネス方針を主導できる人間がやってそう
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 18 • データサイエンティスト • データエンジニア
• データスチュワード
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 19 データサイエンティスト ・世のデータを分析・解析する人 その結果から洞察を得て、ビジネスへ反映する ・機械学習(ML)もここ?
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 20 データエンジニア ・データ基盤 構築・運用・保守を担当 ユースケースに耐えうる基盤整備
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 21 データスチュワード ・データ整備の推進 ・問い合わせへの対応 ・データサイエンティストとデータエンジニアの橋渡し役
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 22 データ基盤 データ サイエンティスト データ組織
データソース ・基幹システム ・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ組織を俯瞰する・統括 データ収集 保守・運用・監視 データエンジニア データスチュワード
参考文献 2023/01/28 エンジニア作業飲み集会 LT会 #1 23 【書籍】 • 実践的データ基盤への処方箋 •
データマネジメントが30分でわかる本 【Web上の記事】 • 今からはじめる、データエンジニアリング・ロードマップ • 「実践的データ基盤への処方箋」から読み解く「データを扱うビジネスパーソン」のキャリアパス