Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データエンジニアリングことはじめ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuno_nekoisland
February 09, 2025
Technology
0
29
データエンジニアリングことはじめ
Yuno_nekoisland
February 09, 2025
Tweet
Share
More Decks by Yuno_nekoisland
See All by Yuno_nekoisland
IaC完全に理解した()
yunoyyxy
0
99
Other Decks in Technology
See All in Technology
ブロックテーマ、WordPress でウェブサイトをつくるということ / 2026.02.07 Gifu WordPress Meetup
torounit
0
200
Red Hat OpenStack Services on OpenShift
tamemiya
0
130
クレジットカード決済基盤を支えるSRE - 厳格な監査とSRE運用の両立 (SRE Kaigi 2026)
capytan
6
2.8k
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.6k
Ruby版 JSXのRuxが気になる
sansantech
PRO
0
160
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
330
Context Engineeringが企業で不可欠になる理由
hirosatogamo
PRO
3
650
モダンUIでフルサーバーレスなAIエージェントをAmplifyとCDKでサクッとデプロイしよう
minorun365
4
220
StrandsとNeptuneを使ってナレッジグラフを構築する
yakumo
1
120
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
730
Agent Skils
dip_tech
PRO
0
120
OpenShiftでllm-dを動かそう!
jpishikawa
0
140
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
78
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
330
GitHub's CSS Performance
jonrohan
1032
470k
A designer walks into a library…
pauljervisheath
210
24k
So, you think you're a good person
axbom
PRO
2
1.9k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
140
Color Theory Basics | Prateek | Gurzu
gurzu
0
200
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.7k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
310
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
110
Transcript
データエンジニアリング ことはじめ 話す人:ゆの @Yuno_yyxy 2023/01/28 エンジニア作業飲み集会 LT会 #1 1
目次 2023/01/28 エンジニア作業飲み集会 LT会 #1 2 1. つかみ(Netflixを添えて) 2. データ周辺の絵図
3. データを取り扱う登場人物
0.何者???? 2023/01/28 エンジニア作業飲み集会 LT会 #1 3 名前:ゆの(@Yuno_yyxy) • 職業システム屋さん(SIerの人間) •
日がなAWS触ってる • 法学部卒なので技術わからん まだNewUserなのでおてやわで。。
0.何者???? 2023/01/28 エンジニア作業飲み集会 LT会 #1 4 趣味ピックアップ 少女漫画や青年誌、ジャンプも購読してます 読め!!!!!!!!
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 5 世はまさに、大DX時代……
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 6 Netflixは、DXを4度変遷
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 7 https://digital-shift.jp/platformer/211110
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 8 オリジナルコンテンツも制作
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 9 https://digital-shift.jp/platformer/211110 • 視聴履歴 •
個人情報 ex… ⇒データを収集・分析することで、 バズるであろう要素を洞察 ex)俳優×ジャンル
1.つかみ(Netflixを添えて) 2023/01/28 エンジニア作業飲み集会 LT会 #1 10 どうやらデータが重要そうだ。。。
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 11 お 前 も デ
ー タ に な ら な い か ?
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 12 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 13 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 世の中にはたくさんの情報がある ⇒何のために存在しているか 用途を理解することで、ユースケースにつなげられる
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 14 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 情報分析用の基盤を構築(概略図) • データレイク:データソースからくる生データを蓄積 • データウェアハウス:生データを整理整頓 • データマート:ユースケース用に集約/集計
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 15 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BIツール ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス データを分析/解析することで、洞察(インサイト)を得る • Tableauでバスケット分析 • MLさせていろいろするとか?
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 16 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス 上記3領域をよしなにする職能領域
2.データ周辺の絵図 2023/01/28 エンジニア作業飲み集会 LT会 #1 17 データ基盤 データ組織 データソース ・基幹システム
・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ収集 保守・運用・監視 データガバナンス データ利活用の全域を統括する。 ⇒顧客のビジネス方針を主導できる人間がやってそう
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 18 • データサイエンティスト • データエンジニア
• データスチュワード
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 19 データサイエンティスト ・世のデータを分析・解析する人 その結果から洞察を得て、ビジネスへ反映する ・機械学習(ML)もここ?
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 20 データエンジニア ・データ基盤 構築・運用・保守を担当 ユースケースに耐えうる基盤整備
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 21 データスチュワード ・データ整備の推進 ・問い合わせへの対応 ・データサイエンティストとデータエンジニアの橋渡し役
3.データを取り扱う登場人物 2023/01/28 エンジニア作業飲み集会 LT会 #1 22 データ基盤 データ サイエンティスト データ組織
データソース ・基幹システム ・野良エクセル ・紙 ・メモ ユースケース ・BI ・ML ・他システム 連携 データ レイク データ ウェアハウス データ マート データ整備 利用促進・FB データ組織を俯瞰する・統括 データ収集 保守・運用・監視 データエンジニア データスチュワード
参考文献 2023/01/28 エンジニア作業飲み集会 LT会 #1 23 【書籍】 • 実践的データ基盤への処方箋 •
データマネジメントが30分でわかる本 【Web上の記事】 • 今からはじめる、データエンジニアリング・ロードマップ • 「実践的データ基盤への処方箋」から読み解く「データを扱うビジネスパーソン」のキャリアパス