Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データエンジニアとしてちゅらデータで働くことになった
Search
Gaku TASHIRO
October 22, 2022
Technology
1
2.6k
データエンジニアとして ちゅらデータで働くことになった
2022年10月22日に行われたCDTC2022(ちゅらデータテックカンファレンス2022)での資料です
Gaku TASHIRO
October 22, 2022
Tweet
Share
More Decks by Gaku TASHIRO
See All by Gaku TASHIRO
SWTTokyo25 Community Hub 生FrostyFriday!
gak_t12
1
150
Snowflake Cortex Searchについて
gak_t12
0
330
今さら聞けないdbtの基本LT
gak_t12
8
8.7k
External Network Accessよもやま話
gak_t12
0
650
Other Decks in Technology
See All in Technology
Tebiki Engineering Team Deck
tebiki
0
24k
分析画面のクリック操作をそのままコード化 ! エンジニアとビジネスユーザーが共存するAI-ReadyなBI基盤
ikumi
0
170
クレジットカード決済基盤を支えるSRE - 厳格な監査とSRE運用の両立 (SRE Kaigi 2026)
capytan
6
2.3k
なぜ今、コスト最適化(倹約)が必要なのか? ~AWSでのコスト最適化の進め方「目的編」~
htan
1
100
MCPでつなぐElasticsearchとLLM - 深夜の障害対応を楽にしたい / Bridging Elasticsearch and LLMs with MCP
sashimimochi
0
130
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1k
FinTech SREのAWSサービス活用/Leveraging AWS Services in FinTech SRE
maaaato
0
120
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
1.4k
GSIが複数キー対応したことで、俺達はいったい何が嬉しいのか?
smt7174
3
130
15 years with Rails and DDD (AI Edition)
andrzejkrzywda
0
160
コスト削減から「セキュリティと利便性」を担うプラットフォームへ
sansantech
PRO
3
1.1k
GitLab Duo Agent Platform × AGENTS.md で実現するSpec-Driven Development / GitLab Duo Agent Platform × AGENTS.md
n11sh1
0
110
Featured
See All Featured
Prompt Engineering for Job Search
mfonobong
0
160
So, you think you're a good person
axbom
PRO
2
1.9k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.2k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
36k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
140
Technical Leadership for Architectural Decision Making
baasie
1
240
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.9k
YesSQL, Process and Tooling at Scale
rocio
174
15k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
96
Embracing the Ebb and Flow
colly
88
5k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.9k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
66
Transcript
データエンジニアとして ちゅらデータで働くことになった © 2020 Chura DATA inc. PROPRIETARY & CONFIDENTIAL.
AGENDA • 自己紹介 • データエンジニアとは? • モダンデータスタックとは? • ◯◯エンジニアとデータエンジニア •
まとめ
自己紹介 • 田代 学(たしろ がく) • 1974.12.12 生まれ(47歳) • 奈良出身
• 埼玉県川越市在住(フルリモート勤務) • 略歴 • SHARPに新卒。Zaurus向けISPの企画運営、携帯向けメルマガ配信サービスの開発運営 • サイバーエージェントにてサーバサイドエンジニア、データエンジニアとして16年勤務。 アメブロの携帯版やブログ検索などのサービス開発、コンテンツ健全化基盤「Orion」の開 発・運用 • 2022年9月ちゅらデータにJoin © 2020 Chura DATA inc. PROPRIETARY & CONFIDENTIAL.
データエンジニアって 知ってますか?
データエンジニアとは? (1/7) • 比較的新しい職種 • "Data Engineering is the new
Sexiest job in 2022” • “需要とキャリアにおいてデータサイエンティストやデー タアナリストを上回った”
データエンジニアとは? 〜全世界のデータ総量〜(2/7) 全世界のデジタルデータの総量 KB→MB→GB→TB→PB→EB→ZB 膨大なデータを活用 できていない!
データエンジニアとは? (3/7) データを収集、保存、分析するため のシステムを 設計・構築・運用するエンジニア
データエンジニアとは? (4/7) データベースエンジニア(狭義) データ(分析基盤)エンジニア
データエンジニアとは? (5/7) 現在、日本においては、 「データサイエンティスト」 「データアナリスト」 に注目が集まっている
データエンジニアとは? (6/7) 「分析」「サイエンス」する為の データが未整備 データサイエンティストの仕事の8割が 「データの準備や前処理」
データエンジニアとは? (7/7) 得意な「分析」「サイエンス」に注力して 力を発揮してもらおう!! データエンジニアは縁の下の力持ち データ活用の大目的
データ分析基盤の構築
データ分析基盤の構築(1/7) データを集めて、一箇所に集め、分析しやすく 基幹DB ユーザ行動ログ 天気データ 住所データ etc. データ分析基盤 基幹DB 基幹DB
トランザクションデータ マスターデータ
データ分析基盤の構築〜データを貯める〜 (2/7) DWH製品 DWH製品:データウェアハウス製品、分析に特化したDB
データ分析基盤の構築〜データを収集する〜 (3/7) Extract(抽出) Load(配信・送出) Transform(変換) DWH 基幹 DB ユーザ行動 ログ
天気データ 住所データ etc. 基幹 DB 基幹DB ELT
データ分析基盤の構築〜データを分析しやすい形に〜 (4/7) データ変換・モデリングツール DWH 基幹 DB ユーザ行動ロ グ 天気データ 住所データ
etc. 基幹 DB 基幹DB データ変換 モデリングツール ELT
データ分析基盤の構築〜データ可視化して分析!〜 (5/7) BIツール:データの可視化 DWH 基幹 DB ユーザ行動ロ グ 天気データ 住所データ
etc. 基幹 DB 基幹DB データ変換 モデリングツール BIツール ELT
データ分析基盤の構築〜データパイプラインを制御〜 (6/7) ワークフローエンジン、オーケストレーションツール DWH 基幹 DB ユーザ行動ロ グ 天気データ 住所データ
etc. 基幹 DB 基幹DB データ変換 モデリングツール BIツール ワークフローエンジン ELT
データ分析基盤の構築〜その他〜 (7/7) DWH 基幹 DB ユーザ行動ロ グ 天気データ 住所データ etc.
基幹 DB 基幹DB データ変換 モデリングツール BIツール ワークフローエンジン • データカタログ • データクオリティ • AI/ML • etc ELT
モダンデータスタック について
モダンデータスタック(1/6) 現代のクラウド環境下に ふさわしい設計とコンセプトに基づく 柔軟で新しいサービス・ソフトウェア群 とその方法論や行く末の議論(を表すバズワード)
Cloud Data Warehouse Data Ingestion Transformation AI/ML BI Reverse ETL
Governance Data Catalog Data Obserbility Workflow Engine The Modern Data Stack (2/6)
モダンデータスタック〜興隆の要因〜 (3/6) クラウド化 特にStorage(Amazon S3やGCS) → 低コストで大規模容量のデータ とCompute(EC2やGCE)→ 低コストで処理可能 SaaS化
1ボタンでサービス利用開始
<レガシー> • サーバ環境の構築が必要 • アプリ、ミドルウェアのインストール • それらメンテナンス(バージョンアップとか) • 拡張がめちゃ困難 •
運用コストがめちゃ高い • 製品ライセンスもめちゃ高 <モダン> • 導入も楽!下手すればボタン一発 • 高スケーラビリティ • ストレージほぼ 無制限 • コンピュートリソースもほぼ 無限 • 簡単な設定のみで動く • メンテナンスはほぼゼロ! • 深い技術的知識は不要 • コストが激減 モダンデータスタック〜”レガシー”との比較〜 (4/6)
モダンデータスタック(5/6) よりビジネス要件に注力できる! (サーバ管理とか余計なことしなくていい!) レガシー モダン サーバ管理 分析・サイエンス ビジネス要件 サーバ管理
モダンデータスタック〜海外サイト〜 (6/6)
◯◯エンジニア と データエンジニア
システムエンジニアとデータエンジニア 要件定義 詳細設計 開発・テスト 導入 運用 システム エンジニア データ エンジニア
ミドルウェア Javaで実装 データウェアハウス ELT構築 Pythonで実装
システムエンジニアとデータエンジニア データ基盤のクラウド移行する場合 移行元オンプレデータ基盤の構成がわかる システム エンジニア データ エンジニア
システムエンジニアとデータエンジニア ジョブチェン可能!!!! システム エンジニア データ エンジニア
ソフトウェアエンジニアとデータエンジニア データ界隈にも ソフトウェアエンジニアリングの叡智 が使えるように! ソフトウェア エンジニア データ エンジニア
ソフトウェアエンジニアとデータエンジニア ジョブチェン可能!!!! ソフトウェア エンジニア データ エンジニア
インフラエンジニアとデータエンジニア クラウド環境でのインフラ構築 (DevOps、CI/CD、Terraform等) インフラ エンジニア データ エンジニア
インフラエンジニアとデータエンジニア ジョブチェン可能!!!! (インフラスキルが大きな柱のデータエンジニア) インフラ エンジニア データ エンジニア
セキュリティエンジニアとデータエンジニア 個人情報データの取扱 データ基盤全体のシステムセキュリティ担保 セキュリティエ ンジニア データ エンジニア
セキュリティエンジニアとデータエンジニア ジョブチェン可能!!レア!! (データセキュリティエンジニア) セキュリティ エンジニア データ エンジニア
アプリケーションエンジニアとデータエンジニア データ・アプリケーションの出現 アプリケーション エンジニア データ エンジニア
アプリケーションエンジニアとデータエンジニア ジョブチェン可能! (データアプリケーションエンジニア) データ エンジニア アプリケーション エンジニア
◯◯エンジニアとデータエンジニア データエンジニアは まだまだ細分化されていない
データインフラ エンジニア データSRE エンジニア データSRE エンジニア データSRE エンジニア ◯◯エンジニアとデータエンジニア データエンジニア
データ サイエンティスト データ アナリスト アナリティクス エンジニア データSRE エンジニア データアプリ エンジニア データセキュリティ エンジニア データスチュワード・ コンシェルジュ BIエンジニア
データインフラ エンジニア データSRE エンジニア データSRE エンジニア データSRE エンジニア ◯◯エンジニアとデータエンジニア データエンジニア
データ サイエンティスト データ アナリスト アナリティクス エンジニア データSRE エンジニア データアプリ エンジニア データセキュリティ エンジニア データスチュワード・ コンシェルジュ ますます発展・広がっていく データエンジニア
データ・・・そこは最後のフロンティア
おすすめの本(1/2) 通称:ゆずたそ本 • データ基盤とはなんぞや • データ基盤システムの作り方 • データ組織について
おすすめの本(2/2) データを扱う人には 必読の書
まとめ • データエンジニアとは • モダンデータスタックとは • ジョブチェンジは可能! • ますます発展広がるデータ界隈で働きませんか?
おわり ご清聴ありがとうございました! © 2022 Chura DATA inc. PROPRIETARY & CONFIDENTIAL.