Slide 1

Slide 1 text

データエンジニアとして ちゅらデータで働くことになった © 2020 Chura DATA inc. PROPRIETARY & CONFIDENTIAL.

Slide 2

Slide 2 text

AGENDA • 自己紹介 • データエンジニアとは? • モダンデータスタックとは? • ◯◯エンジニアとデータエンジニア • まとめ

Slide 3

Slide 3 text

自己紹介 • 田代 学(たしろ がく) • 1974.12.12 生まれ(47歳) • 奈良出身 • 埼玉県川越市在住(フルリモート勤務) • 略歴 • SHARPに新卒。Zaurus向けISPの企画運営、携帯向けメルマガ配信サービスの開発運営 • サイバーエージェントにてサーバサイドエンジニア、データエンジニアとして16年勤務。 アメブロの携帯版やブログ検索などのサービス開発、コンテンツ健全化基盤「Orion」の開 発・運用 • 2022年9月ちゅらデータにJoin © 2020 Chura DATA inc. PROPRIETARY & CONFIDENTIAL.

Slide 4

Slide 4 text

データエンジニアって 知ってますか?

Slide 5

Slide 5 text

データエンジニアとは? (1/7) • 比較的新しい職種 • "Data Engineering is the new Sexiest job in 2022” • “需要とキャリアにおいてデータサイエンティストやデー タアナリストを上回った”

Slide 6

Slide 6 text

データエンジニアとは? 〜全世界のデータ総量〜(2/7) 全世界のデジタルデータの総量 KB→MB→GB→TB→PB→EB→ZB 膨大なデータを活用 できていない!

Slide 7

Slide 7 text

データエンジニアとは? (3/7) データを収集、保存、分析するため のシステムを 設計・構築・運用するエンジニア

Slide 8

Slide 8 text

データエンジニアとは? (4/7) データベースエンジニア(狭義) データ(分析基盤)エンジニア

Slide 9

Slide 9 text

データエンジニアとは? (5/7) 現在、日本においては、 「データサイエンティスト」 「データアナリスト」 に注目が集まっている

Slide 10

Slide 10 text

データエンジニアとは? (6/7) 「分析」「サイエンス」する為の データが未整備 データサイエンティストの仕事の8割が 「データの準備や前処理」

Slide 11

Slide 11 text

データエンジニアとは? (7/7) 得意な「分析」「サイエンス」に注力して 力を発揮してもらおう!! データエンジニアは縁の下の力持ち データ活用の大目的

Slide 12

Slide 12 text

データ分析基盤の構築

Slide 13

Slide 13 text

データ分析基盤の構築(1/7) データを集めて、一箇所に集め、分析しやすく 基幹DB ユーザ行動ログ 天気データ 住所データ etc. データ分析基盤 基幹DB 基幹DB トランザクションデータ マスターデータ

Slide 14

Slide 14 text

データ分析基盤の構築〜データを貯める〜 (2/7) DWH製品 DWH製品:データウェアハウス製品、分析に特化したDB

Slide 15

Slide 15 text

データ分析基盤の構築〜データを収集する〜 (3/7) Extract(抽出) Load(配信・送出) Transform(変換) DWH 基幹 DB ユーザ行動 ログ 天気データ 住所データ etc. 基幹 DB 基幹DB ELT

Slide 16

Slide 16 text

データ分析基盤の構築〜データを分析しやすい形に〜 (4/7) データ変換・モデリングツール DWH 基幹 DB ユーザ行動ロ グ 天気データ 住所データ etc. 基幹 DB 基幹DB データ変換 モデリングツール ELT

Slide 17

Slide 17 text

データ分析基盤の構築〜データ可視化して分析!〜 (5/7) BIツール:データの可視化 DWH 基幹 DB ユーザ行動ロ グ 天気データ 住所データ etc. 基幹 DB 基幹DB データ変換 モデリングツール BIツール ELT

Slide 18

Slide 18 text

データ分析基盤の構築〜データパイプラインを制御〜 (6/7) ワークフローエンジン、オーケストレーションツール DWH 基幹 DB ユーザ行動ロ グ 天気データ 住所データ etc. 基幹 DB 基幹DB データ変換 モデリングツール BIツール ワークフローエンジン ELT

Slide 19

Slide 19 text

データ分析基盤の構築〜その他〜 (7/7) DWH 基幹 DB ユーザ行動ロ グ 天気データ 住所データ etc. 基幹 DB 基幹DB データ変換 モデリングツール BIツール ワークフローエンジン • データカタログ • データクオリティ • AI/ML • etc ELT

Slide 20

Slide 20 text

モダンデータスタック について

Slide 21

Slide 21 text

モダンデータスタック(1/6) 現代のクラウド環境下に ふさわしい設計とコンセプトに基づく 柔軟で新しいサービス・ソフトウェア群 とその方法論や行く末の議論(を表すバズワード)

Slide 22

Slide 22 text

Cloud Data Warehouse Data Ingestion Transformation AI/ML BI Reverse ETL Governance Data Catalog Data Obserbility Workflow Engine The Modern Data Stack (2/6)

Slide 23

Slide 23 text

モダンデータスタック〜興隆の要因〜 (3/6) クラウド化 特にStorage(Amazon S3やGCS) → 低コストで大規模容量のデータ とCompute(EC2やGCE)→ 低コストで処理可能 SaaS化 1ボタンでサービス利用開始

Slide 24

Slide 24 text

<レガシー> • サーバ環境の構築が必要 • アプリ、ミドルウェアのインストール • それらメンテナンス(バージョンアップとか) • 拡張がめちゃ困難 • 運用コストがめちゃ高い • 製品ライセンスもめちゃ高 <モダン> • 導入も楽!下手すればボタン一発 • 高スケーラビリティ • ストレージほぼ 無制限 • コンピュートリソースもほぼ 無限 • 簡単な設定のみで動く • メンテナンスはほぼゼロ! • 深い技術的知識は不要 • コストが激減 モダンデータスタック〜”レガシー”との比較〜 (4/6)

Slide 25

Slide 25 text

モダンデータスタック(5/6) よりビジネス要件に注力できる! (サーバ管理とか余計なことしなくていい!) レガシー モダン サーバ管理 分析・サイエンス ビジネス要件 サーバ管理

Slide 26

Slide 26 text

モダンデータスタック〜海外サイト〜 (6/6)

Slide 27

Slide 27 text

◯◯エンジニア と データエンジニア

Slide 28

Slide 28 text

システムエンジニアとデータエンジニア 要件定義 詳細設計 開発・テスト 導入 運用 システム エンジニア データ エンジニア ミドルウェア Javaで実装 データウェアハウス ELT構築 Pythonで実装

Slide 29

Slide 29 text

システムエンジニアとデータエンジニア データ基盤のクラウド移行する場合 移行元オンプレデータ基盤の構成がわかる システム エンジニア データ エンジニア

Slide 30

Slide 30 text

システムエンジニアとデータエンジニア ジョブチェン可能!!!! システム エンジニア データ エンジニア

Slide 31

Slide 31 text

ソフトウェアエンジニアとデータエンジニア データ界隈にも ソフトウェアエンジニアリングの叡智 が使えるように! ソフトウェア エンジニア データ エンジニア

Slide 32

Slide 32 text

ソフトウェアエンジニアとデータエンジニア ジョブチェン可能!!!! ソフトウェア エンジニア データ エンジニア

Slide 33

Slide 33 text

インフラエンジニアとデータエンジニア クラウド環境でのインフラ構築 (DevOps、CI/CD、Terraform等) インフラ エンジニア データ エンジニア

Slide 34

Slide 34 text

インフラエンジニアとデータエンジニア ジョブチェン可能!!!! (インフラスキルが大きな柱のデータエンジニア) インフラ エンジニア データ エンジニア

Slide 35

Slide 35 text

セキュリティエンジニアとデータエンジニア 個人情報データの取扱 データ基盤全体のシステムセキュリティ担保 セキュリティエ ンジニア データ エンジニア

Slide 36

Slide 36 text

セキュリティエンジニアとデータエンジニア ジョブチェン可能!!レア!! (データセキュリティエンジニア) セキュリティ エンジニア データ エンジニア

Slide 37

Slide 37 text

アプリケーションエンジニアとデータエンジニア データ・アプリケーションの出現 アプリケーション エンジニア データ エンジニア

Slide 38

Slide 38 text

アプリケーションエンジニアとデータエンジニア ジョブチェン可能! (データアプリケーションエンジニア) データ エンジニア アプリケーション エンジニア

Slide 39

Slide 39 text

◯◯エンジニアとデータエンジニア データエンジニアは まだまだ細分化されていない

Slide 40

Slide 40 text

データインフラ エンジニア データSRE エンジニア データSRE エンジニア データSRE エンジニア ◯◯エンジニアとデータエンジニア データエンジニア データ サイエンティスト データ アナリスト アナリティクス エンジニア データSRE エンジニア データアプリ エンジニア データセキュリティ エンジニア データスチュワード・ コンシェルジュ BIエンジニア

Slide 41

Slide 41 text

データインフラ エンジニア データSRE エンジニア データSRE エンジニア データSRE エンジニア ◯◯エンジニアとデータエンジニア データエンジニア データ サイエンティスト データ アナリスト アナリティクス エンジニア データSRE エンジニア データアプリ エンジニア データセキュリティ エンジニア データスチュワード・ コンシェルジュ ますます発展・広がっていく データエンジニア

Slide 42

Slide 42 text

データ・・・そこは最後のフロンティア

Slide 43

Slide 43 text

おすすめの本(1/2) 通称:ゆずたそ本 • データ基盤とはなんぞや • データ基盤システムの作り方 • データ組織について

Slide 44

Slide 44 text

おすすめの本(2/2) データを扱う人には 必読の書

Slide 45

Slide 45 text

まとめ • データエンジニアとは • モダンデータスタックとは • ジョブチェンジは可能! • ますます発展広がるデータ界隈で働きませんか?

Slide 46

Slide 46 text

おわり ご清聴ありがとうございました! © 2022 Chura DATA inc. PROPRIETARY & CONFIDENTIAL.