Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Platform
Search
Yuki
August 21, 2020
Technology
1
380
Data Platform
8/22日に開催したDMM meet upでの資料です。
Yuki
August 21, 2020
Tweet
Share
More Decks by Yuki
See All by Yuki
品質特性から眺める データ分析基盤入門
yuki_saito
4
410
データエンジニアと作るデータ文化
yuki_saito
5
2.8k
Pythonとsparkで学ぶpyspark 速習講座
yuki_saito
2
220
AWS データレイク事例祭り 登壇資料
yuki_saito
7
3.6k
ミライのデータエンジニア
yuki_saito
1
920
Other Decks in Technology
See All in Technology
管理者しか知らないOutlookの裏側のAIを覗く#AzureTravelers
hirotomotaguchi
2
430
速くて安いWebサイトを作る
nishiharatsubasa
10
13k
Moved to https://speakerdeck.com/toshihue/presales-engineer-career-bridging-tech-biz-ja
toshihue
2
740
技術的負債解消の取り組みと専門チームのお話 #技術的負債_Findy
bengo4com
1
1.3k
ハッキングの世界に迫る~攻撃者の思考で考えるセキュリティ~
nomizone
13
5.2k
Tech Blogを書きやすい環境づくり
lycorptech_jp
PRO
1
240
なぜ私は自分が使わないサービスを作るのか? / Why would I create a service that I would not use?
aiandrox
0
750
クラウドサービス事業者におけるOSS
tagomoris
2
840
抽象化をするということ - 具体と抽象の往復を身につける / Abstraction and concretization
soudai
19
7.5k
Swiftの “private” を テストする / Testing Swift "private"
yutailang0119
0
130
Amazon S3 Tablesと外部分析基盤連携について / Amazon S3 Tables and External Data Analytics Platform
nttcom
0
140
30分でわかる『アジャイルデータモデリング』
hanon52_
9
2.7k
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Visualization
eitanlees
146
15k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
BBQ
matthewcrist
87
9.5k
Testing 201, or: Great Expectations
jmmastey
42
7.2k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
Code Review Best Practice
trishagee
67
18k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.7k
Rails Girls Zürich Keynote
gr2m
94
13k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.4k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Being A Developer After 40
akosma
89
590k
Transcript
© DMM.com Data Platform データ本部 データインフラ部 DREグループ 斎藤 友樹 1
© DMM.com 斎藤 友樹 (サイトウ ユウキ) 2児のパパ 一年くらい前にふらりと入社 子供と遊ぶのが好き リモートになって生産性爆上がり
twitter @yuki_saito_en(前職では禁止されてた) 2 自己紹介 第2子 わたし 奥さん 第1子
© DMM.com ちょっと前の話 BQ.BQ.BQ. BQ
© DMM.com ここまでの長い旅路は省略 データ基盤はAWSに決めました 「Amazon Web Services、“Powered by AWS”ロゴ、[およびかかる資料で使用されるその他のAWS商標] は、米国その他の諸国における、
Amazon.com, Inc.またはその関連会社の商標です。」
© DMM.com AWSで作り込んでいる途中(行動ログAPIはGCP) 「Amazon Web Services、“Powered by AWS”ロゴ、[およびかかる資料で使用されるその他のAWS商標] は、米国その他の諸国における、 Amazon.com,
Inc.またはその関連会社の商標です。」
© DMM.com データの活用を強制すべく DRE (6名,途中から7名) の戦いをいくつか紹介
© DMM.com 取組み No.1 行動ログAPI クラウド化 DONE
© DMM.com prd #E8EAF6 行動ログ VS DRE 2020 1Q eagle-api
Kubernetes Engine Cloud Load Balancing Cloud DNS Cloud Bigtable data pipeline Cloud Pub/Sub Cloud Dataflow Cloud Storage on-premises hq Kubernetes cluster ML Real-time ML Business Analysis Logging Cloud Dataflow
© DMM.com 行動ログ VS DRE 比較表 ただリリースに際して色々やらかしたのはナイショ デプロイ回数 rps コミュニケーション
コスト with 他部 旧シス テム 0 謎 jenkins でざわざわ 10,000くらい(風の噂) 10h/week 新シス テム たくさん github actions でちょちょいと 20,000まで確認済み 0~2h/month
© DMM.com 取組み No.2 オンプレお掃除大作戦 ~ almost DONE ~
© DMM.com オンプレサーバ VS DRE 2019 3Q 172 などなど。。。。 これらの組み合わせにより構成された10を超え
る人智を超越したプロダクト軍 (本番のみ) * 2 * 2 * 2
© DMM.com オンプレサーバ VS DRE 2019 4Q end 65 なんとか普通くらいに
持ってきたぞ。 (本番のみ) * 2
© DMM.com オンプレサーバ VS DRE 2020 2Q~3Q 10 (くらい。たぶん) 他事業部のオンプレ資産活用
ための最低限の構成に (本番のみ)
© DMM.com 取組み No.3 データより大きいデータ。メタデータ拡充 ~ just getting started~
© DMM.com メタデータ VS DRE 2019 4Q end No メタデータ
提供ありなし 1 ビジネスメタデータ あり(保守性に難) 2 テクニカルメタデータ なし 3 データ品質 なし 4 データプロファイリング なし
© DMM.com メタデータ VS DRE 2020 2Q No メタデータ 提供あり/なし
1 ビジネスメタデータ あり(保守性に難) 2 テクニカルメタデータ なし 3 データ品質 あり(ほんの一部) 4 データプロファイリング なし
© DMM.com ありがとうございました!