Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Google BigQuery × Amazon Redshift
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Fumihide Nario
February 06, 2016
Technology
1
3.1k
Google BigQuery × Amazon Redshift
CROSS 2016
Fumihide Nario
February 06, 2016
Tweet
Share
More Decks by Fumihide Nario
See All by Fumihide Nario
サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介
fumihide
1
1.2k
カラムナーデータベース徹底比較
fumihide
2
1.4k
Other Decks in Technology
See All in Technology
Webアクセシビリティ技術と実装の実際
tomokusaba
0
150
20260222ねこIoTLT ねこIoTLTをふりかえる
poropinai1966
0
310
社内ワークショップで終わらせない 業務改善AIエージェント開発
lycorptech_jp
PRO
1
400
【PyCon mini Shizuoka 2026】生成AI時代に画像処理やオーディオ処理のノードエディターを作る理由
kazuhitotakahashi
0
200
もう怖くないバックグラウンド処理 Background Tasks のすべて - Hakodate.swift #1
kantacky
0
230
作るべきものと向き合う - ecspresso 8年間の開発史から学ぶ技術選定 / 技術選定con findy 2026
fujiwara3
6
1.6k
マイグレーションガイドに書いてないRiverpod 3移行話
taiju59
0
330
生成AI活用によるPRレビュー改善の歩み
lycorptech_jp
PRO
4
1.7k
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
4
22k
Databricks (と気合い)で頑張るAI Agent 運用
kameitomohiro
0
340
Exadata Fleet Update
oracle4engineer
PRO
0
1.3k
失敗できる意思決定とソフトウェアとの正しい歩き方_-_変化と向き合う選択肢/ Designing for Reversible Decisions
soudai
PRO
8
1.4k
Featured
See All Featured
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
120
The Limits of Empathy - UXLibs8
cassininazir
1
240
Six Lessons from altMBA
skipperchong
29
4.2k
The Curse of the Amulet
leimatthew05
1
9.3k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
50k
Mobile First: as difficult as doing things right
swwweet
225
10k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
380
So, you think you're a good person
axbom
PRO
2
1.9k
Navigating Weather and Climate Data
rabernat
0
130
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
63
Agile that works and the tools we love
rasmusluckow
331
21k
Transcript
Google BigQuery × Amazon Redshift CyberAgent アドテク本部 成尾 文秀
自己紹介 2011年5月よりサイバーエージェントグループのSAP(現SGE)にて インフラや開発を担当。 2014年4月からアドテク本部にてインフラエンジニアとして 多数の広告プロダクトのサーバー、ミドルウェア、データベースなどの構築、運用から データ分析基盤など担当
株式会社サイバーエージェント 1998年の創業以来、インターネットを軸に事業を展開し 現在では代表的なサービスである「Ameba」をはじめ、 スマートフォン向けに多数のコミュニティサービスやゲームを提供しています。
株式会社サイバーエージェント
アドテク本部 インターネット広告において、広告配信の最適化やメディアの収益最大化という観点から アドテクノロジーの重要度が高まっています。 サイバーエージェントではアドテクノロジー分野におけるこれらのサービスについて各子会社を通じ開発しておりましたが 各サービスの開発部門を横断して組織化する専門部署としてアドテク本部が設立されました。
Google BigQuery アドテク本部ではオンプレミスだけでなく OpenStackで構築したPrivate Cloudをはじめ複数のCloudを専用線で結び利用しています。 各環境にあるサーバー側で出力したログを Fluentdを経由してBigQuery側にStreaming insert ・Streaming insertすることでほぼリアルタイムで確認が可能
・他のDWHからの移行ではなくBigQueryを利用する上で新規で作成 ・基本的にスキーマに変更が少なく JOINも少ない ・多角度からの分析を定常的に行う環境ではなく必要に応じて分析
各環境にあるサーバー側で出力したログを Fluentdを経由してRedshiftにLoad ・多角度からの分析を定常的に行う環境で利用 ・ログのスキーマ変更が多い、人が実際に SQLを実行する機会も多く、 JOINも多様される ・アドテク本部では小さいインスタンスタイプも含め 100Node以上利用(昨年10月時点) Amazon Redshift
Sparkで処理を行うケースも増えてきました。 ・定常的な処理(Cronによるバッチ処理)で利用 ・アドテク本部ではパフォーマンスと安定性を求め MapR Technologies社のMapR M7を採用 ・Spark Streaming処理、MapR-FS(HDFS互換)にデータを置いての Spark処理やMapReduce処理 Spark
ちなみに・・
アドテク本部ではRedshiftのもとになっているactian社のMatrixを採用し利用が進んでいます。 ・インスタンスタイプに縛られずハードウェアの選定ができる Matrix さいごに・・