Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Google BigQuery × Amazon Redshift
Search
Fumihide Nario
February 06, 2016
Technology
1
3.1k
Google BigQuery × Amazon Redshift
CROSS 2016
Fumihide Nario
February 06, 2016
Tweet
Share
More Decks by Fumihide Nario
See All by Fumihide Nario
サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介
fumihide
1
1.2k
カラムナーデータベース徹底比較
fumihide
2
1.4k
Other Decks in Technology
See All in Technology
OSだってコンテナしたい❗Image Modeが切り拓くLinux OS運用の新時代
tsukaman
0
120
その意思決定、まだ続けるんですか? ~痛みを超えて未来を作る、AI時代の撤退とピボットの技術~
applism118
34
21k
組織の“見えない壁”を越えよ!エンタープライズシフトに必須な3つのPMの「在り方」変革 #pmconf2025
masakazu178
1
650
IaC を使いたくないけどポリシー管理をどうにかしたい
kazzpapa3
1
110
adk-samples に学ぶデータ分析 LLM エージェント開発
na0
3
290
LINEヤフー バックエンド組織・体制の紹介
lycorptech_jp
PRO
0
840
AIと自動化がもたらす業務効率化の実例: 反社チェック等の調査・業務プロセス自動化
enpipi
0
760
ECS組み込みのBlue/Greenデプロイを動かしてELB側の動きを観察してみる
yuki_ink
3
390
Android Studio Otter の最新 Gemini 機能 / Latest Gemini features in Android Studio Otter
yanzm
0
120
国産クラウドを支える設計とチームの変遷 “技術・組織・ミッション”
kazeburo
4
6.6k
ZOZOTOWNカート決済リプレイス ── モジュラモノリスという過渡期戦略
zozotech
PRO
0
500
Bedrock のコスト監視設計
fohte
2
210
Featured
See All Featured
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
980
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Building Applications with DynamoDB
mza
96
6.8k
Rails Girls Zürich Keynote
gr2m
95
14k
Docker and Python
trallard
46
3.7k
Typedesign – Prime Four
hannesfritz
42
2.9k
4 Signs Your Business is Dying
shpigford
186
22k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
11
940
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Transcript
Google BigQuery × Amazon Redshift CyberAgent アドテク本部 成尾 文秀
自己紹介 2011年5月よりサイバーエージェントグループのSAP(現SGE)にて インフラや開発を担当。 2014年4月からアドテク本部にてインフラエンジニアとして 多数の広告プロダクトのサーバー、ミドルウェア、データベースなどの構築、運用から データ分析基盤など担当
株式会社サイバーエージェント 1998年の創業以来、インターネットを軸に事業を展開し 現在では代表的なサービスである「Ameba」をはじめ、 スマートフォン向けに多数のコミュニティサービスやゲームを提供しています。
株式会社サイバーエージェント
アドテク本部 インターネット広告において、広告配信の最適化やメディアの収益最大化という観点から アドテクノロジーの重要度が高まっています。 サイバーエージェントではアドテクノロジー分野におけるこれらのサービスについて各子会社を通じ開発しておりましたが 各サービスの開発部門を横断して組織化する専門部署としてアドテク本部が設立されました。
Google BigQuery アドテク本部ではオンプレミスだけでなく OpenStackで構築したPrivate Cloudをはじめ複数のCloudを専用線で結び利用しています。 各環境にあるサーバー側で出力したログを Fluentdを経由してBigQuery側にStreaming insert ・Streaming insertすることでほぼリアルタイムで確認が可能
・他のDWHからの移行ではなくBigQueryを利用する上で新規で作成 ・基本的にスキーマに変更が少なく JOINも少ない ・多角度からの分析を定常的に行う環境ではなく必要に応じて分析
各環境にあるサーバー側で出力したログを Fluentdを経由してRedshiftにLoad ・多角度からの分析を定常的に行う環境で利用 ・ログのスキーマ変更が多い、人が実際に SQLを実行する機会も多く、 JOINも多様される ・アドテク本部では小さいインスタンスタイプも含め 100Node以上利用(昨年10月時点) Amazon Redshift
Sparkで処理を行うケースも増えてきました。 ・定常的な処理(Cronによるバッチ処理)で利用 ・アドテク本部ではパフォーマンスと安定性を求め MapR Technologies社のMapR M7を採用 ・Spark Streaming処理、MapR-FS(HDFS互換)にデータを置いての Spark処理やMapReduce処理 Spark
ちなみに・・
アドテク本部ではRedshiftのもとになっているactian社のMatrixを採用し利用が進んでいます。 ・インスタンスタイプに縛られずハードウェアの選定ができる Matrix さいごに・・