Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オートスケールにおけるオブザーバビリティへの取り組み / Observability with...
Search
Kazumichi Yamamoto
July 23, 2024
Technology
1.2k
1
Share
オートスケールにおけるオブザーバビリティへの取り組み / Observability with autoscale
SRE勉強会 ~各社の取り組みや課題から学ぶ会~(
https://techplay.jp/event/947728
)での登壇資料
Kazumichi Yamamoto
July 23, 2024
More Decks by Kazumichi Yamamoto
See All by Kazumichi Yamamoto
からあげの町からお届けするフルリモートSREの日常 / 2023-06-21 tech lunch
yamamotofebc
0
320
「合意のない期待」を防ぐためのドラッカー風エクササイズ
yamamotofebc
3
1.2k
さくらのクラウド向けオートスケーラー / autoscaler for SAKURA cloud
yamamotofebc
1
2.1k
sacloud tools
yamamotofebc
1
140
Rioでコンテナを楽しくする / Rio − Make Containers Fun!
yamamotofebc
2
820
Rancher 2.0 HA with Terraform
yamamotofebc
3
3.8k
Rancher Meetup Hiroshima #1 LT - カタログを使ってみよう // Rancher Meetup Hiroshima 2018-05-11
yamamotofebc
2
710
Rancher Meetup KYOTO #1 LT - 外からコンテナに繋ぐには? // Rancher Meetup Kyoto 2018-04-27
yamamotofebc
4
450
Building HA Kubernetes Clusters with RKE
yamamotofebc
4
3.1k
Other Decks in Technology
See All in Technology
もりもり新機能を一挙紹介! AgentCoreに入門して、AWS上にAIエージェントを構築しよう
minorun365
PRO
6
730
トークン数だけでは測れない — Claude Code 組織展開の効果検証から学んだこと
makikub
0
120
Platform Engineering as a Product: Criteria for Improvement and Multi-Tenant Design
kumorn5s
0
490
Claude code Orchestra
ozakiomumkj
3
920
Gradle×GitHub_ActionsでCI時間を約50%短縮 ジョブ分割の設計と落とし穴 / Cutting CI Time by ~50% with Gradle and GitHub Actions: Job-Splitting Design and Pitfalls
takatty
0
620
タクシーアプリ『GO』の実践的データ活用
mot_techtalk
2
110
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
2
210
Mastering Ruby Box
tagomoris
3
140
ルールやカスタム機能、どう使う?理想の出力を引き出すために今知りたいIBM Bob 5つの機能
muehara
1
310
AI駆動開発が変える、大規模開発の前提 ーHuman in the Loop から Human on the Loop へ / AIE2026
visional_engineering_and_design
2
2.3k
Spring AI × MCP 入門〜AIエージェントへのツール公開、境界設計から始める最小構成 〜
yuyamiyamoto
0
210
Spring Boot における AOT Cache 活用テクニックと 起動時間改善事例
ntt_dsol_java
0
200
Featured
See All Featured
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
The Curse of the Amulet
leimatthew05
1
13k
Art, The Web, and Tiny UX
lynnandtonic
304
22k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.3k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
400
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
160
Agile that works and the tools we love
rasmusluckow
331
21k
The Cost Of JavaScript in 2023
addyosmani
55
10k
エンジニアに許された特別な時間の終わり
watany
107
250k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
370
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
140
How to build a perfect <img>
jonoalderson
1
5.6k
Transcript
© SAKURA internet Inc. オートスケールにおける オブザーバビリティへの取り組み 2024-07-23 SRE勉強会 〜各社の取り組みや課題から学ぶ会〜 @yamamoto-febc
⼭本 和道(@yamamoto-febc) さくらインターネット クラウド事業本部 SRE室 スタッフエンジニア ⾃⼰紹介
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυɾେنܭࢉࢿݯΠϯϑϥΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ ソフトウェア開発、 インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエンジニア採⽤を強化しています
さくらインターネットは新たなアイデアの創出に強い熱意と情熱を持って挑戦する お客様をはじめ、私たちとつながりのあるすべての⼈たちのために、未来のあるべ き姿を想い描きながら ―「やりたいこと」を「できる」に変える ― あらゆるアプ ローチを “インターネット”を通じて提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/recruit-engineer/
© SAKURA internet Inc. • オートスケールの紹介 • オブザーバビリティへの取り組み • 採⽤したツールの使い勝⼿
今⽇の発表内容
© SAKURA internet Inc. オートスケール https://manual.sakura.ad.jp/cloud/autoscale/autoscale.html
© SAKURA internet Inc. APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager (コントローラー)
リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash オートスケールのバックエンド構成
© SAKURA internet Inc. データベース オートスケールのバックエンド構成 ※ リソース数の増加に合わせAPIサーバのペアをスケールアウト
None
© SAKURA internet Inc. オートスケールのバックエンド構成(再掲) APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager
(コントローラー) リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash
© SAKURA internet Inc. オートスケールのバックエンド構成(OpenTelemetry対応) APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager
(コントローラー) リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash collector collector
© SAKURA internet Inc. • OSSのOTelディストリビューション • トレース/メトリクス/ログを1箇所で管理 • データストアは
コールドストレージとして さくらのオブジェクトストレージも使える https://signoz.io/
© SAKURA internet Inc. Why? • スモールスタートしたかった → 全部1箇所にあるので使うのを⽌めるのが楽 •
できるだけ外部サービスを使いたくなかった → セルフホストできる & いざとなればソースコードを追える • 運⽤ノウハウがあるものを選びたかった → ClickHouseなら運⽤ノウハウを持っていた
© SAKURA internet Inc. 実際どう? • 👍 デプロイ〜運⽤は⾮常に楽だった → ⼿軽に始められてgood
• 👍 ダッシュボードは問題なく使える → ただしある程度⾃分で作り込む必要あり (公開ダッシュボードが少ない) • 😢トレースのUIについては不満あり → 痒いところに⼿が届かない感じ...
© SAKURA internet Inc. n オートスケールでOpenTelemetryを導⼊ n OTelディストリビューションとして SigNozを利⽤中 n
SigNozの使い勝⼿は悪くない 今⽇のまとめ
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυɾେنܭࢉࢿݯΠϯϑϥΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ ソフトウェア開発、 インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエンジニア採⽤を強化しています
さくらインターネットは新たなアイデアの創出に強い熱意と情熱を持って挑戦する お客様をはじめ、私たちとつながりのあるすべての⼈たちのために、未来のあるべ き姿を想い描きながら ―「やりたいこと」を「できる」に変える ― あらゆるアプ ローチを “インターネット”を通じて提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/recruit-engineer/