Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オートスケールにおけるオブザーバビリティへの取り組み / Observability with...
Search
Kazumichi Yamamoto
July 23, 2024
Technology
1
570
オートスケールにおけるオブザーバビリティへの取り組み / Observability with autoscale
SRE勉強会 ~各社の取り組みや課題から学ぶ会~(
https://techplay.jp/event/947728
)での登壇資料
Kazumichi Yamamoto
July 23, 2024
Tweet
Share
More Decks by Kazumichi Yamamoto
See All by Kazumichi Yamamoto
からあげの町からお届けするフルリモートSREの日常 / 2023-06-21 tech lunch
yamamotofebc
0
230
「合意のない期待」を防ぐためのドラッカー風エクササイズ
yamamotofebc
3
1.1k
さくらのクラウド向けオートスケーラー / autoscaler for SAKURA cloud
yamamotofebc
1
1.9k
sacloud tools
yamamotofebc
1
92
Rioでコンテナを楽しくする / Rio − Make Containers Fun!
yamamotofebc
2
700
Rancher 2.0 HA with Terraform
yamamotofebc
3
3.6k
Rancher Meetup Hiroshima #1 LT - カタログを使ってみよう // Rancher Meetup Hiroshima 2018-05-11
yamamotofebc
2
630
Rancher Meetup KYOTO #1 LT - 外からコンテナに繋ぐには? // Rancher Meetup Kyoto 2018-04-27
yamamotofebc
4
420
Building HA Kubernetes Clusters with RKE
yamamotofebc
4
2.9k
Other Decks in Technology
See All in Technology
どちらかだけじゃもったいないかも? ECSとEKSを適材適所で併用するメリット、運用課題とそれらの対応について
tk3fftk
2
260
JAWS FESTA 2024「バスロケ」GPS×サーバーレスの開発と運用の舞台裏/jawsfesta2024-bus-gps-serverless
ma2shita
3
310
Apache Iceberg Case Study in LY Corporation
lycorptech_jp
PRO
0
360
JAWS DAYS 2025 アーキテクチャ道場 事前説明会 / JAWS DAYS 2025 briefing document
naospon
0
2.8k
4th place solution Eedi - Mining Misconceptions in Mathematics
rist
0
150
Amazon Athenaから利用時のGlueのIcebergテーブルのメンテナンスについて
nayuts
0
110
実は強い 非ViTな画像認識モデル
tattaka
3
1.4k
エンジニア主導の企画立案を可能にする組織とは?
recruitengineers
PRO
1
300
Aurora PostgreSQLがCloudWatch Logsに 出力するログの課金を削減してみる #jawsdays2025
non97
1
240
[OpsJAWS Meetup33 AIOps] Amazon Bedrockガードレールで守る安全なAI運用
akiratameto
1
130
技術スタックだけじゃない、業務ドメイン知識のオンボーディングも同じくらいの量が必要な話
niftycorp
PRO
0
130
役員・マネージャー・著者・エンジニアそれぞれの立場から見たAWS認定資格
nrinetcom
PRO
4
6.6k
Featured
See All Featured
Side Projects
sachag
452
42k
The Cult of Friendly URLs
andyhume
78
6.2k
BBQ
matthewcrist
87
9.5k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
1k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Music & Morning Musume
bryan
46
6.4k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
6
580
Scaling GitHub
holman
459
140k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
440
Large-scale JavaScript Application Architecture
addyosmani
511
110k
Speed Design
sergeychernyshev
27
810
Transcript
© SAKURA internet Inc. オートスケールにおける オブザーバビリティへの取り組み 2024-07-23 SRE勉強会 〜各社の取り組みや課題から学ぶ会〜 @yamamoto-febc
⼭本 和道(@yamamoto-febc) さくらインターネット クラウド事業本部 SRE室 スタッフエンジニア ⾃⼰紹介
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυɾେنܭࢉࢿݯΠϯϑϥΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ ソフトウェア開発、 インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエンジニア採⽤を強化しています
さくらインターネットは新たなアイデアの創出に強い熱意と情熱を持って挑戦する お客様をはじめ、私たちとつながりのあるすべての⼈たちのために、未来のあるべ き姿を想い描きながら ―「やりたいこと」を「できる」に変える ― あらゆるアプ ローチを “インターネット”を通じて提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/recruit-engineer/
© SAKURA internet Inc. • オートスケールの紹介 • オブザーバビリティへの取り組み • 採⽤したツールの使い勝⼿
今⽇の発表内容
© SAKURA internet Inc. オートスケール https://manual.sakura.ad.jp/cloud/autoscale/autoscale.html
© SAKURA internet Inc. APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager (コントローラー)
リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash オートスケールのバックエンド構成
© SAKURA internet Inc. データベース オートスケールのバックエンド構成 ※ リソース数の増加に合わせAPIサーバのペアをスケールアウト
None
© SAKURA internet Inc. オートスケールのバックエンド構成(再掲) APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager
(コントローラー) リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash
© SAKURA internet Inc. オートスケールのバックエンド構成(OpenTelemetry対応) APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager
(コントローラー) リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash collector collector
© SAKURA internet Inc. • OSSのOTelディストリビューション • トレース/メトリクス/ログを1箇所で管理 • データストアは
コールドストレージとして さくらのオブジェクトストレージも使える https://signoz.io/
© SAKURA internet Inc. Why? • スモールスタートしたかった → 全部1箇所にあるので使うのを⽌めるのが楽 •
できるだけ外部サービスを使いたくなかった → セルフホストできる & いざとなればソースコードを追える • 運⽤ノウハウがあるものを選びたかった → ClickHouseなら運⽤ノウハウを持っていた
© SAKURA internet Inc. 実際どう? • 👍 デプロイ〜運⽤は⾮常に楽だった → ⼿軽に始められてgood
• 👍 ダッシュボードは問題なく使える → ただしある程度⾃分で作り込む必要あり (公開ダッシュボードが少ない) • 😢トレースのUIについては不満あり → 痒いところに⼿が届かない感じ...
© SAKURA internet Inc. n オートスケールでOpenTelemetryを導⼊ n OTelディストリビューションとして SigNozを利⽤中 n
SigNozの使い勝⼿は悪くない 今⽇のまとめ
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυɾେنܭࢉࢿݯΠϯϑϥΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ ソフトウェア開発、 インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエンジニア採⽤を強化しています
さくらインターネットは新たなアイデアの創出に強い熱意と情熱を持って挑戦する お客様をはじめ、私たちとつながりのあるすべての⼈たちのために、未来のあるべ き姿を想い描きながら ―「やりたいこと」を「できる」に変える ― あらゆるアプ ローチを “インターネット”を通じて提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/recruit-engineer/