Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オートスケールにおけるオブザーバビリティへの取り組み / Observability with...
Search
Kazumichi Yamamoto
July 23, 2024
Technology
1
320
オートスケールにおけるオブザーバビリティへの取り組み / Observability with autoscale
SRE勉強会 ~各社の取り組みや課題から学ぶ会~(
https://techplay.jp/event/947728
)での登壇資料
Kazumichi Yamamoto
July 23, 2024
Tweet
Share
More Decks by Kazumichi Yamamoto
See All by Kazumichi Yamamoto
からあげの町からお届けするフルリモートSREの日常 / 2023-06-21 tech lunch
yamamotofebc
0
200
「合意のない期待」を防ぐためのドラッカー風エクササイズ
yamamotofebc
3
1k
さくらのクラウド向けオートスケーラー / autoscaler for SAKURA cloud
yamamotofebc
1
1.8k
sacloud tools
yamamotofebc
1
86
Rioでコンテナを楽しくする / Rio − Make Containers Fun!
yamamotofebc
2
660
Rancher 2.0 HA with Terraform
yamamotofebc
3
3.5k
Rancher Meetup Hiroshima #1 LT - カタログを使ってみよう // Rancher Meetup Hiroshima 2018-05-11
yamamotofebc
2
610
Rancher Meetup KYOTO #1 LT - 外からコンテナに繋ぐには? // Rancher Meetup Kyoto 2018-04-27
yamamotofebc
4
420
Building HA Kubernetes Clusters with RKE
yamamotofebc
4
2.9k
Other Decks in Technology
See All in Technology
ABEMA のコンテンツ制作を最適化!生成 AI x クラウド映像編集システム / abema-ai-editor
cyberagentdevelopers
PRO
1
180
30万人が利用するチャットをFirebase Realtime DatabaseからActionCableへ移行する方法
ryosk7
5
350
[AWS JAPAN 生成AIハッカソン] Dialog の紹介
yoshimi0227
0
150
AWS CDKでデータリストアの運用、どのように設計する?~Aurora・EFSの実践事例を紹介~/aws-cdk-data-restore-aurora-efs
mhrtech
4
650
AIを駆使したゲーム開発戦略: 新設AI組織の取り組み / sge-ai-strategy
cyberagentdevelopers
PRO
1
130
Amazon FSx for NetApp ONTAPを利用するにあたっての要件整理と設計のポイント
non97
1
160
スプリントゴールにチームの状態も設定する背景とその効果 / Team state in sprint goals why and impact
kakehashi
2
100
Nix入門パラダイム編
asa1984
2
200
Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間
oracle4engineer
PRO
27
12k
新卒1年目が挑む!生成AI × マルチエージェントで実現する次世代オンボーディング / operation-ai-onboarding
cyberagentdevelopers
PRO
1
160
Jr. Championsになって、強く連携しながらAWSをもっと使いたい!~AWSに対する期待と行動~
amixedcolor
0
190
APIテスト自動化の勘所
yokawasa
7
4.1k
Featured
See All Featured
Testing 201, or: Great Expectations
jmmastey
38
7k
GraphQLとの向き合い方2022年版
quramy
43
13k
Music & Morning Musume
bryan
46
6.1k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
StorybookのUI Testing Handbookを読んだ
zakiyama
26
5.2k
For a Future-Friendly Web
brad_frost
175
9.4k
Automating Front-end Workflow
addyosmani
1365
200k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
37
1.8k
YesSQL, Process and Tooling at Scale
rocio
167
14k
Large-scale JavaScript Application Architecture
addyosmani
510
110k
Done Done
chrislema
181
16k
How GitHub (no longer) Works
holman
311
140k
Transcript
© SAKURA internet Inc. オートスケールにおける オブザーバビリティへの取り組み 2024-07-23 SRE勉強会 〜各社の取り組みや課題から学ぶ会〜 @yamamoto-febc
⼭本 和道(@yamamoto-febc) さくらインターネット クラウド事業本部 SRE室 スタッフエンジニア ⾃⼰紹介
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυɾେنܭࢉࢿݯΠϯϑϥΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ ソフトウェア開発、 インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエンジニア採⽤を強化しています
さくらインターネットは新たなアイデアの創出に強い熱意と情熱を持って挑戦する お客様をはじめ、私たちとつながりのあるすべての⼈たちのために、未来のあるべ き姿を想い描きながら ―「やりたいこと」を「できる」に変える ― あらゆるアプ ローチを “インターネット”を通じて提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/recruit-engineer/
© SAKURA internet Inc. • オートスケールの紹介 • オブザーバビリティへの取り組み • 採⽤したツールの使い勝⼿
今⽇の発表内容
© SAKURA internet Inc. オートスケール https://manual.sakura.ad.jp/cloud/autoscale/autoscale.html
© SAKURA internet Inc. APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager (コントローラー)
リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash オートスケールのバックエンド構成
© SAKURA internet Inc. データベース オートスケールのバックエンド構成 ※ リソース数の増加に合わせAPIサーバのペアをスケールアウト
None
© SAKURA internet Inc. オートスケールのバックエンド構成(再掲) APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager
(コントローラー) リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash
© SAKURA internet Inc. オートスケールのバックエンド構成(OpenTelemetry対応) APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager
(コントローラー) リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash collector collector
© SAKURA internet Inc. • OSSのOTelディストリビューション • トレース/メトリクス/ログを1箇所で管理 • データストアは
コールドストレージとして さくらのオブジェクトストレージも使える https://signoz.io/
© SAKURA internet Inc. Why? • スモールスタートしたかった → 全部1箇所にあるので使うのを⽌めるのが楽 •
できるだけ外部サービスを使いたくなかった → セルフホストできる & いざとなればソースコードを追える • 運⽤ノウハウがあるものを選びたかった → ClickHouseなら運⽤ノウハウを持っていた
© SAKURA internet Inc. 実際どう? • 👍 デプロイ〜運⽤は⾮常に楽だった → ⼿軽に始められてgood
• 👍 ダッシュボードは問題なく使える → ただしある程度⾃分で作り込む必要あり (公開ダッシュボードが少ない) • 😢トレースのUIについては不満あり → 痒いところに⼿が届かない感じ...
© SAKURA internet Inc. n オートスケールでOpenTelemetryを導⼊ n OTelディストリビューションとして SigNozを利⽤中 n
SigNozの使い勝⼿は悪くない 今⽇のまとめ
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυɾେنܭࢉࢿݯΠϯϑϥΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ ソフトウェア開発、 インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエンジニア採⽤を強化しています
さくらインターネットは新たなアイデアの創出に強い熱意と情熱を持って挑戦する お客様をはじめ、私たちとつながりのあるすべての⼈たちのために、未来のあるべ き姿を想い描きながら ―「やりたいこと」を「できる」に変える ― あらゆるアプ ローチを “インターネット”を通じて提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/recruit-engineer/