Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オートスケールにおけるオブザーバビリティへの取り組み / Observability with...
Search
Kazumichi Yamamoto
July 23, 2024
Technology
1.2k
1
Share
オートスケールにおけるオブザーバビリティへの取り組み / Observability with autoscale
SRE勉強会 ~各社の取り組みや課題から学ぶ会~(
https://techplay.jp/event/947728
)での登壇資料
Kazumichi Yamamoto
July 23, 2024
More Decks by Kazumichi Yamamoto
See All by Kazumichi Yamamoto
からあげの町からお届けするフルリモートSREの日常 / 2023-06-21 tech lunch
yamamotofebc
0
320
「合意のない期待」を防ぐためのドラッカー風エクササイズ
yamamotofebc
3
1.2k
さくらのクラウド向けオートスケーラー / autoscaler for SAKURA cloud
yamamotofebc
1
2.1k
sacloud tools
yamamotofebc
1
140
Rioでコンテナを楽しくする / Rio − Make Containers Fun!
yamamotofebc
2
820
Rancher 2.0 HA with Terraform
yamamotofebc
3
3.8k
Rancher Meetup Hiroshima #1 LT - カタログを使ってみよう // Rancher Meetup Hiroshima 2018-05-11
yamamotofebc
2
710
Rancher Meetup KYOTO #1 LT - 外からコンテナに繋ぐには? // Rancher Meetup Kyoto 2018-04-27
yamamotofebc
4
450
Building HA Kubernetes Clusters with RKE
yamamotofebc
4
3.1k
Other Decks in Technology
See All in Technology
Gradle×GitHub_ActionsでCI時間を約50%短縮 ジョブ分割の設計と落とし穴 / Cutting CI Time by ~50% with Gradle and GitHub Actions: Job-Splitting Design and Pitfalls
takatty
0
620
Javaコミュニティをもっと楽しむための9箇条
takasyou
0
1.2k
ポケモンの型をTypeScriptの型システムで表現してみた
subroh0508
0
180
地元にいないローカルオーガナイザーの立ち回り
uvb_76
1
450
AI駆動開発が変える、大規模開発の前提 ーHuman in the Loop から Human on the Loop へ / AIE2026
visional_engineering_and_design
2
2.2k
APIテストとは?
nagix
0
180
Unlocking the Apps
pimterry
0
190
価格.comをAI駆動で全面刷新する ー 30年分の技術的負債を返し、次の30年の土台をつくる ー / AI Engineering Summit Tokyo 2026
tkyowa
38
41k
「気づいたら仕事が終わっている」バクラクAIエージェント本番運用の裏側 / layerx-bakuraku-aie2026
yuya4
18
9.1k
Oracle Cloud Infrastructure IaaS 新機能アップデート 2026/3 - 2026/5
oracle4engineer
PRO
1
160
Spring Boot における AOT Cache 活用テクニックと 起動時間改善事例
ntt_dsol_java
0
200
AI フレンドリーなエラー監視を TypeScript で実現する
shinyaigeek
2
250
Featured
See All Featured
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2.1k
Un-Boring Meetings
codingconduct
0
310
How Software Deployment tools have changed in the past 20 years
geshan
0
34k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
Code Review Best Practice
trishagee
74
20k
Building Adaptive Systems
keathley
44
3k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
220
Reality Check: Gamification 10 Years Later
codingconduct
0
2.2k
Paper Plane (Part 1)
katiecoart
PRO
0
8.4k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
520
Transcript
© SAKURA internet Inc. オートスケールにおける オブザーバビリティへの取り組み 2024-07-23 SRE勉強会 〜各社の取り組みや課題から学ぶ会〜 @yamamoto-febc
⼭本 和道(@yamamoto-febc) さくらインターネット クラウド事業本部 SRE室 スタッフエンジニア ⾃⼰紹介
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυɾେنܭࢉࢿݯΠϯϑϥΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ ソフトウェア開発、 インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエンジニア採⽤を強化しています
さくらインターネットは新たなアイデアの創出に強い熱意と情熱を持って挑戦する お客様をはじめ、私たちとつながりのあるすべての⼈たちのために、未来のあるべ き姿を想い描きながら ―「やりたいこと」を「できる」に変える ― あらゆるアプ ローチを “インターネット”を通じて提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/recruit-engineer/
© SAKURA internet Inc. • オートスケールの紹介 • オブザーバビリティへの取り組み • 採⽤したツールの使い勝⼿
今⽇の発表内容
© SAKURA internet Inc. オートスケール https://manual.sakura.ad.jp/cloud/autoscale/autoscale.html
© SAKURA internet Inc. APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager (コントローラー)
リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash オートスケールのバックエンド構成
© SAKURA internet Inc. データベース オートスケールのバックエンド構成 ※ リソース数の増加に合わせAPIサーバのペアをスケールアウト
None
© SAKURA internet Inc. オートスケールのバックエンド構成(再掲) APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager
(コントローラー) リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash
© SAKURA internet Inc. オートスケールのバックエンド構成(OpenTelemetry対応) APIサーバ APIサーバ (Active-Standby構成) データベース autoscale-manager
(コントローラー) リソースごとに ユニットファイルを⽣成 cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (負荷計測) router-usage (負荷計測) autoscaler (計算/スケール動作) bash bash cpu-usage (CPU負荷計測) router-usage (NW負荷計測) autoscaler (計算/スケール動作) bash collector collector
© SAKURA internet Inc. • OSSのOTelディストリビューション • トレース/メトリクス/ログを1箇所で管理 • データストアは
コールドストレージとして さくらのオブジェクトストレージも使える https://signoz.io/
© SAKURA internet Inc. Why? • スモールスタートしたかった → 全部1箇所にあるので使うのを⽌めるのが楽 •
できるだけ外部サービスを使いたくなかった → セルフホストできる & いざとなればソースコードを追える • 運⽤ノウハウがあるものを選びたかった → ClickHouseなら運⽤ノウハウを持っていた
© SAKURA internet Inc. 実際どう? • 👍 デプロイ〜運⽤は⾮常に楽だった → ⼿軽に始められてgood
• 👍 ダッシュボードは問題なく使える → ただしある程度⾃分で作り込む必要あり (公開ダッシュボードが少ない) • 😢トレースのUIについては不満あり → 痒いところに⼿が届かない感じ...
© SAKURA internet Inc. n オートスケールでOpenTelemetryを導⼊ n OTelディストリビューションとして SigNozを利⽤中 n
SigNozの使い勝⼿は悪くない 今⽇のまとめ
SAKURA internet ࣾձΛࢧ͑Δ ύϒϦοΫΫϥυɾେنܭࢉࢿݯΠϯϑϥΛ Ұॹʹ࡞Γ·ͤΜ͔ʁ ソフトウェア開発、 インフラ基盤から フロントエンドまで 採⽤強化中! さくらインターネットではエンジニア採⽤を強化しています
さくらインターネットは新たなアイデアの創出に強い熱意と情熱を持って挑戦する お客様をはじめ、私たちとつながりのあるすべての⼈たちのために、未来のあるべ き姿を想い描きながら ―「やりたいこと」を「できる」に変える ― あらゆるアプ ローチを “インターネット”を通じて提供します。 詳しくはWebサイトにて、カジュアル⾯談もやってます 👉 www.sakura.ad.jp/lp/recruit-engineer/