Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Instanauts_jp#9_基調講演#1_InstanaとTurbonomicで始める障害...
Search
Instanauts_jp
October 16, 2025
0
5
Instanauts_jp#9_基調講演#1_InstanaとTurbonomicで始める障害対応とコスト削減(Airitech様)
「Instanauts_jp#9 Instanaユーザ会2周年!仲間と共に新たな発見を!」におけるAiritech様の基調講演の資料です。
Instanauts_jp
October 16, 2025
Tweet
Share
More Decks by Instanauts_jp
See All by Instanauts_jp
Instanauts_jp#9_基調講演#2_TSUBASA OpenAPIクラウド基盤における Instanaの活用事例(T&Iイノベーションセンター様)
instanautsjp
0
17
IBM Instana -Instanauts_jp#8 Instana Global開発メンバーと交流しよう
instanautsjp
0
63
みんなのInstana 全社展開 Instanauts_jp#4
instanautsjp
0
99
IBM TechXchange Conference 2024@ラスベガス 凱旋登壇体験記
instanautsjp
0
110
10分でわかるInstana_202412.pdf
instanautsjp
0
110
JVM(JavaVM)の性能分析者観点で探るInstanaの可能性
instanautsjp
0
430
Instanauts_jp_6_東京リージョンへの移行(GMOあおぞら)
instanautsjp
0
42
Instana × DevOps対談 ~InstanaとDevOpsのシナジーを探る~
instanautsjp
0
53
10分でわかるInstana
instanautsjp
0
37
Featured
See All Featured
The World Runs on Bad Software
bkeepers
PRO
72
11k
Facilitating Awesome Meetings
lara
56
6.6k
Bash Introduction
62gerente
615
210k
For a Future-Friendly Web
brad_frost
180
10k
Writing Fast Ruby
sferik
629
62k
Unsuck your backbone
ammeep
671
58k
Fireside Chat
paigeccino
40
3.7k
Site-Speed That Sticks
csswizardry
13
910
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Leading Effective Engineering Teams in the AI Era
addyosmani
7
460
Testing 201, or: Great Expectations
jmmastey
45
7.7k
Making Projects Easy
brettharned
120
6.4k
Transcript
Airitech株式会社 InstanaとTurbonomicで 始める障害対応とコスト削減
1.はじめに - 自己紹介 2 山﨑 政憲 Airitech株式会社 代表取締役 IBM Champion(AIOps)
今でも現役のトラブルシュータ。
1.はじめに - SREブログ 3 Qiitaにて、Airitech社員の小畑 啓さんと一緒にInstanaを活用したSRE実践につ いてブログ掲載中。全9章予定で5章目まで公開中。
1.はじめに - トラブルシュート事件簿 4 私自身もトラブルシュート経験をQiitaに執筆しています。 Instana活用の事例情報として活用してください。
2.本日のお題 5 ある日、お客様から相談が寄せられました。 1. 本番環境でDBサーバがダウンしてしまい、サービスが停止してしまっ た。原因はDBサーバのメモリ不足のため、サイズアップしたのだが、 本番移行前にじっくり性能検証を行ったのに見つけられなかった理由を 知りたい。 2. 性能が重要なシステムなので、ハイスペックなインスタンスを多数使っ
ていたが、性能試験が空振りだったので、サイジングを見直したい。
3.DBメモリ不足を検証で見つけられなかった理由 6 1. 検証用DBサーバをInstanaで監視できるように設定して負荷試験を再実 施。本番環境で発生している負荷の1.5倍の負荷を与えてみた。 • クエリの実行時間やバッファヒット率等、特に問題は見当たらない。 • DB接続プールの総数に比べて、実際に使用している数が少ない。 必要量は総数の50%程度しかない。
DB接続毎にAPサーバ、DBサーバともにメモリを消費するため、無駄 なメモリ消費が発生していることになる。
3.DBメモリ不足を検証で見つけられなかった理由 7 2. 検証用DBサーバの稼働統計を取得 • DBサーバのバッファメモリの使用率が非常に低い。 5~10%くらいしか使っていない。 3. 本番用DBサーバの稼働統計を取得 •
DBサーバのバッファメモリの使用率が非常に高い。 99.9%を使っている状況。 ※検証用と本番用で全く相反する結果
3.DBメモリ不足を検証で見つけられなかった理由 8 なぜ検証環境と本番環境でメモリ使用量が全く違うのか? 確認してみたところ、検証環境で動作させていない処理によって、履歴デ ータの大量ロードが発生していることが判明した。 過去数カ月分のデータがDBのメモリ上に居残っている状況ということが判 明。 → これまでの性能検証では、本番での稼働状況を再現できていなかった。
4.サイジングの見直し 9 DBサーバのメモリ使用量が本番環境では非常に多い事が分かりました。 では、サイジングの見直しではDBサーバのサイズダウンは可能なのでしょ うか?
4.サイジングの見直し 10 結論:不可能 DB接続プールの接続数を見直せば、メモリは余裕ができる。 しかし、共有バッファに溜まった履歴データは削除はできない。 結果として、サイズダウンが出来る程の余裕は生まれない。
4.サイジングの見直し 11 メモリ使用量には余裕が無いということはサイジング見直しでコストダウ ンは不可能でしょうか?
4.サイジングの見直し 12 結論:可能 同じ役割のDBインスタンスが多く存在するが、メモリ使用量以外の リソース(例:CPU等)はかなりの余裕が存在する。 DBサーバの台数削減が可能。 結果的にサーバの台数は1/3まで削減され、大幅なコストダウンが可 能となった。
5.Instana & Turbonomic 13 本件では、トラブルシュートにInstanaを、サイジング見直しに Turbonomicを使いました。
5.Instana & Turbonomic 14 1. 本件におけるInstanaのメリット ① DBCP2の接続プールの状態監視を実現 (大半が使われていないことが判明) 2.
本件におけるTurbonomicのメリット ① 合計300インスタンス。 役割も台数も多数あるインスタンスを一括で管理できる。 無くてもなんとかなるが、効率よく作業するためには必携。