Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
nagios phase 3 #TechLunch
Search
Livesense Inc.
PRO
April 21, 2014
Technology
0
64
nagios phase 3 #TechLunch
nagios phase 3
2013/07/03 (水) @ Livesense TechLunch
発表者:鈴木 翔一郎
Livesense Inc.
PRO
April 21, 2014
Tweet
Share
More Decks by Livesense Inc.
See All by Livesense Inc.
27新卒_総合職採用_会社説明資料
livesense
PRO
0
4
27新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
0
3.5k
株式会社リブセンス・転職会議 採用候補者様向け資料
livesense
PRO
0
70
株式会社リブセンス 会社説明資料(報道関係者様向け)
livesense
PRO
0
1.6k
データ基盤の負債解消のためのリプレイス
livesense
PRO
0
470
26新卒_総合職採用_会社説明資料
livesense
PRO
0
12k
株式会社リブセンス会社紹介資料 / Invent the next common.
livesense
PRO
1
41k
26新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
1
13k
中途セールス職_会社説明資料
livesense
PRO
0
270
Other Decks in Technology
See All in Technology
『バイトル』CTOが語る! AIネイティブ世代と切り拓くモノづくり組織
dip_tech
PRO
1
130
「改善」ってこれでいいんだっけ?
ukigmo_hiro
0
330
これがLambdaレス時代のChatOpsだ!実例で学ぶAmazon Q Developerカスタムアクション活用法
iwamot
PRO
8
1.1k
Contract One Engineering Unit 紹介資料
sansan33
PRO
0
8.8k
20251010_HCCJP_AdaptiveCloudUpdates
sdosamut
0
140
GoでもGUIアプリを作りたい!
kworkdev
PRO
0
150
Digitization部 紹介資料
sansan33
PRO
1
5.6k
dbtとBigQuery MLで実現する リクルートの営業支援基盤のモデル開発と保守運用
recruitengineers
PRO
3
100
20251014_Pythonを実務で徹底的に使いこなした話
ippei0923
0
210
CoRL 2025 Survey
harukiabe
1
210
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
930
ガバメントクラウドの概要と自治体事例(名古屋市)
techniczna
3
240
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
100
5.8k
Keith and Marios Guide to Fast Websites
keithpitt
411
23k
Unsuck your backbone
ammeep
671
58k
Designing Experiences People Love
moore
142
24k
A Tale of Four Properties
chriscoyier
161
23k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Become a Pro
speakerdeck
PRO
29
5.6k
GitHub's CSS Performance
jonrohan
1032
470k
Rebuilding a faster, lazier Slack
samanthasiow
84
9.2k
Navigating Team Friction
lara
190
15k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
35
6.1k
Code Reviewing Like a Champion
maltzj
526
40k
Transcript
Haraos phase 3
Haraos phase 2 目標 ü no more 誤検知 ü no more 時報
ü no more とりあえずメール
no more 誤検知 ü nagiosは誰でも簡単に閾値変更可能 # vim /etc/nagios/include/nrpe_custom.cfg # /etc/init.d/nrpe reload
$ etckeeper commit "nrpe threshold"
no more 誤検知 ü 1 request落ちてもアラートをあげない ü 一時的高負荷/deployの誤検知防止 ü max_check_attempts ü Soft Critail /
Hard Critcal
no more 時報 ü check / notification 抑制機能 ü GUI/CLI の両方をサポート ü crontabに登録すれば時報の抑制も
no more とりあえずメール ü メールを飛ばすのは監視とは言わない ü 緊急時のみメール&グラフ化が必要 ü PNP pluginによる可視化 ü 適切なthreshold/attempt
Haraos phase 2 ü HR系DB master 発火を検知 ü haken slave
query滞留を検知 ü LDAP disk枯渇を検知 ü mod proxy 障害は検知できず (CentOS 5.Xはharaos未設定です)
Haraos phase 2 何とかDBリプレイスに間に合いました ⊂(・∀・)つセーフ!! ü HB同等レベルの監視項目設定 ü HBやや遅い監視体制
1年前は・・・
jsen APサーバで高負荷状態
関連サーバの負荷を調査 master DB の munin グラフを表示
待つ事 5分・・・
ボトルネック特定に時間が かかりすぎ・・・
今では・・・ ü 障害機器一覧が一目瞭然
Haraos phase 3 目標 ü メール通知のnagios化 ü 不要監視項目の断捨離 ü メディア主体の閾値調整
Haraos phase 3 目標 ü メール通知のnagios化 ü 不要監視項目の断捨離 ü メディア主体の閾値調整
メール通知のnagios化 ü lsync delay haraos化 完了 ü mys delay haraos化 完了 (夜間メール抑制対応追加)
ü あとは既存メール設定削除
不要監視項目の断捨離 ◇対応内容 貴社ユーザーと思われるログインを 多数確認致しましたので 一時的に注意監視とさせて頂きます。 ü 要らないですよね?
メディア主体の閾値調整 ü すぐに対応できないアラートは とりあえず止めてしまう ü 要らないchat通知を抑制して 集中して仕事できる体制へ
メディア主体の閾値調整 ü apache error_log ü Unable to open PDO conn ü SQLSTATE ü 件数
/ min ü apache access_log ü 5XX error 件数
大事な事なので2回言います
メディア主体の閾値調整 ü haraosを使いこなせれば不要 アラートを抑制できます。 ü haraosを使いこなせれば事業 判断に基づく閾値調整が可能 です
大事な事なので3回言います
メディア主体の閾値調整 ü haraosを使いこなせれば不要 アラートを抑制できます。 ü haraosを使いこなせれば事業 判断に基づく閾値調整が可能 です
以上 次回 haraos phase 4