Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
nagios phase 3 #TechLunch
Search
Livesense Inc.
PRO
April 21, 2014
Technology
73
0
Share
nagios phase 3 #TechLunch
nagios phase 3
2013/07/03 (水) @ Livesense TechLunch
発表者:鈴木 翔一郎
Livesense Inc.
PRO
April 21, 2014
More Decks by Livesense Inc.
See All by Livesense Inc.
28新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
0
55
27新卒_総合職採用_会社説明資料
livesense
PRO
0
4.6k
27新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
0
9k
株式会社リブセンス・転職会議 採用候補者様向け資料
livesense
PRO
0
350
株式会社リブセンス 会社説明資料(報道関係者様向け)
livesense
PRO
1
1.7k
データ基盤の負債解消のためのリプレイス
livesense
PRO
0
600
26新卒_総合職採用_会社説明資料
livesense
PRO
0
13k
株式会社リブセンス会社紹介資料 / Invent the next common.
livesense
PRO
2
63k
26新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
1
13k
Other Decks in Technology
See All in Technology
ファインディの事業拡大を支える 拡張可能なデータ基盤へのリアーキテクチャ
hiracky16
0
920
知ってた?JavaScriptの"正しさ"を検証するテストが5万以上もあること(Test262)
riyaamemiya
1
150
Modernizing Your HCL Connections Experience: Visual Report to chain, Profile Enhancements, and AI Integration
wannesrams
0
290
The 7 pitfalls of AI
ufried
0
200
バイブコーディングで3倍早く⚪⚪を作ってみた
samakada
0
220
Microsoft 365 / Microsoft 365 Copilot : 自分の状態を確認する「ラベル」について
taichinakamura
0
470
国内外の生成AIセキュリティの最新動向 & AIガードレール製品「chakoshi」のご紹介 / Latest Trends in Generative AI Security (Domestic & International) & Introduction to AI Guardrail Product "chakoshi"
nttcom
4
2.1k
ボトムアップの改善の火を灯し続けろ!〜支援現場で学んだ、消えないための3つの打ち手〜 / 20260509 Kazuki Mori
shift_evolve
PRO
2
590
AI駆動開発で生産性を追いかけたら、行き着いたのは品質とシフトレフトだった
littlehands
0
440
「強制アップデート」か「チームの自律」か?エンタープライズが辿り着いたプラットフォームのハイブリッド運用/cloudnative-kaigi-hybrid-platform-operations
mhrtech
0
120
エージェント時代の UIとAPI、CLI戦略
coincheck_recruit
0
150
[Scram Fest Niigata2026]Quality as Code〜AIにQAの思考を再現させる試み〜
masamiyajiri
1
260
Featured
See All Featured
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.9k
GitHub's CSS Performance
jonrohan
1032
470k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
400
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Crafting Experiences
bethany
1
140
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
180
Ethics towards AI in product and experience design
skipperchong
2
270
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
370
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
70
39k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Transcript
Haraos phase 3
Haraos phase 2 目標 ü no more 誤検知 ü no more 時報
ü no more とりあえずメール
no more 誤検知 ü nagiosは誰でも簡単に閾値変更可能 # vim /etc/nagios/include/nrpe_custom.cfg # /etc/init.d/nrpe reload
$ etckeeper commit "nrpe threshold"
no more 誤検知 ü 1 request落ちてもアラートをあげない ü 一時的高負荷/deployの誤検知防止 ü max_check_attempts ü Soft Critail /
Hard Critcal
no more 時報 ü check / notification 抑制機能 ü GUI/CLI の両方をサポート ü crontabに登録すれば時報の抑制も
no more とりあえずメール ü メールを飛ばすのは監視とは言わない ü 緊急時のみメール&グラフ化が必要 ü PNP pluginによる可視化 ü 適切なthreshold/attempt
Haraos phase 2 ü HR系DB master 発火を検知 ü haken slave
query滞留を検知 ü LDAP disk枯渇を検知 ü mod proxy 障害は検知できず (CentOS 5.Xはharaos未設定です)
Haraos phase 2 何とかDBリプレイスに間に合いました ⊂(・∀・)つセーフ!! ü HB同等レベルの監視項目設定 ü HBやや遅い監視体制
1年前は・・・
jsen APサーバで高負荷状態
関連サーバの負荷を調査 master DB の munin グラフを表示
待つ事 5分・・・
ボトルネック特定に時間が かかりすぎ・・・
今では・・・ ü 障害機器一覧が一目瞭然
Haraos phase 3 目標 ü メール通知のnagios化 ü 不要監視項目の断捨離 ü メディア主体の閾値調整
Haraos phase 3 目標 ü メール通知のnagios化 ü 不要監視項目の断捨離 ü メディア主体の閾値調整
メール通知のnagios化 ü lsync delay haraos化 完了 ü mys delay haraos化 完了 (夜間メール抑制対応追加)
ü あとは既存メール設定削除
不要監視項目の断捨離 ◇対応内容 貴社ユーザーと思われるログインを 多数確認致しましたので 一時的に注意監視とさせて頂きます。 ü 要らないですよね?
メディア主体の閾値調整 ü すぐに対応できないアラートは とりあえず止めてしまう ü 要らないchat通知を抑制して 集中して仕事できる体制へ
メディア主体の閾値調整 ü apache error_log ü Unable to open PDO conn ü SQLSTATE ü 件数
/ min ü apache access_log ü 5XX error 件数
大事な事なので2回言います
メディア主体の閾値調整 ü haraosを使いこなせれば不要 アラートを抑制できます。 ü haraosを使いこなせれば事業 判断に基づく閾値調整が可能 です
大事な事なので3回言います
メディア主体の閾値調整 ü haraosを使いこなせれば不要 アラートを抑制できます。 ü haraosを使いこなせれば事業 判断に基づく閾値調整が可能 です
以上 次回 haraos phase 4