Slide 7
Slide 7 text
2000年〜 死活監視とOSメトリクスの時代
死活監視
監視対象が正常かどうかをその時点の値で判断、異常ならアラート送信
ping, TCP, HTTP -- 正常にレスポンスが返るか?
CPU, メモリ, disk 使用率 -- 閾値を超えていないか?
0(ok), 1(warn), 2(error), 3(other) せいぜい4状態(=2bit)
実行は5分間隔が普通
代表的なツール: Nagios(1999), Zabbix(2001)
監視というとこれ(死活→アラート)を思い浮かべる人も多い