サーバのIPアドレスの /24 とかの単位で分割して、 ganglia の cluster たくさん作 る。 • ganglia は gmond という agent から UDP でパケット投げるんだけど、 IPアドレスのレン ジ的に近いなら、UDPのパケットも落ちにくいだろうという期待もあった。 • それぞれの cluster に対して賢く proxy する webfrontend を自作する。 • webfrontend がどの cluster に proxy すればいいか、そのためのマッピング情報を batch job で生成し、KVSに保存する。 • マッピング情報には、ついでに Load Average とかも保存しておいて、 Load Average の 順にサーバのリストを取得できるようにする。 • batch でリストを生成すると、完全にリアルタイムとはならないけど、だいたいリアルタイムで 負荷の高い順にソートできる。 • 故障したサーバがあれば、 batch 実行時にマッピング情報の更新対象から外せばいい • webfrontend から、サーバの情報を管理する DBや、マッピング情報を管理するKVSに アクセスして、特定のサーバの情報を表示できるようにする。 frontend部分はフルスクラッチで書いた 23