今のところお客さんのサーバ運用を請け負ったりはしていないので、最低限自分が楽できる程度のサーバ監視くらいでちょうどいい。アラートに追われるのもいやなので、プロセス監視はMonitで自動復帰で手間フリー。リソース監視はゆるラクMuninでたまにチェック。という構成でやってました。

でも監視対象の数が多くなってくると、多数のサーバの健康状態を集中管理できる監視ツールを導入したほうが便利ですね。

いまさらな感じですが、ZABBIXを導入してみました。監視サーバのセットアップはやや大変ですが、一度設定してしまえば、抱えているサーバに対してものすごい安心感を手に入れることができます。

監視対象にはZABBIXエージェントをインストールすることでリソース監視やプロセス監視ができる。SNMPも使えるし、エージェントを入れなくてもWebアクセス監視や、ポートの監視などができる。

いろいろ集めた情報を元に各サーバの健康状態を表示。異常があればメール通知。

とりあえず、リソース監視はMuninで十分なんだけど死活監視もやりたいよね。ということならコレひとつで統合できて便利な感じですね。 

201306zabbix