監視ツール Nagios を 3.2.0 にアップデートしてみる

SOFTWARE REPORT


Nagios をアップデートする

Red Hat Enterprise Linux でサーバー監視ツール Nagios 3.2.0 を利用していたのですけど、yum で更新リストを確認したところ、Nagios 3.2.0 の最新版が公開されていたので、インストールしてみることにしました。

yum update nagios

コマンドラインから上記の命令を実行すると、アップデート自体は、簡単に完了しました。

Downloading Packages:

(1/1): nagios-3.2.0-1.el4 100% |=========================| 3.6 MB 00:09

Running Transaction Test

Finished Transaction Test

Transaction Test Succeeded

Running Transaction

Updating : nagios [1/2]warning: /etc/nagios/cgi.cfg created as /etc/nagios/cgi.cfg.rpmnew

Updating : nagios [1/2]warning: /etc/nagios/nagios.cfg created as /etc/nagios/nagios.cfg.rpmnew

Updating : nagios ######################### [1/2]

warning: /etc/nagios/localhost.cfg saved as /etc/nagios/localhost.cfg.rpmsave

warning: /etc/nagios/commands.cfg saved as /etc/nagios/commands.cfg.rpmsave

Cleanup : nagios ######################### [2/2]

 

Updated: nagios.i386 0:3.2.0-1.el4.rf

Complete!

ただアップデート完了後、管理ページは Version 3.2 として表示されるものの、Nagios の管理ページの Hosts と Services の内容が表示されなくなってしまったのでした。

調べてみると、まず、アップデートの際に表示されたメッセージの中にもあることですが、既存の "localhost.cfg" と "commands.cfg" が、それぞれ "localhost.cfg.rpmsave" と "commands.cfg.rpmsave" という名前に変更されていました。

これらのファイル名を元に戻した上で、次のようにして Nagios の設定ファイルの内容を確認してみます。

/usr/bin/nagios -v /etc/nagios/nagios.cfg

そうしたところ、なにやら nagios.cfg の "check_result_buffer_slots=4096" という行でエラーとなってしまっていました。具体的には、次のエラーが表示されます。

Reading configuration data...

Warning: comment_file variable ignored. Comments are now stored in the status and retention files.

Warning: downtime_file variable ignored. Downtime entries are now stored in the status and retention files.

Error in configuration file '/etc/nagios/nagios.cfg' - Line 442 (UNKNOWN VARIABLE)

Error processing main config file!

どうやら "check_result_buffer_slots" という設定項目が無くなっているような感じです。

実際、アップデート時に生成された Nagios 3.2 用の "nagios.cfg.rpmnew" を確認してみても、これが設定されている箇所を確認することができませんでした。

 

この設定箇所をコメントアウトして、設定ファイルの内容確認を行ったところ、今度は問題なしと判断されました。

これを、いつもの運用の癖でデータベースのリロードにより Nagios を更新してみたところ、相変わらず Hosts と Services が表示されない状態が続いてしまいました。いろいろ試してみた挙句、Nagios をいったん停止して再起動してあげたところ、正しく動作するようになりました。

 

もしかすると、Web サイトを構成するリソース関連か、または動的 HTML が更新されただけで、Nagios は古いプロセスがそのまま残っていたために、肝心の監視情報を見失ってしまっていたのかもしれないです。

アップデートによって表向きの表示が変わっていたので、てっきり Nagios も最新版が挙がったものと思ってしまいましたけど、こういう場面ではやはり一度、自分の手でサービスの再起動を行っておくのがよさそうです。