監視ツール Nagios を 3.2.0 にアップデートしてみる
SOFTWARE REPORT
Nagios をアップデートする
Red Hat Enterprise Linux でサーバー監視ツール Nagios 3.2.0 を利用していたのですけど、yum で更新リストを確認したところ、Nagios 3.2.0 の最新版が公開されていたので、インストールしてみることにしました。
コマンドラインから上記の命令を実行すると、アップデート自体は、簡単に完了しました。
Downloading Packages:
(1/1): nagios-3.2.0-1.el4 100% |=========================| 3.6 MB 00:09
Running Transaction Test
Finished Transaction Test
Transaction Test Succeeded
Running Transaction
Updating : nagios [1/2]warning: /etc/nagios/cgi.cfg created as /etc/nagios/cgi.cfg.rpmnew
Updating : nagios [1/2]warning: /etc/nagios/nagios.cfg created as /etc/nagios/nagios.cfg.rpmnew
Updating : nagios ######################### [1/2]
warning: /etc/nagios/localhost.cfg saved as /etc/nagios/localhost.cfg.rpmsave
warning: /etc/nagios/commands.cfg saved as /etc/nagios/commands.cfg.rpmsave
Cleanup : nagios ######################### [2/2]
Updated: nagios.i386 0:3.2.0-1.el4.rf
Complete!
ただアップデート完了後、管理ページは Version 3.2 として表示されるものの、Nagios の管理ページの Hosts と Services の内容が表示されなくなってしまったのでした。
調べてみると、まず、アップデートの際に表示されたメッセージの中にもあることですが、既存の "localhost.cfg" と "commands.cfg" が、それぞれ "localhost.cfg.rpmsave" と "commands.cfg.rpmsave" という名前に変更されていました。
これらのファイル名を元に戻した上で、次のようにして Nagios の設定ファイルの内容を確認してみます。
そうしたところ、なにやら nagios.cfg の "check_result_buffer_slots=4096" という行でエラーとなってしまっていました。具体的には、次のエラーが表示されます。
Reading configuration data...
Warning: comment_file variable ignored. Comments are now stored in the status and retention files.
Warning: downtime_file variable ignored. Downtime entries are now stored in the status and retention files.
Error in configuration file '/etc/nagios/nagios.cfg' - Line 442 (UNKNOWN VARIABLE)
Error processing main config file!
どうやら "check_result_buffer_slots" という設定項目が無くなっているような感じです。
実際、アップデート時に生成された Nagios 3.2 用の "nagios.cfg.rpmnew" を確認してみても、これが設定されている箇所を確認することができませんでした。
この設定箇所をコメントアウトして、設定ファイルの内容確認を行ったところ、今度は問題なしと判断されました。
これを、いつもの運用の癖でデータベースのリロードにより Nagios を更新してみたところ、相変わらず Hosts と Services が表示されない状態が続いてしまいました。いろいろ試してみた挙句、Nagios をいったん停止して再起動してあげたところ、正しく動作するようになりました。
もしかすると、Web サイトを構成するリソース関連か、または動的 HTML が更新されただけで、Nagios は古いプロセスがそのまま残っていたために、肝心の監視情報を見失ってしまっていたのかもしれないです。
アップデートによって表向きの表示が変わっていたので、てっきり Nagios も最新版が挙がったものと思ってしまいましたけど、こういう場面ではやはり一度、自分の手でサービスの再起動を行っておくのがよさそうです。