みみずんさーばは何台もあります。全てのサーバはRAID1や5で構築しており万が一のHDD障害でも停止しないようにしています。
RAIDの方式はともかく方法はまちまち。ハードウェアRAIDはHP Smart Array。ソフトウェアRAIDに至っては、CentOSではmdadm、FreeBSDはgmirror。Windowsでは、BIOSレベルで用意されているLSI Embedded MegaRAID。と、まぁ。多種多様。
そして、それらすべてを監視し異常の際には通報されるようにしなければなりません。
サーバの画面なんて普通は見ませんしね。
さて。設定方法。
1.CentOSのmdadm
監視対象サーバに導入するnagiosのプラグインに check_raid があり、監視サーバからnrpe経由でチェック。
2.WindowsのLSI Embedded MegaRAID
check_snmp で監視。対象のMIBを探すのだけが面倒でした。
3.FreeBSDのgmirror
gmirror status の結果をもとに監視対象サーバで動くシェルを書いてnrpe経由で監視。
4.FreeBSDのHP Smart Array
MIBがわかればSNMPでの監視も容易なのですが、わからんっ。仕方ないので、camcontrol の結果をもとに監視対象サーバで動くシェルを書いてみたものの、root以外では動かない・・・。FreeBSDにはsudoが標準ではないのでportsからインストール。visudoでnagiosユーザでもcamcontrolを動くようにしてnrpe経由で監視。
これで、HDDが壊れてもすぐに知ることができます。たぶん・・・。