現在構築中のサーバ。電源を入れて1カ月以上経っているだろうか。
いい加減、サービスインさせなくてはなぁとおもいつつも日が過ぎてゆく。。。
つまり未だ構築中www
さて、サーバを見るとLoadAveragesがやけに高い。プロセスはおかしくないしなぁと /var/log/messages を見ると30分おきにエラーが出力されている始末・・・。
Jun 23 23:07:58 www2 smartd[3489]: Device: /dev/sda, 1465 Currently unreadable (pending) sectors
smartdということは明らかにディスクエラーだorz
でも、RAIDからディスクが解除された形跡は無い。
とりあえず、smartctlを打ち込むと、下記の表示結果から黄色い部分の数字が大きくリードエラーや不良セクタが多数確認できたこともあってレン鯖屋さんに連絡。明朝にはディスク交換の予定。サービスインしていないので、影響は無いのですが、こういうこともあるんだなぁとメモ。
これもNagiosでの監視対象として追加しないとなぁ。。。
[root@www2 ~]# smartctl -A /dev/sda
smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 171 157 051 Pre-fail Always - 19387
3 Spin_Up_Time 0x0027 151 151 021 Pre-fail Always - 9408
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 8
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 1315
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 7
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 5
193 Load_Cycle_Count 0x0032 144 144 000 Old_age Always - 170788
194 Temperature_Celsius 0x0022 122 118 000 Old_age Always - 30
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 196 196 000 Old_age Always - 1465
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0