サーバダウン(鯖落ち)情報 Part17

このエントリーをはてなブックマークに追加
751動け動けウゴウゴ2ちゃんねる
556 名前: root ★ 投稿日: 04/05/02 08:24 ID:???
ちょっとだけ仮眠していました。
今日はこれからどうしても出かけなければいけないので、調査状況を書いておきます。

メモリの空き状況をMRTGで実験的にとりはじめていました。
http://mumumu.mu/mrtg/mrtg-rrd.cgi/memory/

メモリは900Mぐらい空いていたのに、いきなり死にました。
つまり、メモリが足りないわけでは決してありません。

/homeに使っているディスク以外のハードウェアは、全部変えています。
ソフトウェアも入れ直しています。
でも、再度落ちました。

セッティングにはumaサーバ等と比較して、無理なところはないはずです。

つまり、/homeに使用しているディスクの不良である可能性が最も大であると考えられます。

571 名前: root ★ 投稿日: 04/05/02 08:41 ID:???
大変幸運にも、死ぬ間際のtopの出力が画面が凍ったままで残っていたのを、
キャプチャすることができました。

http://mumumu.mu/oyster244/game6last.jpg

これを見てわかるように、全く忙しくなく、かつメモリもふんだんに空いている状況で
突然死しています。

はじめて動かすマシンやOSならともかく、他に何台も同じマシンがある状況で
このマシンだけがこんな変な死に方をし、
かつ/homeのディスク*以外*はOSから何から全部入れ替えているのに
状況が再発したというのは、
もはや原因は変えていない唯一のハードウェア(/homeのディスク)にあるか、
あるいは外部にあるか(電源など)しか考えられないです。

あるいは、置き場所が悪いとか方向が悪いとか、オカルトのレベルなのかも。

578 名前: root ★ 投稿日: 04/05/02 08:47 ID:???
復旧・対応は以下の手段になるかと。

1)game6をリブートしてもらう
2)/homeをどこか(memoriesとか)にバックアップする
3)/homeのディスクをとりかえる
4)/homeをバックアップから元に戻す

すみませんがタイムアウトにつき、いったんオフ。
本日は夜までオフラインの予定。

今までのまとめ。
読んだら早く退去すれ