2ch特化型サーバ・ロケーション構築作戦 Part19

このエントリーをはてなブックマークに追加
757root▲ ★
1/19/2006 0:40 JST ごろ、XOロケーションのサーバに障害発生。
一時的に全サーバへの接続性が失われる。

いくつかのサーバは、電源断が入った模様。
調査結果は追ってここに。
758root▲ ★:2006/01/19(木) 01:10:32 ID:???0
XOにある、電源強制断が入ったサーバ:

tiger503 tiger504 tiger511 tiger512
cobra2245
tiger2508 tiger2510 tiger2511 tiger2512

XOにあるけど、電源強制断が入らなかったサーバ:

tiger509 tiger510
banana402 banana403 banana404 banana405 banana406
banana307
tiger2522 tiger2523 tiger2524 tiger2525
tiger2507 tiger2509
759root▲ ★:2006/01/19(木) 01:11:36 ID:???0 BE:547823-
とりあえず現在は、全サーバとも動作している模様。

原因によっては、何らかの根本的対策が必要な予感。
760root▲ ★:2006/01/19(木) 01:30:54 ID:???0 BE:729942-
ここで作業します。
緊急事態につき、野次馬カキコ禁止。

live22の板は、全部復帰できたはず。
761root▲ ★:2006/01/19(木) 01:34:36 ID:???0 BE:2554447-
tiger504 つながらず。
tiger509 電源断入った。復帰必要のはず。
762root▲ ★:2006/01/19(木) 01:35:26 ID:???0 BE:547823-
tiger510 電源断入った。 復帰必要のはず。
763root▲ ★:2006/01/19(木) 01:37:06 ID:???0 BE:1915373-
tiger511 電源断再度入った。
764root▲ ★:2006/01/19(木) 01:39:49 ID:???0 BE:4925669-
状況から考えて、電源不安でほぼ間違いないですね。
XOロケーション全体で起こっている模様。

アクセスがピーク過ぎるまでは、起こり続ける予感。

で、対応できる現地の人が誰一人オフラインではないので、
根本対応は、日本時間の昼あたりになりそうな予感。
765root▲ ★:2006/01/19(木) 01:50:10 ID:???0 BE:1277827-
連絡がとれる人は全員ICQ的にオフラインのようです。
つまり、こちらではどうしようもない状況。

とりあえず、JimさんとSeanさんに状況をメール打っておきます。
766root▲ ★:2006/01/19(木) 02:00:45 ID:???0 BE:5746379-
とりあえず、小康状態か。

tiger504 = game10 ダウンしたままの模様。
767root▲ ★:2006/01/19(木) 02:14:51 ID:???0 BE:1368353-
Seanさんと連絡とれました。
状況を伝達中。
768root▲ ★:2006/01/19(木) 02:17:05 ID:???0 BE:730324-
Sean (02:14 AM) :
Which servers are not online????
Me (02:14 AM) :
Now tiger504 is offline. Please check.
Sean (02:15 AM) :
Please wait while I check it.
769root▲ ★:2006/01/19(木) 02:28:48 ID:???0 BE:1094843-
d1donly (02:28 AM) :
tiger504 is back up now...
mumumu (02:28 AM) :
Ok, I will check now.
770root▲ ★:2006/01/19(木) 02:56:15 ID:???0 BE:5746379-
Me (02:53 AM) :
And I found tiger511 is now out of service.
Ping is OK, but other servers are down.
Please reboot it now.
Sean (02:54 AM) :
ok...I will.
771root▲ ★:2006/01/19(木) 02:58:53 ID:???0 BE:1094843-
障害は2台のサーバを追加したことによる、電源のオーバーロード。
つまり、現地のミス(誰がやったかは不明)。

Seanさんが緊急に電源を繋ぎ変え、障害の原因そのものは修復された模様。

Me (02:44 AM) :
And I have one more question. Do you complete the power rearrangement?
I mean, is the cause of the trouble solved now?
Sean (02:45 AM) :
yes....it has been solved. I sent a completed mail msg just a few minutes ago.
772root▲ ★:2006/01/19(木) 03:08:43 ID:???0 BE:3830876-
tiger511上がりました。

ファイルシステムが一部損傷しているようなので(datのキャッシュのところ)、
一時的にサービス止めて、リモートコンソールで作業します。
773root▲ ★:2006/01/19(木) 03:11:23 ID:???0 BE:3192375-
キャッシュ部分が破損していて、squidがおかしくなるようなので、
いったんキャッシュをゼロクリアして、squidを上げなおしました。< tiger511
774root▲ ★:2006/01/19(木) 03:28:48 ID:???0 BE:3283294-
Me (03:24 AM) :
I received reports from 2ch users all servers of 2ch are normal and back online.
I think the trouble is solved now. Thank you for your work.

But I think this is human error. So, please be careful for your operation.
we serve most biggest BBS service in Japan, so, we are watched by millions
users of Japan always... Please do not forget it, it is very important for us.
Sean (03:28 AM) :
ok....I will remember
775root▲ ★:2006/01/19(木) 03:39:39 ID:???0 BE:2463539-
Me (03:30 AM) :
Yes. But it is proud for us.
It is very funtastic project that 2ch makes bigger and bigger.
Let's enjoy it together.
Sean (03:31 AM) :
Yes... I agree.
Sean (03:31 AM) :
I am excited for it too....
Me (03:32 AM) :
Ok, I was relieved to see it. Please don't let you down.
But server management is very important work for us, please be careful again.
Me (03:35 AM) :
And now time is 3 AM in Japan, so I feel a little bit sleepy.
I will check the servers for a while and will go to bed.

Thanks again for your quick recovery.
776root▲ ★:2006/01/19(木) 03:42:12 ID:???0 BE:1368353-
…ということで今日のところは、このぐらいで。

ここには書いてないけど、
もうちょっときついこと(電源オーバーロードは2回目でしょ、とか)もゆったです。
むぎゅー。