2ch特化型サーバ・ロケーション構築作戦 Part32

このエントリーをはてなブックマークに追加
542動け動けウゴウゴ2ちゃんねる
connect() に対して connection aborted が返ってくるのは早かったので帯域じゃないと思います。

connection aborted はソケットの backlog(listernキュー)があふれて撥ね返されている状態
なので httpd がリクエストを捌けてないんだと思います。

StartServers が小さいので「どーん」に弱いというお話でしたが、一度 MaxSpareServers まで
上がってしまえば(MaxSpareSreversが適正ならば)徐々に回復するはずで、
今回はリブートするまで長時間ずっと回復しなかったので、StartServers のせいかどうか。

逆にサーバー性能に対して MaxSpareServers を大きくとりすぎたために、「どーん」と来たときに
Apacheが身動き取れなくなったんじゃないかという気がします。

一番疑わしいのはディスクの iowait ですが、もしかしたら Apache内の排他制御とかで詰まってたのかも。
いずれにしてもボトルネックがわかrないと対策しようがないですね。