2ch特化型サーバ・ロケーション構築作戦 Part19
760 :
root▲ ★ :
2006/01/19(木) 01:30:54 ID:???0 BE:729942- ここで作業します。 緊急事態につき、野次馬カキコ禁止。 live22の板は、全部復帰できたはず。
761 :
root▲ ★ :2006/01/19(木) 01:34:36 ID:???0 BE:2554447-
tiger504 つながらず。 tiger509 電源断入った。復帰必要のはず。
762 :
root▲ ★ :2006/01/19(木) 01:35:26 ID:???0 BE:547823-
tiger510 電源断入った。 復帰必要のはず。
763 :
root▲ ★ :2006/01/19(木) 01:37:06 ID:???0 BE:1915373-
tiger511 電源断再度入った。
764 :
root▲ ★ :2006/01/19(木) 01:39:49 ID:???0 BE:4925669-
状況から考えて、電源不安でほぼ間違いないですね。 XOロケーション全体で起こっている模様。 アクセスがピーク過ぎるまでは、起こり続ける予感。 で、対応できる現地の人が誰一人オフラインではないので、 根本対応は、日本時間の昼あたりになりそうな予感。
765 :
root▲ ★ :2006/01/19(木) 01:50:10 ID:???0 BE:1277827-
連絡がとれる人は全員ICQ的にオフラインのようです。 つまり、こちらではどうしようもない状況。 とりあえず、JimさんとSeanさんに状況をメール打っておきます。
766 :
root▲ ★ :2006/01/19(木) 02:00:45 ID:???0 BE:5746379-
とりあえず、小康状態か。 tiger504 = game10 ダウンしたままの模様。
767 :
root▲ ★ :2006/01/19(木) 02:14:51 ID:???0 BE:1368353-
Seanさんと連絡とれました。 状況を伝達中。
768 :
root▲ ★ :2006/01/19(木) 02:17:05 ID:???0 BE:730324-
Sean (02:14 AM) : Which servers are not online???? Me (02:14 AM) : Now tiger504 is offline. Please check. Sean (02:15 AM) : Please wait while I check it.
769 :
root▲ ★ :2006/01/19(木) 02:28:48 ID:???0 BE:1094843-
d1donly (02:28 AM) : tiger504 is back up now... mumumu (02:28 AM) : Ok, I will check now.
770 :
root▲ ★ :2006/01/19(木) 02:56:15 ID:???0 BE:5746379-
Me (02:53 AM) : And I found tiger511 is now out of service. Ping is OK, but other servers are down. Please reboot it now. Sean (02:54 AM) : ok...I will.
771 :
root▲ ★ :2006/01/19(木) 02:58:53 ID:???0 BE:1094843-
障害は2台のサーバを追加したことによる、電源のオーバーロード。 つまり、現地のミス(誰がやったかは不明)。 Seanさんが緊急に電源を繋ぎ変え、障害の原因そのものは修復された模様。 Me (02:44 AM) : And I have one more question. Do you complete the power rearrangement? I mean, is the cause of the trouble solved now? Sean (02:45 AM) : yes....it has been solved. I sent a completed mail msg just a few minutes ago.
772 :
root▲ ★ :2006/01/19(木) 03:08:43 ID:???0 BE:3830876-
tiger511上がりました。 ファイルシステムが一部損傷しているようなので(datのキャッシュのところ)、 一時的にサービス止めて、リモートコンソールで作業します。
773 :
root▲ ★ :2006/01/19(木) 03:11:23 ID:???0 BE:3192375-
キャッシュ部分が破損していて、squidがおかしくなるようなので、 いったんキャッシュをゼロクリアして、squidを上げなおしました。< tiger511
774 :
root▲ ★ :2006/01/19(木) 03:28:48 ID:???0 BE:3283294-
Me (03:24 AM) : I received reports from 2ch users all servers of 2ch are normal and back online. I think the trouble is solved now. Thank you for your work. But I think this is human error. So, please be careful for your operation. we serve most biggest BBS service in Japan, so, we are watched by millions users of Japan always... Please do not forget it, it is very important for us. Sean (03:28 AM) : ok....I will remember
775 :
root▲ ★ :2006/01/19(木) 03:39:39 ID:???0 BE:2463539-
Me (03:30 AM) : Yes. But it is proud for us. It is very funtastic project that 2ch makes bigger and bigger. Let's enjoy it together. Sean (03:31 AM) : Yes... I agree. Sean (03:31 AM) : I am excited for it too.... Me (03:32 AM) : Ok, I was relieved to see it. Please don't let you down. But server management is very important work for us, please be careful again. Me (03:35 AM) : And now time is 3 AM in Japan, so I feel a little bit sleepy. I will check the servers for a while and will go to bed. Thanks again for your quick recovery.
776 :
root▲ ★ :2006/01/19(木) 03:42:12 ID:???0 BE:1368353-
…ということで今日のところは、このぐらいで。 ここには書いてないけど、 もうちょっときついこと(電源オーバーロードは2回目でしょ、とか)もゆったです。 むぎゅー。
777 :
root▲ ★ :2006/01/21(土) 03:48:14 ID:???0 BE:3830876-
c.2ch不具合報告総合スレ4
http://qb5.2ch.net/test/read.cgi/operate/1122639354/959 Jimさんに状況確認したところ、返事が。
昨日の続きだった模様。
全ラックを止める(先日の二の舞)の替わりに、一部サーバの電源系を移動したと。
The mobile phone user power maxed out and our new technician
made a decision to move power immediately or have the entire rack
disconnected from blown circuit breaker.
This was the correct decision to make.
I am very sorry for any inconvenience that you incurred.
Please note that power usage on the servers increases as they become busy
and this is monitored
by pie.
778 :
root▲ ★ :2006/01/23(月) 11:30:20 ID:???0
公式p2のサーバ引越しに伴い、 以下のDNSの変更をお願いします。 (変更前) +p2.2ch.net:210.135.97.178 (変更後) +p2.2ch.net:210.135.99.5
779 :
ピロリ :2006/01/23(月) 15:03:59 ID:V29pX+410
ぶひー
780 :
root▲ ★ :2006/01/23(月) 15:21:42 ID:???0 BE:2736656-
>>779 変更完了を確認しました。
TTL=86400(通常モード)なので、
浸透には変更後最大1日かかる予定。
781 :
root▲ ★ :2006/01/24(火) 02:51:35 ID:???0 BE:547632-
783 :
root▲ ★ :2006/01/27(金) 01:41:45 ID:???0 BE:2280555-#
2ch.se / www.2ch.se 用の土地を作りました。 まだNSが向いていないようですが、 とりあえず従来の形で。 +2ch.se:206.223.150.250 +www.2ch.se:206.223.150.250 つまり、2ch.se と www.2ch.se を、 206.223.150.250 に向けていただければ OK です。 アカウント情報は、これからメールするです。
784 :
ピロリ :2006/01/27(金) 11:12:27 ID:DSQF58j/0
785 :
root▲ ★ :2006/01/31(火) 19:32:17 ID:???0 BE:1641863-#
>>785 某3DGUIプロジェクトと名前が紛らわしいですなー
あ、むこうのほうが紛らわしいのかw
788 :
root▲ ★ :2006/02/01(水) 21:02:07 ID:???0 BE:1915373-#
stock.2ch.net 用の土地を作成しました。 (新規追加) +stock.2ch.net:206.223.150.250 よろしくです。
789 :
root▲ ★ :2006/02/02(木) 04:24:52 ID:???0 BE:5837388-#
790 :
root▲ ★ :2006/02/02(木) 17:13:02 ID:???0 BE:1277827-#
ということで、tmp5.2ch.netをmemoriesに収容。 よろしくです。 (現在) +tmp5.2ch.net:206.223.150.205 (変更後) +tmp5.2ch.net:206.223.151.230
791 :
ピロリ :2006/02/02(木) 17:23:22 ID:/kpBwjsi0 BE:475335959-
793 :
ピロリ :2006/02/02(木) 20:09:49 ID:/kpBwjsi0 BE:422520858-
そうだった、、 done です
795 :
root▲ ★ :2006/02/07(火) 13:48:58 ID:???0 BE:3283766-#
select問題。うむむ。
【チョコ】雪だるま作戦に思いを馳せながら雑談するスレッド Part36
http://aa5.2ch.net/test/read.cgi/nanmin/1138964618/427 > --- sys_generic.c.ORG Thu Jul 7 11:17:55 2005
> +++ sys_generic.c Mon Feb 6 11:28:07 2006
> @@ -678,7 +678,11 @@
> * FD_SETSIZE infds, outfds and exceptfds with the old FD_SETSIZE
> * of 256.
> */
> +#if 1
> + fd_mask s_selbits[howmany(8192, NFDBITS)];
> +#else
> fd_mask s_selbits[howmany(2048, NFDBITS)];
> +#endif
> fd_mask *ibits[3], *obits[3], *selbits, *sbp;
> struct timeval atv, rtv, ttv;
> int error, timo;
> にしたつもり。
796 :
root▲ ★ :2006/02/07(火) 17:14:54 ID:???0 BE:1642436-#
797 :
root▲ ★ :2006/02/07(火) 18:13:52 ID:???0 BE:1641863-#
798 :
root▲ ★ :2006/02/07(火) 20:04:20 ID:???0 BE:4377986-#
>>797 これじゃだめで、
/usr/include/sys/select.h をいじるのもだめで、
(/usr/src/sys/sys/select.h があるから)、
結局、
# for increasing FD_SETSIZE
makeoptions CONF_CFLAGS="-DFD_SETSIZE=8192U"
と、カーネルコンフィギュレーションファイルに書いて作り直さないと、
だめらしい。
しかも、いったんクリーンナップして作らないと、バイナリを作り直さない場合が
あるかもしれないらしい。
799 :
root▲ ★ :2006/02/07(火) 20:18:05 ID:???0 BE:5746379-#
ということで、
/etc/make.conf:
CFLAGS+=-DFD_SETSIZE=8192U
これを追加。
COPTFLAGS に同様に追加すると、カーネル生成時に副作用があるので、
追加してはいけない(COPTFLAGSmake.conf的には何もしない)。
Apache等は正しく作れたが、これを見ないportsがあるかもしれないので
要注意。
bbsd のように直接makeする場合は、コンパイル時に-DFD_SETSIZE=8192U を
明示的に追加すること。
カーネルmake時の注意は、
>>798 のとおり。
800 :
root▲ ★ :2006/02/07(火) 20:18:49 ID:???0 BE:7387799-#
>>799 > ということで、
> COPTFLAGS に同様に追加すると、カーネル生成時に副作用があるので、
> 追加してはいけない(COPTFLAGSmake.conf的には何もしない)。
追加してはいけない(COPTFLAGSはmake.conf的には何もしないのがよい)。
rootさんこんばんはーヾ('-')ノ
803 :
root▲ ★ :2006/02/07(火) 23:24:18 ID:???0 BE:4377986-#
805 :
root▲ ★ :2006/02/07(火) 23:45:09 ID:???0 BE:2553874-#
>>804 今読んでいるです。
「うんうん、そうなんだよね」なところ、「おぉー、そうか」なところ、
「そうか、そうやってるのか」なところ、などなど、すんごく参考になるですね。
806 :
root▲ ★ :2006/02/07(火) 23:47:01 ID:???0 BE:1459744-#
> 起動と同時に最大数のプロセスを生成する > プロセスがアイドル状態になっても終了しない とかはまさに、死ぬほどうなづく、うんうんなところ。
807 :
root▲ ★ :2006/02/07(火) 23:53:52 ID:???0 BE:1915373-#
>>806 について補足すると、2ちゃんねるの場合、
そうもいかないところもあるですね。
書き込み主体か読み出し主体かによっても違うし、
いろんな要因があったりするんで。
そのへんは、おいおいまたどっかに書こうかなとは思っていたりするわけですが、
思うに終始しているという話もあったりして。
808 :
root▲ ★ :2006/02/08(水) 00:08:44 ID:???0 BE:1094562-#
・FD_SETSIZE=8192 対応カーネル ・FD_SETSIZE=8192 対応Apache2、bbsd ・Apache2 マルチスレッド復活 ・bbsd マルチスレッド復活(-n 8) @ live22
809 :
root▲ ★ :2006/02/08(水) 00:10:24 ID:???0 BE:3830876-#
>>808 kern/sys_generic.c パッチバージョン
radwinさんの他のスライドもおもしろいよ
811 :
root▲ ★ :2006/02/08(水) 02:18:41 ID:???0 BE:3284249-#
rootタンファイト!
rootタン尊敬してます。ファイト!
814 :
root▲ ★ :2006/02/11(土) 20:40:22 ID:???0 BE:4104959-#
pid 55164 (httpd), uid 2001: exited on signal 10 pid 55160 (httpd), uid 2001: exited on signal 10 calcru: runtime went backwards from 871422 usec to 871357 usec for pid 55170 (httpd) pid 55196 (httpd), uid 2001: exited on signal 10 pid 55218 (httpd), uid 2001: exited on signal 10 pid 55157 (httpd), uid 2001: exited on signal 10 pid 55182 (httpd), uid 2001: exited on signal 10 pid 55156 (httpd), uid 2001: exited on signal 10 pid 55184 (httpd), uid 2001: exited on signal 10 pid 55221 (httpd), uid 2001: exited on signal 10 pid 55162 (httpd), uid 2001: exited on signal 10 pid 55167 (httpd), uid 2001: exited on signal 10 虫を踏んだ時のログ。 Apacheリスタートで復活。 calcru: っていうぐらいで、カーネルの虫か?
815 :
root▲ ★ :2006/02/11(土) 20:42:13 ID:???0 BE:2188883-#
Apacheかカーネルかライブラリか。 いずれにせよ、あとでいったんシングルスレッドに戻そう。< httpd
816 :
root▲ ★ :2006/02/11(土) 20:45:51 ID:???0 BE:1824645-#
817 :
root▲ ★ :2006/02/11(土) 21:10:28 ID:???0 BE:1459182-#
818 :
root▲ ★ :2006/02/11(土) 21:11:31 ID:???0 BE:2554447-#
%sysctl kern.timecounter.hardware kern.timecounter.hardware: ACPI-fast うーむ、やってみるか。
819 :
root▲ ★ :2006/02/11(土) 21:16:24 ID:???0 BE:5746379-#
820 :
root▲ ★ :2006/02/11(土) 21:29:11 ID:???0 BE:1824454-#
>>819 を実施したので、再度様子見。
再発するようなら、MT 再度オフで。
821 :
root▲ ★ :2006/02/11(土) 22:25:12 ID:???0 BE:2189546-#
LA=15超えたら、Apacheをリスタートするしくみを入れてみた。 daily処理の時とリスタート後120秒以内は、発動しないようにしたつもり。
822 :
root▲ ★ :2006/02/11(土) 23:06:20 ID:???0 BE:6567089-#
# for increasing -DFD_SETSIZE=8192U .if ${.CURDIR} != "/var/src/libexec/rlogind" CFLAGS+=-DFD_SETSIZE=8192U .endif なんてやらないといかんかった。せめて#undefしてほしいかも。 < rlogind rlogind.c に、こんなことが直書き。 #define FD_SETSIZE 16 /* don't need many bits for select */
823 :
root▲ ★ :2006/02/11(土) 23:32:23 ID:???0 BE:2919348-#
%grep ACPI- /var/run/dmesg.boot Timecounter "ACPI-fast" frequency 3579545 Hz quality 1000 %sysctl -a | grep hz kern.clockrate: { hz = 1000, tick = 1000, profhz = 666, stathz = 133 } というぐらいで、6.0RでHZが1000になったのが、 微妙に影響していたりするかも、かも。 # とりあえず変えないけど。
824 :
root▲ ★ :2006/02/11(土) 23:45:50 ID:???0 BE:2554447-#
で、 %sysctl -a | grep TSC kern.timecounter.choice: TSC(-100) ACPI-fast(1000) i8254(0) dummy(-1000000) kern.timecounter.hardware: TSC ここが -100 (品質だめ = 選ばれない)になっていることに気づき、 /usr/src/sys/i386/i386/tsc.c を読むと、 #ifdef SMP static int smp_tsc; SYSCTL_INT(_kern_timecounter, OID_AUTO, smp_tsc, CTLFLAG_RDTUN, &smp_tsc, 0, "Indicates whether the TSC is safe to use in SMP mode"); TUNABLE_INT("kern.timecounter.smp_tsc", &smp_tsc); #endif となっていて、
825 :
root▲ ★ :2006/02/11(土) 23:46:42 ID:???0 BE:1368353-#
#ifdef SMP /* * We can not use the TSC in SMP mode unless the TSCs on all CPUs * are somehow synchronized. Some hardware configurations do * this, but we have no way of determining whether this is the * case, so we do not use the TSC in multi-processor systems * unless the user indicated (by setting kern.timecounter.smp_tsc * to 1) that he believes that his TSCs are synchronized. */ if (mp_ncpus > 1 && !smp_tsc) tsc_timecounter.tc_quality = -100; #endif ということらしく、 でも、TSCにしてちゃんと動いているということは、 このマザボはたまたま "Some hardware configurations do this" なやつらしく、
826 :
root▲ ★ :2006/02/11(土) 23:47:55 ID:???0 BE:2736656-#
%sysctl -a | grep smp_tsc kern.timecounter.smp_tsc: 0 のように、デフォルトではオフになっていて、 %sysctl kern.timecounter.smp_tsc=1 sysctl: oid 'kern.timecounter.smp_tsc' is a read only tunable sysctl: Tunable values are set in /boot/loader.conf ということなので、sysctl.conf で指定する必要があると。
827 :
root▲ ★ :2006/02/11(土) 23:48:19 ID:???0 BE:1642436-#
>>826 × ということなので、sysctl.conf で指定する必要があると。
○ ということなので、/boot/loader.conf で指定する必要があると。
828 :
root▲ ★ :2006/02/11(土) 23:51:26 ID:???0 BE:2462393-#
でもどうせ、TSCのクオリティは、 static struct timecounter tsc_timecounter = { tsc_get_timecount, /* get_timecount */ 0, /* no poll_pps */ ~0u, /* counter_mask */ 0, /* frequency */ "TSC", /* name */ 800, /* quality (adjusted in code) */ }; のように、800と決められているようなので、 ACPI-fast(1000)には負ける模様(未確認)。 なので、/boot/loader.conf への追加はどうもしなくてよくて、 /etc/sysctl.conf に TSC を強制選択すると書いておけば、いい模様。
830 :
root▲ ★ :2006/02/12(日) 00:31:54 ID:???0 BE:2462393-#
>>829 おぉ、 phk ですか。
わくてかってかんじで。
831 :
root▲ ★ :2006/02/12(日) 00:36:46 ID:???0 BE:1824454-#
>>829 のパッチを読んでいますが、
これって calcru をまるっきり置き換えなんすね。
まさに、○○だねみたいな。
832 :
root▲ ★ :2006/02/12(日) 03:42:17 ID:???0 BE:821333-#
# for Torino olympic games 0 17 * * * /usr/local/bin/home-backup.sh /home @ live22
833 :
root▲ ★ :2006/02/12(日) 03:42:45 ID:???0 BE:3648285-#
もともとは 14:00 PST/PDT
>>832
834 :
root▲ ★ :2006/02/12(日) 03:55:38 ID:???0 BE:2188883-#
今日健康でもLA=10超えたので、
>>821 を LA=20 で発動に変更。
>>819 > # suspicious "calcru: runtime went backwards" wordaround
word => work
# おはずかしい。
>>832 月曜の朝10時にフルダンプするのもいまいちなんで、
あとで、2時間ぐらい早めておこう。
いまさらだけど
>>811 のradwinさんのスライド読みました。
これはすごいですねーー。
kill -HUP しなくてログローテーションとかどうやるんだろう。
inode変るはずなのに。
839 :
root▲ ★ :2006/02/13(月) 16:02:47 ID:???0 BE:1094843-#
Apache 2.2系で環境を作るべく、調べ中。 以下、FreeBSDのports的観点でまずは。 ・Apache 2.2系では最初からkqueue(2)をサポートしている模様。 - ports作る時のWITH_KQUEUE_SUPPORTは、不要(意味なし)になった。 ・configとかが/usr/local/etc/apache22の下に変わる ・同様にモジュールの場所も/usr/local/libexec/apache22の下に変わる 2ch的には、 ・mod_cgidsoは再インストールが必要 あたりか。
840 :
root▲ ★ :2006/02/13(月) 16:06:36 ID:???0 BE:4104959-#
/usr/local/etc/rc.d/apache22.sh これも名前が変わる。 # # Add the following lines to /etc/rc.conf to enable apache22: # apache22_enable (bool): Set to "NO" by default. # Set it to "YES" to enable apache22 # apache22_profiles (str): Set to "" by default. # Define your profiles here. # apache22limits_enable (bool):Set to "NO" by default. # Set it to yes to run `limits $limits_args` # just before apache starts. # apache22_flags (str): Set to "" by default. # Extra flags passed to start command. # apache22limits_args (str): Default to "-e -C daemon" # Arguments of pre-start limits run. # apache22_http_accept_enable (bool): Set to "NO" by default. # Set to yes to check for accf_http kernel # module on start up and load if not loaded. のように、accf_http(9)のオン・オフをrc.confに書くようになった。 デフォルトでは入らないので注意。
841 :
root▲ ★ :2006/02/13(月) 17:47:18 ID:???0 BE:547632-#
/usr/ports/CHANGES:
20051108:
AUTHOR:
[email protected] The following changes were introduced:
...
* Add bsd.apache.mk
USE_APACHE knob enhancements
/usr/ports/Mk/bsd.apache.mk:
# Variables definition
# USE_APACHE: Call this script. Values can be:
# <version>: 1.3/13/2.0/20/2.1/2.2/1.3+/2.0+/2.1+/2.2+
# common*: common13, common20, common21 and common22
ということは、/etc/make.conf に、
# added by mumumu, for Apahce 2.2 -- 2006/2/13
USE_APACHE=common22
を追加でいいのかな。
842 :
root▲ ★ :2006/02/13(月) 18:33:54 ID:???0 BE:4104195-#
<IfModule dir_module> DirectoryIndex index.html </IfModule> IfModuleの文法が変わったですか。 (多分前のもいけるんでしょうけど)
>>839 >Apache 2.2系で環境を作るべく、調べ中。
いよいよですか.2.2 なら Event MPM も挑戦する価値あるかも.
>・mod_cgidsoは再インストールが必要
それを用いるプログラム (read.cgi 等) もですね.
844 :
root▲ ★ :2006/02/14(火) 03:41:08 ID:???0 BE:4925096-#
>>843 > それを用いるプログラム (read.cgi 等) もですね.
おぉ、なるほど。
で、さっきまた症状再発。
アイドルタイムがぐぐぐとなくなり、でもtop的にはプロセスがRUNにならないのに、
ロードアベレージが上がり続けるという、いかにもカーネルのバグっぽい、
謎な状態になる模様。
845 :
root▲ ★ :2006/02/14(火) 03:42:01 ID:???0 BE:1277827-#
症状はこれまでと全く同じ。 %grep backward /var/log/messages Feb 13 10:27:24 <0.2> tiger2522 kernel: calcru: runtime went backwards from 235116018 usec to 235115799 usec for pid 28466 (httpd) Feb 13 10:28:06 <0.2> tiger2522 kernel: calcru: runtime went backwards from 557817 usec to 557807 usec for pid 17019 (httpd) Feb 13 10:28:06 <0.2> tiger2522 kernel: calcru: runtime went backwards from 547476 usec to 547431 usec for pid 16997 (httpd) Feb 13 10:28:21 <0.2> tiger2522 kernel: calcru: runtime went backwards from 1734019 usec to 1733938 usec for pid 16944 (httpd)
846 :
root▲ ★ :2006/02/14(火) 03:43:54 ID:???0 BE:3192757-#
2006-02-14 03:26:37.805228500 MaxLA = 20, LA = 2.13818359375 2006-02-14 03:27:07.806554500 MaxLA = 20, LA = 14.9033203125 2006-02-14 03:27:37.808498500 MaxLA = 20, LA = 98.05224609375 2006-02-14 03:27:37.809198500 delta = 1139855257 2006-02-14 03:27:37.809226500 Restarting apache... 2006-02-14 03:27:37.893737500 Performing sanity check on apache2 configuration: 2006-02-14 03:27:38.135912500 Syntax OK 2006-02-14 03:27:38.193105500 Stopping apache2. 2006-02-14 03:27:38.208165500 Waiting for PIDS: 55140, 55140, 55140, 55140, 55140, 55140. 2006-02-14 03:27:50.395771500 Starting apache2. 2006-02-14 03:28:21.037681500 MaxLA = 20, LA = 82.00390625 2006-02-14 03:28:21.037954500 delta = 30 2006-02-14 03:28:21.037975500 delta = 30, not restarting 2006-02-14 03:28:51.038550500 MaxLA = 20, LA = 79.72509765625 2006-02-14 03:28:51.038668500 delta = 60 2006-02-14 03:28:51.038692500 delta = 60, not restarting 2006-02-14 03:29:21.039819500 MaxLA = 20, LA = 49.25634765625 2006-02-14 03:29:21.039891500 delta = 90 2006-02-14 03:29:21.039907500 delta = 90, not restarting 2006-02-14 03:29:51.041112500 MaxLA = 20, LA = 30.40380859375 2006-02-14 03:29:51.041344500 delta = 120 (続く)
847 :
root▲ ★ :2006/02/14(火) 03:44:32 ID:???0 BE:1277827-#
2006-02-14 03:29:51.041389500 Restarting apache... 2006-02-14 03:29:51.056401500 Performing sanity check on apache2 configuration: 2006-02-14 03:29:51.104448500 Syntax OK 2006-02-14 03:29:51.121918500 Stopping apache2. 2006-02-14 03:29:51.186926500 Waiting for PIDS: 16927, 16927, 16927. 2006-02-14 03:29:57.209463500 Starting apache2. 2006-02-14 03:30:28.033177500 MaxLA = 20, LA = 53.62548828125 2006-02-14 03:30:28.033181500 delta = 30 2006-02-14 03:30:28.033183500 delta = 30, not restarting 2006-02-14 03:30:58.033944500 MaxLA = 20, LA = 35.7099609375 2006-02-14 03:30:58.034165500 delta = 60 2006-02-14 03:30:58.034201500 delta = 60, not restarting 2006-02-14 03:31:28.035250500 MaxLA = 20, LA = 22.26318359375 2006-02-14 03:31:28.035586500 delta = 90 2006-02-14 03:31:28.035631500 delta = 90, not restarting 2006-02-14 03:31:58.036485500 MaxLA = 20, LA = 12.85009765625 2006-02-14 03:32:28.037717500 MaxLA = 20, LA = 8.75927734375 2006-02-14 03:32:58.038980500 MaxLA = 20, LA = 5.54248046875 2006-02-14 03:33:28.040237500 MaxLA = 20, LA = 3.64404296875 2006-02-14 03:33:58.041496500 MaxLA = 20, LA = 2.49658203125 2006-02-14 03:34:28.042745500 MaxLA = 20, LA = 1.51171875 (以下略)
848 :
root▲ ★ :2006/02/14(火) 03:50:57 ID:???0 BE:1368353-#
[Mon Feb 13 10:27:24 2006] [notice] child pid 28437 exit signal Bus error (10) [Mon Feb 13 10:27:41 2006] [warn] child process 28391 still did not exit, sending a SIGTERM [Mon Feb 13 10:27:41 2006] [warn] child process 28392 still did not exit, sending a SIGTERM [Mon Feb 13 10:27:41 2006] [warn] child process 28393 still did not exit, sending a SIGTERM [Mon Feb 13 10:27:41 2006] [warn] child process 28394 still did not exit, sending a SIGTERM ... [Mon Feb 13 10:27:47 2006] [error] child process 28391 still did not exit, sending a SIGKILL [Mon Feb 13 10:27:47 2006] [error] child process 28392 still did not exit, sending a SIGKILL [Mon Feb 13 10:27:47 2006] [error] child process 28393 still did not exit, sending a SIGKILL [Mon Feb 13 10:27:47 2006] [error] child process 28394 still did not exit, sending a SIGKILL ... [Mon Feb 13 10:27:49 2006] [notice] caught SIGTERM, shutting down [Mon Feb 13 10:27:50 2006] [notice] suEXEC mechanism enabled (wrapper: /usr/local/sbin/suexec) [Mon Feb 13 10:27:51 2006] [notice] mod_cgidso enabled [Mon Feb 13 10:27:56 2006] [notice] Apache/2.0.55 configured -- resuming normal operations [Mon Feb 13 10:28:02 2006] [notice] child pid 16999 exit signal Bus error (10) [Mon Feb 13 10:28:03 2006] [notice] child pid 16994 exit signal Bus error (10) [Mon Feb 13 10:28:03 2006] [notice] child pid 16980 exit signal Bus error (10) [Mon Feb 13 10:28:04 2006] [notice] child pid 17000 exit signal Bus error (10) ... [Mon Feb 13 10:29:54 2006] [warn] child process 16944 still did not exit, sending a SIGTERM [Mon Feb 13 10:29:54 2006] [warn] child process 16946 still did not exit, sending a SIGTERM [Mon Feb 13 10:29:54 2006] [warn] child process 16947 still did not exit, sending a SIGTERM [Mon Feb 13 10:29:54 2006] [warn] child process 16948 still did not exit, sending a SIGTERM ... (続く)
850 :
root▲ ★ :2006/02/14(火) 03:51:36 ID:???0 BE:1824645-#
[Mon Feb 13 10:29:56 2006] [notice] caught SIGTERM, shutting down [Mon Feb 13 10:29:57 2006] [notice] suEXEC mechanism enabled (wrapper: /usr/local/sbin/suexec) [Mon Feb 13 10:29:58 2006] [notice] mod_cgidso enabled [Mon Feb 13 10:30:00 2006] [notice] Apache/2.0.55 configured -- resuming normal operations (ここまで)
851 :
root▲ ★ :2006/02/14(火) 03:52:25 ID:???0 BE:1368353-#
852 :
root▲ ★ :2006/02/14(火) 03:54:06 ID:???0 BE:1459744-#
・装置は2回発動 ・2回とも死ぬ前に SIGBUS 発生 ・1回目はSIGTERMでは死なず、SIGKILLで死んだ ・2回目はSIGTERMで死んだ
853 :
root▲ ★ :2006/02/14(火) 04:01:18 ID:???0 BE:2554447-#
今日作ったインストールキット使って、Apache 2.2を入れてみるか。
ついに2.2投入ですか 早朝実況組もいますがざっくり入れちゃっても問題はないと思います。 (どの時間帯に実施しても騒ぎになること必定ですし)
855 :
root▲ ★ :2006/02/14(火) 04:06:39 ID:???0 BE:1824645-#
856 :
root▲ ★ :2006/02/14(火) 04:07:13 ID:???0 BE:2280555-#
857 :
root▲ ★ :2006/02/14(火) 04:09:53 ID:???0 BE:6567089-#
858 :
root▲ ★ :2006/02/14(火) 04:11:39 ID:???0 BE:3831067-#
859 :
root▲ ★ :2006/02/14(火) 04:21:53 ID:???0 BE:3830876-#
http://www.freebsd.org/cgi/cvsweb.cgi/src/sys/kern/kern_resource.c Revision 1.151 / (download) - annotate - [select for diffs], Mon Jan 23 19:15:13 2006 UTC (3 weeks ago) by ups
Branch: MAIN
Changes since 1.150: +1 -1 lines
Diff to previous 1.150 (colored)
Hopefully fix the "calcru: runtime went backwards from ..." problem by
keeping the resource values locked (where needed) while we use them
for calculations.
MFC after:3 days
…で、これはまだMFCされていない模様。
860 :
root▲ ★ :2006/02/14(火) 04:23:19 ID:???0 BE:1824645-#
>>859 は、
http://www.freebsd.org/cgi/cvsweb.cgi/src/sys/kern/kern_resource.c.diff?r1=1.150&r2=1.151 ===================================================================
RCS file: /usr/local/www/cvsroot/FreeBSD/src/sys/kern/kern_resource.c,v
retrieving revision 1.150
retrieving revision 1.151
diff -u -p -r1.150 -r1.151
--- src/sys/kern/kern_resource.c2005/11/02 21:18:071.150
+++ src/sys/kern/kern_resource.c2006/01/23 19:15:131.151
@@ -35,7 +35,7 @@
*/
#include <sys/cdefs.h>
-__FBSDID("$FreeBSD: /usr/local/www/cvsroot/FreeBSD/src/sys/kern/kern_resource.c,v 1.150 2005/11/02 21:18:07 ps Exp $");
+__FBSDID("$FreeBSD: /usr/local/www/cvsroot/FreeBSD/src/sys/kern/kern_resource.c,v 1.151 2006/01/23 19:15:13 ups Exp $");
#include "opt_compat.h"
@@ -733,8 +733,8 @@ calcru(p, up, sp)
&pcpu_find(td->td_oncpu)->pc_switchtime);
}
}
-mtx_unlock_spin(&sched_lock);
calcru1(p, &rux, up, sp);
+mtx_unlock_spin(&sched_lock);
p->p_rux.rux_uu = rux.rux_uu;
p->p_rux.rux_su = rux.rux_su;
p->p_rux.rux_iu = rux.rux_iu;
861 :
root▲ ★ :2006/02/14(火) 04:25:01 ID:???0 BE:5107687-#
…でもこれ、1.154で「ばっさりこん」なんですよね。
>>829 のやつのもより。
うーむうーむ。
862 :
root▲ ★ :2006/02/14(火) 04:26:32 ID:???0 BE:5107687-#
>>859 がびーん。
Revision 1.152 / (download) - annotate - [select for diffs], Wed Jan 25 02:05:47 2006 UTC (2 weeks, 5 days ago) by ups
Branch: MAIN
Changes since 1.151: +1 -1 lines
Diff to previous 1.151 (colored)
Back out changes made in rev. 1.151.
They were bogus.
Cluebat applied by: jhb@
863 :
root▲ ★ :2006/02/14(火) 04:28:00 ID:???0 BE:912825-#
いずれにせよ、、、カーネルの虫ってことっぽいのかな。 Apacheを変えるのはそれはそれで意味ありそうなんで、 そっちは、たんたんとやるかんじかなと。
864 :
root▲ ★ :2006/02/14(火) 05:57:48 ID:???0 BE:2736465-#
ということで、Apache 2.2.0 を投入。@ live22 TransferLog の動きが、2.0 と違うみたい。 TransferLog "| /usr/local/sbin/logbuffer" とかやっているのですが、Apache 2.xでは直接起動してくれたlogbufferが、 %ps ax | grep logbuffer 74136 ?? I 0:00.01 /bin/sh -c /usr/local/sbin/logbuffer 74137 ?? S 0:01.30 /usr/local/sbin/logbuffer 74568 p1 S+ 0:00.00 grep logbuffer のように、sh経由になり、 しかもApacheをリスタートすると、暴走状態で残ってしまうようです。 (kill -TERMで死にはする)
865 :
root▲ ★ :2006/02/14(火) 06:02:57 ID:???0 BE:5107878-#
おぉ、Apache 2.2 系列では 今の read.cgi は、そのままではコンパイルできないっぽい。 gcc -c read.c -I`apxs -q INCLUDEDIR` -O2 -Wall -funsigned-char -fPIC -DSNOWMAN -o read.o In file included from read.c:1: read.h:11:22: apr_date.h: No such file or directory read.h:12:25: apr_file_io.h: No such file or directory read.h:13:21: apr_lib.h: No such file or directory read.h:14:25: apr_strings.h: No such file or directory read.h:15:24: apr_tables.h: No such file or directory read.h:16:22: apr_time.h: No such file or directory read.h:20:22: apr_want.h: No such file or directory
867 :
root▲ ★ :2006/02/14(火) 06:20:10 ID:???0 BE:2189164-#
>>866 そうです。で、
TransferLog "| exec /usr/local/sbin/logbuffer"
とすることで、前と同じ動きになりました。
リスタートしても大丈夫でした。
色々、微妙みたい。
868 :
root▲ ★ :2006/02/14(火) 06:32:18 ID:???0 BE:1276872-#
>>865 /usr/local/include/apr-1 に入るのかぁ。
ってことは、Makefile 更新しないとってことかい。
869 :
root▲ ★ :2006/02/14(火) 06:41:04 ID:???0 BE:5837388-#
-I`apxs -q INCLUDEDIR` -I/usr/local/include/apr-1 とかやって、read.cgi はできる模様。
870 :
root▲ ★ :2006/02/14(火) 06:43:34 ID:???0 BE:2188883-#
あとは、例の装置のリスタート部分を2.2対応にすればOKかな。 やっておこう。 で、今日はそろそろみせじまいで。
2.2 稼働ですか,乙です.あとは mod_cache がちゃんと使えるようになれば バック側の httpd がかなり楽になりますね.
>>869 は、
%apr-1-config --includes
-I/usr/local/include/apr-1
これ使ったほうがよさげ。
で、
>>871 (live22x[123]をApache 2.2にする)をそのうち。
(´-`).。oO(2.3になると、deny allow がなくなるそうな)
874 :
root▲ ★ :2006/02/14(火) 21:56:45 ID:???0 BE:912825-#
>>873 まじすか。
つまり2.4を使う頃には、あれのしくみ変えないといけないと。
これですね
まだ2.3すら出てないし、これからどうなるか知らないですけど
http://svn.apache.org/repos/asf/httpd/httpd/trunk/CHANGES *) Authz: Mark the directives 'Order', 'Allow', 'Deny' and 'Satisfy' as
deprecated and move them into the new module mod_access_compat which
can be loaded to provide backwards compatibility for these directives.
[Brad Nicholes]
876 :
root▲ ★ :2006/02/14(火) 22:07:33 ID:???0 BE:1095326-#
>>875 mod_access_compat 入れれば、一応互換性は保てることにすると。
たぶん、もっといいしくみにしようってことなのかしら。
878 :
root▲ ★ :2006/02/15(水) 05:43:24 ID:???0 BE:3192375-#
フロント2台追加の第一段階(基本セットアップ)ができました。 以下のDNSへの追加をお願いします。 これをDNSに追加することにより、第二段階(掲示板システムに必要なファイル入れたり、 F22をセットアップしたり等)が、できるようになります。 で、それができた後で、ラウンドロビンへの投入 (= DNSに再度追加し、live22x の仲間に入れる)という手順を踏むことになります。 以上、よろしくです。 (新規追加) +live22x4.2ch.net:206.223.150.110:300 +live22x5.2ch.net:206.223.150.42:300
879 :
root▲ ★ :2006/02/15(水) 05:50:32 ID:???0 BE:821333-#
で、これら2台はApache 2.2 + worker MPMです。 キャッシュ関係はオフです。 どうも、Apache 2.0 で入れていた以下の設定は、そのままではエラーになる模様。 CacheSize なんて知らないよ、って言われたです。 # include cache config file <IfModule cache_module> # config cache directory and size CacheRoot /md/cache CacheSize 65536 </IfModule>
あと,キャッシュ保持時間とかのチューニングの手段は,と...... フロント側 mod_cache のディレクティブ: CacheLastModifiedFactor CacheMaxExpire バック側 mod_headers で Cache-Control ヘッダ付加: # キャッシュ保持時間が n 秒未満なら再評価なしにキャッシュをそのまま使用 # その後は conditional GET で再評価する Header set Cache-Control s-maxage=n
>>878 そろそろ受付嬢の再投入は?
live22x4,live22x5のIPアドレスを直接ラウンドロビンに
いれるのではなく、受付嬢での振り分け先をlive22x4,live22x5に
して、受付嬢の代表IPアドレスを登録する。
とりあえず、1/4の負荷からはどうでしょう。
おちても、3/4の確率でつながるので、以前ほどはひどくないかと。
884 :
ピロリ :2006/02/15(水) 10:24:58
株 ID:Ohaa79xX0 BE:211260454-
885 :
root▲ ★ :2006/02/15(水) 17:00:23 ID:???0 BE:1916137-#
886 :
root▲ ★ :2006/02/15(水) 17:30:04 ID:???0 BE:912825-#
>>880 >>882 どもです。
ディスクキャッシュの時は、htcacheclean ってのを動かすかんじなのか。
いろいろ読み中。
>>881 Event MPM
The event MPM uses a seperate thread to handle Keep Alive requests and
accepting connections. Keep Alive requests have traditionally required httpd
to dedicate a worker to handle it. This dedicated worker could not be used
again until the Keep Alive timeout was reached.
おぉ、なんかよさげですね。
入れてみるかな。
>>883 魅力的ですが、一歩一歩やっていこうかなと。
普通にラウンドロビンして、次にmatdか。
887 :
root▲ ★ :2006/02/15(水) 17:43:47 ID:???0 BE:3830876-#
で、 フロントは負荷的には足りているような気がするのに、なぜ2つ追加投入するのか の件ですが(私も疑問を持ちました)、 それは「雪だるまシステム」そのもののテスト、という意味合いがあるとのことです。 ようは、スロー同期とか今の形で構築したシステムが、フロントが増えていっても ちゃんと動くようになっているかとかを、いまのうちにきちんと試しておきたいと。 どうせ、フロントは増える方向だし、このシステムは将来にわたり使うに違いないので、 いまのうちにきちんとしたものを作っておくほうが、いいんじゃないかなということで。 …ということで、私も納得したと。 で、cobra2247は「コブラをバックエンドにしたらどんなかんじなのか」を試すということで、 バックエンドに仕立てると。
888 :
root▲ ★ :2006/02/15(水) 18:07:19 ID:???0 BE:6566898-#
live22x[45] を作る場合の手順: ・器を作る ・フロントパック(フロントにするためのもの一式)を入れる ・スロー同期のための設定をする (live22x[45], live22) ・スロー同期スクリプトを手で動かす => それまでの過去ログがどばーっと転送される (要注意) ・cronの設定をする(定時スロー同期開始) ・BBx 等にIPアドレスを登録する ・DNSに live22x[45] を登録する ・投稿のテストをする ・F22/丁稚どん/配布リストに live22x[45] を登録する ・DNSに live22y として追加登録する => 将来は live22b[12] の matd に追加、になる ・ウマー
>>887 雪だるまスレのほうがよいのかもしれないけど。
なんとなく、フロントで過去ログをもっているのが厳しいかも。
バックを複数もつとフロントは掛算で過去ログを持ちますよね。
そこが大変そう。
ディスクは十分大きいから大丈夫かもしれないし、
自動的にコピーができるから、バックアップする必要がないという
うれしい点があるかもしれないけど。
メンテを考えると、過去ログは、bbsdを動かすバックエンドとは
別のバックエンドに突っ込むほうがよいのかなと思う。
(dat落ちのタイミングでコピーかな。)
ここらへんも実験!実験!なんでしょうが。
890 :
root▲ ★ :2006/02/15(水) 19:17:13 ID:???0 BE:4469377-#
ふむふむ。 そうすれば各フロントが過去ログをバックにとりにいかなくてよくなるから、 バックも軽くできる気がしますね。 cobra2247をバックにしたら、今のtiger2522をそれに転用してみるとか。
891 :
root▲ ★ :2006/02/15(水) 19:23:47 ID:???0 BE:2554447-#
新 epg.2ch.net の Apache を、event MPM にしてみた。 設定そのものはこんなかんで、worker MPMと変わるところがないみたい。 <IfModule mpm_event_module> StartServers 24 ServerLimit 36 MaxClients 1152 MinSpareThreads 128 MaxSpareThreads 768 ThreadsPerChild 32 MaxRequestsPerChild 1000000 ThreadLimit 32 MaxMemFree 64000 </IfModule>
確かに今の過去ログのやり方のままだと,今後大変になるかも知れないんですよね. とはいえ,ライブな dat と同じように mod_proxy でやると offlaw.cgi の改造が必要だし, さらに mod_cache を使用するとなると /md を過去ログで食い潰すかも知れないし...... となると,いっそ NFS を使ってみるとか.以前雪だるまでライブな dat の読み出しに NFS 使ってた時の問題,例えば不規則に dat の内容が壊れるとか ESTALE 発生が カーネルごとコケる引き金になるとか,そういうのは過去ログでは発生しにくいのでは, と思えなくもないですし......
ここは一つ、全鯖規模で過去ログの一元化を
>>892 過去ログはフロントでキャッシュする必要はないんじゃないかと。
(CacheDisableで過去ログのURLをはずすことはできないんですかね?)
offlaw.cgiは、誰かさんが泣きながら書き換えてもらって。
NFSは、サーバ間がちょっと密結合になってうれしくないかも。
# 感覚だけですが。
895 :
ピロリ :2006/02/16(木) 06:25:52
株 ID:unYN/D580 BE:380268566-
>過去ログはフロントでキャッシュする必要はない 私も原理はそれに賛成。 ただ /doom/kako/ 以下はインデックスなんで各フロントにあった方がいいかと
>>894 >(CacheDisableで過去ログのURLをはずすことはできないんですかね?)
確かに可能ですね.
>offlaw.cgiは、誰かさんが泣きながら書き換えてもらって。
このあたりは,実際に書き換える中の人次第ということで......
>>886 > 普通にラウンドロビンして、次にmatdか。
matdできになっているのは、負荷への耐性がどの程度あるか
わからない点なんですよね。
動作はばっちりだと思うのですが、アプリとして
動くみたいなので、カーネルとの切り替えがばかに
ならないのかなと。
(パケット1個単位で切り替えですよね。)
そんなこともあって、いっきにつっこむのではなく、
少しずつ動かした方がよいのではないのかと。
>>898 > matdできになっているのは、負荷への耐性がどの程度あるか
> わからない点なんですよね。
まずは(他の系が安定している)どっかで、試してみるか。
携帯(c)とかか。
900 :
root▲ ★ :2006/02/16(木) 13:11:25 ID:???0 BE:1916137-#
>>881 live22x4 を、event MPMで動かしてみた。
・live22x4: Apache 2.2.0 + event MPM
・live22x5: Apache 2.2.0 + worker MPM (比較のため)
今日 or 明日あたりに、フロントに投入予定。
>>898 >matdできになっているのは、負荷への耐性がどの程度あるかわからない点なんですよね。
確かに.
>アプリとして動くみたいなので、カーネルとの切り替えがばかにならないのかなと。
>(パケット1個単位で切り替えですよね。)
FreeBSD では BPF,Solaris では bufmod によるバッファリングが効いて
パケット取り込みはある程度まとめて行われると思いますが,
パケットの取りこぼしとか発生しないかどうかってのは,正直わかりません......
パケット送出の方は1パケット単位ですね.マルチスレッドモードなら
まとめて取り込まれたパケットの送出をコンカレントに行いますが,SMP でないと無意味
(シングル CPU だとかえってコンテキストスイッチングによるオーバヘッドが発生する)
だと思うんで,デフォルトではシングルスレッドモードになってます.
902 :
root▲ ★ :2006/02/17(金) 14:32:17 ID:???0 BE:1095326-#
live22x4/live22x5 フロントに投入します。 以下の登録をよろしくです。 (追加) +live22y.2ch.net:206.223.150.110 +live22y.2ch.net:206.223.150.42
903 :
root▲ ★ :2006/02/17(金) 14:32:55 ID:???0 BE:1641863-#
>>902 訂正です。
TTLは他同様、300でお願いします。
(追加)
+live22y.2ch.net:206.223.150.110:300
+live22y.2ch.net:206.223.150.42:300
904 :
ピロリ :2006/02/17(金) 14:42:43
株 ID:ogzJcdWS0 BE:190134836-
905 :
root▲ ★ :2006/02/17(金) 15:23:46 ID:???0 BE:4377986-#
906 :
root▲ ★ :2006/02/17(金) 15:43:52 ID:???0 BE:1641863-#
event MPMのバグじゃなくて、設定に1つ抜けがあった模様。 ううむ。
907 :
root▲ ★ :2006/02/17(金) 15:46:58 ID:???0 BE:1641863-#
*フロント作成時の重要な注意* 192.168.100.1 live22x.2ch.net を、/etc/hosts に必ず追加すること。 これを入れないと、mod_proxy による dat 取得が失敗する。 (live22x[1-5]は、live22x.2ch.net という名前で live22.2ch.net のプライベート側に とりにいくため) しかしどうして、動いたり動かなかったりってことが起きたんだ? あ、わかった、、、。live22x は代表名だから、 自分にアクセスが向くと、だめになるということか。
908 :
root▲ ★ :2006/02/17(金) 16:21:36 ID:???0 BE:1460328-#
live22x4 の event MPM を復活。
909 :
root▲ ★ :2006/02/17(金) 16:47:08 ID:???0 BE:4925669-#
様子を観察中ですが、、、。 event MPMって、何か負荷が高いですね。 たまにhttpdがいっせいにRUN状態になります(topで)。 で、Apache statusで見てみると、こんなふうに 1つのworker にほとんどがぶら下がる感じになっているようです。 つまり、分散していない。 ________________________________________________________________ ________________________________________________________________ ________________________________________________________________ ________________________________................................ ________________________________________________________________ ________________________________________________________________ ________________________________________________________________ ___________C____________________________________________________ ________________________________________________________________ _____________________________________R____C____C____C___________ W_RCC_C__C____W_W__CRC_CR_CWCC__________________________________
910 :
root▲ ★ :2006/02/17(金) 16:48:06 ID:???0 BE:6566898-#
で、こんな具合にそのhttpdが負荷高くなって、LAが上がります。 (CPU idle timeが少なくなる) PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 98662 ch2live22x 21 20 0 96076K 68860K kserel 0 13:17 7.18% httpd 2005 ch2live22x 1 97 0 14292K 13572K select 2 0:14 2.78% speedy_back 2659 ch2live22x 1 96 0 13900K 13168K select 2 0:04 2.64% speedy_back 666 dnscache 1 96 0 32804K 32116K select 2 2:08 0.00% dnscache 667 dnslog 1 -8 0 1204K 576K piperd 0 1:29 0.00% multilog 98661 ch2live22x 8 20 0 67652K 44428K kserel 1 0:25 0.00% httpd 98653 ch2live22x 9 20 0 32096K 22444K kserel 1 0:13 0.00% httpd 98651 ch2live22x 7 20 0 25360K 16552K kserel 1 0:11 0.00% httpd 98642 ch2live22x 7 20 0 22668K 14328K kserel 0 0:11 0.00% httpd 98646 ch2live22x 7 20 0 27560K 17652K kserel 1 0:11 0.00% httpd
911 :
root▲ ★ :2006/02/17(金) 16:49:10 ID:???0 BE:365322-#
ようはひとことでいうと、挙動不審ってかんじですね。 17:00 ぐらいまで様子見たら、worker MPM に戻そうかと。 (Apche 2.2 + worker MPMで動かしているlive22x5は、特に問題なし)
受付嬢はたくさん窓口にいるのに、いきなりみんななぜか忙しくなって開いている窓口がひとつだけ しかもその人はごにょごにょしていてまずー ってな状態と解釈しましたが、違いますかね?
913 :
root▲ ★ :2006/02/17(金) 17:33:53 ID:???0 BE:2188883-#
新 epg も、worker MPM に戻した。
914 :
root▲ ★ :2006/02/17(金) 17:34:40 ID:???0 BE:1095034-#
>>912 概ね、そんなかんじかもです。
というか空いている窓口がいっぱいあるのに、みんな同じ受付に案内されてしまうかんじ。
915 :
root▲ ★ :2006/02/17(金) 19:01:01 ID:???0 BE:2462393-#
次は、キャッシュありの状態に挑戦か。
916 :
root▲ ★ :2006/02/17(金) 20:13:18 ID:???0 BE:1916137-#
mod_disk_cache の場合の容量指定 Apache 2.2系ではディスクキャッシュにした場合、 htcacheclean コマンドでキャッシュのパージをする。 定期的にcron等から起動するか、-d(インターバル)をつけて デーモンにする。 例えばこんな感じで指定する。 htcacheclean -d60 -p/md/cache -l64m -d: デーモンモード、インターバル時間(秒) -p: キャッシュディレクトリ(httpd.confで指定したものを指定) -l: キャッシュ最大容量
917 :
root▲ ★ :2006/02/17(金) 20:26:33 ID:???0 BE:2189838-#
今の設定:
CacheDisable /dome/SETTING.TXT
CacheEnable disk /dome/
CacheDisable /dancesite/SETTING.TXT
CacheEnable disk /dancesite/
CacheDisable /endless/SETTING.TXT
CacheEnable disk /endless/
... (以下、板の分だけ)
<IfModule cache_module>
Include /home/ch2live22x/test/httpd/cache.conf <= 上記を指定しているファイル
# config cache directory
CacheRoot /md/cache
</IfModule>
これだけ。
今はまだ
>>882 等のチューニングは何もしてない状態。
918 :
root▲ ★ :2006/02/17(金) 20:37:28 ID:???0 BE:6567089-#
919 :
root▲ ★ :2006/02/17(金) 20:38:41 ID:???0 BE:547632-#
さて、キャッシュヒットの様子って、 どうやったら見られるんだろう。
920 :
root▲ ★ :2006/02/17(金) 20:40:18 ID:???0 BE:3192757-#
で、「連打」とか「みんながいっせいに」を防げればいいわけだから、 1秒効いてくれれば、かなりいけるんじゃないかなぁと思ったり。
921 :
root▲ ★ :2006/02/17(金) 21:12:39 ID:???0 BE:5745997-#
で、特に携帯(c)系で妙な挙動が起こったらしく、 いったんオフに戻した。 全フロントをApache 2.2にしてから、再度実験か。 Apache 2.2 @ フロントが大丈夫かの確認も伴うので、明日以降ってかんじで。
>>908-911 う〜む......まだ event MPM は発展途上ってことですかね.
今後は非同期 write / read の機能も加わるようなので,今後に期待かな.
>>919 >さて、キャッシュヒットの様子って、どうやったら見られるんだろう。
LogLevel を debug にすればわかりますが,実運用環境で debug は
さすがにきついか...... HTTP レスポンスヘッダに Age が入ってるのが
ヒットしてる目印になるかな.というか,その Age が Squid に
悪影響を与えているのが
>>921 だったり!?
923 :
root▲ ★ :2006/02/18(土) 00:24:52 ID:???0 BE:2918584-#
>>922 > HTTP レスポンスヘッダに Age が入ってるのが
> ヒットしてる目印になるかな.というか,その Age が Squid に
> 悪影響を与えているのが
>>921 だったり!?
とっても高い確率で、ビンゴの予感。
そういえば、2chの鯖って(root権ありのやつ)全部root氏の管理っすか?
925 :
root▲ ★ :2006/02/18(土) 02:54:27 ID:???0 BE:3648858-#
>>924 管理というか、おもりしているですね。
私以外にも root password を知っている人はいます。
■ XOロケーションの2ちゃんねるラックの現状(2005年2月18日現在) 合計25台(tiger: 17, cobra: 2, banana: 6) すぐに移設可能なのは上記中6台(tiger: 3, cobra: 1, banana: 2) ○ Love affair作戦 - tiger: 8, banana: 2 = total: 10 tiger2507 tiger2508 tiger2509 tiger2510 tiger2511 tiger2512 banana405 banana406 tiger511 tiger512
○ 雪だるま作戦 - tiger: 6, cobra: 1, banana: 2 = total: 9 tiger2522 tiger2523 tiger2524 tiger2525 tiger503 tiger507 cobra2247 banana403 banana404 ○ 上記のどちらでもない(移設可能) - tiger: 3, cobra: 1, banana: 2 = total: 6 tiger504 - game10 tiger509 - news19 tiger510 - hobby7 cobra2245 - BBQ banaan402 - VIP931/stock banana307 - BBM
928 :
ピロリ :2006/02/18(土) 16:33:15 ID:x6qKcASm0
現在 banana402 を別のラックに移設中。。。
>>928 了解です。リストを更新しておきます。
IPアドレスは変わらないと。
930 :
ピロリ :2006/02/18(土) 16:43:16
株 ID:x6qKcASm0 BE:517587577-
はい 変わらないように移設とお願いしました。
他のも、移設しておきますかね。 準備が整わないなら今日じゃなくてもいいですが、 割と近日中にってかんじで。
安全に移設できるなら、今日のほうがいいですが。 やるなら、該当サーバshutdownします。
933 :
ピロリ :2006/02/18(土) 16:52:20
株 ID:x6qKcASm0 BE:380268094-
配置計画とかあるから 今日は無理ー
934 :
ピロリ :2006/02/18(土) 16:52:35
株 ID:x6qKcASm0 BE:126756634-
土曜で人手不足ぎみ
>>933 了解です。
んでは、現状を現地に伝えて(私からしたほうがいいのかな: やっておきます)、
配置計画を練ってもらうということで。
936 :
root▲ ★ :2006/02/18(土) 17:04:51 ID:???0 BE:365322-#
937 :
ピロリ :2006/02/18(土) 17:14:19
株 ID:x6qKcASm0 BE:84504724-
うげっ VIP931/stock 同居なのか、しらなかった ちと鬱
938 :
root▲ ★ :2006/02/18(土) 17:20:06 ID:???0 BE:1095326-#
>>937 適当なところに場所作ってくださいー、という指令で、
root権限ありのうち、いちばん空いていたサーバに入れたです。
ちなみにcook81と同居なことは、雪だるま作戦のスレでさんざん書いていたです。
940 :
ピロリ :2006/02/18(土) 17:24:43
株 ID:x6qKcASm0 BE:190135229-
いやいや 舞い上がって視野狭窄していた自分に鬱ってことだす。
941 :
root▲ ★ :2006/02/18(土) 17:36:57 ID:???0 BE:3831067-#
>>940 そういうことすか。
>>939 さっき私も同じWebページ見てましたが、
Pentium Mあたり使ったよさげなBladeは載ってなかったです。
(なので某スレには、たまたまあったNECのやつを例示)
でも、フレキシブルに相談には乗ってくれるんじゃないかなと。< Polywell
>>939 上
ほんとだ・・・
>>936 は撤回します
live22x4のレスポンスヘッダ見て適当に書いただけだなんて恥ずかしくて言えません
943 :
root▲ ★ :2006/02/18(土) 22:25:19 ID:???0 BE:3192375-#
banana613 の情報受け取りました。 root 権限あり banana に変身と認識。 ちと今日は体調不安につき、明日あたりから。
944 :
root▲ ★ :2006/02/19(日) 08:32:11 ID:???0 BE:7387799-#
945 :
ピロリ :2006/02/19(日) 13:07:37 ID:4v8mFBZx0 BE:316890656-
>>943 2pix.2ch.se つくってくれくれ
>>945 やるやる。
本日中にDNS登録依頼出すところまでいこうかと。
で、そのかわりといってはなんですが、 foxBEsetの株価を取って$GB->{KABU}にセットするところで、 bbs.cgiが暴走することがあるようです。 その前のsplitとかfor文のところがあやしそうなのですが、 見ていただけると助かります。
で、どうも、何十・何百種類と持っている人だと、 変なことになっている、、、っぽいなと。
暴走はこんなかんじか。 (ここから上はアドレスが違うだけ) #76 0x28143cc1 in S_regmatch () from /usr/local/lib/perl5/5.8.7/mach/CORE/libperl.so #77 0x28142b32 in S_regmatch () from /usr/local/lib/perl5/5.8.7/mach/CORE/libperl.so #78 0x28146176 in S_regtry () from /usr/local/lib/perl5/5.8.7/mach/CORE/libperl.so #79 0x2814a48b in Perl_regexec_flags () from /usr/local/lib/perl5/5.8.7/mach/CORE/libperl.so #80 0x280f72ef in Perl_pp_match () from /usr/local/lib/perl5/5.8.7/mach/CORE/libperl.so #81 0x280f3ef5 in Perl_runops_standard () from /usr/local/lib/perl5/5.8.7/mach/CORE/libperl.so #82 0x280a0f3e in perl_run () from /usr/local/lib/perl5/5.8.7/mach/CORE/libperl.so #83 0x0804d34d in onerun () #84 0x0804da5e in speedy_perl_run () #85 0x0804bd2c in start_child () #86 0x0804c17c in main ()
bbs.cgi暴走問題も、ここでやろうかと。 @ex14 %gcore 90994 gcore: read from /proc/90994/mem: Bad address 64bit 環境では、gcoreがちゃんと動かない模様。しくり。
いただいたbanana613ですが、今までのIPアドレスレンジと違うわけですが、 (それ自体はめでたくて、PIEが成長したということだと思います)、 DNSの逆引きの設定がおかしいようです。 banana613から他のホスト等にアクセスすると、DNSを引きにいって ハングアップ状態になります。 調べてみると、ns1.pacificinternetexchange.net と ns2.pacificinternetexchange.net の設定がまずい状態のようです。 (ns1.pacificinternetexchange.net: 自分自身を別名として指している) %dig +norec -t ptr 110.224.29.207.in-addr.arpa. @ns1.pacificinternetexchange.net. ; <<>> DiG 9.3.1 <<>> +norec -t ptr 110.224.29.207.in-addr.arpa. @ns1.pacificinternetexchange.net. ; (2 servers found) ;; global options: printcmd ;; Got answer: ;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 48850 ;; flags: qr aa; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 0 ;; QUESTION SECTION: ;110.224.29.207.in-addr.arpa. IN PTR ;; ANSWER SECTION: 110.224.29.207.in-addr.arpa. 800 IN CNAME 110.224.29.207.in-addr.arpa. ;; Query time: 1 msec ;; SERVER: 206.223.144.254#53(206.223.144.254) ;; WHEN: Sun Feb 19 14:58:24 2006 ;; MSG SIZE rcvd: 59
952 :
root▲ ★ :2006/02/19(日) 15:00:24 ID:???0 BE:912825-#
ns2.pacificinternetexchange.net: SERVFAILエラーになる) %dig +norec -t ptr 110.224.29.207.in-addr.arpa. @ns2.pacificinternetexchange.net. ; <<>> DiG 9.3.1 <<>> +norec -t ptr 110.224.29.207.in-addr.arpa. @ns2.pacificinternetexchange.net. ; (1 server found) ;; global options: printcmd ;; Got answer: ;; ->>HEADER<<- opcode: QUERY, status: SERVFAIL, id: 37878 ;; flags: qr ra; QUERY: 1, ANSWER: 0, AUTHORITY: 0, ADDITIONAL: 0 ;; QUESTION SECTION: ;110.224.29.207.in-addr.arpa. IN PTR ;; Query time: 0 msec ;; SERVER: 206.223.146.254#53(206.223.146.254) ;; WHEN: Sun Feb 19 14:59:31 2006 ;; MSG SIZE rcvd: 45
953 :
root▲ ★ :2006/02/19(日) 15:03:17 ID:???0 BE:729942-#
このため、banana613から他のサーバに設定ファイルを転送するのとかが、 とても苦しい状況に。 転送方向を変えるとかしてなんとかやりすごして設定作業しようと思いますが、 この状況だと実運用に入ってもいろんな影響が出る予感。 先方(PIE)に文句言って、直す必要ありですね。 正直、初期不良に近いかなと。
954 :
root▲ ★ :2006/02/19(日) 15:04:51 ID:???0 BE:821333-#
で、kill でも死なないのね(前バグありbbs.cgiで起きていたのと同じ)。
955 :
root▲ ★ :2006/02/19(日) 18:38:49 ID:???0 BE:729942-#
ローカルに持っている bbs.cgi @ ex14 に、 # resource limiter use BSD::Resource; setrlimit(RLIMIT_CPU, 120, 120); をしかけて、120CPU秒で暴走が止まることを確認。 ex11, ex14, live22x[123] に、まずこれを入れよう。
956 :
root▲ ★ :2006/02/19(日) 18:46:19 ID:???0 BE:5107878-#
>>955 > ex11, ex14, live22x[123] に、まずこれを入れよう。
done.
これでとりあえず、超火急ではなくなったと認識。
もしかすると、IsKoukokuを切ると収まるとか? 確かex14も稼働させているんですよね?
958 :
root▲ ★ :2006/02/19(日) 19:36:13 ID:???0 BE:547823-#
2pix.2ch.se の準備が整いました。 以下の登録をよろしくお願いします。 (新規追加) +2pix.2ch.se:207.29.224.110 アカウント情報は、これからメールするです。
959 :
root▲ ★ :2006/02/19(日) 19:37:29 ID:???0 BE:3283766-#
>>957 うーむ、keiba とか確かに稼動しているですね。
> +Rock54/54M
あとで、やってみるです。
960 :
root▲ ★ :2006/02/19(日) 19:49:30 ID:???0 BE:912825-#
>>957 しかし、朝の修正(http getでエラーチェック入れた)から、
暴走が起こりにくくなったのは事実ですね。
見ていますが、頻度が少なくなったんで(よいことなんですが)、
逆にデバッグがなかなかできにくいかも。
962 :
ピロリ :2006/02/19(日) 23:56:09 ID:4v8mFBZx0
>>947 管理人にあたらしい API 作ってもらったんで
それに乗り換えるべく準備中。。。
いましばらくお待ちを、
963 :
root▲ ★ :2006/02/19(日) 23:59:42 ID:???0 BE:1459744-#
>>962 了解です。
たぶんですが、呼び側から板名を指定できるようになるのかしら。
964 :
ピロリ :2006/02/20(月) 00:00:10 ID:qpnoixfx0
んだんだ
965 :
root▲ ★ :2006/02/20(月) 00:06:22 ID:???0 BE:2554447-#
なるほど。
>>964 それなら、その後の微妙な処理をしなくてよさげと。
966 :
ピロリ :2006/02/20(月) 00:10:01 ID:qpnoixfx0 BE:665469397-
その予定でーす
967 :
root▲ ★ :2006/02/20(月) 00:56:42 ID:???0 BE:2736465-#
で、今回はDNS逆引き設定のお願いをば。 モニタサーバで使用しているIPアドレスのうち一つを、讃岐君の環境専用にします。 ということで、以下のDNS逆引き設定の追加をお願いします。 (新規追加) ^26.0.153.223.206.in-addr.arpa:s2ch.net
968 :
ピロリ :2006/02/20(月) 13:18:04 ID:qpnoixfx0 BE:665469397-
969 :
ピロリ :2006/02/20(月) 13:18:50 ID:qpnoixfx0 BE:147883027-
鯖をまとめたら速そう。 IBMのメインフレームとか。 コンパイルマンドクセになるな。
ヨナがくるまで待つか。
某もうすぐ咲くインターネットはSempronメインみたいです。 カルフォルニアと日本じゃ電気代10倍違うから、ランニングコストにもシビアになるんでしょうねえ。
じゅ、十倍…
974 :
root▲ ★ :2006/02/21(火) 15:09:22 ID:???0 BE:4378368-#
>>972 もうすぐ咲くの社長さん、おげんきですかね。
>>973 電力会社的には、日本は5倍ぐらい信頼性高いっていうことのようです。
どっちがいいのかは、、、さて。
ということで、www2 関連のDNS登録変更&追加依頼いきます。
以下の変更をよろしくお願いします。
(現状)
+www2.2ch.net:206.223.151.10:300
(変更後)
+www2.2ch.net:206.223.150.96:300
+www2f1.2ch.net:206.223.150.64
+www2f2.2ch.net:206.223.150.74
+www2f3.2ch.net:206.223.150.84
+www2b.2ch.net:206.223.150.54
975 :
ピロリ :2006/02/21(火) 17:11:50 ID:CuhHuHJ10 BE:338016184-
2chで『山梨でデータセンター』とかやったら面白い。電気はみんな自家発電。ヒロユキがぶどう作ってます、みたいな。回線はレスポンスがちと速くなるし、冬は雪を溶かすほどマシンが唸りを上げて社会に貢献。 山梨の一大観光名所になると。 山梨最近まで金融において孤島だったけどセブンイレブンにATMやっと入ったし。 目標は第二の理研スペックか。 まぁ夢物語だけどね。
977 :
root▲ ★ :2006/02/21(火) 17:18:46 ID:???0 BE:3283766-#
>>975 どもです。観察中。
いまのところ、matd含めて問題ない模様。
>>978 そしてサーバのおもりはし*ーk(りゃ
さあ そろそろ 次スレの 季節じゃが どなたか 立ててくださらんかのう?
980 :
root▲ ★ :2006/02/21(火) 17:35:00 ID:???0 BE:3192757-#
>>979 今夜あたりに(そのぐらいでじゅうぶんかと)。
カルフォルニアでIDCだと小さい体育館ほどの自家発電装置を入れたりして それなりにコストかかったりしそうだなぁ。 自動消火施設とか燃料の軽油とか。固定資産税とか。
>>+www2.2ch.net:206.223.150.96:300 DNSでポート指定って出来るんだ… ちょっといい勉強になった うちでもやってみるか
>>982 それはポートじゃなくてDNSのTTLじゃね?
あ、 そうみたいですねorz
985 :
root▲ ★ :2006/02/21(火) 19:39:44 ID:???0 BE:821333-#
986 :
root▲ ★ :2006/02/21(火) 19:40:47 ID:???0 BE:2736465-#
987 :
root▲ ★ :2006/02/21(火) 20:12:11 ID:???0 BE:1368735-#
matd からの「出」、つまり live22xN に行く経路を、 パブリック側とプライベート側のどっちにすべきか。 どっちもちゃんと動いたけど、さて、どっちがいいのかな。 今はパブリック側で設定。
988 :
ピロリ :2006/02/21(火) 20:13:45 ID:CuhHuHJ10 BE:380268566-
その二種類で何が違うのかってとこかと、
989 :
root▲ ★ :2006/02/21(火) 20:24:49 ID:???0 BE:4104959-#
それぞれの負荷(割り込み処理)のコスト計算ですね。 トラフィック的には、たかが知れているので。 live22x[123]のプライベート側は(非圧縮なので)、 あっしゅくしてから送っているパブリック側よりもトラフィックが多いです。 で、とりあえずパブリック側にしていると。 あと受け付け的には、同じI/Fで受けて送るのと、 違うI/Fに振るのとでは、どっちがいいのかなとか。
990 :
root▲ ★ :2006/02/21(火) 20:57:32 ID:???0 BE:547632-#
portsのPerlが、5.8.8になったもより。 どのへんが変わったんだべか。
>>987 パブリック側でよいのでは。
フロントのパブリック側の上りのトラフィックは基本的にはないですよね?
プライベート側の上りトラフィックはdatとかかなりのトラフィック量に
なると思うので。
LAN2個あれば……。 受付嬢にdat背負わせてもなぁ。 datだけ別鯖はないか。
993 :
root▲ ★ :2006/02/21(火) 21:50:09 ID:???0 BE:3830876-#
matd 稼働開始ですか.とりあえず今のところ異常なしのようで一安心かな.
matd 自体にとっては,パケット取り込みと送出の I/F が同じでも別々でも
差はないと思います(というか,取り込みに libpcap,送出に libdnet と
別々のライブラリを使ってますし).OS にとってはどうか,ってのは
カーネルの stat 見てみるとか(Solaris でいうところの kstat とかで).
トラフィックということでいうと,現状のようにキャッシュなしの場合と
mod_cache でキャッシュさせた場合とでは,条件がかなり変わってきますね.
あと,live22 の bbsd のと同じように,
http://www2.2ch.net/_service/ で
matd の stat (SIGUSR1 で出てくるやつ) が見られると何か参考になるかも......
996 :
root▲ ★ :2006/02/21(火) 22:21:13 ID:???0 BE:5837388-#
>>995 定時的に kill -USR1 あてて、とってみるですか。
帰宅後にごにょごにょしてみます。
kstat に相当するのは、、、。ふむ。
このへんの詰めも、次スレに向けての課題かなと。
で、このスレの
>>1 が2005年7月21日ですか。7ヶ月で1スレと。
いろいろなことが進みました。
でも
>>18 の問題は、結局スレの最後まで解決をみなかったなぁ。
家庭の保守は愛情つぎ込めw 鯖をローテンさせるのもマンドクセ。 下の二つは仕方ない? 死なない程度にシステム移行出来ればいいのに。 私はプログラム書けないしネットの基本もわからんので誰かよろ。 セキュリティは元締めでやると管理は楽だけど効率がいくない。やはり末端に任せるしか無さそうだ。 クッキーかジャバに任せるのも手。 中の人頑張ってくんなまし。
998 :
root▲ ★ :2006/02/21(火) 23:49:10 ID:???0 BE:4104195-#
999 :
root▲ ★ :2006/02/22(水) 01:53:12 ID:???0 BE:1094562-#
1000 :
root▲ ★ :2006/02/22(水) 01:54:54 ID:???0 BE:1824454-#
matd の本格稼動を祝いつつ、以降は次回の講釈にて。 ↓1001
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。