Mission UD:白血病等のがん患者を救え!213Ligands
88 :
名無しさん?:
投稿日:2006年1月2日(月)午後5時45分(標準時)
件名:消えるリザルト
ここには憶測が飛び交っていますので、このいくつかに答えさせてください。
これからちょっとスレッドを追って、質問や発言を見かけたら(たくさん
ありそうですが)それに答えようと思います。新しいがんのデータが使用
可能になるまでに、しばらく時間がかかったことを、最初に言わせてください。
新しいがんのデータが、実際に解析がなされており、古い冗長なデータを
単に解析し直しているのではないようにすることについて、わたしたちは
みんなずっと心配してきていました。新しいがんのデータは良いものです。
新しいがんのジョブやデータが、わたしたちの期待通りの動きをするかどうか
を評価するためには、明らかに一定の期間が必要です。わたしが、評価用に
とてもわずかなデータの一式、正確には20個以下の宿題しか、わざと
アップロードしなかったのは、そのためです。(ベータ・テスト用のシステム
は廃止されており、そのことについて責めないでください、とわたしはすでに
述べました。)
89 :
名無しさん?:2006/01/04(水) 18:36:06 ID:???
あるマシン上で実行される1個か2個の宿題に問題があることは、おおいに
あり得ます。わたしはこれが事実かどうか知りませんし、どうしてこうなって
しまうのかも良くわかりません。個人的には何の問題にも気づいていませんし、
もしそうなってしまうとしたら、たった数人ではなくて、全ての人たちが
問題を経験しただろうと思います。明らかの何人かのメンバーは問題を
抱えており、私たちはこれを調査するでしょう。現在使用可能な宿題が
とても数少ないことを考慮に入れると、1個か2個の悪いものでも、高い
確率のエラーを起こすようです。1個か2個の悪い宿題はあり得、わたしは
容認できると思います。新しいデータ一式全体を通しての10%の不良率は
受け入れがたいですが、どういう動きをするのか確かめることに、
わたしたちはまだ成功していません。
90 :
名無しさん?:2006/01/04(水) 18:36:56 ID:???
UDはUDMonをメンテナンスしたりサポートしたりしていませんから、わたしは
UDMonと話すことはできません。
宿題がうまくリザルトを返すまでにかける必要のある、最小の時間というもの
はありません。ほんの数秒でうまくリザルトを返すことができたとしても、
問題であるとして除外できるようにするために、なお勘定に入れられる
でしょう。
メンバー・ウェブは、エージェントのGUTが間違った結果を報告するときに、
統計情報をチェックすべき場所です。メンバー・ウェブの上の統計ジョブは
1日に1回しか実行されませんから、そのことをどうか考慮に入れて
ください。
91 :
名無しさん?:2006/01/04(水) 18:37:37 ID:???
Grid.orgは、失敗してうまくリザルトを返せない宿題を、採点しませんし、
できません。それがソフトウェアとシステムの動き方であって、わたしは
これを変更できません。わたしはまた、WCGと話すもできません。UDはWCGが
内部で使っているソフトウェアの機構かもしれませんが、UDを利用している
そのシステムは、まったく異なったように設定、拡張されている可能性が
あります。たとえもしリザルトを返さなくても、そのシステムがどう採点
しようとしているのかはわかりません。
92 :
名無しさん?:2006/01/04(水) 18:38:10 ID:???
以前のがんのジョブと現在のロゼッタのジョブが使っているのと同じサーバを、
わたしたちは使っていて、それらにリザルが失われるという問題があることを
聞いたことがありませんから、わたしはここではハードウェアが問題である
とは思いません。以前のスレッドとメンバー・ニュースへの投稿でも述べた
ように、わたしたちは新しいハードウェアに移行する準備ができていません。
最初に起きるに違いないことがいくつかあります。可能になり次第、新しい
装置へ移行するつもりです。
93 :
名無しさん?:2006/01/04(水) 18:39:05 ID:???
ジョブの期限に関する限りは、用語をはっきりさせましょう。プロジェクトは
広義の用語(ヒト・プロテオーム・フォールディング、がん研究プロジェクト)
であり、ただの名前です。プロジェクトはいくつかのジョブから成って
います。ジョブはデータの一部であり、宿題(WU)から構成されています。
がん研究プロジェクト用の現在のジョブは、20個以下の宿題から成って
います。これらの宿題のそれぞれに対して、たくさんのリザルトが返される
可能性があり、基本的に無限のリザルトがあります。これらの各リザルトは、
ファイル・サーバのディスク・スペースを占めます。やがてある時点で、
ジョブは終了しなければなりません。わたしたちは終了時までリザルトを
集めることができません。ジョブが終了し、不活性化されるとき、宿題が
属しているジョブはもはや存在していませんから、未提出のどんな宿題も
採点できません。これについてわたしが「困難」と言ったことは、わたしが
言ったことを忠実に表現していない、と言おうと考えています。わたしは
いつも、ジョブが終了予定で、その日以降はどの未提出の宿題も採点され
ないであろうことを言う投稿をしようとしてきました。それは、わたしが
重要だと思わないからではなく、システムの動き方だからです。それから、
これが起きるときに誰も驚くはずがないようにするために、ジョブを終了
させる前にわたしは1週間か2週間おきます。これで、リザルトが失われる
としてもただ1個のはずです(UDが公式にサポートしていなくて、たくさんの
宿題を前もってロードしておく、UDMonを使用していない限り)。
94 :
名無しさん?:2006/01/04(水) 18:40:02 ID:???
さて、そうは言ったものの、とにもかくにも古いデータを解析し直している
だけの、以前のがんのジョブを使用不能にしました。何人かのメンバーは、
いずれの未提出の古いがんの宿題に対しても、採点されない結果になりつつ
あります。そのデータはとても古く、その一連のデータに対するリザルトは
すでの処理済みですから、ほとんどのメンバーがお気づきのように、無用
でしょた。新しいがんのジョブの終了が必要になるときには、誰も驚かない
ように、メンバー・ニュースに投稿することにします。
95 :
名無しさん?:2006/01/04(水) 18:41:02 ID:???
どの宿題にも6個のリザルトしか返せないようにする、という考えは全体的に
間違っています。現在ジョブは無限のリザルトを受け付けるように設定されて
います。リザルトは、リザルトを処理するスクリプトによって集計される
でしょう。それは、処理中にリザルトの一部しか使わないかもしれませんが、
たとえもしある宿題がすでに何千ものリザルトをうまく返されていたとしても、
すべてのリザルトが返される可能性があります。
96 :
名無しさん?:2006/01/04(水) 18:41:46 ID:???