おい、人のDNAデータがDVDの中に入るぞ!?

このエントリーをはてなブックマークに追加
1名無しゲノムのクローンさん
塩基の形がいくつあるのか知らないけど、
256種類だとして、人のDNAの塩基の数は30億。つまり・・・

3,000,000,000Byte = 約2.8GB

人間の設計図がDVDの中に入っちまうがどうよ?

ちなみに地球が老朽化して人間が地球に住めなくなったら
DNAを改良して1億年後に発芽するような人間をDNA操作で
作って、その種みたいなものを何光年も離れた星へ
自動操縦ロケットで輸送して移住すると思うが、どうよ?
ずざー


>1
再生するためのプログラムのサイズはどのくらいになりますか?
3名無しゲノムのクローンさん:02/03/09 03:28
nr.Z 247MB
nt.Z 1.36GB
4名無しゲノムのクローンさん:02/03/09 10:07
age
5名無しゲノムのクローンさん:02/03/09 11:50
ねえ、ヒトゲノムのフルシーケンスってどこで手に入るの?
>1
何で塩基が256種類もあるんだよ。
塩基の形がいくつあるのか知らないけど、
4種類だとして、人のDNAの塩基の数は30億。つまり・・・

3,000,000,000 x 4 Bit = 12,000,000,000 Bit
           = 1,500,000,000 Byte
           = 約1.4 GB


人間の設計図がCD-ROM2枚の中に入っちまうがどうよ?
間違えた

塩基の形がいくつあるのか知らないけど、
4種類だとして、人のDNAの塩基の数は30億。つまり・・・

3,000,000,000 x 2 Bit = 6,000,000,000 Bit
           = 750,000,000 Byte
           = 約715 MB


人間の設計図がCD-ROMの中に入っちまうがどうよ?
9名無しゲノムのクローンさん:02/03/09 12:37
>>5
それぐらい、自分で調べろ!タコ!
105:02/03/09 13:04
イヤダネ!
教えろ教えろ教えろ〜〜〜〜〜!
115:02/03/09 14:48
教えないとプンプンだぞ〜〜〜!
自分も、かつて試しに計算してみたら、結果に驚いたよ。
裏で、CD-ROMが飛び交っていてもおかしくないな。

>>11
web上で、ある程度公開されてるよ。
自動的に所得するようなプログラム作って、
テキストをバイナリに変換するのも作って、
それにアクセスできるホモロジーソフトも作って、
パッケージにして、CD-ROMに焼く。
状況を理解できる奴とコン厨が組めば、半年あればできるだろう。
製品としても価値はあるし、フリーで流しても面白い。
このおいお前ら系スレタイトルが非常に不愉快な俺はもう古い人間なのか。
しかし、まあそういう人間もいるということは言っておこう。
14名無しゲノムのクローンさん:02/05/20 17:06
DNAの塩基の種類が四種類って、A、T、G、C、の事かな?
だとしたら、A−T、G−C、てな具合に相補的塩基対になっているから、
30億個ある塩基の数のうち、考えるのは片方の主鎖の分だけでいいよね?

3,000,000,000 ÷ 2 × 2 [bit] = 3,000,000,000 [bit]
           = 375,000,000 [Byte]
           ≒ 358MB

これなら、余裕でCD一枚に入るけど、どうかな?
15名無しゲノムのクローンさん:02/05/20 18:18
ここって生物板だよな。厨房板かと思ってしまった。
>>13
まあ>>1が厨房なことは確実。256種類とかいってるし。
>>14
イントロンとか捨てちゃえばもっとシンプルになるんじゃない?
>14
30億塩基じゃなくて、30億塩基対だから、>8が正しいと思う。
それよりお前ら、なんで圧縮かけないのか、理解できない。
既存のアルゴリズムでも良いけど、反復配列を考慮したアルゴリズムを作れば、
かなりサイズは減らせると思うが。

つうか、だれかテキスト形式でも良いから、DNA専用圧縮アルゴリズムとか作らんのか?
18名無しゲノムのクローンさん:02/05/20 21:31
>17
ttp://www.nttdata.co.jp/release/2002/031100.html
NTTデータが作りますた。
ここは厨房ばっかだな。
>>17
 圧縮しなくても CD-ROM 一枚になるんなら、圧縮しなくても
いいんじゃない?そのほうが検索したりするときのスピードが
速くなるし。
>>17
圧縮かけるとエラーからの復帰に弱くなる。
意図的に冗長性を持たせるのは良く使われる手段。

ところで圧縮されていないという根拠は? 圧縮されている根拠も無いけど。
2217:02/05/21 12:11
>>18
なんだ、考える事は皆同じか。

>>20
ネットワーク経由だったら、サイズは小さい方が良い。

>>21
前半部は判る。ただ、NCBIなんかのゲノムデータは当たり前のように圧縮かけてあるけど。
後半部が意味不明。
2321:02/05/21 14:41
>22
二行目のこと?
訂正用の情報(チェックディジット)とかを指したつもり。

三行目なら単にオレが無知なだけ。気にしないでくれ。
24名無しゲノムのクローンさん:02/08/06 02:46
良スレあげ。
>16

蒸し返すようで悪いけど、

>イントロンとか捨てちゃえばもっとシンプルになるんじゃない?

それをすてちまったら、「全ゲノム」じゃないだろうが...

256種類にワラタ
>>1にとっての塩基ってのは水酸化ナトリウムとかが含まれてたのかなぁ?
28名無しゲノムのクローンさん:02/08/13 13:49

ager
29名無しゲノムのクローンさん:02/08/13 14:04
というかだな、画像データとか除いたら一生分の仕事がディスク1枚に余裕で収まりますな。
んでもって、画像データと動画データとか除いたら何も残らない漏れのディスク。
30名無しゲノムのクローンさん:02/08/13 14:45
でも.exeファイルがないという罠
31名無しゲノムのクローンさん:02/08/14 02:58
あふぉばっかりでこのすれ好きずら。
32名無しゲノムのクローンさん :02/08/14 05:19
1なんか悲しい話だね。
33名無しゲノムのクローンさん:02/08/17 01:49
DVDが卵みたいだね
34名無しゲノムのクローンさん:02/08/18 01:00
1は門外漢ですかね?
まあ、ある意味4種類じゃないからね。
36名無しゲノムのクローンさん:02/08/18 06:21
しかもマクでexeファイルが開けない罠
37DJ狼:02/08/28 04:33
ハアハア・
人のDNAのCRC書きだしくらいはさせろよ。
>>25
イントロンを捨てて、あとで適当にイントロンを足せばいいじゃん。
40名無しゲノムのクローンさん:02/08/28 12:58
>>39
イントロンにもいろいろと昨日が有るのでむやみやたらに捨てちゃダメ。
41こんなスレあげてごめん。。:02/10/07 22:48
>塩基の形がいくつあるのか知らないけど、256種類だとして

ワラタ
43名無し:02/11/12 12:05
バイオ通信が発明された。DNA情報をDVDに入れるのではなくて、DNAをDVDのように使うということ。

http://sonobe.s5.xrea.com/invention/biocomm/biocomm_news.html

44.:02/11/12 12:42
>>1

256種類の塩基を使った遺伝子をもつ宇宙人の話でつか?
45名無しゲノムのクローンさん:02/11/12 14:39
ま、とりあえず、将来的には個人のDNAのデータは、保険証に刻まれ
るだろうね。肝硬変になったら、その場で肝臓を再生/移植する、
とか。ま、50年先の話だろうが。

>塩基の形がいくつあるのか知らないけど、256種類だとして

名文句ですな
生物板での落ちに使わせていただきます
47 :02/11/12 16:59
本当に途方もなくどうでもいい話だな.
だいたいそれだけで設計図と思ってるヴァカは生物学やめろ。
48名無しゲノムのクローンさん:02/11/29 23:07
MTがなきゃ好気呼吸できないじゃねぇか!
解糖系だけで生きろってのか?

>>1
とりあえず”セントラルドグマ”とかいうやつのこと調べてみてはいかが?
49山崎渉:03/01/11 13:47
(^^)
50山崎渉:03/01/18 13:24
(^^)
51名無しゲノムのクローンさん:03/01/29 21:19
俺のゲノムはDVDにも入らないほどでかいぞ。
52名無しゲノムのクローンさん:03/02/03 07:30
ある人間のDNAのシーケンスを定めて、それを圧縮したら
どれぐらいのサイズになるか、ぜひやってみせてくれ。
かなりちじむと思われる。
 圧縮のアルゴリズムによっても相当変わると思うが、
一番良いのは、全塩基対をしらべてそれからハフマン
コーディングをすることだな。
53名無しゲノムのクローンさん:03/02/03 15:07
ゲノムプロジェクトのシーケンスって相同染色体の片方+性染色体?
てことは15億塩基対+α?
個人ゲノム情報としては全染色体含んでないと意味無いよね。
54名無しゲノムのクローンさん:03/02/07 04:38
この板でそれに答えてもらった事無い。
55名無しゲノムのクローンさん:03/02/08 12:43
え、うそ、まじでみんな知らんの?
56 :03/02/11 09:54
実はDNAをあるデコード方式でデコードすると、別の情報がでてきたりして

旧約聖書とか仏典の一部がでてきたらヤーね
57名無しゲノムのクローンさん:03/02/13 19:24
マクマリ有機化学概説には、
「ヒトの細胞核には46本の染色体がありそれぞれ非常に大きなDNA分子から成る。
ヒトのDNA分子の分子量は10^12くらいと見積もられる。
1分子は約1mの長さで30億個のヌクレオチドが含まれる」

とあるが、染色体1つだけで30億塩基対と言う意味にとれるのだが…

どこが間違っているのだ?
58名無しゲノムのクローンさん:03/02/14 19:02
ウソーン
59名無しゲノムのクローンさん:03/02/14 20:38
########################################

http://www5b.biglobe.ne.jp/~ryo-kyo/osu.html

########################################
60名無しゲノムのクローンさん:03/02/15 13:47
総数なんか知らなくても困らないからな。
61名無しゲノムのクローンさん:03/02/27 00:41
ウソーン(´д`;)
62名無しゲノムのクローンさん:03/02/27 07:06
修飾塩基のデータを追加しなきゃいけないし…クロマチンの形状はどうすんねん?

と大学三年のバカがつっこんでみますた
63名無しゲノムのクローンさん:03/02/27 09:06
人のDNAは
A)30億塩基対×2本鎖(相補的)×2n染色体=120億塩基なのか
B)30億塩基×2n=60億塩基なのか
C)全30億塩基なのか。

個人DNAの情報量は
A)なら60億×2bit(4種)
B)なら30億×2bit
C)なら15億×2bit
ヒトゲノムとしては
相同染色体の片方+XYでいいから更にそれぞれ約半分ですよね。

結局30億って数字はなんなの〜
6462:03/02/27 09:11
>>63
なんで片方だけで良いんですか?
個人の情報として保存することを考えるなら当然相同染色体の両方を保存しなくてはならないはず。
あとどちらが父、母由来かも表記しなくては。ゲノムインプリンティングもあるわけですから。


哺乳類にとってdiploidであることに大きな意味があるから省略できないのでは。

と何も分かっていない大学三年の大バカが突っ込んでみますた。
65名無しゲノムのクローンさん:03/02/27 09:26
圧縮の話しがあったが、4種類しか文字が無いので
かなりの圧縮率になると言ってみる。テスト
66名無しゲノムのクローンさん:03/02/27 12:07
「ヒトゲノムとしては個人の約半分」と言っていると思われ。


2bitのコードで表現出来るのは4種類 (冗長度0)
こういうのは圧縮とは言わない。
67名無しゲノムのクローンさん:03/02/28 02:40
8の言うとおり
A=00 C=01 G=10 T=11 と表現すれば
ヒト染色体全塩基はコンピュータ上では60億bitsの情報になるんだね。
相補鎖は演算上で処理すればいいだけでしょ。
クロマチン構造とか母性遺伝とかも含めて表現型は全て染色体に支配されているから
1の推論は大枠で妥当だと思う。

問題は1次元のデータを4次元にまで展開するアルゴリズムな訳で、
生物の研究者はそのアルゴリズムを日々探求してるわけですな。
68名無しゲノムのクローンさん:03/02/28 02:48
A)ってこと?
69名無しゲノムのクローンさん:03/02/28 03:01
染色体対を考えれば2倍だけど、ほぼ同一のデータ同士だから、
2倍のデータが必要かどうかは評価の分かれるところだな。
70名無しゲノムのクローンさん:03/02/28 03:04
いやB)だろ。
個体情報として30億塩基対。
ゲノムプロジェクトのデータは15億塩基対。
たぶん。
…じゃないの?
じゃ「ヒトのDNAは30億ヌクレオチド」という記述は30億塩基対の間違いか。
infomaticsな奴は出てこないのか?
73名無しゲノムのクローンさん:03/03/09 12:46
そろそろみんなデータの記録媒体としてDVD-Rとか使ってますか?
74山崎渉:03/03/13 13:31
(^^)
下手なエロゲ以下のデータサイズか・・・
76名無しゲノムのクローンさん:03/03/21 05:01
おい!人のDNAデータが細胞の核に入るぞ!?
77山崎渉:03/04/17 09:30
(^^)
78名無しゲノムのクローンさん:03/04/19 01:47
先日の新聞でも「ヒトゲノム30億塩基対の解読完了」て書いてたな。
30億の意味は気にしてないんだろうけど。
>>1
移住になってないって。
80山崎渉:03/04/20 03:57
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
けっきょくCD−ROMに入ったネ。
めでたしめでたし
82名無しゲノムのクローンさん:03/05/07 23:27
>>81
ん?本当?それは手に入るものなのかい?
どうなんでしょう?
ゲノム解読ニュースのときに榊先生がCDーROM24枚だったかをもっていました。
手にははいらないけど、ゲノムデータは公開されているはずですから、ある意味ではてにはいるかと思います。
既に公開されてますが?
どこにあるかは知る人ぞ知るなので教えない。
知らない人はB君にでも聞いてください
85山崎渉:03/05/21 23:39
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
86名無しゲノムのクローンさん:03/05/21 23:42
つーか、余裕でCD-ROMに入るね。計算したら1bp=1bitだった。
なんか俺計算おかしいかな。

>>84
そんなもったいぶることかよ!アフォくさ。
ちょっと探したらすぐ見つかったよ。

まあ君みたいに出し惜しみする人間は
孤独に浸っていて下さい。ぐへへへっへへへへh
87山崎渉:03/05/28 14:42
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
88名無しゲノムのクローンさん:03/06/10 03:46
1塩基2bitだろ。こんなの計算も糞もない。
89名無しゲノムのクローンさん:03/06/12 00:59
>>88
それがどっこい。自分でダウンロードして計算してみな。
90名無しゲノムのクローンさん:03/06/12 01:39
組み合わせの数で考えなきゃダメだよ
91名無しゲノムのクローンさん:03/06/12 01:49
1塩基1ビットってのが未だに分からんのですが。。。
2^2 = 4で2ビットなんちゃうの?
92名無しゲノムのクローンさん:03/06/12 01:55
おそらく1byteを1bitと勘違いしていると思われ。
テキストで保存すりゃ1文字1バイトだからねえ。
24枚のCDをwinnyに流す、神はおらぬのか。
94名無しゲノムのクローンさん:03/06/13 11:24
>>92神!

>>89虫!
95名無しゲノムのクローンさん:03/06/14 01:56
このスレワラタ
96名無しゲノムのクローンさん:03/06/25 02:13
再生アルゴリズムがわからん。
どうやってあの文字列を解読してるんだ
97名無しゲノムのクローンさん:03/07/19 01:51
インプリンティング
ハッキリ言ってアメリカなどの多民族国家では黒人の方がアジア人よりもずっと立場は上だよ。
貧弱で弱弱しく、アグレッシブさに欠け、醜いアジア人は黒人のストレス解消のいい的。
黒人は有名スポーツ選手、ミュージシャンを多数輩出してるし、アジア人はかなり彼らに見下されている。
(黒人は白人には頭があがらないため日系料理天などの日本人店員相手に威張り散らしてストレス解消する。
また、日本女はすぐヤラせてくれる肉便器としてとおっている。
「○ドルでどうだ?(俺を買え)」と逆売春を持ちかける黒人男性も多い。)
彼らの見ていないところでこそこそ陰口しか叩けない日本人は滑稽。
99名無しゲノムのクローンさん:03/07/28 00:51
まったくの素人でスマソ
よくヒトゲノム解読とかいってるけど、解読の対象となったのは一個人のDNAですか?
ひとりひとりDNAって微妙に違うと思うのですが、今ネットとかで公開されているデータは何なのでしょう??
100_:03/07/28 01:04
>>99
伝聞ですが、主な人種交えて数名だそうです。
白人の一人に、ベンダー(ヒトゲノム解読を数年早めた張本人)
が入ってると、後になって公表してました。

現時点では、公開されているデータの精度は、
個人の違いに言及する、いわゆるSNP解析よりは低いです。

知っている情報は、以上。
この微妙な矛盾を上手く突いて、商売にして下さい。
>>99
まあ、たぶんイントロンとかはけっこう適当なんでしょうね。
平均を取ったデータというか。

遺伝子が見つかったわけじゃないからこれからどーにでもなる。
103名無しゲノムのクローンさん:03/07/29 00:32
法則に例外が存在するだけでも「法則」としては失格となる。
それにもかかわらず、メンデルが発見されたとされる「遺伝の法則」は例外だらけである。
したがって、「遺伝の法則」は実際には存在していない「幻の法則」である。

ソース
http://www1.kcn.ne.jp/~mituto/mat.htm
http://www1.kcn.ne.jp/~mituto
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ
105山崎 渉:03/08/15 19:02
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
106名無しゲノムのクローンさん:04/01/09 01:15
今日うちのじいちゃんDVDの中に入っちゃったでつ。
再生したら、結構楽しそうにしてました。USB接続のマイクつきで100円です。
107名無しゲノムのクローンさん:04/01/09 11:17
人のDNAなんて99.?%が全く同じなんだから保存するのは残りの0.?%だけでいいじゃん(`・ω・´)
108名無しゲノムのクローンさん:04/01/09 21:13
染色体外の情報はどうするんだよ?
細胞は細胞からしか生まれない。
このテーゼはまだ破られていないぞ。
109名無しゲノムのクローンさん
>>108
DNAやヒストンのメチル化やアセチル化による修飾は細胞によってもことなるし
当然,あなたのように染色体外の情報も発生のステージによってまた外部からの
刺激によって変化するので,これを記述するのはちょっと大変でしょうね.

細胞内のタンパク質因子の存在量だけでなく局在,活性化度なども考慮しないといけないので
そうとうな大仕事でしょうな.

ゲノムプロジェクトのすごいところは生物というアナログな生き物の本質の「一部」
を産業的な技術でもって解明することに成功したというところで,まだまだ生命の
本質でわかっていない問題は山積みですもんね.