100分の1以下を実現するデータ圧縮の新技術

1 ：１３２人目の素数さん：02/01/11 16:49

お前ら、語って下さい。

ニュース速報板
http://choco.2ch.net/test/read.cgi/news/1010670022/

情報システム板
http://mentai.2ch.net/test/read.cgi/infosys/1010680187/

素人ではさっぱり埒があかん。

2 ：名無しさん：02/01/11 16:50

米国の新興企業と数学者のグループが，劣化なしにデータを100
分の1以下に圧縮できるという技術を発表。実用化はまだ先だ
が，これによって高速インターネットの可能性が大きく広がるか
もしれない。（ロイター）

http://www.zdnet.co.jp/news/reuters/020110/e_researchers.html

3 ：名無しさん：02/01/11 16:50

フロリダ州ウエストパームビーチの新興企業
ZeoSyncは1月7日，著名な数学者のグループと共同で，データ圧縮の技術革新を達成
したと明らかにした。データの格納／転送に利用される圧
縮技術の限界を克服するものだという。
（略）
ZeoSyncによれば，同社の科学チームは小規模なレベル
で，ランダムな情報シーケンスを劣化させることなく100
分の1以下に圧縮することに成功。この技術は，従来のデー
タ圧縮アルゴリズムを，控えめに言っても大幅に引き離す
ことになりそうだ。

4 ：名無しさん：02/01/11 16:50

ボストンの調査会社Aberdeen Groupのデータストレー
ジ担当アナリスト，David Hill氏は「現段階では，この研
究が『常温核融合』の二の舞となるか，ノーベル賞につな
がる研究となるかはどちらとも言えない」としている。
（略）
ZeoSyncの技術は，動画や音楽のMPEG，写真やグラフィ
ックのJPEGといった既存のあらゆる圧縮技術とは一線を画
すことになりそうだ。既存の技術は，元のデータを最高10
分の1程度の圧縮率で圧縮できるが，これらのアルゴリズム
では一般的に青空や芝生，雪で覆われた白い背景など，デ
ータビットが同一の長いストリングを排除することで圧縮
を実現している。

5 ：名無しさん：02/01/11 16:50

ZeoSyncが発表した声明文によれば，同社の技術が「完
成した暁には，数百分の1程度の圧縮率を実現できる」という。
ZeoSyncは数学用語を使って，自社の技術を以下のよう
に説明している。「自然発生パターンを意図的に作り出し
て，エントロピーライクなランダムシーケンスを形成するもの」
（略）
いずれの企業との交渉もまだ成立には至っていないが，
数カ月以内には発表できるだろうと同氏。ZeoSyncによれ
ば，同社の技術はフラクタルのような既存の圧縮手段の強
化に使えるという。フラクタルとは，幾何学の一分野で，
自然界に見られる無秩序な状態の中に一定の秩序を見出そ
うというもの。

6 ：１３２人目の素数さん：02/01/11 17:02

エイプリルフールにはまだ早いぞ

7 ：5000：02/01/11 17:16

Ａ「圧縮後のデータを、さらに圧縮してやれば、いくらでも圧縮できるぞ。」
Ｂ「圧縮済みデータは、それいじょう圧縮できねーよ！」

どちらの言い分が正しいか。

8 ：１３２人目の素数さん：02/01/11 17:23

エントロピーがどうのこうので情報の圧縮には限界があるとか
なんとか聞いたことあるけどｻﾊﾟｰﾘなんのことやら分からんので
誰か教えてくれ

9 ：１３２人目の素数さん：02/01/11 17:44

Shannon理論が死んで、Smaleの時代到来ってことか？ほんとか？えっと、

「ランダムな情報シーケンスを劣化させることなく100分の1以下に圧縮することに成功。」
はぁ？あり得ない。翻訳間違えてねーか？

10 ：１３２人目の素数さん：02/01/11 17:50

「圧縮」という言葉にみんなだまされすぎ。

11 ：１３２人目の素数さん：02/01/11 17:59

ランダムじゃない情報シーケンスは圧縮できなかったりして

12 ：１３２人目の素数さん：02/01/11 19:47

有史以来、人類が滅亡するまでのあらゆる言葉や情報を番号付けすれば、
高々数百～数千ビット程度で表現できそうな気がする。
そんな変換辞書は神様にしか作れないけどね。

13 ：ぷろぐらむ板転載：02/01/11 21:15

>>12

125 ：これでどうだ？：02/01/11 14:56
圧縮するにはアカシックレコードにしまっておいて
解凍するにはそのポインタから呼び出す

135 ：94 ：02/01/11 15:10
>>131
そのポインタのビット数が元のデータより小さい保証がどこにあるんだYO!(w

http://pc.2ch.net/test/read.cgi/tech/1010674540/50l

14 ：１３２人目の素数さん：02/01/11 21:53

>>7
圧縮限界というものがシャノンによって導かれています。
任意のデータはその限界＋冗長度という長さを持っています。
圧縮というのはその冗長度をシーケンスの性質より削除していこうという手法。
したがって冗長度が０になるまでは（理論的に）圧縮可能です。
つまりAB両方とも正しいし、AB両方とも間違い。

15 ：１３２人目の素数さん：02/01/11 22:14

>8
Shannonの原論文「A Mathematical Theory of Communication」が
「shannon1948.ps（.pdf）」でネットに落ちてるから読んでみるといいですよ。

16 ：当たり前田のクラッカー：02/01/11 22:27

全ての可逆圧縮には元の情報のビット長より情報量が
増えるパターンが存在する。

17 ：16：02/01/11 22:29

>16
>情報量が増える
ビット長が増える
の間違い

18 ：１３２人目の素数さん：02/01/11 22:30

「情報量」が増える事はないな。
圧縮後のデーター長が大きくなる事はあっても。

19 ：１３２人目の素数さん：02/01/11 22:30

訂正、早いね（ｗ

20 ：１３２人目の素数さん：02/01/11 22:39

元記事のZD日本語版
http://www.zdnet.co.jp/news/reuters/020110/e_researchers.html

＞1991年にこの世を去ったShannon博士

おい…

21 ：１３２人目の素数さん：02/01/12 00:25

>>12
そうか。圧縮したいデータを次々圧縮プログラムに登録していくのか。
使えば使うほど、圧縮プログラムのサイズが増える…

22 ：１３２人目の素数さん：02/01/12 00:31

>>20
つい最近だよな。去年の冬か？おれが退学になった頃だから

23 ：１３２人目の素数さん：02/01/12 00:49

元記事
http://www.zdnet.com/zdnn/stories/news/0,4586,2837117,00.html
Researchers squeeze storage breakthrough

Shannon, who died in 1991, had proposed that any type of information, from human speech to computer
keyboards to storage disks is limited by the capacity of the data channel over which it flows. This is the
basis of digital communications theory.

24 ：１３２人目の素数さん：02/01/12 00:56

ニューヨーク--名高い数学者のチームと一緒に働くフロリダ調査始動は、
それが達成した月曜日に述べるところによると、圧縮の以前に知られてい
た限界に打ち勝つ突破は、よくデータをしまっておいて送った。
あることがわかってそしてうまく商業化されたなら、西パームビーチ、
フロリダのZeoSyncによって主張された発見は、losslessデータ圧縮の
フィールドで思考の１世紀の半分をひっくり返して、そこでテレコミュニ
ケーション、および他のデジタル業界が基礎とされるビジネス仮説の土
台を壊すことができた。

Lossless圧縮は、(その)コンピュータによってデータが締めて、蓄えて
そして完全な誠実でその時に元どおりにすることができる過程、あるい
はゼロのデータの損失だ。現存する圧縮テクニックは、空間を保存する
ために、一般的に余分な表現が多いデータを落とした。

25 ：１３２人目の素数さん：02/01/12 00:57

ZeoSyncがその科学のチームが１００回以上同じデータに圧縮される
ことを可能にするような行いにおけるでたらめな情報連続を圧縮する
ときに小規模に成功したと言ったを越えて--データ損失なしで。それ
は、データを締めるための現在の知られているアルゴリズムを越えて
少なくとも大きさの順序だろう。

まだどんな公立のフォーラムで論証される余地がある会社の要求は、
広大に、保管する(べき)コンピュータ・ディスク、テキスト、音楽、
およびビデオの能力を押し上げることができた--もしZeoSyncの公式
がデータの重い量を取り扱うために一定の割合で拡大することに成功
すれば。

業界アナリストによると、テクニックがある日するだろう同じ圧縮は、
通信網容量で巨大な投資に脅威を投げかけて、地球にわたってより安
くおよび広く利用できる高速度のインターネット・アクセスをする。

「どちらのこの調査は、次第に消えていく「冷たい融解」次の詐欺で、
あるいは、それは、ノーベル賞にとって創立だ。私は、(その)１(人)
にそれがもうそうである答えを持たない、」とデイビッド丘、ボスト
ンを本拠地とするアバディーン・グループとのデータ・ストレージ・
アナリストは言った。

１９９０年に、一群のユタの研究者は、--サポートされていないため
に速く見つけた--長く捜された冷たい融解の問題のその解答が発見さ
れたという主張で科学の世界を憤慨させた。

26 ：１３２人目の素数さん：02/01/12 00:58

丘、発表の前方に要約された唯一の独立しているアナリスト、言われた
ZeoSyncの要求は、決定的な証拠から離れて理論上実行できて、しかし
年だった。彼によると、彼は、ZeoSyncの要求を評価する前により多く
の情報を必要とするだろう。

ウェブサイトがhttp://www.zeosync.com/にあることができるZeoSync
は、ピーター通りジョージ、インターネット、および財政上のサービス
企業家によって設立された、それは背景にテレコミュニケーションで
研究させる。

(３０人のフルタイムの従業員との)ZeoSyncは、それがワルシャワ、
モスクワ、および北京でハーバード大学出身の専門家、マサチュー
セッツ工科大、スタンフォード大学、および研究者と協力したと言っ
た。

ZeoSyncで働く科学のチームの中で１９４８年の説に挑戦することは、
アメリカの最も名高い数学者のスティーブSmale、１(人)だ。Smale
は、このフィールドの研究者にとってフィール賞のバークレーおよび
１９６６年の勝者のカリフォルニア大学の名誉退職の教授、ノーベル
賞だ。彼は、彼のプロジェクトにおける役割について達されてなぜなら
論評することができなかった。

ピーター通りジョージ、ZeoSync創業者、および最高責任者は、彼の
会社のテクニックが情報理論で彼のクラシックな１９４８年の論文で
AT&Tのクロード・シャノン博士によって詳しく説明されたデジタル
情報理論の創立に挑戦したと言った。

27 ：１３２人目の素数さん：02/01/12 00:59

シャノン(１９９１年に死んだ)は、(コンピュータ・キーボードへの
人の演説からストレージ・ディスクへの)情報のどんなタイプがそれを
越えてそれが流れるデータチャネルの容量によって制限されることを
提案した。これは、デジタル情報理論の基礎だ。

「我々が発展したものは、情報理論の新しい高原だ」、聖ジョージは
言った。「デジタル情報の雑音-フリーの一貫性の利益で、我々は、
信号を送って類似物の莫大な収容力を示す予定でいる。」

ZeoSyncによって述べられたテクニックは、中断に何十もの現存する
圧縮テクノロジーの印をつけるだろう、ビデオおよび楽譜のための
含んでいるMPEG、および絵およびグラフィックアートのためのJPEG
は、原型の１０回分まで圧縮割合でデータを締めることができる。
これらのアルゴリズムは、青空、緑色の草といったデータの身元が
確認できるビットの長いひも、あるいは雪に覆われている景色の白い
背景を削除することによって一般的に機能する。

声明、ZeoSyncで、「一旦充分に発展されると、１００から１に近づく
ために予期される提案圧縮率は、並ぶだろうか」と、そのテクニック
は言った。

数学の術語を使って、会社は、そのテクニックが「エントロピー風の
でたらめな連続を形づくるために意図的に本来浮かんでいる様式を
無作為化する」と言った。

28 ：１３２人目の素数さん：02/01/12 01:01

ZeoSyncは、それがそれが台ゼロのスペース・チューナーを呼ぶテク
ノロジー、およびそれがBinaryAcceleratorを呼ぶ関係があるテクニ
ックのために特許保護に申し込んだと言った、それは完全に複製でき
る圧縮されたフォーマットへデータを符号化する。

それによると、会社は、２００３の間に商業上の使用にある(べき)テ
クノロジーを予想する。

とりわけ、聖ジョージは、会社がコンピュータ・チップの主要な供給
者を含む戦略的なパートナーがマルチメディア圧縮、および導いてい
るハリウッド音楽またスタジオで使った名がない潜在力との話にあっ
たことをロイター通信に伝えた。

パートナーシップ取り引きは、次の数月の間発表されるだろう、彼は、
いかなるまだ達されなかったにもかかわらず、言った。会社は、その
テクノロジーが次元分裂図形、自然界の順序を無秩序で見つけようと
する幾何学派といった現存する圧縮テクニックを改良するために使用
されるかもしれないと言った。

「我々は、科学のコミュニティーの追加のメンバーにデジタル・テク
ノロジーに革命を起こすように努力して我々に加わるように勧めたい」、
聖ジョージは、以前は隠したがるプロジェクトについて言った。

「終わった(べき)多くの刺激的な作品がある。」

29 ：　　　：02/01/12 01:27

自動翻訳ソフトとしては、まあまあだが、（原文を想像して
頭の中で逆翻訳をすれば、理解できる）科学解説としては
落第である。内容を理解して翻訳したのではないことが
すぐにわかる。（内容に関する知識がないことがバレル）

30 ：リアル攻防：02/01/12 01:39

素人にも分かるような簡単な説明お願いします！

31 ：＞３０：02/01/12 01:44

747 名前：　投稿日：02/01/12 01:34 ID:HWMOwKkH
ぎゅっと握りつぶしたら元に戻らんよ。

748 名前：　投稿日：02/01/12 01:38 ID:B9ZaAWP1
握りつぶすか潰さないかそんなギリギリのところが良いんじゃねぇか

749 名前：　投稿日：02/01/12 01:39 ID:HWMOwKkH
今回のはそのぎりぎりを越えて潰したけど、
元に戻る方法発見しちゃったって話よ。

32 ：リアル攻防：02/01/12 01:46

>>31
なるほど！
これ信じてもいいんですよね？

33 ：リアル電波：02/01/12 01:49

素数を使った圧縮って出来ないのかな？ちょっとひらめいたんだけど。

34 ：132人目の素数さん：02/01/12 01:52

>>33
例えば？

35 ：１３２人目の素数さん：02/01/12 01:59

とりあえずShannonたん(1916-2001)
http://www-groups.dcs.st-andrews.ac.uk/~history/Mathematicians/Shannon.html

36 ：リアル電波：02/01/12 02:01

一番大きい素数をPｍｘとしてそこまでの全部のそすうのべき乗を
羅列するとか・・。遅いか。（汗

37 ：ヒカルのπ：02/01/12 03:03

πを使った圧縮もヨロシクね

38 ：１３２人目の素数さん：02/01/12 09:03

>>37
目的の情報はπのn桁目からm桁分

39 ：１３２人目の素数さん：02/01/12 09:50

>>38 それは
プログラム板
http://pc.2ch.net/test/read.cgi/tech/1010674540/

でも出てたけど、圧縮出来る確率は1/2では

でも圧縮出来なかった時は出来なかったと１ビット増えるだけだから
　平均すれば・・・

　とか言ってみる

40 ：g：02/01/12 10:41

仮想の物では使えんから、出来るとも、出来ないともいえる。
ってのはナシよ。

41 ：１３２人目の素数さん：02/01/12 13:01

数学板の人って役にたたねーな・・・

42 ：眠男：02/01/12 13:30

>>41
数学的に興味がないからじゃない？
ようわからんけど。

どうなんだろ。
数学板の人は数学の応用より
数学そのものの方が好きなような気が。

43 ：１３２人目の素数さん：02/01/12 15:26

シャノンって数学者だったっけ？物理屋さんじゃなかった？

44 ：１２３人目の素数さん：02/01/12 15:42

基本的にさ、圧縮ってデータのやりとりに使うもんなんだから、頻出しそうな
データについては何らかの短い記号におきかえてしまう、みたいなことを
やったらどうなんだろう。つまり、

＞任意のデータはその限界＋冗長度という長さを持っています。

こういう法則があるとしたら、冗長度を小さくするのが今までの発想だったと
したら、「限界」ってものをコンパクトに。

例えば、「この　２ちゃんねらー　め！」って文章があったとして、
今までの圧縮が、冗長分を小さくする発想で、「この２ちゃんねらーめ！」と
空白をなくすような格好だったとしたら、私が言ってるのは、アーカイバソフト
の中に単語として「この」という記号は#1ね、「２ちゃんねらー」は#2、
みたいなのを入れておいたら圧縮された形は、「#1#2め！」で済むということ。
つまりパターン化したデータの断片をアーカイバソフトに組み込んでしまうという
発想。純粋な圧縮とはいえないかもしれないけどね。

どうっすか？

45 ：眠男：02/01/12 15:48

>>44
たしか、その#1、#2ってやつを「辞書」と呼ぶとすると、
その辞書が膨大になる、ってなことがニュー速のほうででてました。

46 ：　　　：02/01/12 15:53

圧縮が不可能な数列を乱数と考えてよいだろうか？

47 ：眠男：02/01/12 16:01

たとえば32*32のアイコンを一つのパターンと考えると、
32768色の画像の辞書を作ろうとしたら
（あれ？32768って2の15乗？16乗ってならないのはなんでだ？
　一つビットを空けてるのか？初歩的な質問でスマソ）
32768の32*32乗、なんて天文学的な数が出てきてしまって、
その辞書をどうするんだ、って話になっちゃう。

そのアイコンを小さくすればいいのか？ってなると、
たとえば4*4のアイコンを一つのパターンとしても
32768^16≒1000兆の4乗（もっとでかいかも）
となって、そんなでかいデータをどこに入れるんだ、って
ことになった・・・のかな？

ここででてる圧縮は、自然界の形状でよくでてくる「フラクタル」
を利用してるのでは。多分。

48 ：眠男：02/01/12 16:02

>>46
圧縮可能な乱数もあれば、圧縮不可能な乱数もあります。

49 ：g：02/01/12 16:13

『巨乳中学生中だし援交日記』てなエロ動画ファイルが
フラクタルやカオスでけっこう圧縮できたら笑う。

50 ：１３２人目の素数さん：02/01/12 16:28

>>49
同じ運動と音声の繰り返しが多いのでフラクタルでけっこういけるんではなかろうか。

51 ：眠男：02/01/12 16:31

エロ動画のなかで、エロビデオを流してるテレビが映ってる
ような動画はすごく圧縮できたりして（笑）
で、圧縮率を高めるためにわざと画面の隅にエロ画像を流してみたり、とか。

あとは、同じシーンをアングル変えてもう一回使ったりしてんのとか、
あれは圧縮率高まるだろーな。ここででてる圧縮法以前の話。

52 ：眠男：02/01/12 16:32

>>49
>同じ運動と音声の繰り返し
1/fゆらぎとか思い出してしまった。
繰り返してるけど微妙にゆらいでるんだよね（笑）

53 ：１３２人目の素数さん：02/01/12 17:12

>>47
＞あれ？32768って2の15乗？16乗ってならないのはなんでだ？
RGBで32bitずつ⇒32×32×32＝2^5×2^5×2^5＝2^15＝32768

54 ：１３２人目の素数さん：02/01/12 19:36

>>53
つっこみどころが多すぎてもう何も言えない・・・

55 ：１３２人目の素数さん：02/01/12 19:37

>53
それって5bitずつじゃあ…

56 ：55：02/01/12 19:37

ｹｺｰﾝ失敗

57 ：53：02/01/12 20:41

×　32bitずつ
○　32色ずつ（＝5bitずつ）

でした。鬱詩。

58 ：>44：02/01/12 22:55

んー、それを「冗長度を減らす」といいます。
圧縮限界というのはアルファベットサイズに対して完全に一様な系列まで
圧縮したときの一情報源文字当りのデータ長をいいます。

勉強してみると分かりますが、それはあまり良い符号化にはなりません。
#1とかが多くなればなるほどいい圧縮になりますが（厳密にいえば平均符号長）
そのためにはそのインデックスの数を増やさなければなりません。
そこら辺の問題点を改良したものが現在のlha等で用いられているZiv-Lemple符号です。

59 ：眠男：02/01/13 00:58

あ、なるほろ。
数学板で訊く話じゃなかった・・・＜32768=2^15

60 ：１３２人目の素数さん：02/01/13 04:54

連休だから人いないんだね。

61 ：１３２人目の素数さん：02/01/14 04:39

永久機関を開発しました。

62 ：１３２人目の素数さん：02/01/14 11:30

問題を定式化するとこんなものでよいですか。

写像φ:S -> I　の具体例を構成する。
　Sはアルゴリズムを記述した有限記号列の空間
　Iは自然数の区間で実用的な範囲(計算性能によるが十分な広さが必要)
　n = φ(s)の時、nの位取表記文字数より s の文字数が1/100以下
　φ(解凍)と逆関数(圧縮)は特定の最大計算量以下

これだとあいまいすぎて技術論優先になってしまうかな。
数論的な成果で画期的な進展が期待できるのでしょか。

25年くらい前のSFマガジンでゲーデル数とメタレベルのべき乗表記で
超巨大数を数文字に圧縮して通信する外国短編を読んだ記憶があります。

計算性能の発展でデータ圧縮自体は漸近的にせよ進展し続ける気はしますね。

63 ：１３２人目の素数さん：02/01/15 04:33

みんな期待しすぎだYO!
変なシーケンスジェネレータ使ってbzip2を強くしただけだろ？
なんでも1/100だったらプレスが間違ってるだけだよ。
シャノンの理論は絶対だよ。

64 ：名無しさん：02/01/15 10:11

>>63
想像力の無い奴め！

65 ：１３２人目の素数さん：02/01/15 10:28

要はこういうことでしょう。

素データを
913517247483640899
だとすると圧縮データは
99＾9
となる。これで圧縮率は約5分の1

俺って天才。おまえら馬鹿だなぁ。

66 ：名無しさん：02/01/15 10:30

>>65
その方法で913517247483640898を表現してみろ。

67 ：１３２人目の素数さん：02/01/15 10:50

>>65
９９＾９を圧縮するとどうなるの。

68 ：5000：02/01/15 11:26

>>65
ニュー速のネタだね。

たいして面白くなかったネタを、
わざわざ紹介した意図は？

69 ：１３２人目の素数さん：02/01/15 11:47

>>66
99^9-1

70 ：困ります、名無しさん：02/01/15 19:01

http://www.watch.impress.co.jp/internet/www/article/2002/0115/zeosync.htm

---------------------------- 終了 ----------------------------

71 ：１３２人目の素数さん：02/01/15 19:08

うまい話に注意って事だね

72 ：１３２人目の素数さん：02/01/15 19:23

　ここで、「見込み無い」って言う人を批判していた人の言い分
が聞きたいな（ｗ

73 ：１３２人目の素数さん：02/01/15 19:28

他人の実績を認められないのは自分が力不足である証拠です。
精進しましょう。

74 ：工房：02/01/15 22:08

例えば
123456789...123456789（1～9が計10回）
という数字を
51^51+50^50+...+4^4+3^3+2
と変形し、
(51;3)2
と書く。どうかな？

75 ：工房：02/01/15 22:18

上の変形間違ってました。ごめんなさい

76 ：１３２人目の素数さん：02/01/15 23:22

＞工房
俺はそういうアプローチである程度の圧縮はできるんじゃないかと思ってるよ。
ただ、それをやるには凄まじいCPUのパワーがいると思うし
いくらなんでも100倍はムリだと思う。せいぜい今の2倍とか4倍とか。

77 ：１３２人目の素数さん：02/01/16 07:49

ま～シャノンの理論は絶対だったってこった
でも、今より圧縮率が高い圧縮技術は現れるだろうな
GKAってどうなんや？あれ

78 ：１３２人目の素数さん：02/01/16 12:42

プログラム板の連中のほうが数学的な話をしている罠
というか数学のプロがこの話に興味がないらしい

79 ：工房：02/01/16 21:05

a^b*c±dの形に圧縮できる数はめちゃくちゃ珍しいことがわかった・・・。

80 ：１３２人目の素数さん：02/01/16 22:02

data[n] = {9F2B78D43C65E10A}←ランダムな数値(hex)
があるとして、
y = f(n);
y2 = y xor data[n];
で、nを1ずつ進めて、y2の結果に規則性が出る。
y =f(x)の関数を作ることが出来れば、一見すると規則性のない数列であっても
エントロピーを少なく出来るんだが、これが上手くいかないんだよなぁ（笑）

プログラム板逝ってきます。

81 ：１３２人目の素数さん：02/01/17 14:36

93326215443944152681699238856266700490715968264381621468592963895217599993229915608941463976156518286253697920827223758251185210916864000000000000000000000000
=
100!

82 ：時間もかかる：02/01/17 20:04

この圧縮(抽出)機はどでかいサイズである、
に一票。

83 ：１３２人目の素数さん：02/01/18 00:40

いや、だからあのさ、コンピュータの中では数字は文字列としてじゃなくて、
二進数であらわされる数字で表現してるのよ。
つまりね、256までなら1文字でね。65536までなら二文字で・・・
ってなるわけ。>>65とかは用勉強。
あとね、100!とかを例に出してる人いるけどさ、それ、特殊な例でしょ？
そんなこといったらπとかeとか√2とか無限に出てくるでしょ。
そんなに都合よくデータは出てきませんよ？

>>82
何がでかいのよ（笑
大きさか？

84 ：１３２人目の素数さん：02/01/18 00:50

>>83
>二進数であらわされる数字で表現してるのよ。
>つまりね、256までなら1文字でね。65536までなら二文字で・・・

1までなら1文字、3までなら2文字だばかもの。

85 ：１３２人目の素数さん：02/01/18 01:37

>>83
時々例に出してる奴はあくまで考え方のサンプルだろ。
二進数がどうたらの指摘は的はずれ。
まあ実際内部表現のことをわかってない奴もいるにはいるんだろうが。

86 ：１３２人目の素数さん：02/01/18 09:05

数学的な興味としては自然数の表現で、位取り記数法(bit列)よりも表現量の少ない
計算可能な記法を限定条件下でも構築可能かに帰着できるのでは？

87 ：１３２人目の素数さん：02/01/18 15:24

>83
圧縮ファイルによく出てくる文字列を記号でおいて
ファイルを作成し解凍時に記号を文字列に直す。
記号の対応表みたいなファイルがいるから
ソフトが馬鹿でかくなるってことでしょ。

実際作ってるのはこういうのじゃないみたいだけどね。

88 ：１３２人目の素数さん：02/01/19 15:37

「数学的に不可能」というのは絶対に不可能という意味ではない。
「既存の公理系で数学的に不可能」というだけの意味だ。
つまり、ZeroSyncの人達は新しい公理系を発見したのです。

89 ：１３２人目の素数さん：02/01/19 16:15

88は公理系の意味を理解していないに一票。

90 ：１３２番目の素数さん：02/01/20 17:57

圧縮で冗長度って言ってるものはなんなんでしょう？元データとは独立した圧縮用
のマークみたいなもの？文書ファイルはあんなに圧縮性能がいいのに、動画になる
と途端に性能が落ちるのはなぜ？

91 ：１３２人目の素数さん：02/01/20 18:06

>>90
文書ファイルの冗長度が高いからじゃないの？

92 ：１３２人目の素数さん：02/01/20 18:18

高次元で圧縮すれば実現可能らしいです。

ソース　　http://www.42ch.net/PictureGeneral/img-box/img20011226032005.jpg

93 ：１３２人目の素数さん：02/01/20 18:23

>>92
　おお！そうか！こんな方法があったとは。
　うーん。なんで気がつかなかったんだろう。というか、これに
気づいた人間は凄いなあ。

94 ：１３２人目の素数さん：02/01/20 18:25

>>92
ソースは jpg ですか？（ｗ　ブラクラじゃあないようだけど・・・。
見た人、リンク先の内容きぼん。

95 ：１３２人目の素数さん：02/01/20 20:58

>>94
jpg田中

96 ：１３２人目の素数さん：02/01/21 05:45

…田中で内容すぐ分かるとは自分も重度の2chらーだな…

97 ：１３２人目の素数さん：02/01/21 19:49

913517247483640899(10進)
↓
10111000 01110100 01111100 01000011(2進)
↓
01100011 ^ 00001001
4byte→3byteと圧縮できたが

98 ：１３２人目の素数さん：02/01/21 19:54

>>97
Yet another popular idea is to split the input bit stream into a sequence of
large numbers, and factorize those numbers. Unfortunately, the number of bits
required to encode the factors and their exponents is on average not smaller
than the number of bits of the original bit stream, so this scheme too cannot
compress all data. Another idea also related to primes is to encode each
number as an index into a table of primes and an offset relative to the indexed
prime; this idea doesn't work either because the number of bits required to
encode the index, the offset and the separation between index and offset
is on average not smaller than the number of bits of the original bit stream.

99 ：１３２人目の素数さん：02/01/22 00:44

bzip2 の圧縮技術はどうなんだろう

100 ：なんてね：02/01/24 16:57

256の100乗のパターンをプログラムに持っておけば、100バイトは1ビットで表せれるヨ。

101 ：１３２人目の素数さん：02/01/24 18:04

>99
Burrows-Wheeler変換＋静的ハフマン符号らしいよ。

Burrows-Wheeler変換はblocksortingとも言われる
データを圧縮しやすい形に変換する方法。

102 ：１３２人目の素数さん：02/01/25 01:10

結果的に眉唾ものになったわけだけどさ、
zeosyncの噂を最初聞いたとき
ブロックソーティングみたいな変換技術の
カオス理論使ったすごい版みたいなのを咄嗟に想像した。
でも、lz系と違って、解凍にも同じ計算量かかるのよしてほしいよね。
使いづらいったらありゃしない。

103 ：　　　　：02/02/04 14:59

その圧縮法をｎ回連続で適用したら、１００＾ｎ分の一に圧縮できる
ことになり、おかしい。

104 ：１３２人目の素数さん：02/02/04 15:20

つーか､お前ら言ってる圧縮法は､
何十年も前にFAXに実装済み｡

数学版バカばっか｡

105 ：１３２人目の素数さん：02/02/04 16:49

2度と止めてくれ。突っ込んでもらうための罵倒は

106 ：１３２人目の素数さん：02/02/12 23:56

>>103がいいこと言ってる

107 ：１３２人目の素数さん：02/02/13 00:29

>>103=106
しかもこいつ、ここの内容すら理解してないな（藁

108 ：　：02/02/13 00:37

乱数Ωの切売します。１０ビット１００００円です。

109 ：１３２人目の素数さん：02/02/13 01:29

http://www.hotwired.co.jp/nwt/020122/
のyesの数を見ると頭が痛くなる。
さらに「読者のコメントをみる」ともっと頭が痛くなる。

110 ：１３２人目の素数さん：02/02/13 10:06

スーパーマンのお父さん入りの量子メモリー（緑色のクリスタル）があれば可能です。
容量は(1280*1024)^(2^32)ビットです。

111 ：110：02/02/13 10:16

(2^32)^(1280*1024)ビットの間違いだった・・・鬱打氏脳

112 ：１３２人目の素数さん：02/02/13 10:22

（旧方式圧縮済みソースのビット列－ソースのエントロピー）／（新方式圧縮済みソースのビット列－ソースのエントロピー）＝１００
って事？？？

だったら記事の内容に意味があるけど、それ以外に取り様があるの？

113 ：１３２人目の素数さん：02/02/13 20:49

>>109
Yes,Noどちら側でもコメントが痛いのが哀愁を誘うね

114 ：１３２人目の素数さん：02/02/25 02:57

もしかして量子論的重ねあわせの利用ですか？

115 ：１３２人目の素数さん：02/03/17 00:50

age

116 ：１３２人目の素数さん：02/03/17 07:21

　既存のbitを基準にするコンピュータでは絶対無理
　本当にランダムなデータを圧縮できるなら、圧縮した出力を
さらに圧縮できることになり、最終的には1bitになる。
　しかし1bitでは2通りの状態しか表すことができないのでそんな
ことはありえない。絶対にこれ以上圧縮できない形があるはずであり、
それは何の法則性も見出せないランダムなデータだ。
　ランダムなデータを圧縮できないくらい対偶を考えればすぐにわかるだろ。

117 ：１３２人目の素数さん：02/03/18 01:32

>>116
何をいまさら。

118 ：１３２人目の素数さん：02/04/08 02:00

119 ：わたんばえ：02/04/17 20:52

>>84
プログラマの人に聞いてみたら２進８桁１文字らしいです

120 ：＞116：02/04/17 21:07

ここでいう”ランダムなデータ”
というのは、”任意のパタン”ではないと思う・
（任意というのは116の指摘とおりありえない）

対象となっているランダムなデータ　というのは
一件不規則に見える（が何らかの拘束条件がある）パターン
というこどしかない。

大衆一般には”任意”という印象をあたえており
巧妙なキャンペーンではあるな。

121 ：１３２人目の素数さん：02/04/17 21:54

>>120
東北の人？

122 ：１３２人目の素数さん：02/04/17 21:59

>>121
そのこころは？

123 ：１３２人目の素数さん：02/04/17 22:00

だって，こどしかないって…

124 ：１３２人目の素数さん：02/04/17 22:30

東北で圧縮？
おもいいきり特定してるし。

125 ：122：02/04/17 22:33

すいません．ゼンゼンわかりません。逝ってよしですか？

126 ：１３２人目の素数さん：02/04/17 22:42

　　＿_　　　　　　　＿_　　　　　　　＿_
　 |よし|　ΛΛ　　|よし| ΛΛ　　　|よし|　ΛΛ 　　／￣￣￣￣￣￣￣￣￣￣￣￣￣
　〃￣∩ ﾟДﾟ）　〃￣∩ ﾟДﾟ）　　〃￣∩ ﾟДﾟ）＜　全員一致で逝ってよし！
　　　　ヾ.　　）　　　　ヾ.　　）　　　　　ヾ.　　）　　＼＿＿＿＿＿＿＿＿＿＿＿＿＿
￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣＼
＼　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　＼
　 |￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣　|
　 |　　　　　　　　　逝ってよし認定委員会　　　　　　　　　　　　　　　 |
＼|　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　 |

127 ：１３２人目の素数さん：02/04/17 22:42

>>125
ﾊｧ？わからないっていってる意味がわからない．
（「。」と「．」が混ざってるぞ．）

128 ：122：02/04/17 22:55

ありがとうございます．思う存分逝ってきます．

129 ：１３２人目の素数さん：02/05/01 01:30

あげ

130 ：１３２人目の素数さん：02/05/11 17:10

>>126
氏ね

131 ：１３２人目の素数さん：02/05/11 17:28

このスレは1/100以下に圧縮できる。
http://science.2ch.net/test/read.cgi/math/1004837995/

132 ：１３２人目の素数さん：02/05/21 21:53

>>126を2^(-32)に圧縮したい。

133 ：１３２人目の素数さん：02/05/21 22:39

>>132

,
↑こんなもんでどうでしょう？

134 ：１３２人目の素数さん：02/06/05 14:33

結局このニュースはどうなったんだ？

135 ：１３２人目の素数さん：02/06/24 03:06

さあ

136 ：１３２人目の素数さん：02/06/25 21:25

137 ：１３２人目の素数さん：02/06/27 19:27

138 ：１３２人目の素数さん：02/06/29 03:39

139 ：１３２人目の素数さん：02/06/30 22:30

140 ：１３２人目の素数さん：02/07/01 17:08

パイや、ルート素数で得られる、無限長数列を辞書に持つ圧縮…は既出だとは思いますが、

辞書の種n
取得開始桁
取得桁数
※n＝ルート演算の対象となる下からn個目の素数。0ならばパイを使用

これを複数個吐くとして、
効率の良いケースを探すためには検索が必要で圧縮時の負荷が大きいとは思いますし、
伸長の負荷も同様とは思いますが、
他の方法で圧縮したデータを奇跡的にさらに圧縮出来るケースもあるわけで、
なんとか実用化できませんか？
ぜひ、数学的な考察をお願いします。

141 ：１３２人目の素数さん：02/07/31 13:37

142 ：１３２人目の素数さん：02/08/02 02:42

ZeoSync 事件
http://www.matsusaka-u.ac.jp/~okumura/compression/zeosync.html

143 ：１３２人目の素数さん：02/08/02 05:20

>>140
ナンセンスだよ。

144 ：１３２人目の素数さん：02/08/15 00:17

http://www.zeosync.com/
潰れちゃった…なのに何故数学板も情報システム板もスレが残ってるんでしょ

145 ：１３２人目の素数さん：02/08/15 13:03

wavファイルの100分の1圧縮とかなら実現できそうだが…

146 ：１３２人目の素数さん：02/09/04 10:42