究極の圧縮?

このエントリーをはてなブックマークに追加
新スレいらねーよ。
953デフォルトの名無しさん:02/06/26 09:04
元データa(長さ2^n)がx = 2 y : x = 2 , y = 3 という感じになればいいのでは。
954デフォルトの名無しさん:02/06/26 09:10
圧縮前データを生成できるようなアルゴリズムを圧縮結果とするような
感じになればいいのでは?
いい加減そのト理論は聞き秋田。
956デフォルトの名無しさん:02/06/26 13:31
>>949の詳細知ってる人いないのー?
>>956
庄野克房さんは知っているはず。
958デフォルトの名無しさん:02/06/26 14:22
http://www.moe.edu.sg/maths/jul99/Triangle.gif
おいお前ら。これ、教えてください。同僚のOLに笑われる。
959デフォルトの名無しさん:02/06/26 14:41
>>958 まじで考え込んだよ。
わかればなんだそんなことかということなんだが。
下の三角形の斜めの線は本当に直線なのか
>>958
(゚∀゚)斜辺をよく観察すると、直線じゃないことがわかる。
あと、2つの三角形は相似であるはずだが、実際には・・・
直線じゃないだろ。
直線じゃないね。
>>958
で、どこが圧縮に関わるんだ。コレ
>>958の脳ミソは圧縮可能だということ。
冗長性が高い、と言うことか
967デフォルトの名無しさん:02/06/29 14:19
>>958
今さらながら職場で大ブーム!
もっと他にこういうのないかな?
>>967
イタチ外
>>958
マジで真剣に考えた。
何とか解けた、と思う。
答えメアドに載せるからあってたら教えてください。
>>969
あってるよ
971969:02/07/13 21:59
>>970
サンクス!
>>969
ちゃう。
斜辺が直線じゃない(3角形じゃない
>>949
バイテックへのリンクが準備中というのにはワラタ
974隣人:02/08/04 12:02
>>1
976乱数:02/08/05 21:57
900kbのを圧縮→疑似乱数でxor→圧縮→疑似乱数でxor→圧縮・・あと2回ほど繰り返す・・・
そしたら250kbぐらいまで逝ったよ。
圧縮にはcabを使い、乱数でxorするのにはHSP使用
>>976
ぜ、ぜ、ぜひ検証させてくれ!
使ったデータとプログラムを公開するか、
追試実験が可能な程度の情報を開示してくれ!

つーか、誰も追試できないと、それは真実にならないので注意。
どんなファイル長でも固定長に圧縮できる方法を発見したぞ。
まず入力ファイルをzipなり何なりで圧縮し、そのファイルサイズ、CRCを出力する。
解凍する場合、(ファイルサイズ)バイトの考えられる全ての組み合わせからCRCの一致するものを抽出
そしてその中からzipとして解凍可能な組み合わせを探す。結構な精度で元ファイルが復元できると思うが、どうか。
処理速度?解凍は死ぬほど遅いが圧縮が糞速いからプラマイゼロだろ(藁
>>978
解凍に一年ぐらいかかったりしないか?(藁
980デフォルトの名無しさん:02/08/06 00:37
>>978
作ってみるわ。まっとれ
981逝って良しの1:02/08/06 00:45
アフォか!
解凍可能な組み合わせが天文学的な数になるに決まってるだろ!
982978:02/08/06 00:57
>>979
まあ並列演算の得意そうな量子コンピュータに期待。

>>980
カコイイ

>>981
そう言われればそうなんだが、うーむ。
長さnの任意のビット列が正常なzipフォーマットになる確率は相当低いし……
とはいえ候補の数も膨大だからな……
まー複数でたら最終的にはファイル内容からユーザが判断するって事で
とりあえず、元データのチェックサム取っといて、
解凍後のデータのチェックサムと比較すれば、
解凍後の候補はかなり絞れるゾ、とか言ってみるテスト
てかこれ、ガロア体かなんか使ってうまく実装できねえか?
時間なんか気にしなければ、だけど
チェックサムが2バイトとして、候補が1/65536になるだけ、4バイトでも
 1/4294967296に出来るだけ。
それに対して、1KBytesのデータでも元データの候補は
2^(8*1024)だから、1.0907481356194159294629842447338e+2466
1MBytesだと、2^(8*1024*1024)で……、Windows付属の電卓では
計算できねぇよぉ。

候補の数を 1/4294967296 に絞っても焼け石に水。
この程度の事ではエントリピーの壁は超えられない。

計算ミスがあれば突っ込んでね。
987978:02/08/06 04:26
>>985
(´Д`)確かに……
冷静に計算したらそりゃそうだわな。
でも、解凍候補が複数存在する(どれが本物かは判断不能)アルゴリズムなら
結構情報量削れる気がすんだよなあ。

小ネタ
圧縮関数 :
与えられたデータから1引く。
例 : 1011→1010
全ビット0の場合 : 0000→111

解凍関数 : 与えられたデータに1足す。つまり上の逆。

こいつを使えば、n回目に圧縮したサイズ≧n+1回目に圧縮したサイズ、となる。
どんなデータでも最終的に0ビットまで圧縮してくれるという優れもの。藁
当然可逆。こりゃ凄えや!
988985:02/08/06 04:30
エントリピーって、なんだよ。エントロピーだろ。

欝だ、寝よう。
989デフォルトの名無しさん:02/08/06 04:41
>>987
n はどうすんの?
0ビットになったら、複数存在する解凍候補は全てのファイルですか。
面白いね。
nが元ファイルと同サイズに
>>991
ワラタ
>>978
ファイルサイズ・CRCのほかに先頭・中間・末尾の数バイトを取得して記憶しておく。
これならさらに絞り込めるかも?
QlpoOTFBWSZTWTZ8BwF3cUgggBJAICAIICBQZvtqDPtKRkpWhBRldSIKUnyFBWQBZXcZYWgFIjsgAiBJICAgIIABAUoBqPspdRBS8xRlhRBS93ki+0ggK/s=
BZ2
ある大きさ n (byte) のファイルが "正常"なZIP書庫である確率ってどれくらいなんだ?
かなり低い。
>>996
何パーセントくらいですか??
998乱数:02/08/06 14:37
できると思ったけど展開ができず、何かと探して見たらソースにミスが・・
やっぱ究極の圧縮は無理?
999デフォルトの名無しさん:02/08/06 14:57
すべてのデータは関数にすることが出来る。
これをジャイアンの定理と言う。

まぁ落ち着け。
1000デフォルトの名無しさん:02/08/06 14:58
1000
10011001
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。