究極の圧縮?

このエントリーをはてなブックマークに追加
1誰か
プログラム板の技術者ども、
これどう思います?
http://www.zdnet.co.jp/news/reuters/020110/e_researchers.html
本当にシャノンの定理を打ち破れるのか?
漏れは出来ないと思ふ。
2デフォルトの名無しさん:02/01/10 23:56
3デフォルトの名無しさん:02/01/10 23:59
こっちに持ってきたか
一応関連リンク貼っとくよ

http://slashdot.jp/article.pl?sid=02/01/10/0842245&mode=nested
4デフォルトの名無しさん:02/01/10 23:59
ここじゃ/.-Jと同様、厨な議論に終始するから数学板逝け
5デフォルトの名無しさん:02/01/11 00:00
不可逆圧縮だろ。1/100くらいなら出来るんじゃない?
めちゃくちゃ乱暴に言うと
乱数列をためしに書いてみてデータと一致してたら
その乱数のシードを圧縮後のデータとする
みたいなイメージかな
>>6
ははーなるほどねぇ。乱暴過ぎなのはわかるけど、ニュアンスがわかって感心した。
8デフォルトの名無しさん:02/01/11 00:36
9デフォルトの名無しさん:02/01/11 00:45
>>6
結局シードの大きさがめちゃくちゃ大きかったりして、って落ちじゃない?。(w
シャノンの定理を超えられるってしたら、相対性理論よりすごいよ。
10デフォルトの名無しさん:02/01/11 00:51
ああ、この手法なら俺が工房のとき思いついたけど、データを圧縮しても食糧問題は解決できないと気付いて開発を中止したよ。
ふーん、そんなにすごいものだったんだ。
ロスレス圧縮で数百分の1程度の圧縮率を実現可能か。
すごいね(w
「任意のデータを」とはどこにも書いてないな
おれは幼稚園の年長組のときに思いついた。
データ圧縮しても死を免れる事は出来ないと気づいてやめた。
ここで言ってる乱数列という部分にフラクタルなどーのこーのを
適応してるんじゃない?
あと、適当な長さで区切ればそんなに突拍子の無い話じゃないし
なによりこの技術はJpegのように非可逆なものにしかつかえない
っといいうかん
15デフォルトの名無しさん:02/01/11 01:04
>>10
そりゃ、誰もが思いつく方法だよ。
俺だって思いついたさ。
思いつくのは簡単なんだけどな。
それを実現するためのアルゴリズムはなかなか思いつかないよ。
16デフォルトの名無しさん:02/01/11 01:06
アンケート

この発表はやくざだと思う。

はい → 1票
いいえ → 0票

続き、よろしく!
ジンジャーが実用化された以上
この圧縮理論が実現してもおかしくはないだろう。
すべての情報は1ビットあれば表せますよ。
いまどき常識です。
ジンジャーって、空を飛ぶって言われてなかったっけ?竹コプター?
で、お前らは今日の情報処理試験合格発表はどうだったんですか?
>>16の圧縮された結果を展開すると、

はい:325票
いいえ:7票

になりました!
22デフォルトの名無しさん:02/01/11 01:25
Smaleって高次のポアンカレ予想解いた香具師じゃん
名前貸してるだけか?
2316:02/01/11 01:26
>>21

おまえはいいやつだよ。レスつかないかと思った。
点呼は禁止、禁止だよっ
>Smaleって高次のポアンカレ予想解いた香具師じゃん
マジかよ!? 見逃してた、チェックしてみるか
シャノン氏が亡くなったのって、去年かおととしじゃなかった?
27デフォルトの名無しさん:02/01/11 01:43
100分の1って、1GBが10MBになるだけだろ?・・・すごいね。
28デフォルトの名無しさん:02/01/11 01:45
> 1991年にこの世を去ったShannon博士は,

あのー、Shannon博士が亡くなったのは去年のことなんですけど…
http://ebi.2ch.net/rikei/kako/983/983322026.html
2928:02/01/11 01:46
かぶた
30デフォルトの名無しさん:02/01/11 01:47
俺の負債と嫁さんの脂肪も圧縮してくれ
肛門が閉鎖されそうです
2001年問題だろ。
なんで100分の1って判るんだろうか?
間違えんな、ヴォケ。
      ∧_∧          _ _     .'  , .. .∧_∧
     ( ´_ゝ`)   _ .- ― .= ̄  ̄`:, .∴ '     ( >>ロイター
    /     '' ̄      __――=', ・,‘ r⌒> _/ /
   / /\   / ̄\-―  ̄ ̄   ̄"'" .   ’ | y'⌒  ⌒i
 _| ̄ ̄ \ /  ヽ \_              |  /  ノ |
 \ ̄ ̄ ̄ ̄ ̄ ̄ \__)              , ー'  /´ヾ_ノ
  ||\            \          / ,  ノ
  ||\|| ̄ ̄ ̄ ̄ ̄ ̄ ̄|| ̄          / / /
  ||  || ̄ ̄ ̄ ̄ ̄ ̄ ̄||          / / ,'
  ||  ||           ||       /  /|  |
                       !、_/ /
そうだな。なんで67とか半端な数字が出てこないんだろう。
きっと圧縮されてるんだYO!
0x4FC583A0

炉動画を圧縮しました。
37LiNK:02/01/11 02:32
100分の1以下を実現するデータ圧縮の新技術
http://choco.2ch.net/test/read.cgi/news/1010670022/
じゃぁこれが成功したらデパートの食料品売り場は
種だけが売られるようになるのか?
39デフォルトの名無しさん:02/01/11 02:38
/.にあったこれが面白かった。

http://www.nurs.or.jp/~nspixp/north/
「できる!」シリーズで シャノンの定理 とかありませんか?
サルでもわかるシャノンの定理教室 とかありませんか?
ちょっと勉強してみたいんですけど
ふーん、なんでも8バイトか。
・・・・・・・・・・・
すげーな。
寝る。
42デフォルトの名無しさん:02/01/11 03:29
これって、株価を操作する為とかそういうの?
出資者を募ってドロンとか。
43デフォルトの名無しさん:02/01/11 03:33
そういや、Iterated system社のフラクタル圧縮(*.fif)はどうなった?
もしかして会社潰れてないか?
もうちっとプログラム板っぽい方向に話持っていきたいねぇ
45デフォルトの名無しさん:02/01/11 03:45
乱数列を100分の1程度に圧縮できるなら、
それを再帰的に繰り返せば限りなく情報量は0に近づく。
この矛盾をどう説明するのだろうか。
>45
「記者がアホ」
アホはすっこんでろ。
      ∧_∧          _ _     .'  , .. .∧_∧
     ( ´_ゝ`)   _ .- ― .= ̄  ̄`:, .∴ '     ( >>記者
    /     '' ̄      __――=', ・,‘ r⌒> _/ /
   / /\   / ̄\-―  ̄ ̄   ̄"'" .   ’ | y'⌒  ⌒i
 _| ̄ ̄ \ /  ヽ \_              |  /  ノ |コ、コボルマンセー・・・
 \ ̄ ̄ ̄ ̄ ̄ ̄ \__)              , ー'  /´ヾ_ノ
  ||\            \          / ,  ノ
  ||\|| ̄ ̄ ̄ ̄ ̄ ̄ ̄|| ̄          / / /
  ||  || ̄ ̄ ̄ ̄ ̄ ̄ ̄||          / / ,'
  ||  ||           ||       /  /|  |
                       !、_/ /
48デフォルトの名無しさん:02/01/11 04:06
オレの予想だと、どこかに巨大な辞書データをおいて、
圧縮展開時に共通の辞書を参照。これで情報量の問題は
パス。場外乱闘というか反則っぽい勝負になる。
辞書にアクセスできない環境では解凍も出来ないの?
できると学者が言ってるんだから多分できるんだろうな。

理論的には
51デフォルトの名無しさん:02/01/11 04:19
>48
例えば、WindowsXPでインストールされる全ファイルの内容を辞書に持っておく。
これで「テスト環境をインストール直後のWindowsXPにしましょう」と
言ってしまえば、あらゆるファイルが数バイトで圧縮出来る。
しかしまあ、圧縮・解凍ぐらいハードで実装しろといいたい。
53デフォルトの名無しさん:02/01/11 04:36
48>>
51>>
これって例のハノイ圧縮みたいなもんじゃん
この圧縮方法には辞書っぽい機構があるのかな?
たぶんないんだろうな
圧縮すると見せかけてNTFSのマルチストリームに押し込む、に
500ガバス。
わかったぞ!
いいか、圧縮したら圧縮したという状態になるだろ。
解凍したら解凍したという状態になるんだ。当たり前だな。
じゃあこの中間の状態って何だ?圧縮されてない状態?解凍されていない状態?
答えはこんな簡単なところにあったんだよ!
57デフォルトの名無しさん:02/01/11 05:17
1/100に圧縮されているが、lsやExplorerでファイルサイズを
見ようとした瞬間に100倍に展開されてしまう方式。
信じろ。
58デフォルトの名無しさん:02/01/11 05:44
>56
(;゜д゜)ハッ そうか すごいよアンタ・・・
59デフォルトの名無しさん:02/01/11 08:36
まずさあ、確認しとくけど
・辞書を使ったとしても無条件に圧縮出来る訳ではない
 は正しいよね?

 頻度に差があるから辞書を使って圧縮出来るんだよね?

だから乱数は予測出来ない=頻度に差はない=圧縮出来ない んだけど

でもパソコンで作り出す乱数は擬似乱数だから予測出来る=圧縮出来る
 仕掛けは、既存の乱数発生アルゴリズムを全部持たせて種を見つけるという方式だ。
 乱数種検索方式と名付けよう。

さて、ここに擬似乱数と真の乱数列や一般のテキストファイルが混在してあるとしよう。
  乱数種検索方式で圧縮する。
  理論検証段階だから時間は制限しないとする。
  で、圧縮出来たものについてどんどん統計を取ろう

お!最初のファイルは10MByteが100バイトになったぞ
   まだ100個しか圧縮出来ないけど平均してみろ ・・はい1/200です
   スゲーようし記者発表だあ!
60デフォルトの名無しさん:02/01/11 08:40
>>59
乱数は予測出来ない

っていうところを、フラクタルだかなんだかで強引に予測するところが
今回の新発見というか新技術のキモでしょーが。
ちゃんと記事読んでますか? もしもーし!
6159:02/01/11 08:57
真の乱数は予測出来ないけど、世の中の現象のランダムに見える現象の殆どはカオスだって事なら同意
完全に最初に想定したカオス上にあるなら1/100になるというのは正しいだろう

ではカオスなら予測出来るか?
俺は無理だと思う カオスを作り出す方程式は大量にあるからそれを識別必要がある
しかし、ランダムに見えるほどの時間分解能で覗いたカオス現象を同定するのは実サンプル数
では不可能。

たとえばスーパ方程式みたいなのがあって 係数の調整で全てのカオスが出現するのだとすると
係数の数も無限になりそうな気がする
 与えるサンプルの数が少ないうちは統計的に偏だから 圧縮出来るように思えるだろうけど
>>59
頼むからもう少し勉強してから書き込んでくれ。
あんたの言葉を初心者が読んでそのまま鵜呑みにしちゃうと、
とっても恥だから…。
63デフォルトの名無しさん:02/01/11 09:28
>62 ん? どこが変なの? 俺も初心者なのか変な個所が判らん
64デフォルトの名無しさん:02/01/11 09:52
>>61
ちゃんと記事読んでますか? もしもーし!

「自然発生パターンを意図的に作り出して,
エントロピーライクなランダムシーケンスを形成するもの」
なる技術をこの人たちが研究してたんでしょうが。

君の聞きかじり理論は、徹頭徹尾間違ってるから気をつけよう。
どこが変かって全部だよ。
65デフォルトの名無しさん:02/01/11 09:56
光速に近い速さで移動させればサイズはほとんど無くなるよ
66デフォルトの名無しさん:02/01/11 10:03
>>65
それって観測している人は動かないって前提でしょーが。
一緒になって移動してたらサイズはもとのままだっちゅーの。
67&rlo;)-_-(:02/01/11 10:10
>>66
ネタにマジレスすんなよ、、、冗談の分からん奴だなぁ。
6861:02/01/11 10:11
ああそういう事ね
 完全にランダムなんじゃないんだ。
 まあ逆に完全にランダムなデータなんか記録や転送しても、それも意味ない事だし
 人間が扱うデーターにはどっかに隠れた規則があるって事なんだろうけど

でもその方法で1/100の場合もあるなら理解出来るけど、平均して1/100なら無理だろ

もし それが賭なら オッズ 110円でも出来ないほうを買うよ
でも、それって、ものすご〜〜〜〜く圧縮が遅くならないかな?
70デフォルトの名無しさん:02/01/11 10:15
>>69
確かに圧縮にはめっちゃ時間かかりそうだ。
でも、展開が速ければ問題ないんじゃないかな。

つーかおそらく展開は従来の圧縮技術以上に
ちょっぱやなんじゃないかと予測する。
>>67
ガミラスに下品な男はいらん
72絶対無理に1票:02/01/11 10:19
ランダムで意味のあるデータ列っていうと
 ZIP/LZH/MP3のような既圧縮ファイルの事だろ

もしそれらを 1/100 に圧縮出来るならスゴイ
たとえ1/10でもスゴイ

いや1/3でもスゴイ

それが1/2でも許す・・・・が、絶対に無理
736:02/01/11 10:24
そう?
オレは結構期待してるけどな〜
インターネット上の全てのファイルはURLという数十バイトのデータに
圧縮されているとみなすことができる。解凍はブラウザにそのURLを打
ち込むだけでよい。
>>74
巨大な辞書をもった圧縮形式だが、解凍するためには
インフラが必要な上、ここが重要なのだが
解凍後のデータは経年劣化するぞ。
はたしてそんなものが圧縮といえるかどうか疑わしいな。
76デフォルトの名無しさん:02/01/11 10:43
>>74

ある意味究極の可逆圧縮だな。
圧縮過程はサーバへのULか。

まぁ、1のソースに関しては運転資金が足りなくなったからVC寄せにエサ撒いたと
いうのが真相じゃないかな。
そういえば前にもイスラエルのVBが「人工知能完成間近!」とか吠えてたな。
あれから音沙汰無いところを見ると、ねぇ。
これってそもそもシャノンの定理とか関係ないじゃん
シャノンの定理はぶっちゃけ冗長性を調べる機軸だぜ?
78デフォルトの名無しさん:02/01/11 10:56
虚数使ってるの?
本当にランダムなデータを圧縮できないのはシャノンの定理を持ち出す
までもなく自明なことだから、その話のどこにオチがあるのか興味はあ
る。
>>78 もまえは手品のタネはみんな磁石だと思ってるだろ。
>>79
本当にランダムなデータはこの際置いといて

ランダムっぽいデータ がこの圧縮技術の対象でしょーが
それに画像圧縮のように可逆である必要が無ければ
適当に妥協してあっしゅくすることも可能だと思うよ。
>>39
やばっ、、、
圧縮率を競うコンテストにこの方式で投稿したことがあるよ…。
パクられたか!?
>>82
Forbiddenなんだけど、いったい何なの?
Forbiddenってなに?
>>81
不可逆圧縮なら質を落とせばいくらでも圧縮できる。JPEGだって圧縮率を
最大に上げれば1/100くらいになる場合もある。ここでは可逆圧縮だと言っ
ていることが重要。
前半「ロスレス圧縮」とかいってるが
後半の応用分野とかみると確かに非可逆圧縮っぽいな。
まあ、仮に本当にランダムなデータなるものが存在したところで
そのデータ長が無限ならともかく、必ず有限である以上
有限な数列にはどんなものにも必ず規則性があるわけで
その規則性がただの順列なのかフラクタルなんとかなのかは
わからないけど、とにかくその規則性を式にしたものを
圧縮に使うってことでしょ。
88sage:02/01/11 11:26
情報量に関するおさらい:

元データをベクトル的に X で表すとする。
圧縮後のデータを同様に Y で表すとする。
圧縮機は、関数 Y=f(X) ...(1) で表せる。

展開機は、f(X) の逆関数 を g(Y) として、
X=g(Y) ...(2)
で表せる。

ここで、世の中にあるデータXの種類が、N 種類とする。
(2) からいって、Y も N 種類以上を区別できなければならない。
もし、N 種類のデータの出現頻度に差が無ければ、
Y を表現するのに最も適切なのはビット数 [log2(N)]+1 程度の
単純な二進数である。
N 種類のデータの出現頻度に差があるのなら、頻度の高いデータに
短いビット数を割り当てれば、平均的なデータ量は減らせる。
頻度の分布が偏っていればいるほど、Y を表現するのに必要な
平均的なビット数は少なくできることになる。

しかし、完全乱数の様にフラットであれば単純に [log2(N)]+1 ビット程度
必要になることは明らかであろう。
10bitのデータを圧縮したら0.1bitになりました。
9088:02/01/11 11:33
普通は、画像データや音楽データはそれぞれ、ある特徴を持って
いて、画像データなら画像データでデータの出現頻度にかなり
偏りがある。

というわけで、平均的なデータ長は減らせている。

ところが、全く予想できないようなものは、数学的に言って、
データ長を減らすことは出来ない。

この証明はごく初歩的にできる。
>>90
だから、今まで予想できなかったものが予想できるようになったんでしょ。
ちゃんと記事読んだ? もしもーし!
>>91
予想できないものが予想できるってどういうこっちゃ
その理論を使えばサイコロの目も予測できるのだろうな。
>>87 その式が元のデータより情報量少なくなる保証はどこにあるんだYO!
95デフォルトの名無しさん:02/01/11 12:08
特許の内容はいつ見れるようになるんだー
Tower of honoi圧縮の作者(自己申告)がここにきてた事もあったっけ。
>93
それだ!あのスレの1にさっそく知らせよう
>>93
完璧に正六面体なサイコロなんてないよ
完璧に等しく振れるヒトなんていないよ
完璧に平らな床なんてないよ
って事でカオス使えばいとも簡単に予測できる
さいころ議論はあっちのスレで
>>98の訳=予測不能
>>100
オマエの知能は予測可能
誰も信じてないようだな。
これって反陽子のスピンの方向を使ってるんだろ?
104デフォルトの名無しさん:02/01/11 13:54
>>98
天才?
105デフォルトの名無しさん:02/01/11 14:02
>>102

いや >>6 が信じてらしい>>73
106デフォルトの名無しさん:02/01/11 14:20
100bitのデータを1bitに圧縮できないことはサルでも分かるはずだが・・・。
108デフォルトの名無しさん:02/01/11 14:23
πを無限に続く乱数、とすれば、全ての情報はπの何桁か目に出現する。
これで圧縮ができる・・・とは思えんな。
100bitの完全な乱数列を生成するKeyはやはり100bitはいる・・・よね。
乱数列の発生キーを使う方法では無理だな。
110デフォルトの名無しさん:02/01/11 14:30
百科事典の情報はつまようじ一本に入れることができる。

って言うお話を知ってる人いる?
要するに、つまようじの先端からの距離 a 離れた場所に傷を付けて相手に渡す。
相手はその a の距離を計測することで

a = 0.1245498754846846554351546468768468465415343545345…

情報を得ることができるというジョーク理論なんだけど、
まさに今回の理論っぽいよね。アナログ信号に変換するんであれば
可能性としてはかなり有用だと思うんだけどな。俺は期待したい。
111デフォルトの名無しさん:02/01/11 14:34
>>108 そうなんだけど、 たとえば n bit目に表れたとする
 そのnが 元の情報の長さより1/100より小さければ 圧縮出来たとする。

殆ど滅多にない確率だけど、圧縮出来た時だけ圧縮したとフラグをつける
圧縮出来ない時には1ビット大きくなるだけだ

ところで、無理数はπだけじゃない√n にも無理数は沢山ある

てな調子で言いくるめられたらどうする?
>>108
πだけじゃなくて、
いろんなもの(√とか自然対数とか)の
組み合せでやれば案外有効なところに落ち着くかもしれず。
>>108
仮にその桁位置を求めることができたとしても、その桁位置を表すのに元の
データのビット数を超えてしまうだろうね。ところでπ(一般的に無理数)は
完全な乱数列とみなせるの?(スレと関係ない話でスマソ)
114デフォルトの名無しさん:02/01/11 14:38
完全である事より、どの部分も決して繰り返さない事が重要なんでは? >>113
出たー、π。映画「π」は必見だ。
116デフォルトの名無しさん:02/01/11 14:41
>>113 平均すれば元のデータ長と同じなると思うよ

だから 1/100になる確率も1/100
という事は100個の無理数を用意すれば およそ半分のデータについては1/100になる

なんて言ってみる
117デフォルトの名無しさん:02/01/11 14:43
この世に完全に法則性のない数列など存在しない
なぜなら完全に規則性のない乱数列は完全に
規則性がないという規則性を持っているからだ
>>116
その100個の無理数の情報が必要なので結局同じと思われ。
>>117
規則を持ってるんなら「完全に規則性が無い」という規則は持ってないことになるぞ。
120デフォルトの名無しさん:02/01/11 14:49
>>118
100個の無理数のどれかは わずか7ビットじゃないか
>>116 の話しはどこが正しくないの?
>>121
1/100になる確率も1/100ってとこ。
123デフォルトの名無しさん:02/01/11 14:53
ダンプのチェックサムから逆算してって方法は…?
圧縮後には (たて)16 + (よこ)16 + 1 の数字が残るだけ。
これってやっぱり数学的には不可逆なの?
124デフォルトの名無しさん:02/01/11 14:55
100bitを1bitに圧縮はできないけど
100Mbyteを1Mbyteに圧縮ならできるかもしれない。

圧縮の対象がめちゃくちゃおおっきいときに有効な圧縮方法だと思う。
125これでどうだ?:02/01/11 14:56
圧縮するにはアカシックレコードにしまっておいて
解凍するにはそのポインタから呼び出す
126デフォルトの名無しさん:02/01/11 14:57
>>123
パリティから元のデータを導き出すような話だね。
>圧縮の対象がめちゃくちゃおおっきいときに有効な圧縮方法だと思う。

なにかを思えるほどに理解している人間はこのスレにはいないと思うのだけど。
>>124
大きなデータであればより多くの有効な規則性を見つけることが可能なので
圧縮率は高くしやすい。しかし規則性が無ければ(見つからなければ)圧縮
は不可能。
10110110
という8ビットの数値を乱数列で圧縮できるか?
1ビットに圧縮できるのは、乱数列の最初にこの8ビットが出現した時。
出現すれば、1、しなければ0とする。

・・・これはだめだな。

乱数列で1/100になる確率は1/100じゃない気がする。
>>121 1行目
131これでどうだ?:02/01/11 15:06
圧縮するにはアカシックレコードにしまっておいて
解凍するにはそのポインタから呼び出す
どのデータも同じやり方で圧縮するんじゃなくて、
データ特有の規則性を無理やり見つけてそれを
利用する、てな感じか?
…時間かかりそうだなー
>>131
なるほど。
ネット接続の環境なら、圧縮しようと思ったデータを適当なページに
放り込んでそのアドレスのみを渡す。
これでどんな巨大なデータもURLだ。
展開にはダウンロード分の時間がかかります(w

しかし、これって圧縮と言えるか?
>>131
エドガーケーシーですか?
13594:02/01/11 15:10
>>131
そのポインタのビット数が元のデータより小さい保証がどこにあるんだYO!(w
>>129
乱数列の辞書があれば、それへのポインタですむ。
乱数列で1/100になる確率は1/100じゃないとして幾らになるか考えてみた

Nビットで表現出来る全ての組み合わせは2^N
Nビット迄で表現出来る値は 2^(N/100)

だからおよそ 2^(N/100)/2^(N)=2^(N/100-N)=2^(-99/100*N)
100バイトの場合 3.83922384357281524E-239
1KByteの場合 6.95719764485075662E-2385
圧縮は四次元空間に...略
13994:02/01/11 15:12
>>132
そんなものを見つける汎用的なアルゴリズムは存在しないに一票
>>137
その表記じゃピンと来ない。
100バイトの場合 1/10000000000000000・・・(0が239個)
1KByteの場合 1/10000000000000000・・・(0が2385個)
というのでいいかな?
141132:02/01/11 15:19
>>139
俺もそう思う。だから、小規模なレベル(on very small bit strings?)でしか
成功してないのかなぁと大胆予想。
>>137
計算が正しいかどうかは別として、1/100のデータ量になる確率は1/100より
遥かに小さいということだね。乱数の圧縮の議論は永久機関の議論に似てい
る。ごまかされるとできそうな気もするが結局はできない。
143デフォルトの名無しさん:02/01/11 15:32
絶対に無理

1メガくらいのサイズのZIP/LZHのような圧縮済書庫ファイルをホントに1/2にでも圧縮出来たら
そりゃもう裸になって走り回ってやるよ
もし1/100になりゃ全財産(しれてるけど)どっかに寄付してもいいよ

ただし、実験時は元のファイルが何か判らない程度に
スクランブル(順番をかき混ぜたりビットを反転したりね)させろよ
>小規模なレベルで,ランダムな情報シーケンスを劣化させることなく
>100分の1以下に圧縮することに成功

記事の情報がこれだけだからなあ。
特許公開待ちだな。
145デフォルトの名無しさん:02/01/11 16:02
自然発生パターンをエントロピーライクなランダムシーケンスに変換する、
これがZero Space Tuner。
>>133
もしインターネットを使わずにどのファイルでもブラウズしようと思えば、
全てのクライアントマシンに世界中の全ファイルをそれぞれにコピーして
おく必要がある。それを考えれば現在のインターネットは億単位の圧縮率
かも。
147デフォルトの名無しさん:02/01/11 16:17
変換されたランダムシーケンスをBitPerfectの複雑な組み合わせに変換して圧縮する、
これがBinaryAccelerator。
148.:02/01/11 16:21
高速サーバーだろうがアカシックレコードだろうが
記録をPCに落とすこと自体は一緒だろ。
ようはその総量を100分の1に落とせるかどうかだよ、ヴォケが!

得意げな顔してカオスとか言ってるヤツもいるし、おめでてーな。
俺、アカシックレコードにアクセスできるかも…。
どうしよう…こわい。
>>110 おそレスだけど
アナログ信号の時間当たりの情報量は占有帯域幅×S/N比(=ダイナミックレンジ)
に比例するんだな。
誤差0でアナログ値を伝える技術がもしあればS/N比無限大になって
無限の情報量が記録、転送できるのも当然なんだな。
πを2進数で表すと無限のビット数が必要になるのに、それをπという1文字で
表せてしまうのだからこれは無限の圧縮率だ。
>>149
儲かりそうな銘柄を教えてくれ
>>152
アカシックレコードにアクセス・・・データ発見・・・
「取り合えず25円以下の建設株買っとけ」
>>150
たしかに110はいいこと言ってるな。
ビット列を元にDA変換して、それを近似式にして送るみたいな感じか?
>>155
しかし仮に原子のサイズまで距離を計測しても30数ビットにしかならない。
時間も掛け合わせてんじゃないの?。スーパーネトワクコントローラーで
パケット間の時間差を10-10μ秒単位で操ってるとか。
158デフォルトの名無しさん:02/01/11 20:21
量子力学使えば簡単では?
つーかハードの話じゃないだろ。

スラッシュドットで誰かが訳してたプレスリリース
http://slashdot.jp/comments.pl?sid=8218&op=&threshold=-1&commentsort=0&mode=nested&startat=&cid=53389

> 既存の圧縮技術はおおよそ数学的構造の冗長性をエンコード・マッピングしていて、
> この縮小処理を適用できるのは一回か数回きりに制限される。 ZeoSync の実質的な
> 乱数列をエンコードするアプローチは、多くの収縮処理の繰り返して既に縮小された
> 情報を縮小し、その前には到達できなかった圧縮能力を生みだすという発展が期待できる。
161デフォルトの名無しさん:02/01/11 21:00
結論:そんなものを研究する時間があるんだったら普通に圧縮しる。
>>158
ζ_____
|\    ∧ ∧\
|   | ̄ ̄ ̄ ̄ ̄|
|   |     ´ー` | < シュレーディンガーはかんべんな!
U\|_____|
      U    U
   
いったん圧縮したものを可逆的な(ランダム)ソートして、また圧縮するみたいな華しかなぁ
164デフォルトの名無しさん:02/01/11 21:10
LZWの結果ををLZXにかけるみたいな〜
165デフォルトの名無しさん:02/01/11 22:36
>>155
乱暴に言うと、それが「算術圧縮」ってやつです。IBMが特許持ってるアレ。
166デフォルトの名無しさん:02/01/11 22:38
算術圧縮はエントロピー圧縮。30年以上前の手法だね。
167デフォルトの名無しさん:02/01/11 22:40
>>166
え?漏れがどっかの解説書で読んだ「算術圧縮」って、まさに>>110みたいな方法論だったんだが。
それがエントロピー圧縮ってやつなの?
168デフォルトの名無しさん:02/01/11 22:47
>>167
エントロピー圧縮というのは情報源を漸近的にエントロピーまで圧縮できる方法。
んで、エントロピー圧縮を超える圧縮といわれるのがユニバーサル圧縮。
ユニバーサル圧縮は漸近的にエントロピーレートまで圧縮できる。
lhaとかgzipはユニバーサルね。

ちなみに、簡単にいうと
エントロピー:定常無記憶情報源の圧縮限界
エントロピーレート:情報源の圧縮限界
169デフォルトの名無しさん:02/01/11 22:47
170167:02/01/11 22:57
>>168
・・・・まいった、っていうか、付いて行けません(謝。
えと要するに、エントロピー圧縮ってのがハフマン符号化オンリーみたいな圧縮で、
LZ法みたいなのを組み合わせたのがユニバーサル圧縮、って事っすか?
171デフォルトの名無しさん:02/01/11 23:01
>>170
おっしゃる通りです。今回のはそのユニバーサルよりも凄いという話。
にわかに信じられない話だが、事実ならばZiv-Lemple以上の発見だね。
しかし2chをネタレス圧縮したらすごい圧縮率だろうな。
174デフォルトの名無しさん:02/01/11 23:33
>>172
なるほど、分かったような気もする。
175.:02/01/11 23:35
MX板でも立ってたよ、、、
捏造ファイルならぺしゃんこに圧縮できるんだが・・・
176.:02/01/11 23:37
それにしてもカオス信者はヴァカだな・・・
ロト6ぐらい当ててみせやがれ。
177 :02/01/11 23:40
そういや、算術圧縮の特許は未だ切れてないのか?
178デフォルトの名無しさん:02/01/11 23:41
算術符号の特許は多種多様に色々とられていますよ?
全部切れる事はないでしょうな。
なん算術圧縮なんてなんかもっとカッコいいネーミングは
180 :02/01/11 23:48
>178
当分、自由に使える見込み無しって事?
多種多様つーことは、やり方次第では既に切れてるのもある?
JPEGの算術圧縮版はどうなったんだろう。
181デフォルトの名無しさん:02/01/11 23:58
arithmetic coding 十分かっこいいじゃん(w

>>180
JPEG2000は圧縮アルゴリズムに適応型算術符号を組みこんだんだっけ。
特許料でも払ってんじゃない?
圧縮屋の常識として算術圧縮は特許の巣窟で、接触したくなかったら
専門に研究するか、止めるかしたほうがいいとよく聞く。
算術符号は浮動小数点計算を行うのだが、それを整数で実装した
RangeCoding(?)とかいう方法は特許はとられていない。
(開発者が特許を取るつもりがない)
JPEG2000ってウェーブレット変換使ってるかと思ってました

今あるデータに元データの100倍になるように無駄なデータをくっつけて
それを新しい規格にして、なんと1/100に圧縮可能!とか
圧縮かけると、WINのエクスプローラでみるとデータサイズが元の1/100になってるが
実は表示だけで、サイズ変わらないとか
一昔前はよくやられてたような、インチキテク使ってたりして
183デフォルトの名無しさん:02/01/12 00:33
RangeEncoderは算術圧縮とほぼ同等に圧縮できると聞いたことがあります。
>>182
JPEGが離散コサイン変換で周波数解析してから可変長符号化するように、
JPEG2000はウェーブレット変換で周波数解析してから可変長符号化か算術符号化する。
185ネタバレ注意:02/01/12 02:03
謎は全て解けた!

いいか、まずは圧縮したいファイルを用意な。OK?
じゃ、それをごみ箱へポイだ。
捨てた時の時刻をファイルのインデックスとして持っておくのを忘れるなよ。
で、解凍するときはそのファイルを捨てた時間を覚えているから、
その時間まで戻ればいいわけさ。

この圧縮技術が実用化されるまでもうちょっと時間かかるらしいけど、
たぶんドラえもんが来るのをまってるんじゃないかな。
レインマンみたいなやつがいて、全部おぼえてくれるんだなぁきっと
>>185
そのファイルをゴミ箱に捨てた時間まで戻ったあなたは、
そのファイルを残しておく必要の無い歴史のほうに分岐しています。
188名無しさん:02/01/12 06:31
>>186
ご冗談でしょう、レインマンさん。
>>188は何を圧縮したものなんだろうか.
>>189
物理学板にいってこい
191デフォルトの名無しさん:02/01/12 09:04
結局この理論って
 >>116 な話しをもっとややこしくやって煙に巻いてるだけじゃないかと思うな

1、希望するデータ列Aのビット長をNとする
2、無限にランダムに出す系列Bを用意する
3、このBにAが出現する平均ビット位置はおよそ2^Nであり
4、この位置を記録するだけでは圧縮出来る確率は1/2である
5、 1/100の長さになる確率もおよそ1/100である
6、同じようなランダム系列を100個用意する
7、すると 1-(1-1/100)^100 とおよそ9割の確率で1/100に出来る


5は、2^Nの1/100という意味で正しいけど それを使って N/100と誤読させる訳だ
192191:02/01/12 09:16
単純に >>191 じゃ騙されないだろうけどカオスとか持ち出して
ややこしくやれば 短時間の説明では見抜けない

で、実証実験と称して
 比較的短いデータ列を大量に用意させて 計算出来たものから表示する

 計算出来たものはもちろん平均1/100程度になるよね

まあ騙すつもりは無くて、こういう過程で自分らが信じ込んだってのもありそうだけど
193191:02/01/12 09:19
自分も Z変換した周波数位相図描いて
  IIRで位相フラットなフィルターが出来たなんて喜んで他人に話した後で
それは不安定領域だったりとかとかあるから まあ勘違いってあるよねって話じゃないかなと
194デフォルトの名無しさん:02/01/12 09:36
圧縮:土に埋めておく
解凍:そのポインタを使って掘り出してくる
195.:02/01/12 10:29
今あるデータに元データの100倍になるように無駄なデータをくっつけて
それを新しい規格にして、なんと1/100に圧縮可能!とか

↑それが正に今の圧縮のシステムだなぁ。

カオスとか持ち出してややこしくやれば短時間の説明では見抜けない

↑それが正にカオス理論のシステムだなぁ(藁
196ん?:02/01/12 10:34
1KBづつ素因数分解して、ハフマン圧縮じゃだめか?
197sage:02/01/12 11:38
>>196
恥ずかしい奴
198sage:02/01/12 12:17
>>197
確かに恥ずかしい奴
199名無しさん:02/01/12 13:28
>>196
似たような事考えて、「俺って天才じゃん、特許取ったら大金持ちだ!」
とか悦に入ってた、鬱。
200デフォルトの名無しさん:02/01/12 13:32
データの圧縮なんかで特許って取れるの?
元にした数学の理論があるなら、その人への著作権(?)侵害は?
201名無しさん:02/01/12 13:33
>>200
少なくとも、ユニシスのGIFは特許が取れてる。
202デフォルトの名無しさん:02/01/12 13:44
>>184
>JPEG2000はウェーブレット変換で周波数解析してから可変長符号化か算術符号化する。
JPEG2000はウェーブレット変換でサブバンド分割して、ビットプレーン分解、算術符号化する。
圧縮がかなり手間取っても、
解凍さえ高速なら商用利用としての価値はあるでしょ。
カオスですか?(プププ
風が吹いたら桶屋の株でも買っとけ
>>201
CompuserveのGIF
UnisysのLZW
206デフォルトの名無しさん:02/01/12 15:05
解凍ソフトにバカでっかい辞書があろうとなんであろうと、
実際に回線に流れるデータ量が現状の100分の1になる技術
であればそれがどんなタコいものであっても歓迎だな。

件の記事を眺める限り、そういう着眼の元開発されてるしな
>>206
その辞書つきの解凍ソフトをどう配布するかが問題になるな。
208名無しさん:02/01/13 07:13
>>207
辞書を計算で生成する。
209デフォルトの名無しさん:02/01/13 07:45
>>208
ネタ?でも、本人はマジなんだろうなぁ・・・。
>>209
案外ネタとも言い切れないな。
辞書生成の一環でフラクタルだかの計算をインストール時に行うとか。
なんにせよ>>206には同意
>>200
圧縮関連は、そこらじゅう特許だらけですが何か?
212デフォルトの名無しさん:02/01/13 08:51
特許、処理速度とか辞書が大きすぎるとかそんなことは置いといて
理論的に1/100可逆圧縮が出来るかどうかが重要です。
出来る前から特許とか考えるのは捕らぬ狸の皮算用です。あふぉ
>>209
ん?俺も今回の記事は、任意の辞書を計算で作れるようになりましたよ
と解釈したんだが…
214デフォルトの名無しさん:02/01/13 13:38
最高1/100だろ。普通は1/10ぐらいで精一杯だと思われ
215デフォルトの名無しさん:02/01/13 13:42
>>214

最高1/100ならたいしたことないね。
10億バイトのファイル(中身は'0'の羅列)をLHA圧縮したら1KB程度になったよ。
216デフォルトの名無しさん:02/01/13 13:42
カオスってなにですか?
217デフォルトの名無しさん:02/01/13 13:42
>>216

混沌
218デフォルトの名無しさん:02/01/13 14:04
>>215
アフォ
219名無しさん:02/01/13 14:19
>>213
ローカルディスクに静的に辞書を持つと仮定して、
辞書参照用のインデックス情報を、圧縮される情報本体
よりも小さくできるという理屈が分からん。
>>219
高次元のマトリクスで管理すれば可能かと
221デフォルトの名無しさん:02/01/13 15:53
超高精度乱数の中から一致するデータ列とその長さを記憶していくって感じなの?
乱数の周期が2^128位あればなんとかなるのかなー。乱数なら辞書はいらんし。
どちらにしろエンコードには莫大な時間が掛かるんでしょうね。

それにしても2003年実用化予定って言うのがすごいなー。これで2chも救われますね。
>>221
ひろゆき氏がライセンス料を支払えるかが問題かも。
223名無しさん:02/01/13 16:10
>>221
長さがnのビットデータ列に一致する乱数列が出現する確率は、

(1/2)^n

その乱数列をインデックスするために必要なビット数が

2^n

になるので結局無理。
224デフォルトの名無しさん:02/01/13 16:28
無料で有料のエロ画像が見たい人はここへどうぞ↓

■ 宣伝カキコ業者の画像や動画をばらまくスレ ■
http://wow.bbspink.com/test/read.cgi/ascii/1010151403/
225デフォルトの名無しさん:02/01/13 16:36
>>214
平均値らしいよ。数百分の1の圧縮率を実現するってあるし。

なんにせよ、無理無理言ってるのもなんか夢が無いし
もうちっとくらい期待してもいいんじゃない?
これが失敗したってここにいる誰も損するわけじゃないしさ
>>225
アフォ発見!
なさけない・・・。
門外漢の投資家が騙されるのならともかく、現役プログラマーが
騙されてドウスル?
なんだかんだいって、実際1/100になりゃ便利だからな。
万が一にでも完成することがあれば、それはそれでいいじゃないか。
>>215
お前はアフォですか?
そんなデータなんてランレングス圧縮したら数バイトになりますよ。
230名無しさん:02/01/13 17:15
>>229
煽りに反応するのカコ悪い。
>230
そうだね、俺なんかと違って君はかっこいいよ。畜生みんなしんじまえ!
232229:02/01/13 17:35
一応言っておくが、私は>>231じゃないぞ。
233230:02/01/13 17:40
>>229
分かってるよ、ハニー。
234デフォルトの名無しさん:02/01/13 17:46
なんで、画像とか音声とかをデジタルデータで持とうとするんだろ。
0,1じゃなくてアナログ値を保持するメモリがあるんだから
それを使えばいいのにね。
235名無しさん:02/01/13 17:47
>>234
どんなメモリよ、レコードとか?
236229:02/01/13 17:48
>>233
一応言っておくが、私は男だぞ。
237230:02/01/13 17:50
>>236
男でも(・∀・)イイ!
>>236
分かってるよ、ベイビー
239デフォルトの名無しさん:02/01/13 17:52
脳の解析してみよう
240229:02/01/13 17:54
>>237
何が(・∀・)イイ!んだ?
241230:02/01/13 17:57
>>240
穴さえついてれば、それで(・∀・)イイ!
242素子タンハァハァ:02/01/13 18:10
>>235
アナログメモリ素子
http://203.138.80.65/nttpat/2876150.htm
いくら1/100と言っても100バイトのランダムデータが1バイトに圧縮できない
のは当然で、一方規則的なデータなら現在の圧縮方式でも1/100以上に圧縮で
きる場合がある。結局1/100に圧縮できる条件が何なのかわからないとすごい
のか大したことないのかもわからんね。
>>234
アナログデータは経年変化があるのと伝送が面倒だからね。
初心者を騙せそうな圧縮ソフトを考えた

「圧縮」を押すと、ショートカットにゴミをつけたファイルを作成
ファイルはどっかのフォルダの深い階層下に名前変えて置く

「このファイルは特殊なフォーマットで圧縮されておりますので
 開くときはかならず専用のソフトをお使いください」

(゚д゚)
246名無しさん:02/01/13 19:06
>>245
CompJapanよりかはレベル高い。
初心者を騙せそうな圧縮ソフトを考えた

「圧縮」を押すと、ショートカットにゴミをつけたファイルを作成
ファイルはどっかのレジストリの深い階層下に名前変えて置く

「このファイルは特殊なフォーマットで圧縮されておりますので
 開くときはかならず専用のソフトをお使いください」

(゚д゚)

(゚д゚) ポカーン
249245:02/01/13 19:20
>>246
桂正明様を目指していますよろしくおねがいします
250デフォルトの名無しさん:02/01/13 21:59
HOAX! HOAX! HOAX!

I emailed a professor that's listed on ZeoSync's website, and his reply was:

"Yes, I'm aware of their fraudulent use of my name.
I have no connection with this company whatsoever."
>>250
マジ?
252超訳:02/01/13 22:38
>>250
すげー!すげー!すげー!

ZeoSync教授にメールして回答を得ました。

「その通りです。私は恐るべき性能を持つものを作り出してしまいました。」
「私はこの技術を通して会社に莫大な利益をもたらす事が可能でしょう。」
253劇薬:02/01/13 22:50
インチキにきまってるだろ!!!

この会社のWebに載ってる教授に聞いたらよぉ、

「たりめーだろ、やつら俺の名前をかたってんだYO!
こんな糞会社とは髪の毛一本の関係もねーぜゴルァ!!」
しかし
HOAX
が題名みたいなものか、以降の文章が悪ふざけなのか。。

それが問題だ
詐欺っぽいにおいがするね
256デフォルトの名無しさん:02/01/14 02:38
256get
出資金集めてドロンだろ。
Smale said in an e-mail to the IDG News Service that he had only spent "one hour" on
the project and was "in no position to say anything about these claims."
259デフォルトの名無しさん:02/01/14 04:01
Lzipって、ネタですか? それともマジですか?
http://lzip.sourceforge.net/
>>247
それ、昔 DOS 用のアプリであったぞ。
>>259
Date:April 1, 2000
---終了---
262デフォルトの名無しさん:02/01/14 04:16
core dump したときに core 取って行ってデバッグしようと思って
gzip に掛けたら 1/100 ぐらいになったよ。(w
なんか、「俺こんだけ圧縮できたぜ!」ってのを自慢すれば偉いと思っているバカが多発している模様
264名無しさん:02/01/14 05:13
>>263
そんな連中は圧縮の基本から勉強し直して来い。
265デフォルトの名無しさん:02/01/14 07:38
1.ティムポ
2.マムコ

1
圧縮の基本♪
266名無しさん:02/01/14 07:54
>>265
ティムポは圧縮展開できてもマソコは無理だろ。
267デフォルトの名無しさん:02/01/14 08:57
解凍したくなくても、されちゃったら嫌だな。
ティムポ冷凍されたら、もっとイヤ。
>>268
半永久保存できるから悪くないかも。
IDG の記事の翻訳。
原文は http://www.idg.net/crd_idgsearch_0.html?url=http%3A%2F%2Fwww%2Epcworld%2Ecom%2Fnews%2Farticle%2F0%2Caid%2C79223%2C00%2Easp&sc=

■専門家が疑う圧縮技術のブレークスルー

ZeoSync は彼らの技術によってオリジナルのデータを 1/100 以下にすることができると
主張しているが、それを信じるものは誰もいない。


Sam Costello, IDG News Service
Friday, January 11, 2002

月曜日、ZeoSync は、繰り返し可能で、可逆的な、1/100 のファイル圧縮を達成した―こ
れはこの五十年間、数学者やコンピュータ科学者の間で不可能だと言われてきたものだ。

もし実際に機能するならば、ZeoSync のシステムはファイルを何度でも圧縮可能で、オリ
ジナルの 1/100 にまで小さくすることができ、しかもデータは全く失われない。データ
の損失は、現在用いられている多くの圧縮法においては避けることのできないものだ。

この発表の後、博士号取得者やアナリストたちは―しばしば強硬なほどに―ZeoSync は間
違っている、と述べている。しかし、ZeoSync は、製品やデモンストレーションの形で、
この証拠が近々露になるだろうと約束している。

この件に関わっているアナリストによれば、もし ZeoSync が正しく、彼らがこのブレー
クスルーを達成したのならば、コミュニケーションやストレージ分野における革命は間近
い。このような圧縮技法があれば、ビデオ・オンデマンドやその他のブロードバンド向け
アプリケーションが、ブロードバンド回線を必要とせず、通常のアナログ回線モデムの上
に実現可能になる―Aberdeen Group のリサーチ会社でストレージおよびストレージ管理
部門のリサーチディレクターを務める David Hill はこのように述べている。
●本当と言うには凄すぎる?

だが、圧縮技術の分野で長年の経験をつんできた研究者たちは、いかにもといった具合の
「本当と言うには凄すぎる」発展が、この分野には幾つも現れ、そして失敗の内に消え去
った、と言う。

ZeoSync の技術が正確にはどのように働くのか、その詳細は闇に包まれている。今回の「
ブレークスルー」を報じたプレスリリースの中で、このフロリダはウェストパームビーチ
にある会社は、次のような複雑な説明をしている「(この技術は)自然に現れるパターンを、
エントロピーライクなランダム列へと意図的に乱雑化する。そして、各々のビットの変動
による文字列を、結果的に大幅に小さなサイズの・・・そしてもちろん等価な、ある種の
系列の複雑な組み合わせに変換する。」この技術はチップにエンコーダやデコーダの形で
実装されるだろう、と ZeoSync は述べている。

一体上記のような説明が何を意味しているのか、素人にもわかるような、説明を求めると、
ZeoSync の CEO である Peter St. George は次のような、間違いなく素人を困惑させく
れる説明をしてくれた。ZeoSync の技術は、データファイルを入力としてとり、そこから
「多次元構造体を作り出す」。


Radical Systems でアーカンソー支社のディレクターを勤める Jim Dyer ―氏はこの件で
テストと開発の両方に参加している―は次のように説明する―データ中の冗長性を取り除
くように作用する伝統的な圧縮法とは異なり、ZeoSync の技術はデータパケットを全体ま
るごとで取り扱い、何度でも圧縮できるようにする。標準的な圧縮法では一回しか圧縮は
行なえない。Radical Systems は ZeoSync の下請けとして二年半に渡りこのプロジェク
トに携わっていると彼は言う。
●見えない詳細

ZeoSync は何人ものアナリストにこの技術についての説明を行なっているが、アナリスト
がその主張に納得できるにたるだけの十分な詳細を明かしていない―Aberdeen Group の
Hill は言う。Hill は先週、説明を受けた。「技術の実現可能性を判断できるほどにはこ
の技術について十分に知ることができなかった」と彼は言っている。と言うのも、ZeoSyn
c は実際に稼動するデモを示さなかったからだ。

ZeoSync がより多くを示さないことについて後ろ暗いものがあるのではないかという見方
を示すアナリストもいる。Forrester Research でシニアアナリストを務める Eric Schei
rer は火曜日に説明を受けた。「とにかく薄っぺらなごまかしのすぐ下に、彼らのもって
いる全てが隠されている」と彼は言う。彼がより詳細な情報を求めると、彼らの言い回し
は曖昧になったとも言う。彼らは、詳細の多くは企業秘密であって明らかにすることがで
きないと述べた、とも彼は言う。

ZeoSync に言葉を投げかけるのは「同じところを何度もぐるぐる回るようなものだった」
と彼は言う。

「彼らが言っているような成果を実現することは絶対にありえない」と Scheirer は言う。
彼は音声圧縮の研究で MIT から博士号を取得しており、同僚のレビューを受けたこの分
野についての論文を1ダース以上世に送り出している。「これは全くの不可能事だ。」
●木を見て森を見ず

しかし、ZeoSync の St. George はこうした懐疑論者を前にして、彼らは間違っている、
と言う。St. George は十二年間―その内の二年以上は ZeoSync でのものだ―この研究を
続けてきており、ZeoSync が実現したと言うところの技術は可能だと言う。「何故なら、
皆が住み着いている箱から外へと我々を連れ出してくれるようなアプローチを我々は採用
したからだ。」

「人は自分たちを制約によって定義づけたがる。」彼は言う。「人は自分たちを小さな水
槽の中に自分たちを閉じ込めたがるが、我々は大きな魚だ。」

St. George は確かに伝統的な数学者の箱の外にいる。彼はシラキュース大学とユタ大学
に3年ずつ在籍したと言うが、どのような学位ももっていない。彼の言うによれば、こと
数学に関して言えば全くの独学だという。
●証拠が必要だ

Aberdeen Group の Hill のように、懐疑的ではあるが ZeoSync の主張を頭から否定して
はいない人々は、周囲を静めるべくより多くの証拠を提示するよう ZeoSync に促してい
る(彼らの主張を裏付けるより踏み込んだ証拠の提示について、我々 IDG News Service
の要求についても彼らは同様にこれを拒否した)。ZeoSync は他の数学者にデータを開示
しテストを指導してもらうべきだろう、また、ZeoSync はこの技術についてのより公のデ
モンストレーションを行なうべきだ、と Hill は言う。

デモンストレーションさえ行なわれれば「この技術は大変に有益なものになるだろう」と
彼は言う。ZeoSync はまだ何もデモを行なっていないが、「きっと近々発表があるだろう」
とも Hill は付け加えた。

「もし貴方がこんな風に重大な何かのブレークスルーを主張するのなら、世間はそれを懐
疑の目で見る必要がある」が、その何かが実際に有効であり、一度その筋の権威に認めら
れさえすれば、そうした懐疑は一蹴される。彼は言う。

St. George はこうした提案にも取り合わない。

「もし我々が椅子に座って、科学誌への投稿やホワイトペーパー以外のものを公にしなけ
れば、世界中の人々の手元にこの技術の齎す素晴らしい価値を届けることはできない」と
彼は言う。

「誰もがそれは動かないと言っていても、動くと言ってくれる声が十もある」とも彼は言う。
技術の発表以後、幾つもの祝福のメールを受け取ったのだと彼は付け加えた。
●現状への満足

科学者や研究者は彼の主張を無視していると St. George は言う。「彼らはこういう現状
に(満足することで)既得権益を手にしているからだ・・・彼らのライフワークというのも
こうした事物に繋がっている」。St. George は ZeoSync についても触れ、来週にはこの
技術の公なデモンストレーションが発表されるだろうと述べた。

「彼らの主張が真実ならば私はそれを気に入るだろうが、彼らの主張は真実ではないし、
それが真実になるどのような道理もない」。Forrester Research の Scheirer は言う。

彼らの主張の背後にある証左として、St. George と ZeoSync は、世界中の大学―ハーバ
ード大学、MIT、スタンフォード大学、カリフォルニア大学バークレー校など―の幾人も
の有数の数学者たちとの関係を喧伝している。しかし、名前の挙げられた幾人かの数学者
は、この件について冷めた態度をとっている。

アーカンソー工科大学の電子工学科助教授を務める John Post は、ZeoSync のこのプロ
ジェクトに参加している科学者として喧伝された中の一人だが、IDG News Service への
e-mail の中で次のように述べている。「この技術について私が何か知恵を出したという
ような事実はないし、当然ながら ZeoSync に代わって個人的に何かを述べることも全く
できない。」

しかし Post は、ある種のデータについては ZeoSync の主張は成り立ちうるかもしれな
い、とも譲歩している。Post は、彼がいう所の「小さな役割」のコンサルタントして 20
01 年 12 月から働いていると述べている。
●去り行く人々

カリフォルニア大学バークレー校で教授を務め、受賞暦もある研究者である Steve Smale
もまた、ZeoSync のこのプロジェクトに関わりのある一員として名前を挙げられている。
Smale は IDG News Service へのメールの中で、僅かに「一時間」しかこのプロジェクト
に時間を割いたことはなく、「彼らの主張について何かを述べることはできない」と言っ
ている。

他に ZeoSync によって関係者として名前を挙げられた研究者の一人、ポーランドの数学
者である Wlodzimierz Holsztynski は、ZeoSync からの発表の後に、彼の名前が ZeoSync
の発表文の上で使われたことについて、ポーランドのニュースグループ pl.sci.matematy
ka にメッセージを投稿している。彼は ZeoSync に対して彼らのいかなる広報資料中にも
彼の名前を含めないように求めた。「(ZeoSync)のページに掲載されたそれよりも重大な
業績が私にはある。」

Holsztynski のメッセージについて尋ねると、St. George は、ZeoSync は既に Holsztynski
の求めに応じて彼の経歴を ZeoSync のWebサイト上から取り除いたが、彼はコンサルタン
トとして雇われているの、だと答えた。彼はまた、この3人の科学者らの理論が ZeoSync
の主張を確証する要だというわけではないとも述べた。

「彼らは我々の主張の根幹に関わっているわけではな」く、むしろごく控えめな役割しか
果たしていない、とSt. George は言う。「この技術の全域に渡って働いている科学者は
ごく限られた数でしかない。」

「これは極めて重大な発表であり、いずれ大きな役割を果たす」もので、今意欲的に取り
組んでいるところなのだと彼は言う。

Forrester Research の Scheirer は、ZeoSync は実験結果を誤解しているかあるいはせ
いぜい非常に限定された条件下でのみ有効なテクニックを作り出したのに過ぎないと述べ
ている。圧縮技術の世界における幾つもの「ブレークスルー」はこれまでにも発表されて
きたが、「常に、ものになることはなかった」。
●強力な支持者たち

しかし、この技術に確信を抱いた人々は、今でもその確信を保っている。Radical Systems
の Dyer は懐疑論者に惑うこともない―彼はこのプロジェクトに参加しており、実際にシ
ステムが動作するところを見たと主張している。Dyer は St. George が非標準的なアプ
ローチを取っていることを認めている。そして、他の人々がそれは不可能ごとだと言おう
とも、この場合には上手く行くのだと信じている。

この2、3年の間の計算機の能力の向上が、このブレークスルーにおいては可能な限りの
役割を果たしているとも Dyer は述べている。

彼は言う。量子コンピューティングのような、他の分野での進んだコンピュータの応用と
同様に、「現在の計算機の馬力がなければ、我々はこのような方法をテストすることすら
できなかった」。

同様に、ZeoSync の St. George も楽観的でいる。ZeoSync は既にこの技術についてハリ
ウッドのスタジオやチップ会社との間で話し合いを進めており、約六ヶ月以内には何らか
の発表にいたるだろうと彼は述べている。彼はまた、近い将来のWeb上での技術デモンス
トレーションについても約束した。

「我々は(公にされた証拠の欠如が)問題なのだと理解している。我々はこれを隠すつもり
でいるわけではない」と彼は言う。「一度技術がデモンストレートされればこの技術は自
立するし、その上で人々が何を言おうとも自由だ。」

「私はグローバルな世界へと突き進むことに怯みなどしない」と彼は言う。「懐疑論者が
真実を目の当たりにするのも時間の問題にすぎない」。

もし全てが計画通りに進んだならば、2,3週間の内には、たとえ飛び出してくるものが
なんであれ、懐疑論者は確かに何かを目にすることになるだろう。


Olo Sawa, of Computerworld Polska, contributed to this report.
278名無し:02/01/14 23:27
長っ。お疲れ様です。
age
お疲れ
ひょえー、長文翻訳お疲れさんです。

なにやら、かなり眉唾の雰囲気ですな。
しかし半年後にはデモがあるそうだからそれ待ちですか。
やっぱ、実際に圧縮、解凍してもらわないとね。完全なランダムデータを。
とりあえず、WINDOWS95のCD辺りを圧縮してもらうということで。
もしくは、リリースされている何かのセットアップキットかな。
St. George also ... said that a public demonstration of the technology would be announced next week.

とあるので、うまく行けば今週中には何か発表がある模様。
どうやら、記者や読み手の誤解じゃなくて、ホントに電波らしいな。
常温核融合の再来か?
ZeoSync のページ読んでみたが英語が分からん・・・。
少なくとも圧縮に相当の計算量を要することは確からしい。
現状で小さなデータしか扱っていないのは計算時間が掛かるから、だそうだ。
世界には2chを超える電波(詐欺?)がいるんですなぁ
287デフォルトの名無しさん:02/01/15 02:24
単に記憶媒体の圧縮だったら笑えるし有り得る・・・のか?
パターン繰り返し、対称性、云々・・・
288sage:02/01/15 02:27
あげんなボケ!
289デフォルトの名無しさん:02/01/15 03:10
まあ、真のボケはおいといて。
>>283
Web上での技術デモンストレーションだろ(w
もう大体カラクリが想像できるね。
技術ってのは夢の具現化
夢を見るのはイカレポンチ
イカレがいるから技術は進歩するもんだ・・・と思っても

なんだかなあ
292デフォルトの名無しさん:02/01/15 05:56
シャノンの「定理」とは言っても、人間の擁する科学はすべてが仮説…。
かつてニュートン物理学は数百年もの間 信じられ続けていたが、亜光速
という条件下では必ずしもそうではないことをアインシュタインは示した。
つまり、この話題になっている圧縮技術も、ある特殊な条件下でシャノン
定理が破綻することを示すものなのかもしれない。
近代において、人類は亜光速の世界を思い描くことは出来なかった。だから
アインシュタインの論文は、当時「世界で理解できるのは数人」などと
言われた。
同じように、今の我々には到底思い描く事すら出来ない条件下で、シャノン
の定理が破れていて、それが情報圧縮という用途に使えるのではなかろうか。
もちろん、資金調達のための詐欺という可能性も小さくないが…。
もし漏れが言っているような事が実際に起こるのだとしたら、我々は今と
いう時代に生きていることに感謝すべきだ。我々は、目撃者となるだろう。
少なくとも、結果を待つ価値はありそうだと思う。
>>292
でも、未だにニュートンの法則が幅を利かせているように、実用にならないほど遠い世界の話になる可能性も。
294 :02/01/15 06:10
誰かが永久機関とか無燃料発電とかを発表したら、その技術を調べて
検討する必要は無い。エネルギー保存則を知っているからだ。
それと同じ。
この「圧縮技術」の報道を知って、その詳細など検討する必要も無く
不可能と判るようでないとしょうがない。
295 :02/01/15 06:15
>>292
しょうもない奴。
>>292
かつて数学的に証明され、「定理」と称されたものがひっくり返った例は
無いと思うが。
天動説と地動説みたいに
その時は「絶対にありえない」とされてきたことをひっくり返す

量子力学なんかは面白いよ。
100分の1でなくて、mp3を2分の1に圧縮できるとしたらどうよ?
実現可能性はあるような気がする。
>298
対称性が見つかればね、波形だし・・・=wma?
不可逆ならなんでもありよしだろうけどね
昔やったよそれ。
順序間違えたら対称性が消えてボン
mp3一箇所はさいていしくじってたけど最近のはどーなのやら。
>>292
>シャノンの「定理」とは言っても、人間の擁する科学はすべてが仮説…。
ここまで恥ずかしいことをさらっと言ってのけるのは、、、ネタ?
292晒しage
ZeoSync の詐欺が失敗しそうな方向に進んでいる中、
St. George は次にどんな行動にでるのでしょうかね?
MP3といっても、定速記録だと、音楽によってはさらに圧縮可能

とりあえず実証実験としてはMSDNのCDROMを1枚にしてみせてくれればOK
>>304
MSDN、毎回桁違いの枚数のCD送ってこられて鬱
最近DVDになったけどそれでも多いぞ。
いやいや。やはり100枚のCD-ROMを1枚に納めてくれなければ。
Wired NewsがこのZeoSyncの発表を取り上げていないのは実に不可解だ。
http://www.hotwired.co.jp/news/
308デフォルトの名無しさん:02/01/15 15:08
高次元のなんとかって前のほうで誰かが言ってたような
関係ないけど、mp3って音楽だから
基本的に Aメロ Bメロ A B Cさび A-B-C
てな感じでループするよね。
このループがあるのを前提にすれば2分の1くらいにはなりそうな気が。
>>307
不可解っちゅーか、適切な対応だと思うのS。
>>309
スライド辞書をでかくして
マッチングでちょいと気の利いたことさせることができれば
可能かもね。
音楽専用になるだろうけど。
次世代音声圧縮フォーマットとして特許取れ>>309 いや、もう誰かとってるか?
>>311
いや、こんなアイデア絶対に他の誰かがもう考えてるでしょ。
でてこない、つーことは1分おきの繰り返しとかの圧縮が困難なのか
微妙にデータが違うので厄介なのか・・・。
313デフォルトの名無しさん:02/01/15 15:33
やっぱりハッタリであったか・・・
>>273

ユタ大と言えばまさに常温核融合の震源地だな。
あそこは「擬似科学」学科でも有るんじゃないか?(w
まあしかし、
プログラムの勉強してる板でも、
 こんな基本レベルのヨタ話しがヨタと見抜けない奴がゴロゴロいるって事が判っただけでも勉強になった
317Riva ◆RivaByXA :02/01/15 16:30
>>313
ちょっと期待してたんだけど、残念。。
318デフォルトの名無しさん:02/01/15 16:41
宣伝の使った人物が嘘ってだけで
技術自体が嘘とは断定できない
319デフォルトの名無しさん:02/01/15 16:43
1/100とかじゃなくて、2/3とか3/4辺りにしておけばもっと皆信じただろうに
>>316
 いや、かなりデマっぽいとは思っても、高名な数学者の名前
だされちゃうとね・・・・。
>>316
君もこのスレのごく初期の段階で言っておけばね。
しっかり理由もつけて。
ここまで話が進んでから言うのはveryカコワルイ
322316:02/01/15 17:18
俺は59だと一応言ってみる
59カコワルイ
324困ります、名無しさん :02/01/15 17:37
そうか、嘘だったのか。
それなら、俺が開発中の1/10圧縮でも金になりそうだ。
>>324
1/10圧縮はやっぱりデマだったのか。
それなら俺が完成させた完全乱数の1/3圧縮で特許が取れるな。
326Disca ◆NAfP6znE :02/01/15 18:14
1/100 の圧縮は簡単と思われ。

キーとデータを入れ替えれば出来る。
なんて簡単なのだろう。
327Riva ◆RivaByXA :02/01/15 18:19
>>324-326
ちょっとワラタ。(w
328St. George:02/01/15 18:19
>>326
Web no Demo no neta wo barasuna!
俺、どんなデータでも30/1のサイズにできるソフト開発してるんだけど。
330困ります、名無しさん :02/01/15 18:48
>>329
シェアウェアで\1000くらいで売ると良いよ。
>>329
ウィルスを添付した結果ですか?
332 :02/01/15 19:35
http://www.watch.impress.co.jp/internet/www/article/2002/0115/zeosync.htm

    Λ_Λ!   / ̄ ̄ ̄ ̄ ̄ ̄ ̄
__( ;´Д`)__< ネ、ネタかっ…!
|  〃( つ つ   |  \_______
|\ ⌒⌒⌒⌒⌒⌒\
|  \           \
\  |⌒⌒⌒⌒⌒⌒|
  \ |______|
詐欺房が。いてまうぞ、カス。
      ∧_∧          _ _     .'  , .. .∧_∧
     ( ´_ゝ`)   _ .- ― .= ̄  ̄`:, .∴ '     ( >>St. George
    /     '' ̄      __――=', ・,‘ r⌒> _/ /
   / /\   / ̄\-―  ̄ ̄   ̄"'" .   ’ | y'⌒  ⌒i
 _| ̄ ̄ \ /  ヽ \_              |  /  ノ |
 \ ̄ ̄ ̄ ̄ ̄ ̄ \__)              , ー'  /´ヾ_ノ
  ||\            \          / ,  ノ
  ||\|| ̄ ̄ ̄ ̄ ̄ ̄ ̄|| ̄          / / /
  ||  || ̄ ̄ ̄ ̄ ̄ ̄ ̄||          / / ,'
  ||  ||           ||       /  /|  |
                       !、_/ /
334 :02/01/15 19:58
こんなのに引っかかる奴いるんだな
リキッ*ジャパ* とかモナー
335デフォルトの名無しさん:02/01/15 20:23
どんなデモを見せてくれるのかと、楽しみにしてたのに・・・・・
デモ大成功→ワショーイ祭り開催→後日トリック(ペテン)が判明→別の意味で祭り開催
→関係者行方不明→ニュー速板で祭り開催→タイーホ→2chが落ちるほどの大祭り
あ〜、魅惑のイベント三昧(藁
336デフォルトの名無しさん:02/01/15 20:33
>>335
2002年のパーソン・オブ・ザ・イヤーはSt. George
に決定だね!
「わくわくするような仕事はまだたくさんある」(St.George氏)
>>337
どうせ全部詐欺。
339 :02/01/15 21:01
  ハハハ
  ∧_∧  / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ( ^∀^)<  あほか もう少しマシな嘘ついてみろ
 ( つ ⊂ ) \_________
  .)  ) )
 (__)_)     (^∀^)ゲラゲラ
>>337
俺は期待してるぜ、お前はやってくれる男さ、ジョージ。
341デフォルトの名無しさん:02/01/15 21:07
1の言ってるシャノンの定理って
平均符号長が・・・ってやつじゃないよね?
>>341
それでしょ?
符号化限界の話。エントロピーがどうとかこうとかいうやつ。
343デフォルトの名無しさん:02/01/15 21:14
たまには、明らかに直感に反した法則が見いだされることもあるよ。

球を4つに分割して、再び組み合わせると元の球と同じものが2つ出来るとか。
344デフォルトの名無しさん:02/01/15 21:17
>>343 ナニそれ?想像もつかんな
線で面が埋められるとか

2つの封筒に片方に倍の金額入ってる 一方を開けた後に 好きな方を選択したらと同じで

無限を相手にしたら何でもありって話しじゃないの?
>>345
コンピュータでは無限は扱えないからね。

>>343
本当に想像つかない。教えて。
数学的に証明された定理です。
立体を分割して組み合わせると体積が増える。<バナッハ・タルスキーの定理
>>345
そーそー。選択公理がからんでくる奴ですね。
>>345
ごめん、チョット違うかも。いま。酔ってるもんで。
封筒の話は聞いたことないや。
このスレの主題と同じようにだんだん怪しい話に(w
ニュース速報板の方のスレはどこへ逝った?
>>347
検索かけてみたけど、本になってるんですね。
見かけたら読んでみることにします。
>>347
ホントですか!?
四角い粘土を4分割してくっつけても同じような気がするけど・・・
そうするとパズルは組み立てると2つ出来上がってお徳とか?
理解不能
4つに分割って言っても、一定の法則に基づいて、
木っ端微塵な4つのグループに分割するってことなんで、
現実では実現することはできないね。

ちなみに、「面積」ではこうはならない。
やっぱ、質量半分の2つの球になるんだろうか…
円筒表面を高速に拡張・収縮した場合に
円筒の体積が増大することが実験で簡単に確認できますよ。
解説してるページがあった。
ttp://www1.gakugei-hs.setagaya.tokyo.jp/~g47g10/index13.html

うーんわからん。
つーか、これ高校生のページなんだな。鬱になった。
358デフォルトの名無しさん:02/01/16 02:53
>>357
大学生じゃないのか?
タルスキの定理/パラドックは「構成」不可能な定理なので
現実世界とは無縁です。以上。

...
自然数全体を考えると、偶数の個数 = 自然数の個数。
同様に奇数の個数 = 自然数の個数。
さらに偶数の個数 + 奇数の個数 = 自然数の個数。

「偶数の個数 = 自然数の個数」の直感的証明は、
2 <-> 1
4 <-> 2
6 <-> 3
とどんな偶数に対しても対応する自然数があることから、偶数の個数と
自然数の個数は同じだけ有る。

....
こういった、無限大を混ぜると、人間の直感とは異なる結果が生じるということを
物体の体積に対して考えたのが「バナッハ-タルスキのパラドックス」

繰り返すが現実の物質は無限に分割できないから、適用することはできない。
360ドキュソ:02/01/16 03:19
>359
理屈ではわかっていても
偶数の個数 = 自然数の個数 / 2 だ!
とか思いたくなる。
∞の個数=∞
∞/2=∞
みたいなもんじゃないの。たぶん。
でも具体的には∞/2であってるはず。
>>359
説明さんくす。
分かったような分からんような。
理論上の物体なら1個から100個でも1000個でも作れる、てな感じなのか。
>318
まあ、それはそうだけど、
やっぱ技術自体が嘘だから
他人の名前を勝手に使い、信憑性を高めようとするんだろうな。

実際に開発出来たなら、むしろ自分の名前だけ載せたいよ。
364仕様書無しさん:02/01/16 03:45
自然発生パターンを意図的に作り出して,
エントロピーライクなランダムシーケンスを形成する
なんかカッコいいなこれから使ってみるか。
大学の小論文に使います。
バナッハタルスキーのパラドックスはね、
一旦体積と言う測度で測れないようにバラバラにした後で
組み合わせるから体積が変わるんだよ。
368ゼノン:02/01/16 10:33
パラドクスはパラドクスといふことか・・・
369クルト:02/01/16 21:58
我々の世界の範囲内では、解決できない矛盾が、存在するのだよ・…
箒ング博士、
虚数の時間ってどこにあるんだべ?
>>367
それって
http://www1.gakugei-hs.setagaya.tokyo.jp/~g47g10/jiken.html
とかと同じでネタなんでないの?
372わけない:02/01/17 06:30
展開させずに圧縮したコードの状態で動作させるよう
373デフォルトの名無しさん:02/01/17 06:35
>>359は「個数」じゃなくて「濃度」だよね。
無限集合の要素の個数はやはり定義できないまま。
374デフォルトの名無しさん:02/01/17 09:55
あー残念。
できたら圧縮したかったのに・・・
375度窮鼠:02/01/17 14:30
>偶数に対しても対応する自然数があることから、偶数の個数と
>自然数の個数は同じだけ有る。

理屈でもサパーリわからない(;
全ての偶数に対して対応する自然数があっても、
全ての自然数に対応する偶数が無い以上、
偶数の個数 < 自然数の個数
にしかならないような気しかせず…
偶数の集合の濃度(個数) <= 整数全体の濃度
はいいよね。
つぎに、偶数の集合の任意の要素 `2n' は
整数の集合の中の `n' に対応づけることができるよね。
つまり、偶数の集合の濃度 => 整数全体の濃度 が言えるよね。

二つの不等式を合わせたら、偶数の集合の濃度 = 整数全体の濃度
377 :02/01/17 15:24
>>375
全ての自然数に対応する偶数はあるよ。
対応する偶数=任意の自然数x2


無数個のものに対して、一般的な個数の概念をあてはめるから混乱するんだよ。
ここでの個数は、無限集合を扱えるように拡張された個数の概念
だと考えるといい。
379度窮鼠:02/01/17 15:58
>>376-377
ども
分かったような分からなかったような…

上にあった
∞/2=∞
ということでなんとなく分かった振りでもしておきます。
ダレダムゲンダイナンテカンガエタヤツハ.
個数の概念を無限の場合に拡張した,濃度という概念は,非常に直感に反します.
n ∈ Z に対して,
f(n) = 2n
と決めてやることで, Z と 2Z (整数全体の集合と2の倍数全体の集合)を
"同じもの" とみなすことができます.
この考え方に基づけば,整数の濃度と有理数の濃度も同じになります.
でも,実数の濃度はこれらとは別で,無限にも種類があるわけです.
381デフォルトの名無しさん:02/01/17 16:26
その話題がこのスレの本題とどう関係あるのかよくわからないんだが…
タルスキが悪い
>381
では、「圧縮」と似てなくもないようなネタを…

掛谷の問題:
平面に置かれた長さ1の針を一回転させるのに必要な面積は?
http://cheese.2ch.net/test/read.cgi/math/1009632359/
384デフォルトの名無しさん:02/01/17 20:01
「ランダムなデータの「完全な圧縮」をうたう新技術は本物か」
http://www.hotwired.co.jp/news/news/technology/story/20020117303.html

セント・ジョージ氏、人生を捧げたプロジェクトを語る。
>>384
今現在は限定したファイルしか圧縮できないってことか?
しかも、数百バイトの圧縮なんて・・・
どうでもいい話になってきたな。
>>383
387デフォルトの名無しさん:02/01/17 20:35
>ワイアード:それは現時点で実現しているのですか?

>セント・ジョージCEO:数百ビットの限られたビットストリームでのみ動作しています。
>商業利用できる技術にするまでには多くの作業が必要です。

数百ビットって…
数百ビットを1/100したら数ビットじゃん。
数ビットで数百ビットを表すのはどう考えても不可能だろ。
300ビットなら 3bit 8通りしか表現出来ないはずですよね 

というか英語1文字が3bitに圧縮出来るってのかよ
だんだん苦しくなってきてるなw
でもネタじゃゆるされんだろうなぁ
裁判はいつ始まるのか?
390デフォルトの名無しさん:02/01/17 21:10
ランダムなデータの「完全な圧縮」をうたう新技術は本物か(続き・英文)
http://www.wired.com/news/technology/0,1282,49599-2,00.html
>>390
Good job!
392383:02/01/17 21:31
>>386 Yes.
>>388
どーでもいいが英語1文字は7ビットだぞ。
394デフォルトの名無しさん:02/01/17 21:35
不可逆圧縮方式ならどんなファイルでも1バイトになります。
>>393
7bitが3bitに圧縮できるかという話だろ。

英大文字・小文字だけだと6bitだけどな。
>>394
なぜに1バイト? 0バイトでいいじゃん。(わら
397393:02/01/17 21:58
ああそうか、
アルファベット1文字すら3ビットに納めることができないのに
もっと大きい数百ビットをおさめられるわけねーだろって話ね。
スマンカッタ。
00011000
00111000
00011000
00011000
00111100
 ↓
 0001
 ↓
 (゚Д゚)1/10

来週あたり苦し紛れでこーゆーの出してきたら許す!
>>398 どういうエンコード? 算術圧縮でも1/10は無理目な感じだけど
>>300
でも、すぐにコピーして使えば消えていない確率は高いぞ
だから厄介なバグなんだけどね
>>399
上のビットマップが何を表してるか
>>399
OCR
>>401 なるほどねえ
むかし、どんなファイルも1バイトに圧縮するってのがあったね。
で、自分自身を圧縮すると0バイトになるの。
なんつったっけ?
しかし
 ”今の所数件だが100メガビットが1メガになる事が” ならまだ納得出来るが

数百ビットでしか確認されてないが1/100になるって話じゃ

100ビットが1bitには無理として

999ビットが10bitになるって事だからなあ

たった一つしかない乱数列の始点を表現するだけでも10ビット必要じゃないか

どんな手品用意したって無理だろ
可逆で100メガビットが12.5メガバイトになる圧縮なら俺もできるぞ。
>404
このスレのどこかに書いてあったような。
>>406
>>329の方がすごい。
>>405
うん、1Mが10Kとか100Mが1Mならまだ疑いようもあるんだけど
1000bitが10bitじゃどう考えてもムリだよね。
かえって信憑性を失ったんじゃないか?
> われわれの技術で圧縮できるのは、スタンフォード大学の
> ドナルド・クヌース教授が(著書『アート・オブ・コンピューター・
> プログラミング』の中で)圧縮不可能と表現したシークエンスです

てな前提だが、この世に完全な乱数は存在しない、という仮定での
圧縮の話をしてる可能性は?
それでも1000bitが10bitになるとは思えんのだけど。

限られたビットストリームって・・・・・
314159265...とか1.41421356...とかじゃねーべな?(藁
412デフォルトの名無しさん:02/01/18 06:35
>>406
どうやるの?
>>412
ネタにマジレスと見せかけるネタ?
>>309
それも昔試みようとしたが、あまりの馬鹿馬鹿しさに、投げた。
音楽の販売元がその技術を習得しないとやってイケナイし、
音声入ると結局はwma程度のサイズは必要。
midiデータ混ぜたとしてもさして有意な圧縮はできんかった。
waveベタベタ張り系のアプリ所有者同士で交換している
特定ファイル形式でなおかつ素材が完全に一致しているの
ならば・・・というかんじ。実用には値しないとおもふ
415デフォルトの名無しさん:02/01/18 07:40
お金集めか?
従来の1000倍ぐらいの性能が出るって3DーLSIがあるって
USAまで説明を聞きに言ったことがある。
うん、たしかに言っていることはそんなに間違いはなかったが、
1000倍の計算能力が必要なだけだった。
どうやって作るんだろうって終わってしまった!
>414に追加
手動圧縮(やや恥?)でならそこそこ可能なものもあった。
ただ、機械に自動認識させるのは手間だった気がするし、
何より「mp3やwmaでも別に構わんよ」という人が多かっ
たらそこまでの技術だったと記憶してる。
417デフォルトの名無しさん:02/01/18 09:01
このスレで新しいアーカイバ作ってくれ。
418 :02/01/18 09:03
恥ずかしいから揚げるな。
ム板の恥スレ。
419デフォルトの名無しさん:02/01/18 09:08
良スレ発見age!
恥ずかしくないと思うが?
景気のいいときは資金集めて羽振りのいい生活していたが
景気が悪くなってにっちもさっちのいかなくなって
ウソついてなんとか資金集めようとする
よくいる経営者の哀れな末路でしょ(HotCafeのハイパーネット等)
反面教師、反面教師
421 :02/01/18 10:39
>>420
このスレが恥。
本気にしてた人がいます。
422とあるアホ:02/01/18 11:00
>>421
ム板にアホがいることがそんな恥ずかしいか?
423 :02/01/18 13:09
速報版よりアホなのはマズイでしょう。
424デフォルトの名無しさん:02/01/18 18:05
大きな視点で見れば
画像→jpg
音声→mp3
プログラム→zip
…等に振り分けている時点で
圧縮種類の選定作業…
つまり、手動圧縮している訳だ。

これらを1つの圧縮理論で100/1というのは
不可能だと思われ。できたら良いけどね。
>>424
(ネタかなぁ…)
ランダムなデータの「完全な圧縮」をうたう新技術は本物か(続き)
http://www.hotwired.co.jp/news/news/technology/story/20020118305.html

>425
漏れも不可能だと思うよ
700Mの動画を100/1されたらたまらんわい
>>426
サンクス。
16,17日つーたらもう発表されてる?
特に発表なし。
今、フロリダは18日の朝の5時ごろ。
http://65.170.178.208/flash/flash.html
430デフォルトの名無しさん:02/01/18 19:01
>たとえば1テラバイトのデータでも、数百ビットに圧縮できるのですか?

またすごい質問を・・・
431 :02/01/18 19:19
上げてるやつは煽っているのか?真性か?
432名無しさん:02/01/18 19:27
「そうか、これは偽者なんだ。それなら、まだ
新しいアルゴリズムを考える価値はあるな。」
とか思う真性の俺は逝ってよしですか?
只今4次元理論を用いたポケットを開発中。データに限らずなんでも圧縮可能!
>4次元理論
ファイルを削除する前の時間からデータを取ってくる?

>たとえば1テラバイトのデータでも、数百ビットに圧縮できるのですか?
その1TBのデータが元々数百ビット分の情報からできてたりすると
圧縮は可能ですが。(πとか、eとか、疑似乱数とか)
435名無しさん:02/01/18 20:25
>>434
「任意の」って言葉は大切だよね…
>>427
70Gかよ!(w
πとか、eなら圧縮出来るけど

πのN桁目からM桁の値なんてのは N+Mビット必要になるでしょ

でπは無限に続くんだから・・・
「ということにする」技術なんです。
439至高の圧縮技術:02/01/18 21:56
俺すげ―アイデア思いついちゃった!
posシステムってあるじゃん?あれのデータ版で、データはローカルに
おかなくていいの、で、すべてのデータはパケットの状態でトラフィック
上を常にぐるぐる回ってるわけ。
どうよ?

>>439 圧縮とちゃうやん(w
山手線に電車をならべてぐるりと1周させ、その中を人が歩くというのを
思い出した。
441至高の圧縮技術 :02/01/18 22:19
>440
レスThanks!
いや上の方のリンク先で「今まで人間が作り出したソフトに通し番号を
つけていけば……」っていう話しがあったからさ、その手法の問題点って
ハイパーな管理者が必要ってことだからさ、それを解決できると思って。
>440
水銀遅延管メモリについて勉強しませう。
443デフォルトの名無しさん:02/01/18 23:53
「蛇遣い座ホットライン」ですか?
>>437
そうか!
与えられたデータに一致するN桁目からM桁を見付けて、
そのNとMだけにすればlog(N)+log(M)だYO!
天災だよアンタ
445 :02/01/19 00:55
log(N)+log(M)>元のデータに100円
446デフォルトの名無しさん:02/01/19 02:53
>>437
>>108-115あたりでがいしゅつ。
いや、あの手を使うのかもしれんな。
写真を圧縮すると、全てはイメージ的に抽象化される。
人の形はまるでトイレの男女のマークのように!!

しかしなんということだ、これでも人は元の写真と同一だと認識し
てしまうではないか!!
そう、所詮人の図形や色彩の認識力なんて・・・・

//しかしこんなアプリ絶対現在の俺の腕では作るの不可能だな
>>445
log(N)+log(M)はおよそ元のデータサイズ
 およそ元のデータサイズと同じである確率は Mが大きくなるほど大となる
 1ビットでも大きくなったり小さくなったりする確率は
 ・・・ええと、まあとっても小さいんだ

だから 100円 頂戴
449448:02/01/19 11:50
ありゃ? M=元のデータサイズで

log(N)≒M だから log(N)+log(M)>元のデータ ってネタか 失礼しました
えんがちょ
451デフォルトの名無しさん:02/01/21 07:30
円が超? それは解凍では
452デフォルトの名無しさん:02/01/21 08:50
おいおい、自分の理解を超えたことはネタ扱いかよ
わるいかよ。俺はそうやって生きてきたんだよ
454デフォルトの名無しさん:02/01/21 09:25
俺に理解出来ない事はネタ及び電波とみなす
455デフォルトの名無しさん:02/01/21 09:40
ランダムなデータの「完全な圧縮」をうたう新技術は本物か(続き)
http://www.hotwired.co.jp/news/news/technology/story/20020118305.html
の、
こんな言葉があります。「あることをできないと言う者は、それをやろうとしている者の邪魔をすべきではない」
に少し感動。
俺は感動よりも 
 誰も邪魔はしてないだろ 
 そういう事は出来てからいえ とおもたよ
457456:02/01/21 09:47
 例えば 常温核融合出来る理論を作ったが金が無いとかなら判るよ

でも圧縮アルゴリズムだったら コード書けばテスト出来るっしょ
 無限の時間かかるならともかく、有限の時間で出来るんなら 
 圧縮対象を絞って実験してみせるとか
 リバースエンジニアリング禁止契約を結んで頂ければコードを提供しますから
 とかやればいいでしょ
458デフォルトの名無しさん:02/01/21 09:53
俺にとってはオームの法則すらネタです
万有引力に至っては電波でしかありません
460デフォルトの名無しさん:02/01/21 10:03
んでちょっとまじめな話。
完全な乱数ではなく、圧縮後のファイルなら再圧縮できるんじゃないかな、と思った。

圧縮後のファイルは同じパターンが出てこない。その時再圧縮すれば分かる。
再圧縮してサイズが大きくなるなら、完全な乱数よりも同じパターンが出てこない確率は低いはず。

・・・ってことを元にして圧縮できないかな?昔やってみたけど挫折したテーマ。
>>460
 それはつまり、ビット列の集合を
 LZ法(既に同一パターンが出現していればその位置に置き換える方法)で
 圧縮出来るかどうかに別けると 圧縮後のファイルは、圧縮出来ない方の
 ファイルに分類できる

 この分類情報を圧縮に使えないかという意味ですよね?

でもビット列の集合全体は LZ法で圧縮出来ない場合が圧倒的に多そうで
エントロピー的には意味がないように思います
462460:02/01/21 10:43
>>461
大体そうだけど、ちょっと追記。

>完全な乱数よりも同じパターンが出てこない確率は低いはず。
ってことは、1111・・・・とか、0000・・・・とかを情報量を増やして、
その他はその分情報量を減らすってこと。

これによる圧縮率が100%未満なら価値はあると思うです。
>.462
なるほど、しかし
算術圧縮で1Kで1ビット小さくなるかどうかのような気が

できる出来ない以前に、勝手に人の名前を拝借するのは大問題だろう
そんなに自信があるなら人の名前使うなっちゅうに
ねずみ講や詐欺師と同じ手口だろーて
セント・ジョージはタケコプターでも作ってなさい
465ノラエモソ:02/01/21 12:04
>464
タケコプターをバカにするな!
466デフォルトの名無しさん:02/01/21 12:16
高速より速く移動すると未来に行けますが何か?
>>166
光速より速く移動すると過去に行けます
高速に近い速さで移動すると未来に行けます
468 :02/01/21 12:20
ああ、恥ずかしい、恥ずかしい
でも光速を超えるにはタキオンを生成しないといけないよ
それには1.21ジゴワットもの電力が必要なわけでして
そんな電力を作れるのはプルトニウムか雷くらい
他にもブラックホールに近い重力を経験するという方法もあるね >未来
アインシュタイン>>ニコラテスラ>>>>>>>>>>>>>>>>>>>>>>>エジソン>>>中松
>>471 それはエジソンに失礼だろ > の数
>>471
最後のが桁違い(藁
任意の100Mのデータを1Mにマップする時点で不可逆
宇宙の原子の数は 10^80 2^256程度とか考えると
2進で256bitも用意すれば全ての事象を表現出来そうな気持ち
にはなるな
100Mbitで表現されうる全てのデータ中、人間様と係わりあいを持てるのは
将来に渡っても、せいぜい 2^100も無いというのは正しいかもしれないな
>469
「1.21ジゴワット」のジゴって何?そういう単位あるのかな?
映画ではたしか「ディガ」みたいに発音していたが、1.21ギガワットのことでもないよなぁ。
yotta …24乗 Y
zetta …21乗 Z
exa  …18乗 E
peta  …15乗 P
tera  …12乗 T
giga  … 9乗 G
mega  … 6乗 M
kiro  … 3乗 k
hecto … 2乗 h
daca  … 1乗 da
479デフォルトの名無しさん:02/01/21 16:21
>>475
時系列という概念はないのかい
>>477
ギガの訛りかと
>ジゴワット
バックトゥザフューチャーで使われてたね。ドクが言ってた。
ペーパーブックでは「架空の単位か、ギガの誤り」と注釈がついてた。
私の計算が確かならば時速140キロに達した瞬間
ぶったまげるような事が起こる
483デフォルトの名無しさん:02/01/21 18:07
お前ら!これでも読んで納得して下さい。

Theorem:
No program can compress without loss *all* files of size >= N bits, for
any given integer N >= 0.

Proof:
Assume that the program can compress without loss all files of size >= N
bits. Compress with this program all the 2^N files which have exactly N
bits. All compressed files have at most N-1 bits, so there are at most
(2^N)-1 different compressed files [2^(N-1) files of size N-1, 2^(N-2) of
size N-2, and so on, down to 1 file of size 0]. So at least two different
input files must compress to the same output file. Hence the compression
program cannot be lossless.
いや納得出来ないな
理論的な話としては >>483は正しい

ではたった256bit=32byteでいいから、全てのビットパターンのファイルは現実に作れますか?
 100Mの全てのビットパターンはもちろん作れないでしょう?

現実に存在するファイルはそのビットパターンの全てを埋める事は出来ない筈
であれば現実に存在するファイルの多くに通用する圧縮アルゴリズムがあっても不思議ではない
485デフォルトの名無しさん:02/01/21 18:26
>>483で納得できない奴は、関数や写像の定義を
もう一度読んだ方が良いと思われ。
あと数学的帰納法の定義も。
完全ハッシュ関数で世界中にある全てのファイルに連番が打たれたとしたらこれは圧縮であるや否や
488ドキュショ:02/01/21 18:33
>483様
訳して下さい。
定理:
いかなるプログラムも長さが N ビット以上の「全ての」ファイルを
ロスなしに圧縮することはできない。なお、N はゼロ以上の整数とする。

証明:
仮にあるプログラムが N ビット以上の全てのファイルを圧縮できるとする。
このプログラムによる圧縮では、丁度 N ビットの長さを持った、
全部で 2^N 通りのファイルを圧縮する。圧縮されたファイルのサイズは
高々 N-1 ビットであり、従ってそれらは高々 (2^N)-1 通りの異なる
圧縮済みファイルとなる(N-1ビットのファイルが 2^(N-1) 通り、
N-2 ビットのファイルが 2^(N-2) 通り・・・と言う風に
サイズ0の1通りのファイルまでを合計した)。
従って、少なくとも2つの異なる入力ファイルが、
同一の圧縮結果ファイルとならざるをえない。
故に、圧縮プログラムはロスレスではありえない。
この定理で否定している事は
  長さがNbit以上の全てのファイルを同時にロスなく圧縮出来ない であって

 Nbitの実在のファイルが圧縮出来ない事は否定していない

実際、ZIP/LHAにより多くの実在するファイルはロスレスに圧縮されている

もちろん、ある圧縮プログラムで圧縮出来ないファイルが常に存在する点は疑いようがない
圧縮という言い方に語弊がある。
あくまでも変形の一種であって、
よくあるタイプのファイルが短く、
そうでないものが長くなるということ。
長くなりそうな奴は別のアルゴリズムで圧縮すればいいとか
圧縮せずに未圧縮マークをつければいいとか言わないように。
>>484
>ではたった256bit=32byteでいいから、全てのビットパターンのファイルは現実に作れますか?
> 100Mの全てのビットパターンはもちろん作れないでしょう?

ではε-δ風に。
256bit全てのビットパターンのファイルは現実に作れます。

すでに手元に用意できています。32 バイトで指定していただければ
そのビットパターンを提示できます。

484 さんのお望みの部分をお知らせください。
>>492
ありがとうございます。 
 お手数ですが、
32バイトをASCIIコードとして 全てが数字の場合で結構ですからお送りください

残念ながら当方ネットワークは64kbpsですので圧縮の程、よろしくお願いします
互いに相補的な2つ(以上)のアルゴリズムを同時に使えればいい?
1つはある種のファイルを非常に小さくし、そうでないファイルは圧縮できない。
もうひとつは1つ目で圧縮できないファイルを限りなく小さくし、そうでないファイルは圧縮できない。

世の中の全ファイルが2つに分けられたら苦労しねーけどな。

for( BIGNUM i=0; i<((BIGNUM)2<<256); i++ )
thisthread(492) << ask( i );

絶対無理です。
ランダムなデータの圧縮ができるなら、そのデータは厳密に言えば
ランダムでない。もちろん長い系列じゃないと話にならんが。
497デフォルトの名無しさん:02/01/21 21:40
情報数学勉強しろゴルァ
韓先生万歳!!
>>494
>32バイトをASCIIコードとして 全てが数字の場合
この集合を実際に構成していただいたものを送っていただければ
「すぐ」にでもお返しいたしましすYo.
499これは本当です!:02/01/21 22:20
200GBのファイルを16KBまで圧縮することに成功しました。
もちろん可逆です。
500500:02/01/21 22:40
Ruby >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 500
最強の圧縮ソフトはすでに7年前に完成していますよ。
http://www.vector.co.jp/soft/dos/game/se020186.html
可逆が重要なのでは?
例えジョークでもそこんとこは厳しく
つーかそんなくそソフトの登録を許可するVectorのポリシーの無さに一言言いたい。っていまさらだけどな。
>503
それは「team KuSoGe-製ゲーム」というカテゴリに分類されていて、
ネタ扱いだよ。
>>502

前世紀・豊かな時代の素朴なジョークだ。
ゆるしてやれ。
>>504
全部Freeなのに1つだけOtherがある、何だろう??
人柱きぼんぬ。
って言うか、このジャンル消えても誰も困らないな。
総ダウソ数を聞いてみたひ・・・。
>506
※こいつは『ドネーション・サポートウェア』なんだ。
作者あてに『寄付』をしてくれると、何もしない人よりお得なサービスを受けれる
って話だよ。

だってさ。
508507:02/01/22 00:47
追加

要するに 金銭/物/レス のどれかを、『寄付』として提供してほしいわけです。

だそうです。
それとOtherは2つだよ。
509デフォルトの名無しさん:02/01/22 06:51
>>497
韓先生って誰だ?
>>498

お手数ですが、よろしくお願いします。
[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]
[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]

さて32桁の数が人間の世界で均等に使われる事は無い事にお気づきになるでしょう
 上の桁はゼロである事が多く、ゼロでない最も上の桁は1である率が高いです

 全ての32桁の数を均等に圧縮出来るプログラムは作れませんが、平均的に圧縮
出来るプログラムであるなら作る事が出来るいう点にはご同意いただけるのでは?
> ゼロでない最も上の桁は1である率が高いです

誤りかと思われ
>>507
ジョークソフトでサポートか、おめでてーな。
>510
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
[01][01][01][01][01][01][01][01][01][01][01][01][01][01][01][01]
ええと、今何の話をしてるかというと
 >>483 >>489 
○いかなるプログラムも N ビット以上の「全ての」ファイルをロスく圧縮出来ない

に対して >>484 >>490

○256bit=32byteでいいから、全てのビットパターンのファイルは現実に作れますか?
 作れないなら現実に存在するファイルの多くに通用する圧縮アルゴリズムがあっても不思議ではない

という反論がなされ、 >>492
○すでに手元に用意できています。32 バイトで指定していただければ
 そのビットパターンを提示できます。

と話題をふった結果 上
515 :02/01/22 09:22
結論として、
「乱数を含め、すべてのファイルを可逆圧縮する事は出来ないが
現実のファイルならできるかもね。」
でよろしいか?
516デフォルトの名無しさん:02/01/22 09:29
>>515
いや、違う。
あらゆるビットパターンファイルを可逆圧縮できるアルゴリズムが存在するなら、
圧縮したファイルについても可逆圧縮が可能でなくてはならない。

仮に圧縮前のファイルをN(自然数)ビットとすると、圧縮後のサイズは
N-1ビット以下になる。
よって、多くてもN回の圧縮を行うとファイルサイズは(N-N)ビット=0
になってしまう。
あらゆるビットパターンファイルを可逆圧縮できるアルゴリズムは存在しない

しかし、人が宇宙の終了までに使う範囲のビットパターンはあらゆる
 ビットパターンに比べてほんの小さなものでしかない。
 人が出会うビットパターン全てにインデックスを付けても256bitもあれば足りるであろう

その範囲で効率良く圧縮出来るアルゴリズムが存在してもおかしくはない
そのアルゴリズムで圧縮されたものは再度の圧縮は出来ないであろう
時系列はどこいちゃうんだ?
つか、たかだか256ビットのパターンの種類さえ115792089237316195423570985008687907853269984665640564039457584007913129639936通りもあるんだから、
人が出合う「可能性のある」ビットパターンの組み合わせがどのくらいあるのだろう。
その中の1つを特定するインデックスに必要な桁数は、どのくらいだろう?
などといってみる也
520デフォルトの名無しさん:02/01/22 10:58
一律な数式に頼るより文法と単語をとうろくするタイプの圧縮のほうが
現実的だと思うのだが...

あと根本的に”サイズ”という概念をbit数から時間と効率に置き換えると
ZIP形式が既知であり普及度からいっても究極では?
>>520
まあ大体賛成なんだけど話が変わってるぞ。
>>518
ちょっと混乱してきてるんですが、その話と現状存在する圧縮アルゴリズム(例えばZIP)と
どう違うんですか?
>>522
圧縮率。
>>522 様
 カレは 全てのファイルは 32バイトに圧縮出来ると申しております
525デフォルトの名無しさん:02/01/22 12:17
>>509
情報と符号化の数理読め!!!
526509:02/01/22 12:24
>>525
おお、電通大の先生の名前なのか。
「韓」なんて書いてあったから「圧縮はウリナラが起源ニダ!」
とかの電波かと思った。
527デフォルトの名無しさん:02/01/22 12:43
音声とか動画なら、データ列を仮想マシンコードに置き換える方式が最強なように思う
528uu:02/01/22 13:32
http://www.web-bc.co.jp/cgi-bin/web-bc/pp_db21/search.cgi?PPSEL=all
株式会社アーテックコミュニケーション
これはなんだろう?
529522:02/01/22 13:37
>>523-524
ありがとうございます。ちょっとわかってきました。
世の中にはたかだか 2^256通りの情報しかないのだから、それに32バイト長のインデックスを
つけてやれば、1情報32バイトに圧縮できるということですね。

で、展開はどうするの?というのが議論の主題となるわけでしょうか?
530デフォルトの名無しさん:02/01/22 14:46
1/100に圧縮できるだったら、相当冗長だな
531デフォルトの名無しさん:02/01/22 14:47
32バイトで表現できるんだったら、
HDDは32バイトでいいんでない。ワラ
お前ら全員、逝ってよし!
じゃあ、一応つっこみ(三村風)を…

> しかし、人が宇宙の終了までに使う範囲のビットパターンはあらゆる
> ビットパターンに比べてほんの小さなものでしかない。
> 人が出会うビットパターン全てにインデックスを付けても256bitもあれば足りるであろう

足りるかよ!
>>522
Nビットのファイルは2^N通りある。そのことを踏まえて、

不可能派の意見
「全てのNビットのファイルを圧縮して小さくなるなら、
Nビットのファイルの内、少なくとも2つ以上が同じ圧縮ファイルになってしまう」
可能派の意見
「Nビットでも実際に存在するのはそれよりもはるかに少ないんだから
それを見極めることが出来れば圧縮できるはず。
(ZipやCabなども同じ理論で出来ているではないか。)」


で、不可能派の意見が普通なんで議論は終了。sage進行しとけ、ってこと。
俺は「出来たらいいなあ」派だけどね。
まず「存在し得るビットパターン」のうちどれが「人が出会うビットパターン」で
どれがそうでないかマーキングする作業がいるな。
>>534
ZIPやCABは同じ理論ではないと思われ。
>>528
アーテックは、ITコア技術である、画像、音声データ
を1ビットも欠損がなく高圧縮技術を確立している。
この応用は多業種にわたり応用が期待されている。
1例として、通信21Kbpsで動画とステレオ音声が同時
に伝送でき、受信もできる。静止画では可逆変換ロス
レスで、100:1を表現している。今後のコア技術は、
Jpeg,Mpegのレベルではなく、ロスレスの新時代に
入ったと言える。

もうできてるんか?
538デフォルトの名無しさん:02/01/22 15:44
最小記述長 = モデルの適合度 + モデルの数
みたい感じ
539534:02/01/22 16:20
>>536
「理論」を「考え方」とか「理由」とかと置き換えれ。
zipもcabもデータが偏ってるから圧縮できるってことだ
>>533
多めに見積もっても

将来マシンが 100T/Byteで内容を更新出来るとして 10^14
宇宙の寿命を10^20秒は越えないだろうとする
宇宙中のコンピュータの数を10^20は越えないとする

合計 10^(20+20+14)=10^54 で180bitでしかない
>540
その結果できる、インデックスそれ自身への
割り当て分はどうなりますか?
>>540
思うに、100Mのテキストデータがあったとしたら、
256^100Mパターンのデータがあるよな。
これは180bitをはるかにオーバーするが。
実際に使われるのはそのごく一部とか言うのが圧縮できる派の主張だが、
テキストデータは容易に書き換え可能なのだが(そして実際書き換えられるのだが)
それらへのインデクス付けはどう対応するんだろう?
>>540
> 100T/Byte
100TB/秒の間違い?
>540 >542
なんか、数え方が変な気がする。
ビットパターンの数っていうけど
ビットパターン一つって何?
例えばこのスレは一つと数えるのか?
でも >>1, >>1-3, >>4-50 のようなのはどれも別物でしょ?
結局組み合わせたりなんだりで256bit遙かに超えそうだよ。
546デフォルトの名無しさん:02/01/22 16:56
>>540
秒単位どころではないよ
100m走も記述できん
547 :02/01/22 17:20
>>546
パターン数とサイズをいっしょにすな。
548540:02/01/22 17:33
>>541 インデックスへの割当は無視してもいいし含めてもいいです
 含める場合は新しいファイルが出来る都度 自分も新しくなるので2増えます
 つまり1ビット余分に必要になるだけです

>>542
 100Mバイトの領域があるとすると2^(800,000,00)のパターンがありますが
 これは >>410で書いた通り 全てのパターンを実在させることは不可能です
 もしその一部でも書き換えたら、新しくインデクスをひとつ割り当てて下さい

>>543
 すみません 100TB/秒の間違いでした

>>545
 このスレでしたらレスが追加される都度新しくインデクスを割り当てると考えて下さい
 ビットパターンが完全に一致するファイル毎に違うインデクスを割り当てた場合の話です
 どんなに大目に見積もっても256bitは難しいと思います

>>546
 時間単位を 理論分解能であるプランク定数 10^34 に持って来ても 60ビット増えるだけです
 つまり180+60=240bitです。
>548 つまり1ビット余分に必要になるだけです
いや、再帰的に適用するのよ。
550仕様書無しさん:02/01/22 17:46
これって識別bit数でしょ?
組み合わせの数考えて
551デフォルトの名無しさん:02/01/22 17:47
圧縮じゃなくて、いつのまにか
配置の問題になっているとおもうんだけど
>>548
> 新しくインデクスをひとつ割り当てて下さい

どうやって?
圧縮できても復元できなければ意味無いでしょ。ってことはデータベースはどこか1箇所にまとめてそこに情報を追加するってこと?
それは圧縮じゃなくてデータ保存する場所を変えてるだけジャン。
553547:02/01/22 17:48
ああ、>>546まちがい。>>545だった。スマソ。
やはり究極の圧縮はアカシックレコードに格納だな。
データそのものを圧縮するより記録媒体を小型化したり通信技術を向上させるほうがはるかに現実的かと。
インデックスから目的のビットパターンはどうやって生成するんだ?
該当するパターンを全てローカルディスクに持っておくのか?
557540:02/01/22 17:56
>>549 おっしゃることは判りますが、それは言いがかりかと
   そもそもこの話しは、インデクスを付ければ256bitで済むという話であって
   そのインデクスはファイルである必要は無いのではなかろうかと

 もちろん、32バイトあれば 全てのファイルの区別は付くという話と
 その圧縮法が存在するのとはイコールではありませんが

インデクスが付く話を圧縮の話に持ち込んだのは、 
 理論的に全てのファイルをロスレス圧縮出来ないから 
 今回のような高性能な圧縮法は存在しないという議論は正しくない という説明をしたかったからです

数学的な演算でそれが可能とは思いませんが、
>>527 さんのいう仮想マシンの実行コードに置き換える方式が、あるいは打開するかもしれませんしね
>>557が言っている事は、目的のファイルをURL等で
一意に指定するのと変わらんと思われ。
>>558
あれと同じだろ、圧縮したと見せかけて元のファイルは別のところに隠しておくって言うソフトの話が過去スレで。
560デフォルトの名無しさん:02/01/22 18:06
というか、1/100圧縮より
通信速度100倍速くするほうが現実的だと思う。
したがって、
>理論的に全てのファイルをロスレス圧縮出来ないから 
>今回のような高性能な圧縮法は存在しないという議論は正しくない
の説明にはなっていないと思われ。
>>560
BフレッツはISDNの1600倍速いだろ。
563名無しさん:02/01/22 18:11
>>562
解決ジャン!!!
とりあえず、誰かがマジに発明するまでは不可能という事で

発明した後は、

FM音源が出る前に、
 サイン組み合わせただけで三角波からノイズまで出せるなんて誰が信じただろうか

というようなもんかもしれないな

それだよ>>564

FM音源と同じ方式で あらゆる信号が作り出されるんだよ・・・きっと
単にDCTしてるだけでは‥‥
人間が両手に羽をつけて、羽ばたいて空を飛ぶことが出来るなんて、誰が信じただろうか

というようなもんかもしれないし
568仕様書無しさん:02/01/22 18:16
>>565
記述パラメータ多すぎ
でもまだサンプル発表してないんだよな。近日中に発表って言ってなかった?
「現存するすべてのファイルを圧縮する方法」を作ると、
その方法であるファイルを圧縮した時点で、
「現存するすべてのファイル」の前提が崩れませんか。
>>565
音楽データのサイズは、FM音源の音色 + MIDI < WAV
MIDIの達人がデータを作るとどんな音楽でも再現できるので、
データ圧縮の達人を養成するのが良いかと思われ。
100分の1以下も可能という新圧縮技術、あなたは信じますか?
http://www.hotwired.co.jp/nwt/020122/
>>571
すでにロスレスじゃないと思われ。藁
>>570
圧縮後のファイルが、現存する未圧縮のファイルに含まれれば問題ないかと。
圧縮済みかどうかは人間が判断するということで。
だからこそ、人は議論する。
576デフォルトの名無しさん:02/01/22 18:27
1/100に圧縮できるランダムデータを作成してるに過ぎなかったりして・・・
> N個の要素をもつ集合に存在するすべてのものは、
> N-1個の要素の集合で表すことができます。
統計的なパラメータの話だと思われ。

ふと気がついた・・・
ランダムデータを一度圧縮可能なデータに膨張させた後、
それを元よりも小さく圧縮し直すことができれば、
ある程度は小さくすることもできるかも?
>>578
で、どうやって復元するんだい?藁
>>578
 それは、理想的な圧縮したアーカイブを一度解凍した後に
またもっといい方法で圧縮しなおせばある程度は小さくでき
る、と言ってるのと同じ気がするぞ。
>>578
ブロックソートとか?
しかしマジでFM音源ってノイズっぽいデータも作れるんだよな
 あれってどうなってるんだろ? ノイズジェネレータは載ってないよね?
>>582
確か乗ってたと思う。たぶん。
>582
ノイズっぽいデータを入れてやればいいかと
ノイズでないっぽいデータ作るほうが大変TT
>>582
線形合同法をサインカーブでやってるだけでしょ?
586デフォルトの名無しさん:02/01/22 20:20
ちょっと聞いておくれ。
俺なりにランダムなデータの圧縮方法を考えてみた。

発想を逆転してみてはどうだろう。
例えば、今存在する数式ではランダムを表現するのは難しいとして、
逆に今ある数式のものを「非辞書」的に使うんだ。
「こっちには行かないだろう予測」だな。

で、どうする?
って感じだが、一瞬でも「オッ!」って思わなかったか?
>>582
高めの周波数のモジュレータにフィードバック。
>>586
ランダムなデータはこっちには行かないだろうって言う予測も
ランダムだから無理。昔やってみた。
256bitの話に戻るけど

 結局大きさが1Mだろうが1Gだろうが、
 何番目って情報がふられた段階でエントロピーは
 消えてしまうわけ?
 消えるとしたら、そのビットが確定した時? それtも誰かがインデックスを付けた時?
590582:02/01/22 21:10
FM音源検索してみました ノイズを作る方法は
>>587さんが書いてるように変調信号をフィードバックする事で出来るようです

これってもしかしてカオス?
591デフォルトの名無しさん:02/01/22 23:17
>>586
エントロピーが高いって事は予測不能なんだってば
592名無しさん:02/01/22 23:55
>>589
データはいじってないわけだから、エントロピーも変わってないんじゃない
まだ「アルゴリズム」で原理を超えられると思ってる奴がいるのか・・・。
アルゴリズムは光速も越える!
そうだタキオンを使えば・・・
596がもふ:02/01/23 02:42
宇宙は収縮に向かう

最後には究極の圧縮状態になる
>>594
ならば全ての人類にアルゴリズムを授けてみせろ!
598デフォルトの名無しさん:02/01/23 05:08
>>597
μアルゴリズムは伊達じゃない!
>>592
 中身が判らない状態でのエントロピーはビットサイズだけあるけど
 中身が判ればその段階で、沢山あるデータの一つという情報になってしまう
 ああ、「あの10年前のピコゲーみたいな奴ね」程度の情報になってしまうわけだ
 だから見る前と後ではエントロピーは違うと思われる


>>589
 インデックスにはインデクスサイズだけの情報しかないが、
 しかし、インデックスだけの情報と、そのデータそのものとは意味が違う

 ブリタニカに載ってるかどうかという情報で足りればいい場合はそれでいいが
 ブリタニカの100ページに載っているという表現はブリタニカがある場合にしか
 意味はない
 
 結局、誰かがそのデータを保存して、インデックスを付ける=命名しただけでは
 まだエントロピーは変化していない。 
 その情報を皆で共有した時がその時だと思う
どんなファイルに対しても
最悪半分のビットが一致する出力は簡単に作れるんだけどなあ
601デフォルトの名無しさん:02/01/23 10:20
>>600

ほんとか?全部1だとあくまで「平均して」半分のビットが一致だぞ。

602デフォルトの名無しさん:02/01/23 10:20
アルゴリズムって魔法だとおもってない?ワラ
603デフォルトの名無しさん:02/01/23 10:39
全部1のファイルと全部0のファイルに最悪半分一致する出力ってどんなのだろう。
101010・・・・ってファイルはどのファイルに対しても
平均半分一致するってことじゃねえの?
>>604 それだと 1010には全滅かと
606604:02/01/23 10:50
>>605
0101には全滅ってことだね。
んじゃ、乱数で。
607600:02/01/23 10:54
違う違う
単純に、そのファイルのビット頻度に応じた乱数出して
初期値を少し調整すれば 半分のビットが一致するってだけ

一致率が1/2だと圧縮には意味ないのかなあ
>>607
 たとえば、どこが一致してるかのファイルを作ったとして、
 そのファイルを何らかの規則で見直した時にエントロピーが初期値の
 ビットサイズより下がるような一致の仕方(連続して0,1が並ぶ等)なら意味あると思うけど

普通はそうならないから圧縮出来ない
>>607
zipの不可逆圧縮は意味無いからなあ。面白いけど。
>>607
 逆だよ 一致率が1/2から大きくズレるような何かの系列が見つけられたら圧縮出来る
探索にすげえ時間がかかる気が・・・ヒントもないし・・・
ところでその乱数は再現できる必要があるから、擬似乱数ってことになる?
>>610
その方法で 1/100に圧縮出来る為には 1/(2^(100)) とかの率で一致する必要があるかも
613おそらくここにヒントあり:02/01/23 12:50

「我々は、皆が住み着いている箱から外へと
 連れ出してくれるようなアプローチを採用したからだ。」

「人は自分たちを制約によって定義づけたがる。」

「人は小さな水槽の中に自分たちを閉じ込めたがるが、
 我々は大きな魚だ。」

 St. George
>>607
全く無意味。
A→(圧縮)→B→(展開)→Cとして、
AとCの一致率が1/2の時、
Cから得られるAについての情報量は0。常識。
615デフォルトの名無しさん:02/01/23 13:37
@論破されて一旦終了
    ↓
A何件かジョークでの書き込みが続く
    ↓
B勘違いした真性君が真性カキコ
    ↓
C同調した電波がカキコ
    ↓
D電波でにぎわう
    ↓
 @にもどる 
>>615
ワラタ。
まったくもってその通り。
では、結論としては「無理だろ。」ということで。
617デフォルトの名無しさん:02/01/23 14:00
>>615
大正解
>>607
必ずウソをつく奴は、必ず本当のことを言う奴と同程度にはあてになる。
ウソと本当を半々で言う奴は全然あてにならない。

出来るだけ一致する様な乱数を出力させて、それとのXORを取り、その結果を圧縮すれば、
0になっている確率が高くなるので、それなりに圧縮できそうだ。

ツッコまれる前に書いておくと、こういう圧縮アルゴリズムは
「一見ランダムそうな数列」は圧縮できるが
「一見規則ただしそうな数列」は圧縮できない。
それでも、探せば使い道はありそうな気がする。
>>618
ということは、普通の圧縮をかけた後のデータのほうが、
ランダム性(という言い方はあり?)が高いから、可能性があるということか。
>>618
一致しないビットの分は1になるから、
結局情報量はまったく変わらない。

…つーのが>>610のevenだと思われ。
621618:02/01/23 15:01
>>620
その通り。オレが言いたいのは610と同じことなんだけど伝わらなかったか。
「出来るだけ一致」というのは50%からは十分離れてるってことだな。

622620:02/01/23 15:07
>>621
すまん、「それなりに圧縮」というところに目を引かれてしまった。
623デフォルトの名無しさん:02/01/23 15:42

なにかしら有用な技術を開発してる可能性はありそうだな。
1の話に戻そうと? >>623

では ここまでのまとめ

○真にランダムなデータは1/2どころか1ビットでも小さくするのは難しい
○全てのファイルをロスレスに圧縮する方法は存在しえない
○この世の全てのデータはしかし 2^256 個tを越える事はないだろう
○しかしそれと圧縮とは無関係だ
ついに完成したよ!
数十バイトのデータがたった0バイトに!もちろん復元可能だ!

圧縮
バイナリデータをBase64にエソコード

ファイルのデータを消す

エソコードした文字列と最後にエソコード後の文字数をファイル名にくっつける

解凍
ファイル名からBase64にエソコードされた文字を取り出す

元のファイル名に戻す

Base64デコードファイルに書き込む

( ゚Д゚) でかいデータは勘弁してね
現在>>615のA
627C:02/01/23 17:14
○この世の全てのデータはしかし 2^256 個tを越える事はないだろう

データってなんなのさ!
クォークとかなら超えるんじゃねーの?
2chのログなら、多少間違っててもかわらない。ワラ
意外と単に訳が間違ってるだけとか
630デフォルトの名無しさん:02/01/23 20:07

なにかしら有用な技術を開発してる可能性はありそうだな。
>>630
出番早すぎ。台本は>>615にあるからちゃんと読んでおくように。
632デフォルトの名無しさん:02/01/23 20:16
この世の中の事象はすべてアカシックレコードに刻まれてるんだから
その何ページ目の何行目かさえ書いておけばいいんじゃないの?

俺って天才?
633デフォルトの名無しさん:02/01/23 20:38
>>632
残念! そういうものがあっても、
ページ数の桁数と行番号の桁数の長さが、
事象を記述する文字列とおなじくらいの容量になるので、
圧縮にはならないのだ。
634633:02/01/23 20:52
>>630
たぶんないと思う。
永久機関の発明と同レベルの話で、
好意的な人は「実現しなくても、何か別のところに使えるかも」
なんていうけど、実際にはね・・・
>>633 いやいや 256bitもあれば足りるという説も
256bitは10進で表現したら77桁 >>519 である

アカシックレコードからファイルに関する記述だけを取り出すものとする
必要なインデックスは

時間の分解能は1/10^27 程度
宇宙の寿命jはせいぜい10^20秒は越えないだろう
宇宙中のコンピュータの数も10^20台は越えないだろう

合計 67/log(2) つまり 222bitを越えないだろう
非可逆、不可逆どちらが正しいの?
638デフォルトの名無しさん:02/01/23 22:13

なにかしら有用な技術を開発してる可能性はありそうだな。
639 :02/01/23 22:14
>>637
また微妙な質問を、、、
640デフォルトの名無しさん:02/01/23 22:29
>637
とりあえずGoogleで調べてみた。
不可逆→約11,000件
非可逆→約4,280件
ふかぎゃく‐へんか【不可逆変化】‥クワ
〔理〕可逆ではない変化。#可逆変化

ひかぎゃく‐へんか【非可逆変化】‥クワ
〔理〕(→)不可逆変化に同じ。
>>636
中に入ってるデータは?
643デフォルトの名無しさん:02/01/24 01:35
>>636
>時間の分解能は1/10^27 程度
こういえる理由がわからん。
時間の分解能は1/無限大じゃないのか?
644デフォルトの名無しさん:02/01/24 01:37
>>643
うむ。根拠に乏しい。>>636 ソースキボンヌ
645デフォルトの名無しさん:02/01/24 01:41
>>636
時間は連続だろ。
時間が離散ってことになったら今までの物理がすべて覆されることになるぞ。
おまえはアインシュタインとかに勝てるのか?
646デフォルトの名無しさん:02/01/24 01:49
時間は10^-44以下には割り切れないはずだったのでは?
>>636
>時間は連続だろ。
その根拠は?
648デフォルトの名無しさん:02/01/24 01:56
原子核の直径を光が横切るのにかかる時間が最小単位だったような…。
それ以上は不確定性原理により分からないという結論だったような…。
うろ覚え。
649デフォルトの名無しさん:02/01/24 01:56
>>647
時間が離散だったら、光が波でなくなる。
>636
宇宙が多世界解釈的にできていたらどうする?
「プランク時間」を google れ。
652デフォルトの名無しさん:02/01/24 02:00
>>649
光は波じゃねーぞゴルァ。
波の性質をもってるだけだ。知ったかウゼェ。
653デフォルトの名無しさん:02/01/24 02:09
>>652
あ、すまん、言い方が悪かった。
波の性質が消え、粒子としての性質のみになる。
とりあえず、この世界では波の性質があることは明白なので、
この世界では時間は連続なわけです。
654デフォルトの名無しさん:02/01/24 02:11
>>652
>光は波じゃねーぞゴルァ
んなこたぁ現代人ならみんな知ってるだろ。
655デフォルトの名無しさん:02/01/24 02:13
漏れの時間は不連続ですが、なにか?
656デフォルトの名無しさん:02/01/24 02:15
>>653
だから、
連続だったら波動性のみが残るでしょ?
離散だったら粒子性のみが残るでしょ?
で、この世界で波は波動性と粒子性を持ってるでしょ?
ってことで、結論は「よくわからない」以上。

おれは不連続だと思うけどね。
657デフォルトの名無しさん:02/01/24 02:16
訂正
>この世界で波は
この世界で光は
658 :02/01/24 02:20
波でもいいんだよ。
659 :02/01/24 02:20
波ねぎだく
660デフォルトの名無しさん:02/01/24 02:21
時間は不連続に決定しました。
なぜなら、時を止めれる人がいるから
661デフォルトの名無しさん:02/01/24 02:22
>>658
波は粒子性をもっていません。
時間の分解能って、時間を計測するときに
それ以上小さく誤差を丸めることができないってだけで、
時間は連続なんでないの?
663 :02/01/24 02:27
>>661
アフォ。光は波と粒子と両方じゃ。
664デフォルトの名無しさん:02/01/24 02:31
>>661
波動性、粒子性だろ?
物質は全て両方もってるわけで・・・
波は物質ではない。国語の問題。
665デフォルトの名無しさん:02/01/24 02:34
>>663,664
大学で物理を勉強しなおしてきなさい。
666 :02/01/24 02:35
電磁波は物質ではありませんが、光子は物質です。
質量はありませんが運動量を持っています。
SF ネタだが光子ヨットなんてのもあるしな。
たしか工房のときにニュートンかなんかに
「プランク時間 (10^-34秒だか) 以下の時間は物理的に意味を失う」とか
書いてあったな。
あと、プランク長さ (これも 10^-36mだかなんだか) ってのもあるらしい。
>>636が言ってるのは時間の分解能であって離散かどうかではない

 時間と位置は同時に正確に測れない (ホントは運動量だけどまあ見逃して)

という原理は知ってるよね?
すると記憶素子が1mm間隔にしかなくてもプランク定数より細かく時間は測れない。

未来の話だと、記憶素子はミクロン単位だろうから、プランク定数よりずっと荒い
時間単位でしかメモリーに出し入れできない というかそれより早く出し入れした
場合の因果律が怪しくなる
因果律が怪しくなるってのは変な書き方だった

つまりさ
時間と位置が同時には正確にならないんだから
時間の関係を正確にしようとするとビット位置の方が怪しくなってくるって事
ビット位置って物理量か??
>>671
 どうやって記録するかって問題なんだろうけど

 今の方式の延長上なら 結局物理的な記憶位置がビット位置になるんではないの?
ものすごく脱線してるなあ。面白いからいいけど。
ソフトウェアでの何でも圧縮は不可能だな。
じゃあ、圧縮用ハードウェアを作ろう。

そういえば、デジタルだと精度に限界があった実数が、
アナログだと無限の精度になるじゃぁないか!

これは圧縮の一種ですか?
>>110で外出です。
そういえば正式発表まだ?・・やはり嘘か。
>そういえば、デジタルだと精度に限界があった実数が、
>アナログだと無限の精度になるじゃぁないか!
はつみみです。
678デフォルトの名無しさん:02/01/24 10:40
>>676
痛い・・・。
>>678
サンプルを公開するっていってなかったっけ?
確か今週発表なはず
ある意味期待あげ

アナログだと無限の精度、こんぴゅう太は離散値しか扱えないから意味無いかもしれないですねぇ
そんなあなたにオーディオカセットテープレーコーダ
精度 一般的には 正確度および精密度の事
 正確度は真の値との誤差の度合いを示し
 精密度は繰り返し測定した時のバラツキ具合を示す
残念ながらアナログだから無限の精度というのは 正確度・精密度供にありえない

分解能 見分けられる最大の表現能力というような感じの用語
      多くの業界では信号と雑音の比(S/N比)のことを分解能と呼ぶことが

>>680 テープレコーダは磁気記録 結局スピンというデジタル量を元にしている
究極の記憶装置はつまようじでケテーイ>>110
>683
たしかに、分子・原子からできて*いない*つまようじは、
究極の記憶装置を通り越し、究極の物質といえるだろう。
>>684
ワラタ
あ!いい事考えた!
実際に出会うビットパターンは全てのビットパターンよりもはるかに少ないんだから
実際に出会うビットパターンへのインデックスに変換すればいいんだ!

問題はどう実装するかだな。
インデックスの代わりにハッシュでいいでしょう >>686
32バイトもあれば、まず宇宙が終るまでに重複はないかと

問題はそこではなくて、 逆変換=解凍方法=全部のビットパターンをどう記録するかかと
>>686
それは要するにフィル名は8文字で十分、と言っているに過ぎない。
689デフォルトの名無しさん:02/01/24 23:24
>>686
それってLz法なんじゃ・・・
車輪は再発明されるべくして再発明されるということか。
691デフォルトの名無しさん:02/01/25 04:19
>>636
おっと、それは圧縮の研究を始めた人がよく陥るミス。

その論法で行くと、256件からなるデータを8ビットに圧縮できることに
なってしまう。それが成り立つのはデータが個々の1ビットのときだけ。

4ギガバイトのデータを32ビットでアドレッシングできるからといって、
4ギガバイトのデータが32ビットに圧縮できるわけではないよね。
692691:02/01/25 04:26
>>691 の続き。

もしアカシックレコードが、現存する世界だけでなく、実現可能性のある
すべての世界についての情報まで記録しているとすれば、
そのレコードの適当な位置を指すポインタのアドレスだけで、
この世界のすべてを一意に示すことができるのですが・・・

残念なことに、 可能性として考えうる世界の数は、とてつもなく
大きくなって、それをアドレッシングする ために必要なビット数は、
結局、この世界の記述するために必要な情報量
そのものと同じようなものになっちゃいます。
693たまご:02/01/25 04:32
来てください!
http://www.i-chubu.ne.jp/~hyamada/
694デフォルトの名無しさん:02/01/25 05:34
このZeoSync社って胡散臭くない?
投資家から金ふんだくって、とんずらしようという魂胆と見た。
あと、このZDの記者、解説が超てきっとう。
JPEGは、ランレングスじゃねぇ。
695デフォルトの名無しさん:02/01/25 05:36
>>686
まず動的辞書法やハフマン法でも勉強すれ
>694は今更何を言ってるのでしょう?
>>694
>JPEGは、ランレングスじゃねぇ。
zero-runを使ってますが何か?
>>696
時差が激しい地域にお住まいなのでしょう。
今日金曜日だなぁ
休日に発表なんてことは普通考えられないので
どう多めに見てもあと2日以内に発表がある?
>>691
>その論法で行くと、256件からなるデータを8ビットに圧縮できることに
>なってしまう。それが成り立つのはデータが個々の1ビットのときだけ。
 正確には情報量がlog2(256)の時だね

>4ギガバイトのデータを32ビットでアドレッシングできるからといって、
>4ギガバイトのデータが32ビットに圧縮できるわけではないよね。
 その4ギガのデータを共有してる世界同士は32bitをやり取りするだけでいい=圧縮である


>>692 は 現存する世界の過去未来さえ表現出来たら十分では?
   実現されなかった未来には興味はないと思うのだが?
 その意味で256bitもあればインデックスが付くというのは間違いではないと思う

単純な問題は アカシックレコードに皆がアクセス出来ない 
 あるいはアクセスにコストがかかるから。
>>699
このまま何も無かったかのごとく過ぎてくんじゃない?
持ち上げたり落としたりしながら1の発言を促し、程よく熟成されたところを
見計らって晒すくらいのことは、2ちゃんでもちょっと濃慣れた板なら普通
にやってのけるのに、アメ公どもはその辺の匙加減がわかってないよ。
生真面目に反論して黙らせてしまっては、祭りも開けないじゃないか(w
>>702
このスレでは、信者も出たことだし、ワショーイだ (藁
>702
日本人はお祭り好きの民族だから・・・(笑
705デフォルトの名無しさん:02/01/26 19:30
何かあるかな?
>>705
あがったから何かあったのかと思たーよ
夜逃げしかないだろうな。
708デフォルトの名無しさん:02/01/26 20:09
Updated...
709名無し:02/01/26 23:55
>>692
>大きくなって、それをアドレッシングする ために必要なビット数は、
>結局、この世界の記述するために必要な情報量
>そのものと同じようなものになっちゃいます。

どういうこと?
2^256個のメッセージを区別するのに256bit以上必要なの?
>>700で答えが出ているような気もするけど・・・
710デフォルトの名無しさん:02/01/27 08:00
>>700
>>709

そもそも、不確定性原理を根拠に「時間の分解能」を論ずるのであれば、
アカシックレコードもまた不確定性原理から導かれる「あらゆる可能性」の
重ね合わせでなければ変でしょう?
>>710 不確定性原理をそういうふうに読む人は すでにあっちの世界に足が漬かってるものとおもわれ
ラプラスの魔?
ニールスボーア、アインシュタイン
正しいのはどちら?
710は確率論的解釈をさらに踏越えている
世界中のありうるすべての情報を詰め込んだデータベースってすでにそれ自体が世界な気がする。
>>709
> 2^256個のメッセージを区別するのに256bit以上必要なの?

必要。
なぜならばそのインデックスそのものも情報だから。
実際にはインデックス付けたい情報 ∪ インデックス
がインデックス付けられなければいけない情報。
再帰的に適用すると
インデックス = インデックス付けられる情報
となるまでインデックスは増え続ける。
>540-541
あたりで既出やね。
>548でよくわからん返答があるけど。
自分はアインシュタイン派〜
確率論などばかげている!

そろそろ発表ないのか?
>>716
 もしかして こういう事を言ってるの?
 n番目というインデックスを n+1に書いたら n+1のインデックスをn+2に作る必要があり
 以下無限に発散という
 なんとかのパラドクスだね

とりあえず、まともなプログラマならそんな実装はしないって事で
まだやってるの?ループしまくりだね。
721デフォルトの名無しさん:02/01/27 14:37
3
↑円周率100桁を圧縮してみました
π
↑円周率∞桁を圧縮してみました。
π(1-65536)
↑センセー、圧縮する桁数を減らしたら、結果、桁数増えました!
Hφ=Eφ
↑世界を圧縮してみました。
これを展開すれば歴史上のあらゆるデータを得られます。
そのかわり、100年分のデータを展開するには、100年かかります。

↑僕の肛門を圧縮してみました。
圧縮率が高すぎて閉鎖されるところでした

↑1の脳を圧縮してみました。
展開しても変わらないでしょう


CD-Rを圧縮してみました。
728710:02/01/27 15:07
マジレスは野暮だとは思うので、sage にしておきます。

>>712
もし、普通の年表のように、確定的な事実を単一の時間軸に沿って
並べた「アカシックレコード」が存在するなら、
古典物理学の意味での「ラプラスの魔」も成り立ちますね。
ラプラスの魔=アカシックレコードを読むことのできる魔物、ということに
すればよいことになります。

>>711
>>714
不確定性原理は、確率論じゃないのですが・・・
高校の教科書とかだと、「Δ位置とΔ運動量の積」しか言わないけど、
このスレでいうような微小時間について考えるなら、「Δ時間とΔエネルギーの積」ですね。
で、Δ位置やΔ時間を小さくしていくとΔ運動量やΔエネルギーの不確定性が巨大に
なる(その結果、古典物理の理論では絶対にありえないことが起こる)というのは、
物理現象であって、普通の確率論や統計学から導かれるものではありません。
不確定性原理を統計学で言うランダム過程と混同する人が多いけど、全く別のものです。
>>728を圧縮してみました

マジ野暮サゲ
>712
も並古ラす
>711 >714
不高こでな物不

いかがなものか
>>729
それは冠。
731710:02/01/27 15:16
>>729
わはは、一瞬何のことかと思ってしまった。

> いかがなものか
よろしいんじゃないでしょうか。
>>729 を展開するのに必要な辞書ってどのくらいのサイズになりますか?
韓国語なら圧縮しやすそうな気が・・・・・・
ハングル→漢字変換だけでもかなりサイズが縮みそう(w
箱の中の猫の生死を確認するには、気づかれないようにそっと箱を開けてやればいい
↑不確定理論の話?
いきなり宇宙全体とかアカシックレコードとか言い出すから
話がややこしくなるんだよ

人間が使う可能性のありそうなすべての単語には、
辞書での出現順序による一意なインデックスを付けられる。

これを大規模にしただけの話だろ。
で、辞書自体のサイズは考慮しないの?
>>736
問題ありません。
Windows XP SP1 に標準で付属します。
辞書はDVD-ROM8枚組です。
インストールには最低30GBのディスク容量が必要です。
>>729を圧縮してみました
>7サ2ラ>1物不か
740デフォルトの名無しさん:02/01/27 20:15
おーい。じゃあ、現実的な目標として1Gの任意のファイルを100Mに可逆圧縮する方法を誰か考えてYO♪

↑モナを圧縮…
>>740
1Gのモノクロビットマップなら可能ですが、何か?
>1Gの任意のファイル
全然現実的じゃない。うえに話がループしている。
>>740
>1Gの任意のファイルを100Mに可逆圧縮する方法
無理

>100Mの任意のファイルを1Gに可逆圧縮する方法
可能
745デフォルトの名無しさん:02/01/27 20:46

ZeoSyncはなにかしら有用な技術を開発してる可能性はありそうだな。
746デフォルトの名無しさん:02/01/27 20:46
現実的じゃない、かぁ。。。
アカシックレコードとか変な話に反れてたから、具体的な目標をちょっと言ってみたんだぁ。

じゃ、任意のファイルに対して圧縮率約90%+αをってゆう目標なら現実的かな?
747デフォルトの名無しさん:02/01/27 21:03
>>744
>可能
↑そんなことは聞いてない。
>>746
完全にランダムな情報には圧縮できる冗長性がないから、
任意のファイルでは不可能。
749デフォルトの名無しさん:02/01/27 21:15
>>748
ねぇねぇ、前から思ってたんだけど「完全にランダムな情報」ってどんな状況(バイナリの羅列)のファイルなの?
例えば、1GBのzipで圧縮されたファイルがあったとして、再圧縮しようとしてもサイズが変わらなかったり増えたりする時は、
それもある程度ランダム(完全にランダム?)なファイルって言えるの?
750デフォルトの名無しさん:02/01/27 21:18
>じゃ、任意のファイルに対して圧縮率約90%+αをってゆう目標なら現実的かな?

それが簡単にできたら、mp3 がはやることなんか無いのに.

>任意のファイルに対して
この前提によって理論的に不可能
752デフォルトの名無しさん:02/01/27 21:27
>それが簡単にできたら、mp3 がはやることなんか無いのに.
圧縮率90%ってのは、例えば10Mを9Mにって事だったような、、、
このスレの>>1が言ってるのは圧縮率1%って意味だよ。これよりはハードル低いと思うけどね。。。
誰かいいアイデアないかなぁ?
無限ループに入ってるな

>>752
その圧縮を500回かけてみ
754デフォルトの名無しさん:02/01/27 21:45
うん、言いたい事は解ってるよ。つーかソコが大事なんだよ。
例えば任意のファイルに対して圧縮率99%+α(αは辞書作ったりして増えちゃう分ね)でも、
cpuの性能は毎年上がっていくんだし、時間の許す限り繰り返せば、縮むって事が重要じゃないのか?
>>749
ランダムではないが、冗長性を抽出できないという点ではランダムデータと同等。
>>754
だから繰り返してももう縮まねーんだってば。
757デフォルトの名無しさん:02/01/27 22:12
じゃあさ、1GBのランダムデータがあったとしてさぁ、そのファイルを例えば8ビットずつに分けると
8ビットだからバイナリの組合せは256種類しかないわけじゃない?じゃその256種類のバイナリの出現率はどうなるの?
256種類均等に出現するのがランダムデータ?それとも逆に大幅に偏るの?
758Ruby!:02/01/27 22:13
256種類均等に出現するのがランダムデータ
>>757
たとえば、
1バイトの内、0xFFがでる確率は1/256
2バイトの内、同じデータが続く確率は1/256
などなど。

サンプルが多くなればなるほど数学上の確率に近くなる。
これがランダムデータ。
繰り返しがないので現在の圧縮技術では圧縮できない。
760デフォルトの名無しさん:02/01/27 22:38
>サンプルが多くなればなるほど数学上の確率に近くなる。
うーん、じゃあ実際のファイルはどのくらいランダムなんだろうか?
ランダム度を調べるソフトってないの?
あるファイルのnビット長(調かな?)での出現頻度を算出するソフト。
761759:02/01/27 22:41
>>760
この前調べたけどやっぱり偏りはあるな。
以外と0x00が一番多かったりする。(その時は。)

っつーか、作りなされ。ム板なんだから。
762759:02/01/27 22:44
あ、ちなみにCab最高圧縮後のファイルね。761の話は。
出現頻度の高いデータでも、連続してないとあんまり圧縮できないよね。
764デフォルトの名無しさん:02/01/27 22:49
調べたの!?いいね、実践主義って。

>っつーか、作りなされ。ム板なんだから。
俺は、その勉強から始めないといけないなぁ。。。はぁ。
765759:02/01/27 23:03
>>764
5分ぐらいでできるよ。VB使ったけど。

あとその時に気づいたんだけど、圧縮後のファイルって
同じデータが続く確率が高い。ランダムデータは約0.39%ぐらいだけど
圧縮後のファイルは0.48%ぐらいだったな。
766デフォルトの名無しさん:02/01/27 23:21
>5分ぐらいでできるよ。VB使ったけど。
ム板住人じゃないからハードル高いっス。。。

>同じデータが続く確率が高い。
そうか、「ランダムデータ」ってやつが8ビットで分割時に256種類均等に出現するファイルだとして、
そうすると1ビット分割時でも2種類均等に出現するわけだが、出現順序はランダムって訳じゃないよね?
出現順序の偏りを使った圧縮方法が有効なのかな?
全角文字を半角にすれば1/2に圧縮可能
スレも残り少ないので
以下の事柄が説明できない人は書き込みを禁止します

・シャノンの情報理論における「情報量」の定義
・ハフマン符号化の方法
・可逆圧縮と負荷逆圧縮の違い
・LZ法の概略
・ZeoSyncの最初のプレスリリースにはあったが現在は削られている学者の名前
769デフォルトの名無しさん:02/01/27 23:55
>>767
元からある半角文字はどうするねん?全角文字で表すのか?
っていうか、それ、一種のハフマン符号化だろ。
>>768 の発言により、おまえ、このスレから退場。
770768:02/01/28 00:04
s/負荷逆圧縮/不可逆圧縮/

…俺も退場しよう
そして誰もいなくなった。
>>768
一番最後分からん。俺も退場だな。
そして>>768以外誰もいなくなった。
--------------糸冬 了------------------
775デフォルトの名無しさん:02/01/28 06:21
カバかい?おっと、サイかい!
776デフォルトの名無しさん:02/01/28 07:04

いずれにせよ、ZeoSyncはなにかしら有用な技術を開発してる可能性はありそうだな。
>>757-758
 たとえば、 x[i] := i mod 256 という規則が あったとすれば
 均等頻度を見れば均等に出現するが、差分を取れば大きく隔たる

では x[i+1] ::= (x[i]*A + B) mod 256 ならどうか
A=17,B=1でみてみよう
1 18 51 100 165 246 87 200 73 218 123 44 237 190 159 144 145 162
一見ランダムに見えるが、すぐに奇数偶数が交互に表れる規則は読み取れる
さらに2階差分を取れば差が一定である規則が見えてくる
778退場者:02/01/28 08:33
もう発表ないと約束反故だと思うんですけど、情報ない?
779デフォルトの名無しさん:02/01/28 10:20
ないですよ
既に逃げの準備に入ってると思われ
>>766
> 出現順序の偏りを使った圧縮方法が有効なのかな?
たぶん>>754でいうαの方が大きくなるか、かなり近くなってしまうと思われ。
782デフォルトの名無しさん:02/01/28 12:16

あれだけ自身満々に語っておいて、残りの人生どうするつもりだろ
任意のバイト列を繰り返し適用することによって0まで圧縮する方法あるYO!!
方法は簡単、任意のバイト列を一つの大きな数Nとして捉えてここから1引くだけ。
あとは、これをN回適用すれば・・・
ウヒ
残りの人生、TVタックルにでも…
785デフォルトの名無しさん:02/01/28 12:49
>>768
個人的には算術符号(or Elias符号)の知識も要求したいところ。
>>782
カリブあたりで一生ブラブラして暮らせるくらいの金はすでにゲットしたんじゃ
ないかな。
>>783
いくつ引いたかの情報が元バイト列と同じ大きさになる以外は完璧だな(w
かくして永久機関を発明したと主張するものは、後を絶たない…
永久機関!作ったよ小学生の頃、夏休みの工作で(w
電球の下に光電池パネルを置いて、省エネスタンド・・・・
エッシャーの騙し絵永久機関には消防のころ
いたく感銘を受けた記憶がある。
791デフォルトの名無しさん:02/01/28 20:00
>>777
ん?おい!1GBを8bit長(調?)で切って「ランダムデータ」といえるファイルは、16bit長で切った場合は、
ランダムといえないんじゃないか!?ランダムなバイナリのうまい定義知ってる人は誰か教えれ♪

>>768
LZ法はLZ77符号化についてだけ読んできたけど、LZ78は固定辞書って事だろ?
LZ77のスライド辞書の適応も、位置と一致bitの長さと不一致分の記述で定義していくやり方って、
>>763が言ってるように連続してないと効率悪くなるね。
じゃあ逆に離散している、データの切れ端を別の方法で位置なりをうまく記述してやればいいのかな?
で、その後でハフマンかなぁ、やっぱ。

>>785
算術圧縮をうまく解説してるページが見つからないよぉ。しかも難しいらしいネ。でもハフマンより少し縮むらしい。。。

>>786-790
あーん。ネタレス付けると勿体無いYO!
良質な乱数は、途中の桁だけ取り出しても、良質な乱数です。
>>738
これって今は現実的じゃないけど、将来わからんね。
>>793
DVDってところが変わりそう。
>>791
 ランダムな定義は nBITのデータ列から 1個減らしたどの一部も どんな方法でも予測出来ない事
796738:02/01/29 08:52
>>793
ネタだったんだが・・・・・・
大前提:出現頻度に応じて割り当てビット量を変える。だから圧縮できる。
だとすれば、汎用の辞書をどれだけ巨大化したところで、圧縮できそうにないんだが?
ほとんどの、とは言わないまでも、多くのコンピュータ用データに共通する片寄りで
も見つかれば、できなくもなさそうだけど・・・・・そんな片寄りはなさそう。
>>796 いや EXEファイルなんかだとコンパイラのライブラリ部とか
  頻出するパターンとかあるから辞書使えば結構圧縮出来るでしょ。

それから文章なんかも 辞書が巨大なほど圧縮出来るでしょ
2CHのスレだと1/100も可能かもね
逝って良し
オマエモナー
辺りを辞書に加えれば良いわけだな♪

逝って良し子はともかく逝ってヨしは外れてしまうってか?
>>798
逝って良し子♪
2ちゃんのログは不可逆で圧縮するとか?
イッテヨシ、逝ってヨシ、逝って養子→(圧縮)→逝ってよし→(展開)→逝ってよし
2ちゃんブラウザと2ちゃんサーバで共通の辞書を持てばかなり圧縮が効きそう。
>>800
2chらしくないからヤダ。
>>801を、不可逆で圧縮展開すると

>>800
2ちゃんねるらしくないから嫌です。

と、なるわけだな(w
>802
解凍の方は個人の特色に合わせて、とかは?

例としては、ヒッキー用は否定的な語尾の後に例の絵文字が、とか。
どーでもいいようなことを熱く語らないでください。
ヽ(`Д´)ノボッキアゲ!
806結論:02/02/02 01:08
バナナはおやつに入りません。
807補足:02/02/02 02:00
バナナのみを持って行く事で遠足のおやつ代を
300円から0円に圧縮できます。(圧縮率無限大)
冷凍バナナ食べたい
>808
代わりに漏れのバナナをかじってください
810デフォルトの名無しさん:02/02/02 18:16
で?
ボッキボッキ言ってねーで
たまにはアナルの話でもしろよ
ヽ(`Д´)ノアナルナメ!
69
アーイムジャーストシンプールマッドネスメーン
BUCK-TICKのSix/Nineのトラック2のLove Letterより

君達のことだ。
815デフォルトの名無しさん:02/02/03 03:12
まだ動きはないの? もう逃げたのかな?
816 :02/02/03 03:35


      ∧_∧      ∧_∧
     _( ´∀`)    (´∀` )
  三(⌒),    ノ⊃    ( 815  )   いいかげん・・
     ̄/ /)  )      | |  |
    . 〈_)\_)      (__(___)

         ∧_∧  .∧_∧
         (  ´∀) (´∀` )
       ≡≡三 三ニ⌒) 815 .)   目をさませって・・
        /  /)  )  ̄.| |  |
        〈__)__)  (__(___)

           ∧_∧  ,__ ∧_∧
          (    ´)ノ ):;:;)∀`)
          /    ̄,ノ'' バ  )  言ってるだろーが!!
         C   /~ / /   /
         /   / 〉 (__(__./
         \__)\)
817 :02/02/03 03:36

                      ヽ l //
            ∧_∧(⌒) ―― ★ ―――
            (    ) /|l  // | ヽ   ヴォケがーー!
           (/     ノl|ll / / |  ヽ
            (O  ノ 彡''   /  .|
            /  ./ 〉
            \__)_)

>>1に対して延々とネタにマジレス。
でも面白い意見多し。良スレ。頑張れ。
819デフォルトの名無しさん:02/02/04 18:16
あげちゃう(*´-`*)
デフォルトとちきい
821810:02/02/05 04:23
で?ジョーヂはどうなったのよ?音沙汰無し?
822デフォルトの名無しさん:02/02/10 00:42
age
823デフォルトの名無しさん:02/02/13 06:31

ここまで大風呂敷広げたんだから、事の顛末だけ教えれ

ここまで大風呂敷広げたんだから、事の顛末だけ教えれ

ここまで大風呂敷広げたんだから、事の顛末だけ教えれ
セントジョージは夜逃げをしたらしい
千とジョージの神隠し
>825
ワラタ
827sage:02/02/14 14:11
セントジョージ「ククク・・・馬鹿な2ちゃんねらーから金も得たし、
         さっさとんずらするか。」
ぎゃふん
http://www.zdnet.co.jp/news/0202/20/b_0219_06.html
“画期的”なZeoSyncのデータ圧縮技術に疑問符

Intelなど大手チップメーカーが同社の技術をテストする準備を進めているとしているが,Intel側はこうした計画があるとは確認できないとしている。
またZeoSyncのリリース文に技術顧問として名前が載っている数人が同社と全く関係がなかったことも判明した。
ZeoSync幹部は,リリースに一部誤情報があったことを認めつつも,圧縮技術については,間もなく第三者から,その正当性を証明するものが提示されるとしている。

間もなくっていつだよ!
4月1日です。
このスレageたの誰?

全員sageのように見えるんだが
書きこみに失敗すると、レス増えずにあがる事が、前にあったけど、そんなやつ?
>>830
まだジョージは懲りてなかったんだな・・・
>>835
また詐欺で金儲けしようとしてるというのが正しい
>>833
sageでも書き込んでいればなかなか下がっていかない。
書き込みされていないスレのほうが早く下がっていくから。
無論、dat落ちもしない。
838デフォルトの名無しさん:02/02/22 11:00
更に窮地においやられているジョージですが、まあそれはおいといて

すでに>>6,>>108,>>111,>>112が同じようなことを言ってるけど
乱数列を(n1/n2)**(n3/n4)のn5桁目からn6桁目という表現する方法を
数学的に見つけたんだったら、n1からn6を構成するデータの大きさ以下に
圧縮することは不可能だけど、実用的な高圧縮はできるんでは?
>>838
すでに皆が同じような事を言っていますか
そのn1〜n4を固定してn5のビットサイズだけでも
(n6-n5)のビット数がわずか1ビットでも小さくなる確率は
ビット数が大きければ殆どありえないほど小さいのです。
841デフォルトの名無しさん:02/02/23 09:45
128ビットのファイル(最も基本的なコンピュータ文字であるASCIIで16文字)を100ビットに圧縮するのに,1日以上かかった。(上のリンク先より抜粋)
……仮に実現したとしても、これで使い物になるのか?
>841
今の圧縮理論も最初は似たようなこと言われてたからねえ。
>842
現在の圧縮理論と ZeoSync の話の違いは、
前者が「理屈は正しいんだけど時間がかかるでしょ」で
後者が「理屈が矛盾しているよ。せめて実例を出してよ」
でしょ。

あと、「今の圧縮理論も最初は似たようなこと」っていうけど、
言われていたのは算術圧縮やブロックソートの方で、LZ 系の自己組織化圧縮
理論にはあまりそのような批判は無かったのだが。
>>841
20年ぐらい後で、CPU200GHzが標準の時代に突入した頃に役立つのではないかと
>>844
200GHzは20年もかからない
>>845
熱の問題がちゃんと解決されて、トレンドがクロックレスやマルチになってなければな〜
847デフォルトの名無しさん:02/02/24 02:01
10Bitのチョコを10分の1に圧縮シテシマッタことならある
848デフォルトの名無しさん:02/02/24 02:13
私の息子は3分の一まで圧縮しましたがなにか?
このスレに来ている者は自分で圧縮法を考え付いて実装したことはないの?
>>848

それはどんなものでも圧縮化ですか?
851デフォルトの名無しさん:02/02/24 03:44
>>849

自分のが圧縮したことはあるがなにか。
>>849
あるよ。ゲームで使うグラフィックデータの簡単な圧縮だけど
>>849
「圧縮法」の言葉の意味の問題かなぁ。

汎用アルゴリズムはほとんどの場合「よい」圧縮結果を出すが、
特定用途の場合、元データの偏り方が予測/管理可能な場合、それに基づいた圧縮アルゴリズム/パラメータを
選ぶことがある。そのための手間と結果(圧縮率など)とのトレードオフだけどね。

そういったパラメータ調整や、いくつかのアルゴリズムの取捨選択ってのは、身につけておくべき
知識でしょう。

けど、誰も考えつかなかったアルゴリズムを「考える」ってのはふつうはやらないよ。
この分野はほとんど開拓されているので、十分な時間と資金と、何かのひらめきが無いと
無理。

少なくとも ZeoSync のような、存在しないことが証明されている分野を研究することは
無駄だ。


新しいアルゴリズムも
誰も相手にしていなかった特殊な用途に関してはありえる。
組み込み型で特定のパターンの巨大なデータを使うとか、
ある分野の計算で使うテーブルとか。
圧縮法や暗号化技術を考えてみるのはおもしろいよね。
>>840
>ZeoSyncのわずかな予算では当面の間,
>Pentium IIチップ搭載の古いコンピュータでテストするしかない。
弱すぎ。
ついでに頭も弱すぎ?
最新CPUにしても速度が全然かわらんから、古いCPUでごまかしてるだけだろ
>Pentium IIチップ搭載の古いコンピュータでテストするしかない
          |\              /|`、
            | | \            / | |
            | |   \_____/  .| |
         |レ ´              \|
          |                 ヽ
           |                  ヽ
          |               ,,,,;;::'''''ヽ
          |     ,,,,;;:::::::::::::::       __ ヽ
          |     "   __ ::::  '"ゞ'-' |
          |       - '"-ゞ'-' ::::::...     |
          |             :::::::   ヒつ |
           |       ヒつ   ( ,-、 ,:‐、   |
          |                     |
          |            __,-'ニニニヽ . |
..          |              ヾニ二ン"  /
           ヽ                   /
            ー――――――l――l――‐´
                      /、  ||
                       | |  / |
                       || |  | |
                      | | |  | |
                      | | |  | |
                     /  | | _ | |ー 、
                    / /  ̄   ̄ー- _/>
                    `ー          ´
         この程度のマシンでもそれなりの結果は出せなくては
        (実用化は)難しい
>Pentium IIチップ搭載の古いコンピュータでテストするしかない

和訳 「金かしてくれ。貧乏なんだよ。返す宛てはないけどな。」
>Pentium IIチップ搭載の古いコンピュータでテストするしかない

和訳 せんとじょーじ「金くれ。そしてさっさとんずらするぜ。」
CEOの名前からして怪しい
863デフォルトの名無しさん:02/03/04 04:41

画期的な劣化なし圧縮は大ウソ
http://www.st.rim.or.jp/~k-kazuma/TH/TH511.html
>863
わかってるからあげなくていいって
865デフォルトの名無しさん:02/03/04 10:46
スレ違いの質問であれば申し訳ありません。
パールを一から学びたいと思っています。
お勧めの文献もしくはHP等があれば
教えて頂きたいのですが。

おおまかな説明で申し訳ありませんが
私は基本的に要領が悪いので
そんな私でも学べるような物を是非お願い致します。
>スレ違いの質問であれば申し訳ありません。
本当です。

>私は基本的に要領が悪いので
この質問を見ればわかります。

まずは、質問するのに適切なスレを探せるようになりましょう。がんばって。
867デフォルトの名無しさん:02/03/05 00:39
>>865
ttp://www.kusa.ac.jp/~e06t033/opal.html

ここなんかどうでしょうか。日本語だし、あなたと違って
シンプルにまとまっててわかりやすいと思いますよ。
>>863
何か、猿でもわかりそうな事を、さも偉そうに書きなぐる著者の姿勢に萎え。
ZeoSyncたんを応援したくなった。(無理だろうけど)
マスメディアの白痴どもはその猿でも分かりそうなことさえ
理解してないって趣旨だろ
よくわからんけど、結局圧縮無しの劣化って不可能なの?
だれか発明してくれないかな。100分の一になれば、
ネットの活用性も増えそうだなぁ。高速回線も必要なくなるしね!
たぶん漏れは、エロ動画でしか使わないような気もするが(藁
>>870
> よくわからんけど、結局圧縮無しの劣化って不可能なの?

別に難しい事じゃない。簡単に実現できるよ。
不可能なのは劣化無しの圧縮であって、その逆は全然OK。
872デフォルトの名無しさん:02/03/26 06:58
ねたにまじレスカコイイ
突っ込まれたその時からミスは全部ネタってかー。そっちの方がカコイイ。
圧縮なしの劣化。

ランダムにビットを反転でもさせれば。
875 :02/03/26 09:04
上にも出てたけど,クライアント・サーバな圧縮方式って駄目かな?
異様なまでに巨大な辞書をサーバに置いて使うの.
>>875
30人がMXで落とした200MBの動画を解凍しようとしました。
サーバ落ちるか思いっきり遅いか。
>>875
ネタとして、既出。
ネットワークの帯域がストレージの速度より十分速ければ
いちいちデータを移動する必要もなし。
すべてのファイルはURIで管理。

というのが理想なんだけどな。
ネットワークの帯域があがったら、それよりも早いストレージが提供されるのが理想。
>>877はネタだしょ。
あたりまえだけど、ストレージの速度がネットワークの速度より速くなければ、
そのネットワークの繋ぐ先のサーバーが成立しなくなるじょ。
881880:02/03/26 11:53
>>878 だた。
>>875-880
帯域がどうとかそういう問題以前に、
その異様なまでの巨大な辞書を参照するためのデータをどう考える?
辞書をいくら大きくしようとエントロピーを越えることはできないのでは?
もうなんか凄まじくガイシュツネタが多いので新しいネタキボン
もうネタがないからこんなにカキコ少ないんだろうけど
>>883
ネタが無いんだったら糞スレに書き込むな。
いつまでたっても DAT 落ちしねーだろうが。
885あげ:02/04/09 01:26
あげ
>>884
自爆?
Visually Lossless ってさ、結局Lossyじゃん。
荒れもそうじゃないの?
888デフォルトの名無しさん:02/04/27 04:11
  ノ     ∧     /) ∧
  彡  ノW \从/V  W \   ミ
  (  ノ        |      ノ \)
  ∩V      、、 |       >V7
  (eLL/ ̄ ̄\/  L/ ̄ ̄\┘/3)
  (┗(      )⌒(      )┛/
   ~| \__/ |  \__/ |~     / ̄ ̄ ̄ ̄ ̄ ̄
    爻     < |  ;     爻    < 888
    ~爻     \_/  _, 爻~      \______
     ~爻__/⌒ ̄ ̄ ̄~~ヽ_ 爻~
     /    ー ̄ ̄\_ ̄\
  _一‘     < ̄ ̄\\\J
<\       ー ̄ ̄ヽ_ヽJ   ̄\_
  \     _ニニニヽ )       ~\
   \  _/⌒|\ ヽ_~~ ~⌒\_
  __/~    V \_|     ~\_
889デフォルトの名無しさん:02/04/27 13:18
ランダムデータが圧縮出来るんなら
永遠と圧縮を繰り返すことが出来る訳でしょ?
おかしいじゃん
>>889
どうしてこの手のスレって同じような話題が繰り返されるわけ?

ランダム「っぽい」データを圧縮できると「主張している」形式
891デフォルトの名無しさん:02/04/27 13:37
>>890
アフォか?「あらゆるデータ」を圧縮できると言ってたんだよ。

「主張している」だと嘘にならんのか?頭大丈夫?
>>890
世の中にはカオス理論とか言うものもあるしね。
893MMR:02/04/27 13:39
>>890はエジプト人です
>>891←典型例
895>:02/04/27 13:43
>>894
おまえはズラだな

はい
ズラです
ずらずらずーら
896デフォルトの名無しさん:02/04/27 13:49
一瞬でも信じた馬鹿はプログラマ辞めろ。
897デフォルトの名無しさん:02/04/27 13:52
>>896あなたは天使です
私たちの命の恩人です
もうなんて言ったら良いのやら
本当に感謝してます
私たちが馬鹿でした
引数を「いんすう」って読んでいました
恥ずかしくて
898デフォルトの名無しさん:02/04/27 13:53
俺の高校の数学教師も「いんすう」って読んでたな
899デフォルトの名無しさん:02/04/27 13:56
ひき肉
900デフォルトの名無しさん:02/04/27 13:59
>>899 ハァ?
定数を「じょうすう」って読んでる教授がいたなぁそういえば。
902デフォルトの名無しさん:02/04/27 14:05
さだかず
だよ
淫水
904デフォルトの名無しさん:02/04/27 14:18
定石
905デフォルトの名無しさん:02/04/27 14:23
hasui
>>898
そりゃ因数じゃないのか?
9071:02/04/27 17:40
いや
数AのあほBASICでの事
908デフォルトの名無しさん:02/05/16 01:43
結局どうなったのか、その後の情勢を知っている人はいますか?
そして、908がその後どうなったのかを知る人はいない。
910デフォルトの名無しさん:02/05/16 01:48
俺も知りたいのでage
>>901
デ・ファクト・スタンダードって意味ならあってるでしょ?
常数としての意味なら定数だけど・・・
912:02/05/16 03:57
逆。
デファクトスタンダードなら「じょうすう」は笑いものだ。
>>901には「早計過ぎたな」と言っとけ。
定石とかんちがいしてるのでは
914:02/05/16 04:05
引数はひきすうだな。
つか、>>911 が“デファクトスタンダード”の意味を判っているのかが心配。
916901:02/05/16 12:17
>>911
「じょうすう」と「ていすう」では意味が違うですよ。
じょうすうと読む場合の「数」は運命と言う意味です。
「じょうすう」なら常数とも書くのか。フーン
そういや 文章の作者が同じか認識するのに 圧縮してみて圧縮率が高いかどうかなんて馬鹿な研究発表してた大学が外国にあったな
>>918
何で馬鹿なの?
…と釣られてみるテスト
920    :02/05/20 03:07
「引き数」
のほうが読みやすいなぁ
>>918
そいつの文章の特徴抽出という点では・・・。
922デフォルトの名無しさん:02/06/16 06:20
次スレは950でいい?
>>922
950までいかなかったりしてな(w
このスレで終わりにしてホスィ
>>922
何の話題があるんだと小一時間。
zdの記事、なくなってるし。
ついでにZeoSyncはトップページだけしか表示されないし。
結論:アフォにはそれらしく思えるデタラメを発表して、
ヴァカから金をせしめる典型的な詐欺ですた。

−−−−終冬−−−−−
9286:02/06/16 19:19
ちょっと残念・・・
ちょっぴり期待してたんだけどね。
929逝って良しの1:02/06/16 20:21
ネタだネタだと書きこんでるのは、
このスレの前半でマジで信じてた馬鹿本人ちゃう?

「いやー俺は最初から信じて無かったよ。ネタだよネタ」
と信じこみたいんですね。

sage
930460:02/06/16 22:15
>>928
来るの遅そっ!
>>36
解凍の仕方を教えてください。
>>108
ガイシュツ
http://j.peopledaily.com.cn/2002/06/19/jp20020619_18233.html
これの(アルゴリズム的な)情報キボンヌ
数倍ってワラタ
935デフォルトの名無しさん:02/06/20 03:15

  新 ネ タ 投 入 で す か ?
936デフォルトの名無しさん:02/06/20 03:30
圧宝 って、読み方は アッポー でいいのかな?

ジャイアント馬場が主人公のそういうゲームがあった気がするけど
>>936
なんで日本語読み?
中国は漢字の発音まったく違いまっする
>>936
笑った。もし日本人が命名したのならセンスが良いけどね。
中国のそれ、いつぞやのデマと変わらないレベルだなァ。
940デフォルトの名無しさん:02/06/20 20:25
ホームページ消滅したよ
941デフォルトの名無しさん:02/06/21 07:26
>>936
セガのプロレスゲームだったね。
942Disca ◆NAfP6znE :02/06/21 09:18
圧宝国際でも有名な圧縮ソフトの数倍
ターボール?
ラー?
エルエイチエー?
ジップ?
アッポー?どれ?
可逆と不可逆を比較してたりして。
944デフォルトの名無しさん:02/06/22 20:03
cabでいいじゃん。
 JPEG2000 !
圧縮率20〜30%UP!
可逆/非可逆選択可能!
ファイルサイズによる圧縮率選択可能!
アニメーションストリーム形式可能!
その他色々!
946デフォルトの名無しさん:02/06/23 03:06
JPEG2000の詳細情報キボンヌ
947デフォルトの名無しさん:02/06/23 03:07
もう2002も半分過ぎたよ...
>942
多分RLEだろ(w
949デフォルトの名無しさん:02/06/25 15:33
バイテック、カオス現象を利用したデジタル情報の完全可逆圧縮技術を開発

http://ascii24.com/news/i/tech/article/2002/06/14/636541-000.html

これってどうよ。
カオスやフラクタルを使って、完全可逆という辺りが怪しいような。
非可逆なら、まだ判るんだけど。
951デフォルトの名無しさん:02/06/26 00:39
>>950
新スレよろしく
新スレいらねーよ。
953デフォルトの名無しさん:02/06/26 09:04
元データa(長さ2^n)がx = 2 y : x = 2 , y = 3 という感じになればいいのでは。
954デフォルトの名無しさん:02/06/26 09:10
圧縮前データを生成できるようなアルゴリズムを圧縮結果とするような
感じになればいいのでは?
いい加減そのト理論は聞き秋田。
956デフォルトの名無しさん:02/06/26 13:31
>>949の詳細知ってる人いないのー?
>>956
庄野克房さんは知っているはず。
958デフォルトの名無しさん:02/06/26 14:22
http://www.moe.edu.sg/maths/jul99/Triangle.gif
おいお前ら。これ、教えてください。同僚のOLに笑われる。
959デフォルトの名無しさん:02/06/26 14:41
>>958 まじで考え込んだよ。
わかればなんだそんなことかということなんだが。
下の三角形の斜めの線は本当に直線なのか
>>958
(゚∀゚)斜辺をよく観察すると、直線じゃないことがわかる。
あと、2つの三角形は相似であるはずだが、実際には・・・
直線じゃないだろ。
直線じゃないね。
>>958
で、どこが圧縮に関わるんだ。コレ
>>958の脳ミソは圧縮可能だということ。
冗長性が高い、と言うことか
967デフォルトの名無しさん:02/06/29 14:19
>>958
今さらながら職場で大ブーム!
もっと他にこういうのないかな?
>>967
イタチ外
>>958
マジで真剣に考えた。
何とか解けた、と思う。
答えメアドに載せるからあってたら教えてください。
>>969
あってるよ
971969:02/07/13 21:59
>>970
サンクス!
>>969
ちゃう。
斜辺が直線じゃない(3角形じゃない
>>949
バイテックへのリンクが準備中というのにはワラタ
974隣人:02/08/04 12:02
>>1
976乱数:02/08/05 21:57
900kbのを圧縮→疑似乱数でxor→圧縮→疑似乱数でxor→圧縮・・あと2回ほど繰り返す・・・
そしたら250kbぐらいまで逝ったよ。
圧縮にはcabを使い、乱数でxorするのにはHSP使用
>>976
ぜ、ぜ、ぜひ検証させてくれ!
使ったデータとプログラムを公開するか、
追試実験が可能な程度の情報を開示してくれ!

つーか、誰も追試できないと、それは真実にならないので注意。
どんなファイル長でも固定長に圧縮できる方法を発見したぞ。
まず入力ファイルをzipなり何なりで圧縮し、そのファイルサイズ、CRCを出力する。
解凍する場合、(ファイルサイズ)バイトの考えられる全ての組み合わせからCRCの一致するものを抽出
そしてその中からzipとして解凍可能な組み合わせを探す。結構な精度で元ファイルが復元できると思うが、どうか。
処理速度?解凍は死ぬほど遅いが圧縮が糞速いからプラマイゼロだろ(藁
>>978
解凍に一年ぐらいかかったりしないか?(藁
980デフォルトの名無しさん:02/08/06 00:37
>>978
作ってみるわ。まっとれ
981逝って良しの1:02/08/06 00:45
アフォか!
解凍可能な組み合わせが天文学的な数になるに決まってるだろ!
982978:02/08/06 00:57
>>979
まあ並列演算の得意そうな量子コンピュータに期待。

>>980
カコイイ

>>981
そう言われればそうなんだが、うーむ。
長さnの任意のビット列が正常なzipフォーマットになる確率は相当低いし……
とはいえ候補の数も膨大だからな……
まー複数でたら最終的にはファイル内容からユーザが判断するって事で
とりあえず、元データのチェックサム取っといて、
解凍後のデータのチェックサムと比較すれば、
解凍後の候補はかなり絞れるゾ、とか言ってみるテスト
てかこれ、ガロア体かなんか使ってうまく実装できねえか?
時間なんか気にしなければ、だけど
チェックサムが2バイトとして、候補が1/65536になるだけ、4バイトでも
 1/4294967296に出来るだけ。
それに対して、1KBytesのデータでも元データの候補は
2^(8*1024)だから、1.0907481356194159294629842447338e+2466
1MBytesだと、2^(8*1024*1024)で……、Windows付属の電卓では
計算できねぇよぉ。

候補の数を 1/4294967296 に絞っても焼け石に水。
この程度の事ではエントリピーの壁は超えられない。

計算ミスがあれば突っ込んでね。
987978:02/08/06 04:26
>>985
(´Д`)確かに……
冷静に計算したらそりゃそうだわな。
でも、解凍候補が複数存在する(どれが本物かは判断不能)アルゴリズムなら
結構情報量削れる気がすんだよなあ。

小ネタ
圧縮関数 :
与えられたデータから1引く。
例 : 1011→1010
全ビット0の場合 : 0000→111

解凍関数 : 与えられたデータに1足す。つまり上の逆。

こいつを使えば、n回目に圧縮したサイズ≧n+1回目に圧縮したサイズ、となる。
どんなデータでも最終的に0ビットまで圧縮してくれるという優れもの。藁
当然可逆。こりゃ凄えや!
988985:02/08/06 04:30
エントリピーって、なんだよ。エントロピーだろ。

欝だ、寝よう。
989デフォルトの名無しさん:02/08/06 04:41
>>987
n はどうすんの?
0ビットになったら、複数存在する解凍候補は全てのファイルですか。
面白いね。
nが元ファイルと同サイズに
>>991
ワラタ
>>978
ファイルサイズ・CRCのほかに先頭・中間・末尾の数バイトを取得して記憶しておく。
これならさらに絞り込めるかも?
QlpoOTFBWSZTWTZ8BwF3cUgggBJAICAIICBQZvtqDPtKRkpWhBRldSIKUnyFBWQBZXcZYWgFIjsgAiBJICAgIIABAUoBqPspdRBS8xRlhRBS93ki+0ggK/s=
BZ2
ある大きさ n (byte) のファイルが "正常"なZIP書庫である確率ってどれくらいなんだ?
かなり低い。
>>996
何パーセントくらいですか??
998乱数:02/08/06 14:37
できると思ったけど展開ができず、何かと探して見たらソースにミスが・・
やっぱ究極の圧縮は無理?
999デフォルトの名無しさん:02/08/06 14:57
すべてのデータは関数にすることが出来る。
これをジャイアンの定理と言う。

まぁ落ち着け。
1000デフォルトの名無しさん:02/08/06 14:58
1000
10011001
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。