圧縮アルゴリズム考えたんですが

おおよそでは復号されたとは言えない。
例え意味のある日本語のリストをあらかじめ辞書として全部持っていても
くわしく、けわしく、かわさきなどのどれが正しいかを判定するのは不可能。

それなのに何故、記号の羅列の中にｋｗｓｋが出てきたとしても
俺らが確実に「くわしく」と読んでいるかというと
「ｋｗｓｋ＝くわしく」であってそれ以外にはありえない、という
辞書があるからであって
これは書いた人と読んだ人の辞書が違えば当然解読できない。
例えば「カワサキ」と書こうと思ってｋｗｓｋと書いても「詳しく」と読まれるだろう。
だからカワサキを圧縮することは出来ない。
つまり情報量は復号時に使われる辞書に依存すると言える。

文脈があればカワサキと書くことも読むこともできる、という意見もあるだろうが
前後の文脈というもの自体もデータなので
それも含めると情報量は増えるがサイズも増える。
なので母音抜き圧縮を辞書無しに文脈と経験で復号できると言うならば
このレスから母音だけで構成される音以外の母音を全部抜いても
次の問いに確実に正解できるはずだ。
immdnnnkikwsktittdsyu?

976 ：デフォルトの名無しさん：2006/02/08(水) 08:04:01

いままでになんかいくわしくといったでしょう？

977 ：デフォルトの名無しさん：2006/02/08(水) 08:11:58

問いは「いままでになんかいかわさこといったでしょう？」
答えは勿論0。一度も川迫なんて言ってない

978 ：デフォルトの名無しさん：2006/02/08(水) 13:58:49

>>975
>969

979 ：魚チョコ：2006/02/08(水) 14:28:24

話ちがうが圧縮の反対でさあ。こういう掲示板で、レスに見えないデーターを
うめこむために全角空白と半角スペースを使って、

全半全　1
全全　　 0

として二進数でかきこむの。

全全半全半全全半全半全全全全全半全半全半全半全全全

これで漢字１字か……。

980 ：デフォルトの名無しさん：2006/02/08(水) 15:55:28

>>978
非可逆圧縮の場合どの程度まで情報欠落を許して
補完で元のデータとどれだけ近い状態になるか、という話になる。

母音抜き圧縮(仮)は
圧縮対象データの何十倍もの量のデータ(前後の文章)を必要とした上に
復号後に補完しても元のデータと全く違ってしまう可能性が高い。
これでは圧縮アルゴリズムとしては全く使い物にならない。

そんな可逆圧縮以上のデータ量になるのが容易に予想される
腐った非可逆圧縮は圧縮と呼ばない。ただの言葉遊びと呼ぶ。

981 ：デフォルトの名無しさん：2006/02/08(水) 17:56:50

>>975
つ記号論

「辞書」は広辞苑とかの辞書じゃないよ。

982 ：魚チョコ：2006/02/08(水) 18:02:15

んあ、まちげーた。

全半全　　0
全全　　　 1

だった――って、誰もこんなくすつまんねーﾚｽよまねーか。俺でもよまねーもんな　ﾐﾟ仝　ﾟ　ﾐ

983 ：デフォルトの名無しさん：2006/02/08(水) 18:07:44

>>980
「詳しく」が「詳細を教えてくれ」を意味するように、「ｋｗｓｋ」は母音抜きとかそういう問題じゃなくて、「詳しく」って意味になってるってことだろ。
だからある種の変換リストを送る側と受ける側が共有してれば、転送する情報量は少なくなるってこと。

厳密には圧縮じゃないけど、ｋｗｓｋは情報欠落してないよ。
それとも>>980は人と会話するときに、たとえば「リモコンをくれ」を言うにしても、
「赤外線で通信することによって、ある程度機械から離れたところから機器を遠隔操作できる端末をとってくれ」
とでも言わないと通じないのか？

984 ：デフォルトの名無しさん：2006/02/08(水) 18:19:21

俺は子音でなく母音を落としてるところにlossy圧縮の形が見えたな

985 ：デフォルトの名無しさん：2006/02/08(水) 18:24:36

だから俺は最初から単なる辞書だろって言ってるってば。

「辞書じゃない　経験と文脈で復号できる」と言う人が居たから
ならば君が言う通り辞書じゃないとすれば、という話をしたところ
そしたら何故かjpegの話を振られたので
ならばlossyとすれば、と話を繋げたわけだよ

986 ：デフォルトの名無しさん：2006/02/08(水) 19:32:04

ただし辞書を使えばそれは圧縮ではないわな

987 ：デフォルトの名無しさん：2006/02/08(水) 21:32:45

>>980

>>985
だって、snegとかkwskとかを知ってれば、実際に
ktkrと書いてあると、ｷﾀｺﾚのことだとわかったからなぁ。
ktkr=ｷﾀｺﾚだという辞書は判定前に持っていなかったにも
かかわらず。

ただ、これはもちろん復号先のデータに仮定をしている。
仮定の度合いが極端で、なおかつ前後の文脈で変わるのが
JPEG(JFIFか)との違いではあるが、圧縮にはデータの仮定は
つきもので、正しく復号できるとは限らないのは非可逆圧縮の常だな。

が、>975は、正しく復号できないなら圧縮じゃないと言う。
データに対する仮定をすることが辞書をもつことだと言う。
ｷﾀｺﾚを圧縮するしないにかかわらず事前に共有されている前提の
データ（=文脈と経験）のサイズをktkrのサイズに含めて問題にする。

988 ：デフォルトの名無しさん：2006/02/08(水) 21:36:19

wktk

989 ：デフォルトの名無しさん：2006/02/08(水) 23:20:13

>>987
記号論の本を1億回読んでこい。
意味は辞書と文法によって確定されるもんだ。
経験や文脈は、無意識のうちに辞書や文法に組み込まれているだけ。

990 ：デフォルトの名無しさん：2006/02/08(水) 23:33:38

基礎化

991 ：デフォルトの名無しさん：2006/02/08(水) 23:43:32

>>989
辞書と文法の話で言えばその「組み込む」ってのは
辞書の動的な生成だろ？
復号のために事前に辞書を持ってる、っていう今まで
の「辞書式だ」って話とは合わないだろ。

>>983と考えるなら事前に辞書持ってるってことに
なるけどな。

992 ：デフォルトの名無しさん：2006/02/08(水) 23:50:51

>>1
このスレを圧縮してください。

993 ：デフォルトの名無しさん：2006/02/08(水) 23:55:15

お前はアホ？
相手が全く同一のコードを共有しているわけじゃないのになぜ話が通じるか説明してみな。