圧縮アルゴリズム考えたんですが

このエントリーをはてなブックマークに追加
952デフォルトの名無しさん:2006/02/05(日) 18:56:11
>>868
遅レスすまん。
15年ほど前に実行形式のプログラムが自己展開する奴を作ったことあるけど、アセンブラで116バイトだったよ。
953デフォルトの名無しさん:2006/02/06(月) 03:39:54
>>747
jpegは算術符号が特許の絡みで実装できないため最終段でハフマン圧縮してるらしい。
だからゼロベタの部分はハフマン圧縮しても偏るため、再圧縮が効くときもある。
954デフォルトの名無しさん:2006/02/06(月) 20:24:31
圧縮アルゴリズム考えたぞ!
まずファイルを圧縮して10分割する
一つを相手に送ってその他をCDに焼いて
郵送すれば実質圧縮ファイルの10分の1だ!
よし特許取って来よう。
955デフォルトの名無しさん:2006/02/06(月) 20:34:46
応用すれば元の圧縮ファイルの100分の1や1000分の1
1000000000000000000000000分の1も可能だ!
956デフォルトの名無しさん:2006/02/06(月) 20:42:38
はいはいすごすすごろくす
957デフォルトの名無しさん:2006/02/06(月) 22:15:53
田中彰の応援歌を考えた。

行くぞ彰ホームラン!センターオーバーホームラン!
弾丸ライナーだ!飛ばせ!運べ!彰!

俺が考えた歌詞ですよ!
弾丸ライナーだ!の後に「ヘイ!」とか「おい!」って掛け声を入れてスタンドでジャンプするの
とかいれると面白いかもしれない。
958デフォルトの名無しさん:2006/02/06(月) 23:45:48
究極の圧縮&暗号化思いついた!



バイナリの先頭1バイト(0〜255)を鍵として、ユーザーに覚えてもらう。
それを繰り返せば0バイトになる。

よし特許。
959デフォルトの名無しさん:2006/02/07(火) 02:32:45
>>958
kwsk!!
960デフォルトの名無しさん:2006/02/07(火) 02:41:33
「kwsk」も圧縮だよなー
961デフォルトの名無しさん:2006/02/07(火) 03:24:50
要するに
kuwasiku 鍵=k
→uwasiku 鍵=u
→wasiku 鍵=w
→asiku 鍵=a
→siku 鍵=s
→iku 鍵=i
→ku 鍵=k
→u 鍵=u


って脳で覚えてるだけじゃねーか
962デフォルトの名無しさん:2006/02/07(火) 09:07:21
>>960
そりはハッシュでわ?
というかインデックス?
たまたま衝突が少ないだけ。
kwsk -> 詳しく に1対1で戻せない。
情報が欠落してる。

なんでマジレスしてるんだ漏れ?
963デフォルトの名無しさん:2006/02/07(火) 10:03:24
何そのヘブライ文字
964デフォルトの名無しさん:2006/02/07(火) 18:13:07
>>962
>>961は欠落してないから圧縮なのか?
965デフォルトの名無しさん:2006/02/07(火) 19:42:01
単に記憶領域を変えただけとも言う
966デフォルトの名無しさん:2006/02/07(火) 23:22:49
脳が最適な状態に圧縮
967デフォルトの名無しさん:2006/02/08(水) 00:38:35
脳が最適な状態に委縮
968デフォルトの名無しさん:2006/02/08(水) 00:41:27
詳しく
くわしく
kuwasiku
kwsk     //uaiuの情報はどこへ…

srnnterg?>>961
969デフォルトの名無しさん:2006/02/08(水) 01:28:11
>>962
JPEGが圧縮ではないそうですが、巷にあふれる言説についてコメントをどうぞ。
970デフォルトの名無しさん:2006/02/08(水) 01:33:29
いやいや、このスレという有限状態において、kwskという四文字から生成しうる語句は「詳しく」となる確率が高く、ほぼ1意に復号可能と見做せるのでは?
971デフォルトの名無しさん:2006/02/08(水) 02:08:38
ヒント

日本語ローマ字表記は子音と母音のセット
母音は5種類しかない
意味のある文字列の判定は誰がするか
その意味を記憶している場所はどこか
972デフォルトの名無しさん:2006/02/08(水) 02:10:58
つーかT9
973デフォルトの名無しさん:2006/02/08(水) 02:24:08
>>970
それはkwskが、意味を持たない「記号」の羅列ではなくて、既に意味を持った「記号」となってるから。
つまりそれを解読するには「辞書」が必要。
974デフォルトの名無しさん:2006/02/08(水) 02:59:12
>>973
頭文字の省略という習慣を知ってれば文脈と経験から推測できるよ。
圧縮になぞらえて言うなら、符号化方式さえ分かればおおよそ
複合可能だということだな。
975デフォルトの名無しさん:2006/02/08(水) 07:59:02
おおよそでは復号されたとは言えない。
例え意味のある日本語のリストをあらかじめ辞書として全部持っていても
くわしく、けわしく、かわさき などのどれが正しいかを判定するのは不可能。

それなのに何故、記号の羅列の中にkwskが出てきたとしても
俺らが確実に「くわしく」と読んでいるかというと
「kwsk=くわしく」であってそれ以外にはありえない、という
辞書があるからであって
これは書いた人と読んだ人の辞書が違えば当然解読できない。
例えば「カワサキ」と書こうと思ってkwskと書いても「詳しく」と読まれるだろう。
だからカワサキを圧縮することは出来ない。
つまり情報量は復号時に使われる辞書に依存すると言える。

文脈があればカワサキと書くことも読むこともできる、という意見もあるだろうが
前後の文脈というもの自体もデータなので
それも含めると情報量は増えるがサイズも増える。
なので母音抜き圧縮を辞書無しに文脈と経験で復号できると言うならば
このレスから母音だけで構成される音以外の母音を全部抜いても
次の問いに確実に正解できるはずだ。
immdnnnkikwsktittdsyu?
976デフォルトの名無しさん:2006/02/08(水) 08:04:01
いままでになんかいくわしくといったでしょう?
977デフォルトの名無しさん:2006/02/08(水) 08:11:58
問いは「いままでになんかいかわさこといったでしょう?」
答えは勿論0。一度も川迫なんて言ってない
978デフォルトの名無しさん:2006/02/08(水) 13:58:49
>>975
>969
979魚チョコ:2006/02/08(水) 14:28:24
話ちがうが圧縮の反対でさあ。こういう掲示板で、レスに見えないデーターを
うめこむために全角空白と半角スペースを使って、

全半全 1
全全   0

として二進数でかきこむの。

全全半全半全全半全半全全全全全半全半全半全半全全全

これで漢字1字か……。
980デフォルトの名無しさん:2006/02/08(水) 15:55:28
>>978
非可逆圧縮の場合どの程度まで情報欠落を許して
補完で元のデータとどれだけ近い状態になるか、という話になる。

母音抜き圧縮(仮)は
圧縮対象データの何十倍もの量のデータ(前後の文章)を必要とした上に
復号後に補完しても元のデータと全く違ってしまう可能性が高い。
これでは圧縮アルゴリズムとしては全く使い物にならない。

そんな可逆圧縮以上のデータ量になるのが容易に予想される
腐った非可逆圧縮は圧縮と呼ばない。ただの言葉遊びと呼ぶ。
981デフォルトの名無しさん:2006/02/08(水) 17:56:50
>>975
つ 記号論

「辞書」は広辞苑とかの辞書じゃないよ。
982魚チョコ:2006/02/08(水) 18:02:15
んあ、まちげーた。

全半全  0
全全    1

だった――って、誰もこんなくすつまんねーレスよまねーか。俺でもよまねーもんな ミ゚仝 ゚ ミ
983デフォルトの名無しさん:2006/02/08(水) 18:07:44
>>980
「詳しく」が「詳細を教えてくれ」を意味するように、「kwsk」は母音抜きとかそういう問題じゃなくて、「詳しく」って意味になってるってことだろ。
だからある種の変換リストを送る側と受ける側が共有してれば、転送する情報量は少なくなるってこと。

厳密には圧縮じゃないけど、kwskは情報欠落してないよ。
それとも>>980は人と会話するときに、たとえば「リモコンをくれ」を言うにしても、
「赤外線で通信することによって、ある程度機械から離れたところから機器を遠隔操作できる端末をとってくれ」
とでも言わないと通じないのか?
984デフォルトの名無しさん:2006/02/08(水) 18:19:21
俺は子音でなく母音を落としてるところにlossy圧縮の形が見えたな
985デフォルトの名無しさん:2006/02/08(水) 18:24:36
だから俺は最初から単なる辞書だろって言ってるってば。

「辞書じゃない 経験と文脈で復号できる」と言う人が居たから
ならば君が言う通り辞書じゃないとすれば、という話をしたところ
そしたら何故かjpegの話を振られたので
ならばlossyとすれば、と話を繋げたわけだよ
986デフォルトの名無しさん:2006/02/08(水) 19:32:04
ただし辞書を使えばそれは圧縮ではないわな
987デフォルトの名無しさん:2006/02/08(水) 21:32:45
>>980

>>985
だって、snegとかkwskとかを知ってれば、実際に
ktkrと書いてあると、キタコレのことだとわかったからなぁ。
ktkr=キタコレだという辞書は判定前に持っていなかったにも
かかわらず。

ただ、これはもちろん復号先のデータに仮定をしている。
仮定の度合いが極端で、なおかつ前後の文脈で変わるのが
JPEG(JFIFか)との違いではあるが、圧縮にはデータの仮定は
つきもので、正しく復号できるとは限らないのは非可逆圧縮の常だな。

が、>975は、正しく復号できないなら圧縮じゃないと言う。
データに対する仮定をすることが辞書をもつことだと言う。
キタコレを圧縮するしないにかかわらず事前に共有されている前提の
データ(=文脈と経験)のサイズをktkrのサイズに含めて問題にする。
988デフォルトの名無しさん:2006/02/08(水) 21:36:19
wktk
989デフォルトの名無しさん:2006/02/08(水) 23:20:13
>>987
記号論の本を1億回読んでこい。
意味は辞書と文法によって確定されるもんだ。
経験や文脈は、無意識のうちに辞書や文法に組み込まれているだけ。
990デフォルトの名無しさん:2006/02/08(水) 23:33:38
基礎化
991デフォルトの名無しさん:2006/02/08(水) 23:43:32
>>989
辞書と文法の話で言えばその「組み込む」ってのは
辞書の動的な生成だろ?
復号のために事前に辞書を持ってる、っていう今まで
の「辞書式だ」って話とは合わないだろ。

>>983と考えるなら事前に辞書持ってるってことに
なるけどな。
992デフォルトの名無しさん:2006/02/08(水) 23:50:51
>>1
このスレを圧縮してください。
993デフォルトの名無しさん:2006/02/08(水) 23:55:15
お前はアホ?
相手が全く同一のコードを共有しているわけじゃないのになぜ話が通じるか説明してみな。
994デフォルトの名無しさん:2006/02/08(水) 23:58:13
>>991

事前に「リモコン」という言葉を辞書に持ってる。
動的に生成されるか否かは関係ない。
995デフォルトの名無しさん:2006/02/08(水) 23:59:59
















996デフォルトの名無しさん:2006/02/09(木) 00:03:36
工学土方に、言語学や哲学の概念は理解できません><
997デフォルトの名無しさん:2006/02/09(木) 00:04:16
ksk
998デフォルトの名無しさん:2006/02/09(木) 00:05:00
突然ですが農村の過疎化について語るスレとなりました
999デフォルトの名無しさん:2006/02/09(木) 00:06:08
>>993
通じないこともあるんだよ。馬鹿?

>>994
動的か否かが関係なかったら>985の「辞書じゃなかったら」
なんて仮定が出てくるはずもない。文脈嫁。
1000デフォルトの名無しさん:2006/02/09(木) 00:06:10
テラカワイソス
10011001
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。