大体話はわかったが、
じゃあVISTAとメイリオの組み合わせなら、
この問題は解決すると理解してよろしいか?
JISの字形の揺れはこれは日本内部の問題だからしょうがないとして
>>952 この問題ってどの問題さ。
>>944みたいな異体字を表示する方法はフォントに依存するしかないよ
Adobe-Japan-1-6にも「与」の簡体字なんて入ってない
(「器」とか「海」は異体字が収録されてるがメイリオには入ってない)
Unicodeは統合と包摂優先というのは他ならぬ
>>944が言ってることだしな
今更な話題はどうでもいい。
>>954 そういう要望があるのも事実で
ユニコードを初めとしていくつかの文字コードはそうなってきてるし
画像を使えはおかしい
ユニコード信者はなんで
他の文字コードを認めないんだろう?
いや、こいつだけ特別だろ。
さてそろそろ次スレの準備かな。
>>958 普通はユニコードだけじゃ仕事にならんし
信者でも併用して使ってると思うぞ
だから959が言ってるとおり信者全般じゃなくて
こいつだけだとおもう
>コードポイントを統合しないと検索に支障出る。
>「浅」の字をわずかな字体差で分離しちゃうと、中国語のサイトで
>「浅田真央」が検索できない、なんてことが起きる。
英字の全角と半角問題と同じで検索ソフトが対応するようになるよ
ユニコード厨は半角厨と同じ匂いがする
Unicodeに問題があるという主張をするなら
何の文字コードと比べて問題があるかを言わなければならないが決して言わないところがずるい。
SJISと比べてもJIS X0208と比べても問題はない。
それらの文字を全て含んでいるのだから。
批判厨のやりたいことはWindows95用の古い旧式ソフトウェアを擁護すること。
旧式ソフトウェア厨にはNTやXP、Vista Mac OS Xで標準コードとして取り入れた文字コードUnicodeが邪魔で忌むべきものになった。
OSの過渡期にはこうした厨房は必ずあらわれる。
アホかこいつ
>>962 ttp://www.atmarkit.co.jp/fpc/opinion/014watanabe/014watanabe.html > さて、異体字の問題の1つに、「検索や抽出の障害になる」ということがある。これは、確かに解決しにくい問題である。
> 検索や抽出といった処理は、現状は文字コードによってマッチングをチェックすることで実現している。しかし、
> 現状で一般的な文字コード体系では、異体字が確認しやすいようにコード化してあるわけではない。
> 当然「邉」と「邊」についても、文字コードからこの2つの文字が異体字の関係にあることを知ることは不可能だ。
>
> ただし、前に仮想的な例として挙げた「異体字統合辞書」を実際に用意することでこの問題に対処することは
> 可能である。しかし、こうした辞書を作るのは簡単ではないし、こうした統合が必ずしも有効とは限らない。
たかだか24個しかないアルファベットの大文字/小文字、全角/半角と一緒にしちゃいけない。
JIS X 0213(第1〜第4水準)に異体字がどれだけあるかということさえ、完全に把握できていないし
異体字同定テーブルも確定されておらず、実装例がほとんど無いのが現状。
実際、プログラミング言語には「大文字⇔小文字」「全角⇔半角」変換関数は標準装備されているが、
「異体字の同一視」についてはプログラマサイドで開発・実装する必要がある。
パフォーマンスを犠牲にするような(しかも需要が低そうな)機能の搭載は、
職業プログラマなら及び腰になるのもやむを得ない。
Googleで「慶應」で「慶応」がいまだにヒットしないのもそのせい。
異体字にコードポイントを割けば割くほど、日本語電子テキストの混乱は深まるばかり・・・。
一人でまとめサイトでも作ってくれ
> たかだか24個しかないアルファベット
とりあえずAからZまで数えてみろ。
どこからみてもアホでした。どうもありがとうございました。
辞書ソフトの話はどこ?
Unicodeの話をすると粘着長文信者が涌いてくるから保全変わりにいいんだよ
だから信者じゃなくて、ただのキチガイだろ
検索性を維持するにはJISコードの範囲内で文字を使えってことですね
975 :
名無しさん@そうだ選挙にいこう:2006/12/09(土) 11:58:44
>>974 どこをどうよんだら
その結論になるんだ???
あと、Vistaと新JIS(JIS X0213)とUnicodeの問題と関係がよくわからないが
わかっている人はいるだろうか。
祇園の祇のネへんが示へんに変わるらしいが。
男が細かいこと気にするな。
これが結論。
女は?
>>974 違います。
JISだとJIS外の文字が文字化けして入力、検索とも最初からできません。
検索性を考慮してたくさんの文字に対応しているのがUnicodeなどの文字コードです。
難しい漢字だけでなくアクセント記号のついたローマ字も文字化けしてJISは使い物になりません。
だから難しい漢字は使うなと、、、
難しい漢字もアクセントのついたローマ字も使いたい人は使えばいいだろ。
古いソフトに合わせるために利便性を損ねて、難しい漢字使うなとか外国の文字使うなとか
勝手な命令を他人にしていてもしょうがないだろ。
使いたい人は使えばいいし、ソフト側も使えるようにしなくてはならない。
問題は新しい文字コードにあるのではなく、
「新しい文字コードを使いたくても使えない」古いソフトのほうにある。
新しい文字コードを使ったところでお前の頭が良くなるわけでもなし。
べつにいいんじゃないの。
>>985 テキストやノートがひらがなだけでやったら
効率落ちるじゃん
SJISで十分
JIS規格化においても字体の揺れを吸収するため「包摂規準」を設けて
「複数の形の文字をひとつのコードに割り当てている」。
しかも78JIS,83JIS,90JIS,97JISの紆余曲折を経ているのも事実。
これは事実。
でも所詮日本国内での「揺れ」の話。
UNICODEにおける包摂字体の揺れを吸収するため「包摂規準」を設けて
「複数の形の文字をひとつのコードに割り当てている」。
一方で、「Souce Separation Rule」による「分離基準」も設けており、
ある国の規格で分離しない字体が他国の規格で分離されていれば原則として
「複数の形の文字は別々のコードに割り当てている」。
これも事実。
しかも中台韓越日のあいだでこれを行う。
要するに簡単に言えばこれは
あなたの家の近所に軍隊が駐屯するとして、
それが自衛隊であるのか、中台韓越日連合軍なのかということなのである。
前者がはるかにマシなのはいうまでもないことであろう。
>>989 なるほど
Unicodeのほうがはるかに良いことはいうまでもないですね
>>989 すごいっ
自衛隊だけでなくEUみたいに日本、中国、台湾、韓国、ベトナムの連合軍みたいな最強の軍隊に例えられるんですね!
マジすげーよユニコード
えー
中共軍なんか世界最強のレイプアーミーやんか
6
5
996 :
名無しさん@そうだ選挙にいこう:2006/12/11(月) 13:01:04
4
997 :
名無しさん@そうだ選挙にいこう:2006/12/11(月) 13:01:19
3
998 :
名無しさん@そうだ選挙にいこう:2006/12/11(月) 13:01:27
2
999 :
名無しさん@そうだ選挙にいこう:2006/12/11(月) 13:01:40
1
1000 :
名無しさん@そうだ選挙にいこう:2006/12/11(月) 13:01:48
1000
1001 :
1001:
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。