BTRON仕様OSとUNICODEの多言語を語るスレ
7 :
Be名無しさん:
http://news.2ch.net/newsplus/kako/1023/10232/1023201516.html の890-902の話題。
902 名前: 名無しさん@3周年 投稿日: 02/06/08 01:38 ID:A44OC3l0
>>899 ダブっている文字の数を考えるとカスタマイズ作業だけでも
相当なものになるだろうけど、まあそれは置いておくとして。
同一文字の重複か異体字かを各ユーザが自由にカスタマイズ
するものとすると、TRONコード上では異体字の区別を含めた
厳格な文字の同定ができないということにならない?
(TRONコード上に定義された2つの文字を、ある人は同じ文字だ
と言い、他の人は各々異なった字形を持つのだと言う。)
異体字を逐一区別して片っ端から収録しておきながら、
結局同定できないってのは凄い問題じゃないか、と。
つーか、
www.iana.org/assignments/character-sets
に登録されてない、charsetは。。。
10 :
Be名無しさん:02/08/05 23:24
http://cocoa.2ch.net/linux/kako/1003/10031/1003159137.html の53も興味深い。
53 名前: login:Penguin 投稿日: 01/10/17 00:30 ID:YQKlNfNV
>>38 TRONコードは、誰かが新しい文字が必要だと思い、申請したら、
例え点を一個追加するだけでも、それは追加される。だから、
> なら別々にして必要に応じて変換ライブラリーみたいなの使えばいいと思うぞ。
は、日々変化する。それは「いい」か?
文字の同定の基準が存在し、かつ無闇に文字集合が変動しない、
という取り決めがなかったら、大変だぞ。
> これは運用の問題だろ?
> 斎藤と斉藤と齋藤を区別したいときもあれば同じに扱いたい時もある。
文字集合が固定されている環境でのみ、その要求は満たされる。
新しい「齊」や「藤」が次々に生まれる環境では、それらを「同じに扱」うことは、
原理的には可能だが、現実問題としては難しい。
11 :
Be名無しさん:02/08/06 12:39
>>7 まあ、そのあたりが本質だわな。
超漢字ってのは「後回しシステム」なのよ。
符号化する上で最も難しく手間もかかるのが文字の同定。
それを「後回し」にして、手っ取り早く文字数を誇るために
あれもこれも見境なく詰め込んじまった。
だから現状ではまともな運用なんかできっこない。
インド系文字の合成も「後回し」で、
使い道のない符号表上のグリフだけが実装されている。
決まり文句は「今後対応していきます」。
で、原稿プロセッサはどうなったのかと小一時間(略