BTRON仕様OSとUNICODEの多言語を語るスレ

このエントリーをはてなブックマークに追加
7Be名無しさん
http://news.2ch.net/newsplus/kako/1023/10232/1023201516.html

の890-902の話題。

902 名前: 名無しさん@3周年 投稿日: 02/06/08 01:38 ID:A44OC3l0
>>899

ダブっている文字の数を考えるとカスタマイズ作業だけでも
相当なものになるだろうけど、まあそれは置いておくとして。


同一文字の重複か異体字かを各ユーザが自由にカスタマイズ
するものとすると、TRONコード上では異体字の区別を含めた
厳格な文字の同定ができないということにならない?
(TRONコード上に定義された2つの文字を、ある人は同じ文字だ
と言い、他の人は各々異なった字形を持つのだと言う。)

異体字を逐一区別して片っ端から収録しておきながら、
結局同定できないってのは凄い問題じゃないか、と。
8Be名無しさん:02/08/05 23:01
>>6
バカか。
9Be名無しさん:02/08/05 23:13
つーか、
www.iana.org/assignments/character-sets
に登録されてない、charsetは。。。
10Be名無しさん:02/08/05 23:24
http://cocoa.2ch.net/linux/kako/1003/10031/1003159137.html
の53も興味深い。

53 名前: login:Penguin 投稿日: 01/10/17 00:30 ID:YQKlNfNV
>>38
TRONコードは、誰かが新しい文字が必要だと思い、申請したら、
例え点を一個追加するだけでも、それは追加される。だから、

> なら別々にして必要に応じて変換ライブラリーみたいなの使えばいいと思うぞ。

は、日々変化する。それは「いい」か?
文字の同定の基準が存在し、かつ無闇に文字集合が変動しない、
という取り決めがなかったら、大変だぞ。

> これは運用の問題だろ?
> 斎藤と斉藤と齋藤を区別したいときもあれば同じに扱いたい時もある。

文字集合が固定されている環境でのみ、その要求は満たされる。
新しい「齊」や「藤」が次々に生まれる環境では、それらを「同じに扱」うことは、
原理的には可能だが、現実問題としては難しい。
11Be名無しさん:02/08/06 12:39
>>7
まあ、そのあたりが本質だわな。
超漢字ってのは「後回しシステム」なのよ。
符号化する上で最も難しく手間もかかるのが文字の同定。
それを「後回し」にして、手っ取り早く文字数を誇るために
あれもこれも見境なく詰め込んじまった。
だから現状ではまともな運用なんかできっこない。
インド系文字の合成も「後回し」で、
使い道のない符号表上のグリフだけが実装されている。
決まり文句は「今後対応していきます」。
で、原稿プロセッサはどうなったのかと小一時間(略
12Be名無しさん:02/08/07 08:46
トロ吉の反論待ちage
13Be名無しさん:02/08/07 17:55
>>7
んー、一般的には、なりますね。異体字のというか文字の同定のためのデータベースみたいなのを
共有しなければならない感じですよね。(全世界のそれを共有する必要はないでしょうが、
それでも標準みたいなのを想定しないと組み合わせの爆発が起きてしまうかな)
逆に言えば、そのDBの共有ができれば問題なさそうですが、ややSF的なのかな。

これはコードに文字同定の問題を持ち込むことを避ける以上、必然的に招く事態じゃないでしょうか。
TRONコードってそういうものなのでしょう。いっぽう、たとえばUNICODEやJISは、文字の同定を
文字コードがやるのだ!! という考え方なんでしょうね。どっちもいまいち要改善って感じですけど、
文字の同定の問題が学問的に解決していない以上、しかたないですね。

本題に戻ると、文字セットを追加するしくみはいちおうあるようなので、前述のDBにユーザーが追加を
できる仕組みが必要ということですか。

ageるほどのスレではないのでsage