【社会】"混乱大丈夫?" 次期OSウィンドウズ・ビスタで漢字150字形を変更

このエントリーをはてなブックマークに追加
818名無しさん@6周年:2005/07/31(日) 19:56:27 ID:EJsEVbpZ0
>>806

文献を1つ調査する度に16ビットの領域1面を埋めるだけのコードポイントを使ったりするんだけど。
しかも、そのコードポイントは、その文献のため「だけ」にしか使われなかったりする。
(何故なら、他の文献に使われている活字と、たとえ類似していたとしても「全く同じ文字と看做す」
ための包摂基準が存在しないから。)

活字以前の古い文献を調査すると、1つの文献に繰り返し出てくる文字も、その箇所によって違う
コードポイントを振る必要が出てきたりする。しかも、そのコードポイントは、その1箇所のため「だけ」
にしか使われなかったりする。
(何故なら、他の箇所に使われている活字と、たとえ類似していたとしても「全く同じ文字と看做す」
ための包摂基準が存在しないから。)

字形や字体についての調査ってのは、要するにそういうことなんですよ。
何等かの包摂基準を適用して実用的なコードポイントに割り振った時点で、原本のユニークな
字形データを切り捨てることになる。
819名無しさん@6周年:2005/07/31(日) 19:57:18 ID:J4SMq5Zn0
包摂という決まりを神様みたいに祭り上げるな
かつて、右から左に書くことをドラスティックに辞めたのと同様に、漢字、特に字面に拘る
書き順に拘るは愚は辞めればいい。記号に過ぎん。
合理化こそ最小最短の無駄リソース廃止方法だ
820名無しさん@6周年:2005/07/31(日) 20:00:36 ID:v1LsbfpY0
「全ての字形にコードを割り当てれば?」って言う奴は

俺の娘のこだまちゃんが書く発展途上の「あ」とか、
SMAPの草薙のサインだけで使われる字とか、
珍走が壁に書きなぐった、書き間違いの「夜露死苦」
の字形も文字コードに入れろって事でいいんだよな?
821名無しさん@6周年:2005/07/31(日) 20:01:50 ID:UYUf/sXb0
>>820
「g」の字はちゃんとあるだろ
822名無しさん@6周年:2005/07/31(日) 20:04:04 ID:v1LsbfpY0
>>821
彼がサインに書く時に使われる字形「そのもの」ですよ?
それが、MSゴシックの「g」と同一だとする包摂基準は?
823名無しさん@6周年:2005/07/31(日) 20:12:28 ID:t+/Kg4nd0
>>822
その質問って「今日の俺と明日の俺が同じ人間だという基準は何?」と似てないか?自明のことだろ。
824名無しさん@6周年:2005/07/31(日) 20:15:27 ID:ZT6KJNUU0
>>810
暴挙だな。
一度決めた字体を変更するなんて…。
825名無しさん@6周年:2005/07/31(日) 20:16:22 ID:pz/7x1NX0
>819
じゃあ、合理化のため、英語にすれば。
826名無しさん@6周年:2005/07/31(日) 20:17:54 ID:J4SMq5Zn0
>>825
それでいいんじゃないのか?
827ぱ ◆hN2uuNqrYk :2005/07/31(日) 20:18:33 ID:ho/kSGIV0
英語でも斜線付きの0(ゼロ)が書けない!
828名無しさん@6周年:2005/07/31(日) 20:19:00 ID:EJsEVbpZ0
>>823

包摂に関しては自明じゃないから困りものなんですよ。

何等かの包摂基準を設けると、その基準が気に入らないとか、特殊な研究のために
その包摂基準では区別がつかなくなる字形の違いを区別しなくちゃならないとか
そういう不満がいっぱい出てくる。

その不満の根源は、「文字セットにコードポイントを割り振って言語をテキストデータ化しても
字形まで含めて丸々保持できる」という誤解にあるんだけどね。

文字にコードを割り振ってデジタイズする時点で、字形の精密な再現性なんてものは
もはや望むべくもないことを理解しなければならない。
文字コードを使う時点で、それがどんなコードであれ、何等かの基準で包摂されているんです。

だから、大事なことは、その文字セット策定時に想定している主な利用法の範囲で「実用的に」
包摂されているか否か。
829名無しさん@6周年:2005/07/31(日) 20:22:09 ID:V4w7oRgj0
数字ですらすでに、1 1 @ T 一 壱 @とこんだけあんだぞ
今のところ、うちの電話番号はローマ数字を使うんだ!
なんて言い張るバカはいないんで、世の中なんとかなってるが
830名無しさん@6周年:2005/07/31(日) 20:23:13 ID:7qQP79wJ0
>>824
あぁ、書き方が悪くてすまんね。

 ・JIS83はコンピュータ環境が発展・発達していく重要な時期だから問題だった
 ・現代は環境の整備・標準化の方向に向かっている

>一度決めた字体を変更するなんて…。
字体は「決めた」のではなくて「例示」として制定ね。
また包摂の概念上、字体に優劣は無いので必ず従わなければならないものではない。
ちょっと前に流行ってた、手書きフォントでも作ってみれば?
831名無しさん@6周年:2005/07/31(日) 20:26:43 ID:5pT0OD940
ローマ数字用文字なんて、バカバカしいとしか言いようがないからね。
あれはアルファベットにほかならないのに、わざわざいわゆる全角文字で 1,2,3... とずっと用意しているという…。
こんなバカげた文字ができてしまった理由を知りたいね。
832名無しさん@6周年:2005/07/31(日) 20:48:07 ID:ZT6KJNUU0
>>830
典型的官僚的いいわけ。
実際の実務がそれでつとまるはずがない。
833名無しさん@6周年:2005/07/31(日) 20:48:17 ID:EJsEVbpZ0
>>831

いわゆる全角英数字や半角カタカナの存在は確かに不恰好ですが、それこそ
データ互換性のためにいまさら消せないんですよね。

ここで言う互換性は字形についてではなく、コードポイントの区別という意味で。
全角英数字とASCIIの英数字とを使い分けることが出来る文字エンコーディングが
あまりに一般的に普及しているので。

悪名高いUNICODEのCJK統合漢字についても、もともとこの文字セットは制定時点で
各国で普及している文字セットとの間で相互変換可能な、橋渡し的なテーブルとして
実装可能となるように考えられていたので、原規格分離原則を適用して、「他の文字と
同様の包摂基準を適用したら統合される筈なのに、統合されていない文字」があったりして
包摂がまだまだ生ぬるいんですね。まあ、後方互換性の点から止むを得ないことですが。
834名無しさん@6周年:2005/07/31(日) 20:51:58 ID:ylkjRaC+0
まてまて、俺の名字は印刷されなくなるんかよ
835名無しさん@6周年:2005/07/31(日) 20:53:24 ID:v1LsbfpY0
>>832
今まで、正しい葛飾が出なかったから泣く泣く「葛飾」を
使ってきた人にとって、新JISは大歓迎なんだが。

お前も「森鴎外」を平然と「冒涜」するんですか?
836名無しさん@6周年:2005/07/31(日) 20:54:23 ID:7qQP79wJ0
>>830
何だそりゃ?
実際の実務とは?

たとえば社内基準で「吉」の「土」と「士」を使い分けている新聞は実際に存在している。
つまり必要に応じてJISに依拠しない運用は為されているが、これでどう「実際の実務」
が務まっていないんだ?
837名無しさん@6周年:2005/07/31(日) 20:55:46 ID:v1LsbfpY0
>>834
JIS83のままだと、名字が正しく印刷されない人がいたから
改正されたんだけど、その人達より、お前の名前の方が
優先されなければならない理由は?
838名無しさん@6周年:2005/07/31(日) 20:58:39 ID:ylkjRaC+0
>>837
いままで使えてた漢字が使えなくなったってことなの?
全然意味が分かんない。MACのOTF使用時の外字が使えるようになったったってことか?
つか、OTFにしたら問題解決なんじゃネーの?
839名無しさん@6周年:2005/07/31(日) 20:58:52 ID:7qQP79wJ0
>>836
830じゃなくて>>832だったw
840名無しさん@6周年:2005/07/31(日) 21:09:25 ID:ZT6KJNUU0
>>835
君は喜ぶかも知れない。だが、反対に嫌な思いをする人がいるだろ。>>834とかね。

>>836
特殊な例を出されてもねw 社内の基準を外部に広められないだろうし。
社内の基準で鴎外の字とかキチンと決めていたのに、混乱が起こる。

いずれにせよJIS83の暴挙の焼き直しだ。
841名無しさん@6周年:2005/07/31(日) 21:15:42 ID:c0UIC8ts0
そういえば、世界で一番合理的な文字がお隣の国にあったな。
あれを使えば、こんなヤヤコシイ事態に遭遇しなくて済むんだよ。
842名無しさん@6周年:2005/07/31(日) 21:26:17 ID:7qQP79wJ0
>>840
根本的な部分で認識が食い違っている気がしてきた。

>社内の基準で鴎外の字とかキチンと決めていたのに、混乱が起こる。
だから何で社内基準が混乱する? 何で社内基準を外部に出す必要がある?
字体に拘る「特殊な環境」だからこそ「特殊な運用」を行う。
それこそ、新聞社のような字に拘る業界じゃ当たり前の話だ。

「今までJIS83環境でやってきたけど、JIS83の例示字体じゃなきゃ困るんだよヴォケ」
という意味か?
それなら、字体とコードを明確にくくりつけた「特殊な運用」を行わなかった方がヴォケ
なだけだ。
実際に対策を行っている業界があるのに自分はしなかった、でも困るから止めろ、なんて
通用すると思ってる?
843名無しさん@6周年:2005/07/31(日) 21:28:48 ID:WxfM4coj0
>>812
つ【超漢字】

買えよ。まさか嘘でしたとはいわんよな。
844名無しさん@6周年:2005/07/31(日) 21:33:50 ID:WxfM4coj0
>>816
全ての漢字にコードを割り振るのは十分可能なんだが。
845名無しさん@6周年:2005/07/31(日) 21:34:26 ID:g6TEC/Kv0
ののたん受難だな
846名無しさん@6周年:2005/07/31(日) 21:49:24 ID:7qQP79wJ0
>>843
超漢字の多言語実装は書記方向指定ができない、結合文字処理ができない言語
がある等まだまだ発展途上。
TRONコードはあっても実装が伴ってなけりゃ実用にはハードルが高い。
847名無しさん@6周年:2005/07/31(日) 22:22:14 ID:yHHdrwf30
>>819
右から左へは今も書きますよ。もしかして新聞読んだこと無い?
さすがに、一行一文字は今は見掛けませんが。

>>827
0に斜線がないと、0とOの区別がつきにくいですよね。
ほかには、大文字のアイと小文字のエルが区別できないことも。
WinXPに標準搭載のMSゴシックでは大文字のアイの上下に横線をつけて区別できるように
なったけど、上下に横線をつけたものとそうでないものは別個の文字だという香具師が、
このスレには居そうだな。
848名無しさん@6周年:2005/07/31(日) 22:48:42 ID:LW8eRgfk0
>>847
>右から左へは今も書きますよ。

そりゃさすがに詭弁だわな。
その論理が通じるならば、明治以前に左から右に進む縦書きが
存在してなきゃおかしい。
849名無しさん@6周年:2005/07/31(日) 22:50:42 ID:oiKJNlla0
俺んとこの業務も字形にこだわりを持っている。
で、現行の83JISの例示字形を基本にしつつ、
少し違う字形の場合だけ、注釈をつけて運用していた。
同じ字形の場合は注釈をつけない。量が多くなって大変だからね。

しかし今回のフォント変更により、いよいよ2004JISの字形を基本にせざるをえなくなった。
問題は、過去に作成した文書をどうするか、だ。
今回変更になる文字168種が含まれていないかどうか、
過去の文書を全部検索して対処するべきなんだろうが、これはつらい。orz

でも長期的に見れば、今回の例示字形変更は必要なことだったと思っているよ。
願わくば、これが最後の字形変更であらんことを・・・。
850名無しさん@6周年:2005/07/31(日) 22:58:36 ID:J4SMq5Zn0
>>848
そうやって論点ずらすだけなんだよな、847みたいなのは
なにが もしかして新聞読んだこと無い?だw
池沼かな
851名無しさん@6周年:2005/07/31(日) 23:10:40 ID:I8vzj1Az0
冒瀆
森鷗外
852名無しさん@6周年:2005/07/31(日) 23:14:08 ID:I8vzj1Az0
草g
853名無しさん@6周年:2005/07/31(日) 23:16:35 ID:AUytvjLI0
政治的にも経済的にも文化的にもアメリカのいいなりな日本は
確実にMSになめきられているね
854名無しさん@6周年:2005/07/31(日) 23:29:37 ID:v1LsbfpY0
>>844
俺の芸名は、昨日俺が独自に作った漢字なんだけど、
もちろん文字コード体系に入るんだよね?

ローカル漢字なんて認めないとは言わせないよ。
855名無しさん@6周年:2005/07/31(日) 23:35:24 ID:v1LsbfpY0
>>853
今回のニュースは、MSが「日本政府の言いなり」になって
既存の漢字字形を「最新のJIS規格の通りに」変更したって事なんだが。

文盲か?お前は

そんなに「森鴎外」を「冒涜」したいのなら、
日本政府に文句言えよ。「JIS2004漢字を撤回しろ」ってな。
856847:2005/07/31(日) 23:36:20 ID:yHHdrwf30
>>848
一行一文字の縦書きではないのですか?

>>850
いちご新聞しか読んだことないのならいいや。
一般紙だと一行十一〜十三文字程度の縦書きの記事が右から左へ読むよう書かれてるでしょ。
国語のノートも同じく右から左へ使う。

>>853
>>688
857名無しさん@6周年:2005/07/31(日) 23:46:28 ID:LW8eRgfk0
>>854
さすがに漢字かどうかの判定基準を引くことは可能だろう。
たとえば「大字林」に収録されてるかどうかとか。

>>856
明治以前に、一行一文字でもなんでもいいから、
左から右に書く縦書きがあったのか?
858名無しさん@6周年:2005/07/31(日) 23:56:18 ID:v1LsbfpY0
>>857
人名漢字には「大字林」に入ってない異体字が死ぬほどありますが、何か?
その大半は、明治時代に名字を与えられた百姓が、
適当に考えた上に役所で書き間違ったものだが。
859名無しさん@6周年:2005/07/31(日) 23:56:38 ID:zilHkU8z0
>>776
リング作るのめちゃめちゃ速い?
860名無しさん@6周年:2005/08/01(月) 00:04:10 ID:LW8eRgfk0
>>858
なんで戸籍上存在する漢字と国語上存在する漢字とを混同するかなぁ。
それぞれにその存在を規定する裏づけが違うっしょ?
でもってこのスレで扱ってるのは後者の話。

ついでに言っとくと>>854の「おれ漢字」はそのどちらでもないけど。
861名無しさん@6周年:2005/08/01(月) 00:10:15 ID:r9Sf2T/20
>>856
まだ屁理屈いうかw
なんだよ、いちご新聞て?
862名無しさん@6周年:2005/08/01(月) 00:10:57 ID:zcTYvXPU0
もちろん、その「書き間違いの異体字」も正式な文字と認めなければ
「日本の文字コード体系」とは言えません。

名前の漢字が違う字形で印刷・表示されると
「字形が変わると運勢が変わる!どうしてくれるんだ!」
と血相を変えてクレームをつける奴らがいますから。
863名無しさん@6周年:2005/08/01(月) 00:14:21 ID:zcTYvXPU0
>>860
「人名に使われる文字と国語は切り離して考える」なんて
訳の分からん論理を振り回すな。

そんな論理、すぐに破綻するって書いてて気付かないのか?
頭の悪い奴だ。
864名無しさん@6周年:2005/08/01(月) 00:19:36 ID:/0HIp1ua0
>>862
なんか「ふいんき」みたいな揺らぎの話が混ざってきたな。
「書き間違いの異体字」が将来正式な字形になる可能性は
もちろんあるけど、話言葉と違って書き言葉は厳然としたテキストが
あるから、相当の時間を経て一般化されないと無理だわな。

>>863
「誤記」だと明らかであるにもかかわらず、戸籍法の上で確定して
しまった人名漢字の話だろが。その前段をすっとばして議論するから
>>854みたいなバカが出てくる。
865名無しさん@6周年:2005/08/01(月) 00:26:24 ID:jDPJ1GI10
>>857
左から右に書く縦書きが存在しなければならない理由が分からない。
866名無しさん@6周年:2005/08/01(月) 00:42:35 ID:zcTYvXPU0
>>864
そもそも、そういう「揺らぎ」を無視する事を前提とした
文字コードであるJISコードで、どんな字形を表示するかってのは
どこかで落とし所を決めないと話にならん。

それで、過去との互換性を尊重しつつ、JIS83の誤りを是正したのが
JIS2004なわけだ。

それを「アメリカの文化侵略」とか「俺の名前はVistaでは文字化け?」
なんて完全な誤解や、
「JIS83の字形が必要な場合に困る」「全ての異体字を収録すべき」
なんていう難癖をつける阿呆がいるから問題。

JISとMSの方針は「Windowsの日本語表示・印刷を出版業界に合わせる」
なんだから、それで合わない特殊用途があるなら、各自個別に対応しろ。
867名無しさん@6周年
>>865
そもそも日本には行を右から左に展開する縦書きしか存在しなかった。
右から左への横書きに見えるものは、一行一文字の縦書きである。
ということだよ。で、>>819が言ってるのは、そこに左から右への横書きを
導入したのはドラスティックだということ。

これに対する>>847の反論は、行の展開と文字列の方向とを意図的に
混同させた論法で、そこを誤魔化すために「一行一文字」論を混ぜている。
縦書きの一行一文字が横書きと同様になるのは正しいが、
だからと言って一行複数文字で構成される縦書きの存在をもって
文字列を「右から左に読む」とは言えんわな。