文字コード総合スレ part6

599 ：デフォルトの名無しさん：2010/12/17(金) 01:24:26

0x8FB8B5 は eucJP-ms で「塤」ですが、
0x8FB8B5 が書かれたページをIEで開き、エンコードを日本語（EUC）にすると、「曙ｳ」になります。
しかし、「曙」はCP51932でもeucJP-msでも0xBDECとなっています。
一体どのような文字コード（または変換）が使われているのでしょうか？

600 ：デフォルトの名無しさん：2010/12/17(金) 02:21:13

CP51932やCP50220はGL/GRの範囲内のコードポイントを
まず計算でShift_JISに変換してからCP932でデコードする。
だから
8F B8 B5
｜8FはGL/GRに含まれないのでそのまま、
↓B8 B5をEUC-JPの1文字としてShift_JISに変換
8F 8C B3
↓8F 8CはShift_JISで「曙」、B3はShift_JISで「ｳ」
曙ｳ

601 ：デフォルトの名無しさん：2010/12/17(金) 03:33:01

有り難うございます！

602 ：デフォルトの名無しさん：2010/12/17(金) 22:18:03

＞曙ｳ

発音してみたらなんかかわいかった

603 ：デフォルトの名無しさん：2010/12/17(金) 23:27:56

>>602が発音してるところを想像したらなんかかわいかった

604 ：デフォルトの名無しさん：2010/12/26(日) 02:46:19

>>602が発音してるところを>>603が想像してなんかかわいいと思ってるところを想像したらなんかかわいかった

605 ：デフォルトの名無しさん：2010/12/26(日) 03:20:26

この流れを応用しUTF-8エンコーディングが生まれた

606 ：デフォルトの名無しさん：2010/12/26(日) 18:27:10

感動した

607 ：デフォルトの名無しさん：2010/12/26(日) 19:07:19

0xFCEE 0x8FB8B5 を日本語EUCで表示した時、
MSIEだと「黑曙ｳ」になり、
MSIE以外（Firefox, Opera, Chrome）だと「黑塤」になります。
※0xFCEE は CP51932 で「黑」（eucJP-msでは「」）
※0x8FB8B5 は eucJP-ms で「塤」（CP51392 には存在しない）

これらをPHPで再現しようとしているのですが、中々思い通りにいきません。
（試作品： http://www1.axfc.net/uploader/Sc/so/187780.zip）
正しく再現する良い方法は無いでしょうか。
iconvやnkfなどで処理できればいいのですが…
よろしくお願いします。

608 ：デフォルトの名無しさん：2010/12/26(日) 20:58:12

>>607
©黑塤
8F A2 ED FC EE 8F B8 B5
↓8Fはそのまま、EUCのA2EDはSJISで81EB、EUCのFCEEはSJISでEEEC、
↓8Fはそのまま、EUCのB8B5はSJISで8CB3
8F 81 EB EE EC 8F 8C B3
↓8F81はSJISで「潤」、EBEEとEC8FはCP932で未定義なので「・」、8CB3はSJISで「元」
潤・・元

何が難しいのかわからん。
強いて追加でアドバイスするなら1パス目と2パス目では文字が違う場所で
区切られる可能性があることに注意しろというくらい(だから2パス変換が必須)

609 ：デフォルトの名無しさん：2010/12/26(日) 21:01:19

あと1パス目のEUC→SJIS変換は未定義のコードポイントでも8145にしてしまわず
計算で変換してくれるようなものが必須。
(PHPのmb_convert_encodingがそうなってるのかは知らん)

610 ：デフォルトの名無しさん：2010/12/26(日) 22:02:16

有り難うございます。
0xFCEEをCP51932としてCP932に変換すると、0xFC4Bになり、
EUC-JPとしてCP932に変換すると、0xEEECになるようです。
MSIEで使用されているのはCP932だと聞いていたのですが…
混乱してきました。そもそもPHPでのEUC-JPが一体何なのかよくわからない…

611 ：デフォルトの名無しさん：2010/12/26(日) 22:04:10

× CP932だと聞いていたのですが
○ CP51932だと聞いていたのですが

612 ：デフォルトの名無しさん：2010/12/26(日) 23:03:15

ああそうか
CP932ではNEC選定IBM拡張文字よりIBM拡張文字が優先されるんだった
それでEEEC→FC4Bに変換されるけど、>>608の1パス目の変換ではこの規則を
適用しちゃダメ。あくまでも計算でコードポイントを置き換えるだけ。
しつこいよーだがmb_convert_encodingでそれができるかどうかは知らんので
最悪、自分で計算する必要がある。

613 ：デフォルトの名無しさん：2010/12/27(月) 13:37:14

うぅ　計算式がわかりません
%systemroot%\system32\*.nls がMSIEの変換表っぽいですが、どう使えばいいのやら…
c_932.nls, c_20932.nls はあっても、c_51932.nls は無いし

614 ：デフォルトの名無しさん：2010/12/27(月) 23:51:32

少しは自分で調べろよ…。
<?php
function euc2sjis($e) {
$e = unpack('C*', $e);
$h = $e[1];
$l = $e[2];
$c = ($e[1] - 0xa1) * 94 + ($e[2] - 0xa1);
$h = (int)($c / 188);
$h += ($h < 31) ? 0x81 : (0xe0 - 31);
$l = $c % 188;
$l += ($l < 63) ? 0x40 : (0x80 - 63);
return pack('C*', $h, $l);
}
echo preg_replace("/([\xa1-\xfe]{2})/e", 'euc2sjis("\1")', "\x8F\xA2\xED\xFC\xEE\x8F\xB8\xB5");
echo preg_replace("/([\xa1-\xfe]{2})/e", 'euc2sjis("\1")', "\xFC\xEE\x8F\xB8\xB5");
?>
PHPインストールしてぐぐりながら40分で作れたぞ。

> c_932.nls, c_20932.nls はあっても、c_51932.nls は無いし
mlangはCP51932を内部計算でSJISに変換して(「1パス目」)、c_932.nlsを使ってるから。

615 ：デフォルトの名無しさん：2010/12/28(火) 00:42:51

(´‥∀‥`)ほう

616 ：デフォルトの名無しさん：2010/12/28(火) 01:18:53

2chニュースは時事ニュースがとんでもなく面白く理解できる。
難しそうではあるが気になるニュースタイトルに飛んでみると記事に対する2ちゃんねらー達の面白い書き込みによってニュースの内容があっという間に理解出来る様になる。
おれは今まで半ば義務感でニュースをサイトなどに目を通していただけなのだが、2chニュースのお陰で仲間の誰よりも時事問題の先端を行く様になってしまった。もはや中毒気味になる位にニュースが毎日楽しくて仕方ない。
ここでは敢えて四つしか取り上げないが、2NNサイト内であればどの掲示板でもRSS生成が可能。
サイトを覗くだけでも良いがRSSリーダーで効率良く情報収集する人ならばこちらがオススメ。(RSSリーダーは各デバイスに応じた専用アプリ・ソフトがある)

またTwitterでも2ch botがある。Twitterは各デバイスに応じた専用クライアントソフト・アプリを介して使用するのが便利。興味が有る人は各々調べて貰いたい。

●2ちゃんねるニュースサイト(RSS生成可)
2NN新着http://www.2nn.jp/latest/
2NNトップページhttp://www.2nn.jp/
2NN今日のニュース http://www.2nn.jp/ranking/today/
2NN祭級ニュース http://www.2nn.jp/matsuri/

●2ちゃんねるニュースサイト(RSS生成不可)
2ちゃんねる BBY(各ニュース板における前日までの新着スレッドが一望出来る)http://headline.2ch.net/bbynews/
2ちゃんねる全板縦断勢いランキングhttp://2ch-ranking.net/index.html?board=zenban
?page=click_linklog_view.daily_ranking&

617 ：デフォルトの名無しさん：2010/12/28(火) 07:28:15

何？

618 ：デフォルトの名無しさん：2010/12/28(火) 08:26:35

2ch に書かれることこそがニュースの真実とか思ってる情弱だろw

619 ：デフォルトの名無しさん：2010/12/28(火) 17:25:39

マルチポストにレスしちゃう男の人って……

620 ：デフォルトの名無しさん：2010/12/28(火) 17:32:12

男とは限らないぞ

621 ：デフォルトの名無しさん：2010/12/28(火) 18:30:19

えっ

622 ：デフォルトの名無しさん：2010/12/31(金) 11:17:43

なんかかわいいな

623 ：デフォルトの名無しさん：2011/01/05(水) 02:29:55

…///

624 ：デフォルトの名無しさん：2011/01/05(水) 11:34:09

>>614　有り難うございます。
半角カタカナの処理が抜けているようなので、
/([\xa1-\xfe]{2})/e を /(\x8e[\xa1-\xdf]|[\xa1-\xfe]{2})/e に置換して、
euc2sjisの頭に
if (preg_match('/^\x8e[\xa1-\xdf]$/', $e))
return preg_replace('/^\x8e[\xa1-\xdf]$/', mb_convert_encoding($e, 'SJIS-win', 'CP51932'), $e);
を追記してみました。
まだまだ知らないことだらけですが、精進します。

625 ：デフォルトの名無しさん：2011/01/06(木) 01:42:07

ああすまん半角カナのことをすっかり忘れてた
> return preg_replace('/^\x8e[\xa1-\xdf]$/', mb_convert_encoding($e, 'SJIS-win', 'CP51932'), $e);
return preg_replace('/^\x8e([\xa1-\xdf])$/', '$1', $e);
でいいんじゃね? 試してないけど。

626 ：デフォルトの名無しさん：2011/01/07(金) 00:02:28

つーかpreg_replaceもいらんな
if (preg_match('/^\x8e([\xa1-\xdf])$/', $e, $matches))) return $matches[1];
どうしたらあんな冗長なコードを思いつけるのか非常に興味がある

627 ：デフォルトの名無しさん：2011/01/07(金) 00:23:17

n3698は文字鏡の丸パクリかよ…。これだから外人が無造作に出してくるものは(ry

628 ：デフォルトの名無しさん：2011/01/07(金) 14:10:46

誰かが出さなきゃトリガーにすらならんからなぁ
もっとも出典は書いといた方がよかったけど

629 ：デフォルトの名無しさん：2011/01/11(火) 18:26:37

今年になってから元気がないなここわ

630 ：デフォルトの名無しさん：2011/01/18(火) 00:11:45

>>628
日本NBは人の足引っ張るだけだしな

631 ：デフォルトの名無しさん：2011/01/18(火) 22:23:00

それは本当にそう思う

632 ：デフォルトの名無しさん：2011/01/19(水) 00:06:30

さっきからコメントに出ている「NB」て何？日経ビジネス？

633 ：デフォルトの名無しさん：2011/01/19(水) 00:28:03

↓面白いボケを

634 ：デフォルトの名無しさん：2011/01/19(水) 00:37:16

Non-Breaking space
別名 nbsp;

635 ：デフォルトの名無しさん：2011/01/19(水) 01:23:04

それが面白いと思った>>634に脱帽

636 ：デフォルトの名無しさん：2011/01/19(水) 02:09:09

一同脱帽

637 ：デフォルトの名無しさん：2011/01/19(水) 02:10:09

かぶってねーよ

638 ：デフォルトの名無しさん：2011/01/19(水) 02:15:07

漏れの棒は被ってる

639 ：デフォルトの名無しさん：2011/01/20(木) 12:11:52

http://groups.google.com/group/boost-developers-archive/browse_frm/thread/deed8f95125dce02
多少の移行の問題は受け入れて std::string は基本 UTF-8 ってことにしちゃおうぜ、
って話がこないだから boost の ML でさんざん飛び交ってる。

具体的に何とは言えないけども、不安だ。

640 ：デフォルトの名無しさん：2011/01/20(木) 17:07:47

localeであるべきだよ

641 ：デフォルトの名無しさん：2011/01/20(木) 17:15:42

しちゃうまえに、とりあえず作れよと言いたい。

642 ：デフォルトの名無しさん：2011/01/21(金) 10:56:05

日本ＩＴ界の鬼っ子「外字問題」解消を　経産省が着手
ttp://www.asahi.com/national/update/0120/TKY201101200591.html

643 ：デフォルトの名無しさん：2011/01/21(金) 11:07:51

>>642
> 法務省が幅広い電子化を目指して０４年にまとめた「戸籍統一文字」（５万
> ６０４０字）をもとに５万８７１３字のデータベースを作る。世界共通の文字
> コード体系「ユニコード」に反映させ、あらゆるコンピューターで人名や地名
> を網羅する狙いだ。

VSでやるのかね?

644 ：デフォルトの名無しさん：2011/01/21(金) 11:19:34

>法務省が幅広い電子化を目指して０４年にまとめた

年金記録の消失と名寄せで騒いでた時期と一致するな

645 ：デフォルトの名無しさん：2011/01/21(金) 11:30:23

>>642
>　外字の存在はネット上の同じサービスを大勢の個人や企業が共有する「クラウド」化を妨げ、
>日本が世界的な流れに取り残される原因にもなりかねないとされ、解決が急がれている。
>政府側でプロジェクトを統括する経産省の平本健二さんは「１９８０年代から続く問題を解決したい」と語った。

まずは Windows の日本語 locale の mbcs を UTF-8 にすることから始めようか

646 ：デフォルトの名無しさん：2011/01/21(金) 11:35:06

汎用電子とは違うの？

647 ：デフォルトの名無しさん：2011/01/21(金) 11:43:16

新手のプロジェクトじゃないかと。

>>642
> プロジェクトを進めるのは経済産業省と大手ＩＴ企業。民間側の協議会は昨年
> １２月６日に発足し、コンピューターで日本語を扱うのに不可欠なソフトを作っ
> ているマイクロソフト、ジャストシステムなど９社・団体が加わった。マイク
> ロソフトの加治佐俊一ＣＴＯ（最高技術責任者）は「外字問題という、世界で
> も例のない日本固有の問題が解決に向かう」と語る。

648 ：デフォルトの名無しさん：2011/01/21(金) 11:53:21

新たな不幸の始まりの気がする

649 ：デフォルトの名無しさん：2011/01/21(金) 12:04:02

これのことだよな
ttp://internet.watch.impress.co.jp/docs/news/20101206_412176.html

650 ：デフォルトの名無しさん：2011/01/21(金) 12:32:56

民間のってのはそれだろうね
ってかJSC2の連中はやりたくないのかよ>>642

651 ：デフォルトの名無しさん：2011/01/21(金) 14:42:48

Adobe入ってるなら今よりひどくはならないだろうな。

652 ：デフォルトの名無しさん：2011/01/21(金) 14:53:41

Googleは入ってないのか

653 ：デフォルトの名無しさん：2011/01/21(金) 14:55:32

ttp://www.asahi.com/national/update/0120/TKY201101200591.html
の２ページ目

>　一方で、懸念の声もある。

>　国立国語研究所の高田智和准教授は「戸籍や地名にはすでに使われていない異体字や誤字も多い。
>いたずらに使える字を増やすのでなく、使われているかどうかで仕分けるのが先ではないか」という。

>　プロジェクトが完了すれば、パソコンの日本語変換で「渡辺」の候補は現状の３から一気に２２に増える。
>ＪＩＳ規格を決める際、多くの異体字を集約した東京外語大の芝野耕司教授（言語学）も
>「多くの漢字が画面上に並ぶ中から、延々探せというのか。漢字を増やすことはコンピューターにとって
>意味のある行為かも知れないが、人にとっては使い勝手が悪化するだけだ」と話している。

二人ともUNICODEの異体字を誤解しているような発言だぬ

ttp://internet.watch.impress.co.jp/docs/news/20101206_412176.html
こっち読めば良いのにね

654 ：デフォルトの名無しさん：2011/01/21(金) 15:07:28

その二人はJTC1/SC2の日本の委員だよ
ttp://www.itscj.ipsj.or.jp/meibo/020000.pdf

使える字を増やしたくないのに、文字を追加するプロジェクトにいる不思議

655 ：デフォルトの名無しさん：2011/01/21(金) 16:19:05

ttp://ivstpc.jp/directors.aspx
IVSの協議会はMSが割と乗り気なのかな。
いずれIVS対応の明朝版メイリオみたいなフォントが来ればいいけど。

656 ：デフォルトの名無しさん：2011/01/21(金) 16:34:38

Win7はIVSの枠組み出来てるから、
データの蓄積をしたいわけだよね。
それも役所が使ってくれるやつ。
MSジャパンは官庁、教育機関への食い込みに力入れていて、
現地法人では唯一CTO置いているくらいだし。それが>>647の人。

657 ：デフォルトの名無しさん：2011/01/21(金) 22:20:53

>>653
>「多くの漢字が画面上に並ぶ中から、延々探せというのか。

例えば異字体選択パレットの字形の並び順を、現代の日本で最もよく使われているものの
順に表示するようにすればいい。
他には、あまり使われていない字形は [その他] をクリックするまで表示しない、でもいい。

んで、それは文字のコード化レイヤーの話じゃなくて、アプリケーションのUIレイヤーの
話なのだから、それをもって異字体のコード化をすべきでないという議論はおかしい。

658 ：デフォルトの名無しさん：2011/01/21(金) 22:35:28

>　国立国語研究所の高田智和准教授は「戸籍や地名にはすでに使われていない異体字や誤字も多い。
>いたずらに使える字を増やすのでなく、使われているかどうかで仕分けるのが先ではないか」という。

国語研究所のひとなのにこんな暴言吐けるとは・・・
古典に載ってる地名なんかどうするつもりなんだろう

659 ：デフォルトの名無しさん：2011/01/21(金) 22:45:01

字形の上では AJ1 ∪ Hanyo-Denshi ⊆ 経産省新外字、を満たすが、マッピングが単射
でないとか、親字のコードが違うとか新たなカオス発生の悪い予感が…

660 ：デフォルトの名無しさん：2011/01/21(金) 23:22:08

>>658
まあ、戸籍統一文字は大漢和なんかで「誤字」とされていないものを
片っ端から収録しているだけで実際に使われているかどうかは調べていないので、
戸籍の電子化だけが目的ならオーバースペックなのは確か。

661 ：デフォルトの名無しさん：2011/01/21(金) 23:28:01

>>654
> 使える字を増やしたくないのに、文字を追加するプロジェクトにいる
なるほど、増やしたくないから足を引っ張るためにそこにいるのか。
>>630-とつながった

662 ：デフォルトの名無しさん：2011/01/21(金) 23:59:04

>>658
だよな。たとえ誤字であろうが今使われていない字であろうが、
過去に使われたことがあれば、必要になってくる場面というのはありうるわけだし。

663 ：デフォルトの名無しさん：2011/01/22(土) 00:42:40

安岡さんとこにリンクあった
ttp://ossipedia.ipa.go.jp/article/9/

664 ：デフォルトの名無しさん：2011/01/23(日) 00:43:44

ふむ…

665 ：デフォルトの名無しさん：2011/01/23(日) 10:07:26

>>662 現在も過去も使われた形跡なんかない文字、おそらくそこにしかない誤字でもなんでも
登録されてたりするから問題なの。

あと常識として、国研ってのはもともと漢字制限の研究のために設立されてるから。

666 ：デフォルトの名無しさん：2011/01/23(日) 12:34:29

移管じゃなく完全に解体すべきだった

667 ：デフォルトの名無しさん：2011/01/23(日) 14:21:07

JISに親字すら登録されてない文字があるから、
IVSの枠組みで全部やろうとすると、
JISに文字を登録する必要があるんだな。

668 ：デフォルトの名無しさん：2011/01/23(日) 14:30:20

各市町村で勝手に臨時フォント作ってたら品質にばらつきが出るだろ

669 ：デフォルトの名無しさん：2011/01/24(月) 23:34:42

議事録面白い。発言者名が削除されているのはつまらないけど。

670 ：デフォルトの名無しさん：2011/01/25(火) 02:13:21

Win7のレンダリングはIVSに対応してるらしいがNLSが未対応なので
CompareStringExなんかがIVSを無視してくれない。
BMPのVSはちゃんと無視するのに

671 ：デフォルトの名無しさん：2011/01/25(火) 03:06:28

ややこしいよう

672 ：デフォルトの名無しさん：2011/01/25(火) 11:17:43

>>670
レンダリングが対応しているって言うけど、どのAPIなら大丈夫で、
.NET(WPF)やSilverlightならどうなっているかって情報が、MSのサイト見てても全然わからん。
もしまだ無いなら自分で全部まとめようかと思っているんだが、誰かがすでに
まとめている所ってある？

673 ：デフォルトの名無しさん：2011/01/25(火) 12:40:24

外字は DNS で管理すれば良くね？

674 ：デフォルトの名無しさん：2011/01/25(火) 13:53:03

漢字だけで58000字以上ものグリフ集合なんてフォントメーカーは対応できるのかねえ

675 ：デフォルトの名無しさん：2011/01/25(火) 14:20:56

でもお高いんでしょ？

676 ：デフォルトの名無しさん：2011/01/25(火) 16:35:54

10万円コースかな・・

677 ：デフォルトの名無しさん：2011/01/25(火) 16:44:45

安！！

678 ：デフォルトの名無しさん：2011/01/25(火) 16:49:39

>>674
共通フォントデータベース作るなんて話になってるが。
まあ役所の戸籍の話だと思うが。

679 ：デフォルトの名無しさん：2011/01/25(火) 18:42:12

フォントは今入札やってるんだっけか
できたフォントを役所の中だけで使うのか一般配布もするのか注目だなぁ

680 ：デフォルトの名無しさん：2011/01/25(火) 19:03:31

ttp://bizpal.jp/epub/00012
>同じグリフをどのように扱うのかどちらかに寄せるのか？その場合のマッピングは？
>IVS技術促進協議会よりマッピングテーブル、実装ガイドの提供を予定

AJ1と汎用電子とでグリフがダブってる件に対する問題意識はあるみたい

681 ：デフォルトの名無しさん：2011/01/26(水) 17:08:11

>>672
ないんじゃないかな

682 ：デフォルトの名無しさん：2011/01/28(金) 01:57:34

>>676
インデックスフォントの価格を考えたら
印刷物クォリティのフォントはそうなるよな

683 ：デフォルトの名無しさん：2011/01/28(金) 02:04:55

>>672
自分の知ってる範囲だと
DirectWriteはOK
UniscribeもWindows 7かOffice 2010付属のものならOKだが
ScriptItemizeの第4引数にSCRIPT_CONTROL構造体を渡してfMergeNeutralItemsを
1にセットする必要がある。さもないと互換性のため従来どおりIVSの手前でrunが
分割されるので正しく描画できない。
通常はNULLを渡すので修正が必要(DLLだけ入れ替えても対応できない)

684 ：デフォルトの名無しさん：2011/01/28(金) 19:45:06

>>680
> 別々に登録した背景
> それぞれの出典などの同定、整合性
たとえばCID1125～7477とJA****はどちらもJIS X 0208-1990が由来で
しかもかつてのAJ1のTechNoteは平成明朝体そのもので印刷されてたんだから
対応することは自明だろ…と思ったら安岡先生に先を越されてた。
http://itpro.nikkeibp.co.jp/article/COLUMN/20110124/356398/

685 ：デフォルトの名無しさん：2011/01/28(金) 21:38:10

>>684
字形の出所にまで遡らないといけないのか…きっついなー

686 ：デフォルトの名無しさん：2011/01/29(土) 02:01:38

>>685
むしろ実際の字形を一切見なくてもマッチングが取れるんでかえって曖昧さがなくて
簡単かもしれない。
もちろんCID+8686とJTBE75の起源を実際に確かめようとか思ったらえらいことになるけど。

687 ：デフォルトの名無しさん：2011/01/29(土) 08:34:59

そういうのを協議会で決めるんだろ。叩き台は安岡さんが既に作ったし。
ベンダーだって、コストがバカにならんから新たに作るグリフはなるべく減らしたい。

688 ：デフォルトの名無しさん：2011/01/29(土) 10:40:31

安岡氏に限らず、こういう細かいの大量にチェックできる人ってどんな頭してるんだろう(褒め言葉)

689 ：デフォルトの名無しさん：2011/01/29(土) 12:13:05

( ＾ω＾)

690 ：デフォルトの名無しさん：2011/01/29(土) 12:59:53

>>588
> 安岡氏に限らず、こういう細かいの大量にチェックできる人ってどんな頭してるんだろう(褒め言葉)

こんな頭してる。

1文字のチェックに15分かけたとして一日に32個
58000個もあれば、1,812日かかるから
7年は食いぶちに困らねぇなw

691 ：デフォルトの名無しさん：2011/01/29(土) 15:05:10

Ken Lunde氏の対応表
http://lundestudio.com/IVD/hd2aj1-mapping.txt
漢字データベース計画の対応表
http://kanji-database.cvs.sourceforge.net/viewvc/kanji-database/kanji-database/data/hd2cid.txt?view=log
これらは字形ベースでマッチング

692 ：デフォルトの名無しさん：2011/01/29(土) 15:06:04

>>690
今年度中にフォント完成させろとかいう超強行スケジュールなんだが?

693 ：デフォルトの名無しさん：2011/01/30(日) 00:33:01

漢字データベースの方はサーバが今落ちているっぽいな。
http://sourceforge.net/apps/wordpress/sourceforge/2011/01/27/service-downtime/
github に退避しているみたい。

JIS X 0208/0212/0213 の規格書字形でAJ1-6と汎用電子が重複するのは由来からも明白だな。

メーカー外字由来の文字もそこそこかぶるだろうけど、住基文字はどのメーカー外字に対応している
かは公表されてないし、一旦平成明朝にする時点でデザイン変更されているものもあるだろうから、
これは目視で確認するしかないな。

問題はやはり登記統一文字とAJ1-6でかぶるやつだな。これは追跡が大変そうだ。

694 ：デフォルトの名無しさん：2011/01/30(日) 02:06:57

無能な権力者ほど文字をいじりたがるな

695 ：デフォルトの名無しさん：2011/01/30(日) 16:19:44

>>23
> （例：淡淡と淡々、どちらもあっさりした味わい）
> （○○会会長、△△家結婚式式場、これ等は踊り字を使うのは間違い）
というのが基本だというのは理解できるけど、例外なんていくらでも…

> 同じ漢字を直接繰り返すことは、再婚や不幸の繰り返しを連想させ縁起が悪いため、
> 「結婚式々場」、「告別式々場」と表記することが多い。

696 ：デフォルトの名無しさん：2011/01/30(日) 16:32:59

ふつう結婚式場じゃね?

697 ：デフォルトの名無しさん：2011/01/30(日) 19:32:11

△△家結婚式場だと△△家が所有する式場みたいじゃね

698 ：デフォルトの名無しさん：2011/01/30(日) 20:27:30

おまえんちの本家も式場ぐらい持ってるだろ？

699 ：デフォルトの名無しさん：2011/02/01(火) 19:11:01

Firefox 4: WOFFでIVS対応、SVGフォントは対応を拒否
Opera: Win7ではWOFFでIVS対応、SVGフォントはHTMLから使えない
WebKit: SVGフォントでIVS対応、SVGフォント以外はIVSどころか結合文字すら
　まともにサポートしていない。SafariにいたってはSIPの漢字すら豆腐になる

結局こいつら協調する気ないんだな。
WebKit/SafariはWindows上の話なのでMacやモバイル端末ではもう少しマシかも

700 ：デフォルトの名無しさん：2011/02/01(火) 22:35:51

現状ではOpenTypeフォントをそのまま使うのが一番安全
でもFirefoxはなんでSVGフォント拒否なんだろ

701 ：デフォルトの名無しさん：2011/02/01(火) 23:14:38

どこが安全？？？

702 ：デフォルトの名無しさん：2011/02/02(水) 00:09:27

Firefox, Opera, WebKit全部対応済みだしIEも9で対応

703 ：デフォルトの名無しさん：2011/02/02(水) 00:35:46

実際んとこ、IVS含め全部網羅した東アジアフォントってドンぐらいのサイズになるんだろう

704 ：デフォルトの名無しさん：2011/02/02(水) 00:43:48

glyphwikiの6卍フォントで16MBくらいだったかな
アウトラインをpostscript化して整えればもう少し小さくできそうだけど

705 ：デフォルトの名無しさん：2011/02/02(水) 01:01:15

ううむとうなるサイズだな

706 ：デフォルトの名無しさん：2011/02/02(水) 19:51:00

>>702
IVSを使えるかどうかは別問題
つーかFirefox 4以外OpenTypeフォントのformat 14 cmap subtableに対応していない。
WOFFと変わらない

707 ：デフォルトの名無しさん：2011/02/02(水) 20:20:12

当面は {基底漢字+VS} をリガチャとしてGSUBにも突っ込んどけば

708 ：デフォルトの名無しさん：2011/02/02(水) 20:45:56

format 14 cmap subtableが提唱される前にそれ試したことがあるけど
少なくともUniscribeはBMP外の結合文字に対応していなかったようでうまくいかなかった。
Win7でもformat 14 cmap subtableを使うことが前提なのかうまくいかないみたい。
VistaではGSUBリガチャを使ってた数学記号やパスパ文字用の異体字も
Win7ではformat 14 cmap subtableを使う方式に置き換えられた

709 ：デフォルトの名無しさん：2011/02/03(木) 00:29:41

国旗はどうするのかな?
SMPにある符号2つの組合せで表されるみたいだけど。

710 ：デフォルトの名無しさん：2011/02/03(木) 00:54:01

チャートの説明では、「Regional Indicatorを組合わせたものには、
国旗を表すグリフが宛がわれることもあるかもねー」って感じになってる。

国旗は政治的な問題が絡んできかねないから、多分国旗を直接符号化した
という形にはしたくなかったんじゃないかと。

711 ：デフォルトの名無しさん：2011/02/03(木) 03:29:52

要はTW問題対策か。

ケータイ会社がテキトーに作った絵文字のおかげで
世界をこんな難題に巻き込んでしまったことを考えると
日本人の一人としてとても申し訳ない気持ちになるが、

……その当の日本の国旗はというと
建国記念絵文字の旗竿付き日の丸としてちゃっかり同時に、
国旗符号とは別枠で入ってるんだから乾いた笑いが止まらないｗ

712 ：デフォルトの名無しさん：2011/02/03(木) 13:07:43

軍艦旗も入れとけばよかったな

713 ：デフォルトの名無しさん：2011/02/04(金) 03:10:41

>>711
日本地図や、渋谷駅前のモニュメントを記号化したものまで入ってるしな。
ガラパゴス絵文字をほぼそのまま取り込んだんだからある意味当たり前ではあるが

714 ：デフォルトの名無しさん：2011/02/04(金) 03:16:07

Regional Indicatorは14面の文字じゃないのか…。
14面の文字だとそれ自体は表示されないんだっけ?

715 ：デフォルトの名無しさん：2011/02/04(金) 20:25:22

Tフォントついにキター!
http://charcenter.t-engine.org/tfont/index.html
> 3. Tフォントの再配布は、無改変かつ非営利に限り、これを自由とします。
> その際には出所ならびに権利標記を必ず添記して下さい。
> T-Font (C) Sakamura-Koshizuka Laboratory, The University of Tokyo
> http://www.sakamura-lab.org/FONT/
出所を書くのはいいけどそんなURLで大丈夫か?

716 ：デフォルトの名無しさん：2011/02/04(金) 20:39:49

アパッチはNot Foundと言っている。

717 ：デフォルトの名無しさん：2011/02/05(土) 00:14:48

2005年12月の発表時はこのURLで公開すると確かに言ってたんで
http://www.t-engine.org/news/pdf/TEP051213_u18.pdf
利用規定の直し忘れじゃないかと思うんだが

718 ：デフォルトの名無しさん：2011/02/07(月) 22:31:01

Proposal to encode two Right Indic Kana variants in the UCS
イ KATAKANA LETTER GAMEST HA
人 KATAKANA LETTER GAMEST RU
Source: http://dic.nicovideo.jp/oekaki/12242.png
みたいなこといつまで続けるんだろうね。

719 ：デフォルトの名無しさん：2011/02/08(火) 07:41:33

話のすり替え乙

720 ：デフォルトの名無しさん：2011/02/08(火) 08:10:38

何が?

721 ：デフォルトの名無しさん：2011/02/08(火) 08:13:36

誰かの手書きの誤字が「典拠」として収録されてしまうって現状そのものじゃん。

722 ：デフォルトの名無しさん：2011/02/08(火) 17:47:23

ュ KATAKANA LETTER GAMEST E
ラ KATAKANA LETTER GAMEST HU
ウ KATAKANA LETTER GAMEST RA
上 KATAKANA LETTER GAMEST TO

723 ：デフォルトの名無しさん：2011/02/08(火) 19:05:16

ラとかウに似たカナを提案するのは危険

724 ：デフォルトの名無しさん：2011/02/08(火) 19:19:45

また国語審議会の人が怒るのか

725 ：デフォルトの名無しさん：2011/02/09(水) 00:55:11

「ネ」と「申」を組み合わせて1文字として扱うのは、濁点の仕組み使えばできるかと思うのだが、
「神」という文字を2文字として扱うにはどうすればいいんだ？

726 ：デフォルトの名無しさん：2011/02/09(水) 01:03:54

NEMOUSU TV

727 ：デフォルトの名無しさん：2011/02/09(水) 01:39:18

2channeler decomposition mapping が必要だな・・・

728 ：デフォルトの名無しさん：2011/02/09(水) 09:44:36

ノ＼゛力

729 ：デフォルトの名無しさん：2011/02/09(水) 23:08:09

>>727
decompositionじゃなくてcollationで
contraction(2文字を1文字として扱う)も
expansion(1文字を2文字として扱う)も可能

730 ：デフォルトの名無しさん：2011/02/10(木) 00:48:47

悟リの分解再構築が可能になるのか

731 ：デフォルトの名無しさん：2011/02/10(木) 08:45:32

フォントの合字でやれよ

732 ：デフォルトの名無しさん：2011/02/10(木) 20:41:45

まさに'dlig' featureの出番

733 ：デフォルトの名無しさん：2011/02/11(金) 12:34:20

何だこの流れｗ
みんな蝦を持て余してるんだなｗ

734 ：デフォルトの名無しさん：2011/02/11(金) 16:59:03

http://www.sakamura-lab.org/FONT/
にリダイレクトが設置されてリンク切れが解消された。
今はリダイレクト先が落ちてるけど

735 ：デフォルトの名無しさん：2011/02/11(金) 18:42:17

ぐだぐだだなｗ

736 ：デフォルトの名無しさん：2011/02/11(金) 20:40:49

復旧したようだ

737 ：デフォルトの名無しさん：2011/02/12(土) 16:46:19

IE9 RCがIVSに対応してた。イヤッッホォォォオオォオウ！(AAry
Firefox同様SVGフォントには未対応なのでWebKitとそれ以外の陣営に分かれたようだ。

738 ：デフォルトの名無しさん：2011/02/12(土) 17:05:05

どんどん混沌としてくるなあ

739 ：デフォルトの名無しさん：2011/02/12(土) 17:37:35

>>302やARIB外字の非漢字はIE9 RCでも相変わらず箱だった…。

740 ：デフォルトの名無しさん：2011/02/12(土) 21:41:47

Win7のレンダラに丸投げしているだけでは。

741 ：デフォルトの名無しさん：2011/02/12(土) 21:57:23

>>740
SP1 RCを入れてるからメモ帳では花園明朝を選べば表示できるんだよ。
IVSもIE9 betaでは駄目だったのでDirectWrite使うだけでうまくいくわけではないみたい

742 ：デフォルトの名無しさん：2011/02/12(土) 22:03:56

あ、CSSでフォントを指定したらIE9でも表示できた。
フォールバックがショボいのか。

743 ：デフォルトの名無しさん：2011/02/12(土) 22:21:59

ふむ

744 ：デフォルトの名無しさん：2011/02/13(日) 03:04:18

指定されたフォントが、あるIVSに対するグリフを持っていなかった場合のことは、
今のところ実装依存なのかな。
基底文字用のグリフでOKとするのか、別のフォントへフォールバックするのか。

745 ：デフォルトの名無しさん：2011/02/13(日) 04:39:39

難しいな

746 ：デフォルトの名無しさん：2011/02/13(日) 16:05:53

今のところWebブラウザでフォールバックするものは存在しない

747 ：デフォルトの名無しさん：2011/02/13(日) 20:31:36

俺の頭はフォールバック中だ！

748 ：デフォルトの名無しさん：2011/02/14(月) 19:50:28

http://std.dkuug.dk/jtc1/sc2/wg2/
がNot Foundになっとる
http://std.dkuug.dk/Jtc1/sc2/wg2/
とかわざと1文字変えるとMultiple Choiceになるから
実際には削除されてないと思うんだが
いったい何が起きてるんだ

749 ：デフォルトの名無しさん：2011/02/14(月) 21:41:51

繋がらなくなることは最近よくあったけど404は初めて見た。

750 ：デフォルトの名無しさん：2011/02/15(火) 22:01:27

長いね
コンビーナが気づいてないのかな

751 ：デフォルトの名無しさん：2011/02/16(水) 16:03:38

復活
http://www.dkuug.dk/JTC1/SC2/WG2/docs/n3987.pdf
Adobe-Japan1に収録されている小書き「こ」と小書き「コ」の追加提案キタ

752 ：デフォルトの名無しさん：2011/02/16(水) 19:59:50

小書きの「こ」もゖの次じゃなくてSupplementの方なのね

753 ：デフォルトの名無しさん：2011/02/16(水) 23:02:43

その辺の使い分け基準がどうもよくわからない

754 ：デフォルトの名無しさん：2011/02/16(水) 23:29:43

ワンブロックにひらカタ両仮名が規則性もなく混在ってのも何だかなあ

755 ：デフォルトの名無しさん：2011/02/17(木) 00:07:09

中黒と長音符がひらがな、濁点がカタカナにある時点で最初からおかしい気がしてならない

756 ：デフォルトの名無しさん：2011/02/17(木) 00:38:03

そのへんは何であそこに入っちゃったんだろうな。
3000～303fのが良さそうなのに。文字名にHiraganaとかKatakanaって付いてたせいか。

757 ：デフォルトの名無しさん：2011/02/17(木) 08:40:56

U+3040,3097,3098はもう永久に埋まらんのかな?

758 ：デフォルトの名無しさん：2011/02/17(木) 08:57:58

ドイツ人はβの位置で悩んだり愚痴ったりしないのかな

759 ：デフォルトの名無しさん：2011/02/17(木) 09:33:28

ベータの位置で悩んだり愚痴ったりはしないだろうな
エスツェットの位置で悩んだり愚痴ったりはするかもしれないが

760 ：デフォルトの名無しさん：2011/02/20(日) 21:52:58.59

日本は10646 2ndに反対票入れたのか・・

761 ：デフォルトの名無しさん：2011/02/20(日) 22:01:11.58

さすが文字を増やしたくない連中のすくつだな

762 ：デフォルトの名無しさん：2011/02/20(日) 22:08:25.03

Unicode listでUTF-cにマジレスしてる奴は
日本人のくせにUTF-9 (エイプリルフール版じゃない方)も知らんのか…。つーか
> In your proposal, the maximum length of the coded character
> is 4, it is less than UTF-8's max length.
UTF-8の最大長は(Unicodeでは)4バイトだろ。何言ってるのこいつ

763 ：デフォルトの名無しさん：2011/02/20(日) 22:33:05.27

まあJSC2の人だから、と思ったけど今は10646でも4バイトなのか。

764 ：デフォルトの名無しさん：2011/02/20(日) 22:56:58.51

5バイト、6バイト長になるとこは使わないことになったんだっけ?

765 ：デフォルトの名無しさん：2011/02/20(日) 22:58:24.54

言い分は解るがFDISで反対票ってのはなぁ
3rd ed.がすぐうしろに控えてるんだから
もっと穏当なやり方あったろうに

766 ：デフォルトの名無しさん：2011/02/21(月) 00:00:14.30

FDISってことはもうWG2の手を離れてふつーならシャンシャン投票になる段階か。
JIS X 0213:2000のときも親委員会でもめたな

767 ：デフォルトの名無しさん：2011/02/21(月) 00:27:31.37

Unicode 6.0のmulticolumn chartもちょっと見れば分かるような間違い満載だし
(U+20534あたりとか)まあ気持ちはわかる。
しかしこれを鵜呑みに実装されたらと思うとワロエナイ

768 ：デフォルトの名無しさん：2011/02/21(月) 00:37:23.56

票読みはした上でのことだろうけど万が一否決されていたら
2版そのものがパーになったわけで

棄権してコメントはwg2にポストする方が他国の心証はよかったんじゃ

769 ：デフォルトの名無しさん：2011/02/21(月) 00:40:14.90

JTC1/SC2ではMember bodyに拒否権がなくてよかったな

770 ：デフォルトの名無しさん：2011/02/21(月) 20:33:41.62

殺伐としているなあ

771 ：デフォルトの名無しさん：2011/02/21(月) 22:42:59.20

Unicode 6が全chapter完成したそうだ。

772 ：デフォルトの名無しさん：2011/02/21(月) 23:23:18.66

BookmarksはまだだけどもうPDFは読めるね

773 ：デフォルトの名無しさん：2011/02/22(火) 00:14:31.86

守岡氏(@MnjaMnja)が何をあんなに悩んでるのかよくわからん。
字体・字形の禅問答を避けて「base characterで表現するのが適切なグリフの集合の
部分集合」と定義しているUTS#37のほうがよっぽど形式的(formal)だと思うんだが。
# 前半の「集合」がwell-definedかどうかはまた別問題

774 ：デフォルトの名無しさん：2011/02/23(水) 01:55:23.15

なんかグリフをネット公開するだけでにユニークコードくれる団体とか、そのコードの規格とかってないものかな？

775 ：デフォルトの名無しさん：2011/02/23(水) 02:04:52.01

しいて言えばトロンコード？
郵送しなきゃいけないようだけど番号は機械的にくれるみたい

776 ：デフォルトの名無しさん：2011/02/23(水) 05:54:28.04

ISO/IEC 10036 (原則有料)
IVDもMember bodyに対して無条件に登録料棒引きとかするなよ。
有料なら無駄に税金使うなと圧力掛けられたのに。
(同じかどうかわからないから無駄じゃないと言い張るだろうが登録料に
引き合うだけの効用があることを証明する必要が出てくる)
まあIVD登録の方に誘導したかった気持ちはわかるんだが

777 ：デフォルトの名無しさん：2011/02/23(水) 06:10:31.36

Win7 SP1が出た
ようやくARIB外字フォントや絵文字フォントが使い物になるのか

778 ：デフォルトの名無しさん：2011/02/23(水) 06:20:12.28

絵文字フォントついてるの？

779 ：デフォルトの名無しさん：2011/02/23(水) 06:36:46.82

付いてないけど今までWin7では作っても(Firefox以外で)表示できなかったのが改善された

780 ：デフォルトの名無しさん：2011/02/23(水) 07:13:09.18

とりあえずジョークRFCでいいから、架空文字とかをユニークコードとして扱える規格が出ないものかなあ？

781 ：デフォルトの名無しさん：2011/02/23(水) 07:20:29.93

128bitくらい空間を用意しておいて(IPv6のULAみたいに)
ランダムに使うことにすればほとんどかぶることはないって誰か言ってたな

782 ：デフォルトの名無しさん：2011/02/23(水) 07:28:47.37

16バイト文字コードに既存のコード全部ぶち込んで、適当な圧縮で改行単位とかでパックすれば縮んて、意外と実用的になったりして？

783 ：デフォルトの名無しさん：2011/02/23(水) 10:26:31.05

>>780
ちょっと違うかもしれないけど、こんなのならある
ttp://evertype.com/standards/csur/

784 ：忍法帖【Lv=7,xxxPT】：2011/02/24(木) 23:13:43.76

Logoで亀に書かせる方式にすれば、どんな文字でもかけるんじゃね？

785 ：デフォルトの名無しさん：2011/02/24(木) 23:25:09.64

はいはい、表現したい文字を書く最も短いLogoプログラムが
文字コードになるわけですね？チャイティンさん。

786 ：デフォルトの名無しさん：2011/02/24(木) 23:29:38.48

>>764
10646 2ndでは定義域が完全に0000..10FFFFに定義され直して、群(Group)の概念は
黒歴史になった。U-00000000形式の8桁表記も廃止された。
もちろんUTF-8も4バイトまでしか定義されていない。

787 ：デフォルトの名無しさん：2011/02/25(金) 01:17:39.42

じゃあ一体存在意義は何なんだ

788 ：デフォルトの名無しさん：2011/02/25(金) 01:58:02.74

>>784
ttp://www5.puny.jp/uploader/download/1298007172.zip
turtle

789 ：デフォルトの名無しさん：2011/02/25(金) 21:44:27.11

10646 2ndのdecomposable characterの定義がすごいことになってる
> A decomposable character is a character for which there exists an equivalent
> composite sequence.
まず「equivalent」の定義が見当たらないが、話が進まないので
「canonical or compatibility equivalent」のことだと思い込むことにする。
> 4.17
> Composite sequence
> A sequence of graphic characters consisting of a base character followed by
> one or more combining characters, ZERO WIDTH JOINER, or ZERO WIDTH
> NON-JOINER (see also 4.14)
Singleton (互換漢字など)はcomposite sequenceじゃないらしい (one or more
combining charactersが存在しない)。したがってdecomposable characterでもない。

素直に「UCDに分解マッピングが定義されている文字」とかUnicodeと同様の
定義にしておけばよかったのに、どうしてこうなった

790 ：デフォルトの名無しさん：2011/02/25(金) 21:46:03.55

> Singleton (互換漢字など)はcomposite sequenceじゃないらしい
Singleton (互換漢字など)の分解結果はcomposite sequenceじゃないらしい。
したがって互換漢字は(10646 2nd的には)decomposable characterではない。
だった

791 ：デフォルトの名無しさん：2011/02/25(金) 23:15:18.05

今の10646ってこれ単体で運用できるのかな

792 ：デフォルトの名無しさん：2011/02/26(土) 01:26:58.24

UCDとかUAXとか参照しまくり

793 ：デフォルトの名無しさん：2011/03/03(木) 00:28:58.59

ううむ

794 ：デフォルトの名無しさん：2011/03/03(木) 11:10:40.87

http://slashdot.jp/%7Eyasuoka/journal/525713
＞それでも、「U+1F1FF U+1F1F7 U+1F1FA U+1F1F8」(ZRUS)に関しては、
＞「旧ザイールの国旗」と「アメリカ合衆国の国旗」を表示する実装、
＞という大技があり得るので結構なやましい。
＞うーん、こんなことなら、High/Low Surrogatesをみならって、
＞1文字目と2文字目を別コードにするよう提案すべきだったか…。

ZRはobsoleteですよ、センセイ

795 ：デフォルトの名無しさん：2011/03/03(木) 11:28:00.99

ふむ

796 ：デフォルトの名無しさん：2011/03/03(木) 21:40:59.85

あ、Mac OS X LionにEmojiフォントが付くってことは、
Unicode 6ベースなんだな。

797 ：デフォルトの名無しさん：2011/03/03(木) 22:38:18.07

ヒラギノのIVS対応マダー?

798 ：デフォルトの名無しさん：2011/03/04(金) 00:59:44.96

>>796
フォント付くの？
なんか絵文字の表示に対応っていう微妙な言い回しの記事なら見たが

799 ：デフォルトの名無しさん：2011/03/04(金) 02:05:01.22

Apple Color Emojiという名前のTrueType fontと書かれている。

ttp://www.appleinsider.com/print/11/02/27/inside_mac_os_x_10_7_lion_font_book_3_emoji_support.html

True Typeって、カラー対応してるんだろうか。良く知らないけど。

800 ：デフォルトの名無しさん：2011/03/04(金) 02:22:48.26

フォント付くのかー
カラーは現在のTrueType仕様では対応してないはず
独自拡張かな

801 ：デフォルトの名無しさん：2011/03/04(金) 12:06:50.50

502グリフってことは収録文字はiOSと同じくSoftBankのものだけっぽいな

802 ：デフォルトの名無しさん：2011/03/04(金) 12:48:06.69

ううむ

803 ：デフォルトの名無しさん：2011/03/04(金) 22:26:46.82

ありゃ、docomoとauも入れると何文字？

804 ：デフォルトの名無しさん：2011/03/04(金) 23:23:14.62

1000文字以上
iOSにあった同名のフォントをそのまま持ってきただけじゃね

805 ：デフォルトの名無しさん：2011/03/05(土) 00:55:47.94

>>803
テンプレくらい見てよ。
http://unicode.org/~scherer/emoji4unicode/snapshot/full.html

806 ：デフォルトの名無しさん：2011/03/08(火) 01:18:54.93

http://std.dkuug.dk/JTC1/SC2/WG2/docs/n3992.pdf
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n3910.pdf
日本の将棋雑誌とか新聞では普通に漢字で符号化してるし
先手と後手の記号はJIS X 0213で符号化済みだからいらないのかな

807 ：デフォルトの名無しさん：2011/03/08(火) 21:20:18.02

まるお氏がこんなことつぶやいてたんだけど既出？

> 秀丸でDirectWrite対応（2011.02.23）
ttp://hide.maruo.co.jp/hidetalk.html
ttp://hide.maruo.co.jp/software/tkhist_pre.html

808 ：デフォルトの名無しさん：2011/03/08(火) 23:46:20.64

IVSとかOpenType Layoutには対応してるの?

809 ：デフォルトの名無しさん：2011/03/09(水) 00:40:45.96

>>808
前者については、DirectWrite対応アプリならIVSのOpenType Layout(UVS)はそのままサポートされる。
ttp://msdn.microsoft.com/ja-jp/windows/dd673458.aspx#2b2

後者については、OpenType Layoutならではの高度な文字体裁機能のサポートって意味？
メールとかエディタにそんな機能のサポートが必要なの？
必要ない機能には対応しないんじゃね？
ttp://msdn.microsoft.com/ja-jp/windows/dd673458.aspx#2b1

その他のOpenType Layoutとしては縦書きとか対応させたいようだけど、日本語環境でのDirectWriteはまだバグだらけでいろいろ苦労してるっぽいな。

810 ：デフォルトの名無しさん：2011/03/09(水) 02:33:37.47

DirectDrawもいいけど秀丸はちゃんと結合文字サポートしてくれ。
いまだに半濁点付きカ行がちゃんと表示できない。

811 ：デフォルトの名無しさん：2011/03/09(水) 08:02:47.49

結合文字サポートしてないならIVSをサポートしてるわけないと思うんだが。
バックエンド(DirectWrite)がサポートしててもアプリがアホなことしてたら
まともに表示できない。
それにエディタなら結合文字の前半だけ削除したり選択したりできないとか
カーソル移動の対応とかも重要だな。1バイト文字しか扱えない欧米のエディタで
マルチバイト文字の文書を扱ってるんじゃあるまいし。
欲を言えば検索にも対応してほしい

812 ：デフォルトの名無しさん：2011/03/10(木) 12:42:11.68

安岡さんが変体仮名の話題ねえ
文字情報基盤～の方でゴーが出たのかな

813 ：デフォルトの名無しさん：2011/03/10(木) 13:16:03.00

そっち方面はいろいろタブーがあったりするのか

814 ：デフォルトの名無しさん：2011/03/10(木) 13:39:06.86

>>663 に公開されてる。
このへんとか＞ ttp://ossipedia.ipa.go.jp/doc/314/

815 ：デフォルトの名無しさん：2011/03/10(木) 14:22:06.86

あひるだかほつまだかって出せるの？

816 ：デフォルトの名無しさん：2011/03/10(木) 15:25:20.05

jindaiはだいぶ昔に蹴られてるはず

817 ：デフォルトの名無しさん：2011/03/10(木) 21:19:25.96

>>811
底辺IT土方「結合文字サポートしてないならIVSをサポートしてるわけない」ｷﾘｯ
大学講師「結合文字サポートは後回しでIVSをまず先にサポート」ｷﾘｯ
ttp://www.fonts.jp/hanazono/

結合文字とIVSとじゃ潜在的需要の規模がまるで違うだろ
だいたい結合文字をいまさらサポートしてもエディタの売り上げにつながらねーよ
そんなもんより今後注目を浴びそうな先端技術をいち早くサポートすれば宣伝効果があがるだろ
つーかエディタでDirectWrite対応してもIVS以外で売り上げにつながる謳い文句があるとは思えんが

818 ：デフォルトの名無しさん：2011/03/10(木) 21:37:29.66

VSは結合文字の一種なんだが?

819 ：デフォルトの名無しさん：2011/03/10(木) 21:41:43.54

OpenTypeフォントにおいてはVSはその他の結合文字と違うテーブルで実装されるけど
DirectWriteを呼び出すアプリにとっては別に違いはない。
だから結合文字をまともにサポートしないアプリはIVSもサポートできない

820 ：デフォルトの名無しさん：2011/03/10(木) 21:56:15.48

【難しいひらがな】変体フォントが出来たよ～
ttp://hato.2ch.net/test/read.cgi/news/1299729885/

821 ：デフォルトの名無しさん：2011/03/11(金) 01:08:53.56

ゴシック体は文字の骨格をどう捉えてるかがはっきり出るだけに難しい罠。
とりあえず春(す)は、二画目の終わりを左に跳ね上げて三画目に繋げた方が
自然だと思う。

822 ：デフォルトの名無しさん：2011/03/12(土) 02:15:51.21

ChromeはIVSの表示には未対応だけど検索に対応してた。
たとえば「葛飾区」で検索するとちゃんと「葛(U+E0101)飾区」にもヒットする。

823 ：デフォルトの名無しさん：2011/03/12(土) 09:29:24.44

逆に「葛(U+E0101)飾区」で検索して「葛飾区」はかかるの？

824 ：デフォルトの名無しさん：2011/03/12(土) 14:16:32.06

かかる。

825 ：デフォルトの名無しさん：2011/03/12(土) 15:25:59.25

素晴らしい

826 ：デフォルトの名無しさん：2011/03/13(日) 03:55:12.34

素晴らしいな

827 ：デフォルトの名無しさん：2011/03/13(日) 13:40:23.66

Safariも同様だった。WebKitはICUのsearcherを使っているらしい。
http://trac.webkit.org/browser/trunk/Source/WebCore/editing/TextIterator.cpp
ただし単純にprimary weight以外を無視すると「か」と「が」とか「つ」と「っ」まで
同一視されてしまうので(辞書順ソートにおいては正しいweightの付け方だけど
あいまい検索として適切とは言いがたい)、そのへんの補正を行なっている。
何も考えずにcollatorを使えば済むほど甘くはないようだ。

828 ：デフォルトの名無しさん：2011/03/13(日) 14:05:16.66

telで検索すると℡にヒットしたりキロミリで検索すると㌔㍉にヒットしたりするな

こっ、これは別に互換分解なんかじゃなくてデフォルトの照合規則なんだからっ
変な勘違いしないでよね！

829 ：デフォルトの名無しさん：2011/03/14(月) 20:34:31.93

だね

830 ：デフォルトの名無しさん：2011/03/14(月) 21:58:55.91

モヤイで検索するとアホ面の絵文字が引っかかったりするのだろうか

831 ：デフォルトの名無しさん：2011/03/14(月) 22:06:36.18

モ「ヤ」イの時点であいまい検索だな。

832 ：デフォルトの名無しさん：2011/03/14(月) 22:37:46.36

渋谷のはモヤイが正解

833 ：デフォルトの名無しさん：2011/03/15(火) 19:53:07.82

G\"odel, Godel, Goedel
K\H{o}nig, K\"onig, Konig

834 ：デフォルトの名無しさん：2011/03/20(日) 20:45:06.84

Unicode 6.1はQ1 2012の予定っすか。

835 ：デフォルトの名無しさん：2011/03/20(日) 21:14:03.85

何が変わるんですぞ？

836 ：デフォルトの名無しさん：2011/03/20(日) 21:37:10.57

10646の3版に一致させるみたい。

837 ：デフォルトの名無しさん：2011/03/20(日) 22:43:32.19

チックタックだなあ

838 ：デフォルトの名無しさん：2011/03/21(月) 09:50:00.93

余震が怖い

839 ：デフォルトの名無しさん：2011/03/22(火) 10:30:56.65

ttp://www.ustream.tv/recorded/13386889

安岡さん楽しそう

840 ：デフォルトの名無しさん：2011/03/27(日) 00:22:47.03

いつのまにかppmからEncode::EUCJPMSがなくなってるんだけど
ActivePerlでCP51932を扱うにはどうしたらいいの?

841 ：デフォルトの名無しさん：2011/03/27(日) 01:15:04.49

自己レス。
Strawberry Perlに乗り換えて解決した

842 ：デフォルトの名無しさん：2011/03/27(日) 02:01:22.59

>>839
IVSの粒度はIVCごとに異なっていて
常用漢字表に印刷されている「次」 ∉ 6B21 E0100
常用漢字表に印刷されている「次」∈6B21 E0102
常用漢字表に印刷されている「次」∈6B21 E0103
6B21 E0100⊂6B21 E0103
6B21 E0102⊂6B21 E0103
と理解してたんだけど。

つかIPAmj明朝一般公開見送りかよ…。

843 ：デフォルトの名無しさん：2011/03/27(日) 02:21:17.46

IPAフォントはヒンティングが今一つなんで、公開しても民業圧迫ってことはないと思うんだけどなあ。

844 ：デフォルトの名無しさん：2011/03/27(日) 02:29:04.66

>>843
民業圧迫が理由じゃなくて、たとえば常用漢字表の「次」の字形(6B21 E0102に近い)
を6B21 E0103(チャートでは6B21 E0100に近い)に割り当てていいのか? という
問題が未解決だからだそうな。
>>842に書いたとおりの解釈ならいいと思うんだけど、安岡先生が強く反対しているので
とりあえず公開見送りになったらしい。
考えられるオプションは
・とりあえず「次」などはIVSを外す。
・上記のような問題が起きる数文字をIVDに登録する。
・いっそ常用漢字の2136字すべてを「常用漢字コレクション」として登録する。

845 ：デフォルトの名無しさん：2011/03/27(日) 16:49:56.34

これ以上日本発のコレクションを増やすのはあれなんで
汎用電子に追加する方向がいいな

846 ：デフォルトの名無しさん：2011/03/30(水) 20:08:35.57

Unicodeのミス見つけた

𪕾（2A57E：鼠+芻）
𪕿（2A57F：鼻+自/冖/儿）
𪖀（2A580：鼠+雀）

別の部首の漢字が紛れ込んでる

847 ：デフォルトの名無しさん：2011/03/31(木) 13:26:55.42

そういうのって指摘があったら直されるものなの？

848 ：デフォルトの名無しさん：2011/03/31(木) 20:55:02.15

フォントのミスなら直るはず

849 ：デフォルトの名無しさん：2011/03/31(木) 23:27:26.86

それふぉんと？

850 ：デフォルトの名無しさん：2011/04/01(金) 02:06:55.59

12 名前：1 [sage]： 2010/07/12(月) 17:54:35
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」

>>849 許可ください。

851 ：デフォルトの名無しさん：2011/04/01(金) 02:33:40.65

9ヶ月前のロングパスを回収っすか。

852 ：デフォルトの名無しさん：2011/04/01(金) 18:22:25.08

10646/2ndのフリー版ﾏﾀﾞｰ?

853 ：デフォルトの名無しさん：2011/04/01(金) 23:20:22.78

フリーがいいっすよね

854 ：デフォルトの名無しさん：2011/04/02(土) 18:42:21.57

4011-4013は四月馬鹿三連発なんだろうけど
Source欄を見るとちょっぴり本気かもしれないと思えてくるから不思議

855 ：デフォルトの名無しさん：2011/04/03(日) 01:07:40.16

おお
エイプリルフール提案文書来てたのか

856 ：デフォルトの名無しさん：2011/04/03(日) 02:58:07.90

ヨーロッパでももう4/1って終わってるよな。
unicode-mlでの議論見るに、もしかして本気なのか？

857 ：デフォルトの名無しさん：2011/04/03(日) 03:15:48.95

ファイストスの円盤文字も4月1日提案だったのか(N3066)。
こりゃやっぱりPlane 13を異体字セレクタ用に予約してもらうべきだな

858 ：デフォルトの名無しさん：2011/04/16(土) 20:13:24.92

IRG36ネタ
・AJ1用に32のIVSを追加するよ！　2011/06から登録手続きをする予定だよ！(IRGN1765)
・汎用電子も2011年末までに第二陣を登録するよ！(IRGN1760)
・UTC自身が簡体字をIVDに登録するよ！(IRGN1757)

859 ：デフォルトの名無しさん：2011/04/17(日) 00:50:07.25

乙

860 ：デフォルトの名無しさん：2011/04/17(日) 19:27:28.92

今年後半はIVDの更新レビューが2回行われることになるのか。

861 ：デフォルトの名無しさん：2011/04/18(月) 21:22:31.45

> The following represent new developments in the realm of IVS support, which demonstrate that acceptance of and
> support for IVSes are becoming increasingly broad:
もしかしてKen LundeがIVSサポートしてるフォントをTwitter上でゆるぼしてたのは
このためか?

862 ：デフォルトの名無しさん：2011/04/18(月) 21:34:30.23

簡体字はUnification Ruleによるとほとんどは統合されないことになっているから
IVSでは表せないんじゃなかったっけ? せっかくIWDS作ったのに端からブチ壊しに
してくれるわけ?
(逆に反対する奴は10646 3rdのAnnex SとIWDSを根拠にすればいい)

863 ：デフォルトの名無しさん：2011/04/18(月) 21:55:16.95

CSSで「text-rendering: optimizeLegibility;」を指定するとChromeやSafariのWindows版でも
結合文字やBMP外漢字を表示できるようになることが判明。

864 ：デフォルトの名無しさん：2011/04/18(月) 22:28:02.94

な、なんだってー！！(AA略

865 ：デフォルトの名無しさん：2011/04/19(火) 00:28:24.78

朗報っちゃ朗報だが、Legibilityと何が関係あるんだろう…？

866 ：デフォルトの名無しさん：2011/04/19(火) 00:45:05.68

デフォルトのoptimizeSpeedは速度優先
optimizeLegibilityは正確さ優先だから
速度を稼ぐために結合文字の処理を真面目にやってないってことかな。
しかしTwitterを「text-rendering: optimizeLegibility」で検索すると
落ちるだの表示がグチャグチャになるだの旧字体になるだのさんざんな評判だな。
デフォルト設定じゃないからまともにテストされてないんだろうか。

867 ：デフォルトの名無しさん：2011/04/21(木) 17:42:45.18

>>858
安岡センセイIRGN1757に反対

868 ：デフォルトの名無しさん：2011/04/21(木) 18:23:38.47

漢字を知らない馬鹿と漢字しか知らない馬鹿

869 ：デフォルトの名無しさん：2011/04/21(木) 18:36:06.77

1757は連名なのになんでJenkinsだけ名指しなんだろう。

870 ：デフォルトの名無しさん：2011/04/21(木) 19:44:21.65

>>867
ふつう反対するよ
安岡センセイに触発されて調べてみたら少なくとも6文字が
Extension Cに収録済み(しかもUnihan DatabaseでkSimplifiedVariantも定義済み)
なんだがいったい何をどうしたらこんな大雑把な提案が作れるんだ…。

871 ：デフォルトの名無しさん：2011/04/21(木) 19:49:41.80

特定のグリフがどこそこに収録済って言い方はおかしい
例示グリフに例示以上の意味はないから

872 ：デフォルトの名無しさん：2011/04/21(木) 19:55:29.75

じゃあExtension Cに6文字もUROと重複があるとでも言えばいいの?
そんな言葉遊びがしたいわけじゃないんだが

873 ：デフォルトの名無しさん：2011/04/21(木) 19:59:13.20

重複じゃないんだったらIVSでは表せない(Annex S的にUnifyできない)
ものを無理に表そうとしているわけで、どっちにしても提案は破綻してる

874 ：デフォルトの名無しさん：2011/04/21(木) 20:12:14.81

Unicodeが符号化しているのは抽象化された文字で、
IVSが指しているのは具体的な文字図形。
言葉遊び以前にレイヤーが違う。

875 ：デフォルトの名無しさん：2011/04/21(木) 22:13:27.22

漢字しか知らない馬鹿の方が信頼できる

876 ：デフォルトの名無しさん：2011/04/22(金) 11:45:49.42

>>871
IRGN1757よく読め。これが収録しようとしているのはグリフじゃない。

877 ：デフォルトの名無しさん：2011/04/22(金) 22:44:22.96

うむ

878 ：デフォルトの名無しさん：2011/04/23(土) 10:49:37.19

むう

879 ：デフォルトの名無しさん：2011/04/24(日) 00:24:05.47

ややこいなあ

880 ：デフォルトの名無しさん：2011/04/26(火) 22:36:41.14

しかし、縦に書かない日本語はな・・・

881 ：デフォルトの名無しさん：2011/04/27(水) 03:56:06.49

IRGってOracle Boneまで手がけるのか・・

882 ：デフォルトの名無しさん：2011/04/29(金) 22:41:28.56

改元したら、何日ぐらいでPCで使えるようになるのかな？

883 ：デフォルトの名無しさん：2011/04/30(土) 08:55:06.62

もうその手の互換文字は追加されないと思うよ

884 ：デフォルトの名無しさん：2011/04/30(土) 10:56:49.29

根拠は？

885 ：デフォルトの名無しさん：2011/04/30(土) 15:38:28.71

「㍻」を「偏が平、旁が成の国字」だと主張するんだ

886 ：デフォルトの名無しさん：2011/04/30(土) 16:25:03.15

実際に「偏旁」の一文字が存在する元号になるとややこしいな。

887 ：デフォルトの名無しさん：2011/04/30(土) 16:51:29.84

火暴とかか

火暴元年んー

888 ：デフォルトの名無しさん：2011/04/30(土) 16:55:22.92

寧ろ「日暴」で。「

889 ：デフォルトの名無しさん：2011/04/30(土) 17:06:29.12

縦書きフォントだと、
冠
旁
になるわけ?

890 ：デフォルトの名無しさん：2011/04/30(土) 17:07:02.97

广の中にマが入って麻の略字、ってやつを追加してほしい

891 ：デフォルトの名無しさん：2011/04/30(土) 17:28:53.03

>>889
大正はそっちのほうが収まりがいいな

　　　　　　　 ■　 ■
　　　　　　　 ■
　　　　 ■■■■■■
■■■■■　　 ■
　　 ■　 ■　　 ■
　　 ■■■　　　 ■　 ■
■　 ■　 ■■■　 ■　 ■
　　 ■■■　 ■　 ■　 ■
■■■　 ■　 ■　 ■■
　　 ■　 ■　 ■　 ■
　　 ■　 ■■　 ■　 ■■

　　　　　 ■
　　　　　 ■　　　　　
■■■■■■■■■■■
　　　　 ■　 ■
　　 ■■　　　 ■■
■■　　　　　　　 ■■
　　　 ■■■■■
　　　　　 ■
　　 ■　　 ■■■■
　　 ■　　 ■
■■■■■■■■■■■

892 ：デフォルトの名無しさん：2011/04/30(土) 22:34:39.13

>>890
それは魔の略字だろ。
それを言い始めたら、广にKOを入れた字も入れろと言い出す奴も出てくるから嫌。

893 ：デフォルトの名無しさん：2011/05/01(日) 01:12:01.02

ラテンとCJK夢のコラボ

894 ：デフォルトの名無しさん：2011/05/06(金) 10:32:15.85

「日へんに玉」ってCJKに入ったの？

895 ：デフォルトの名無しさん：2011/05/06(金) 17:32:55.42

>>894
http://glyphwiki.org/wiki/u2b782

896 ：デフォルトの名無しさん：2011/05/06(金) 20:19:52.13

旧TRON文字収録センターの画像が消されてトップページも移転通知になった
検索CGIはまだ残ってるみたいだけど

897 ：デフォルトの名無しさん：2011/05/07(土) 00:29:26.10

10646 2nd ed.の無償版来た！

898 ：デフォルトの名無しさん：2011/05/07(土) 12:47:45.79

2003以前は削除されたか

899 ：デフォルトの名無しさん：2011/05/07(土) 22:59:23.07

(´д｀)ｴｰ

900 ：デフォルトの名無しさん：2011/05/08(日) 19:11:08.55

まあ規格ってのは最新版のみが有効なもので、どっかの国の漢字コード規格みたいに
全バージョン参照する必要があるほうが本来おかしいから。

901 ：デフォルトの名無しさん：2011/05/13(金) 15:47:34.56

歴史的経緯を知らないと文字コードは理解できない
って安岡センセイが言ってたよ

902 ：デフォルトの名無しさん：2011/05/13(金) 23:40:43.71

今日まで異字体と戦ってきたみんなを、
希望を信じたプログラマを、
私は泣かせたくない。
最後まで笑顔でいてほしい。
それを邪魔する規格なんて、
壊してみせる、変えてみせる、
これが私の願い。

903 ：デフォルトの名無しさん：2011/05/14(土) 08:50:27.13

安岡センセイはJISの歴史に詳しい。
安岡センセイとって都合の悪いUnicodeについてはかなりレベルが低い。
認識の誤りを指摘されてもたださずに同じことを言い続ける老害レベル

904 ：デフォルトの名無しさん：2011/05/14(土) 09:41:09.59

安岡センセはその昔 sci.lang. とかで漢字のAA貼って奮闘していたからなあ

905 ：デフォルトの名無しさん：2011/05/14(土) 09:43:20.84

包摂絶対正義主義の基地外が湧いてます？

906 ：デフォルトの名無しさん：2011/05/14(土) 10:13:11.93

Unicodeに関してはちょくちょく「？」なことを言うなとは思っていた。
とりあえず他国の代表をブログで馬鹿呼ばわりするのはやめと毛。

907 ：デフォルトの名無しさん：2011/05/14(土) 16:27:00.07

>>901
「理解」がどういうものかにもよるでしょ。
仕様を議論したいなら歴史的経緯は必要だろうけど、
規格に合わせた実装を作りたいだけなら必要ない。

908 ：デフォルトの名無しさん：2011/05/14(土) 23:23:07.65

仕様書だけ見て実装できないなんて規格として欠陥品
欠陥品であることを逆ギレして自慢するとかもうね

909 ：デフォルトの名無しさん：2011/05/15(日) 00:00:22.36

>>907
文字コードは異なる文字コードとの変換が重要だから、歴史じゃなくて
いろんな文字コードの体系だった知識とか製品固有の知識が必要になると思う。

Windows-31Jの仕様とJIS X 0208の仕様だけみてもJIS変換プログラムは作れないし、
Oracle DB(JA16SJIS)を使用しているJavaプログラムで「～」が化けるので何とか
してくれと言われても仕様書だけじゃ足りないし、文字コードにShift_JISを指定すると
JavaでHTMLが文字化けするのに対応できない人は多い。
先日はHP-UXでiconvにsjis指定すると文字化けするので何とかしてくれと言われたので
cp932を指定させたらすぐ直った

910 ：デフォルトの名無しさん：2011/05/15(日) 00:50:57.63

それ歴史じゃないじゃんw

911 ：デフォルトの名無しさん：2011/05/15(日) 09:15:30.55

>>910
そうだな、>>909が言ってるのは歴史じゃないな
……で、それがどうしたんだ？

912 ：デフォルトの名無しさん：2011/05/15(日) 09:44:33.65

>>910は文盲

913 ：デフォルトの名無しさん：2011/05/16(月) 07:29:30.22

>>906
IRGN1757は馬鹿だと俺も思った

914 ：デフォルトの名無しさん：2011/05/16(月) 22:48:13.75

うむ

915 ：デフォルトの名無しさん：2011/05/16(月) 23:15:41.46

完璧にそれまでのUnicodeの分離方針と矛盾してるし
あれは馬鹿と言われても仕方ないレベル

916 ：デフォルトの名無しさん：2011/05/17(火) 00:15:47.85

しかもPRCに話がとおってないらしい

917 ：デフォルトの名無しさん：2011/05/17(火) 02:00:46.95

IVDはコンソーシアムの管轄下にあるから
USが本気なら誰が反対しても登録されるだろう。
問題は背後にどんなシナリオがあるかで。

918 ：デフォルトの名無しさん：2011/05/17(火) 11:17:14.99

安岡センセイがJenkins名指ししてるのも
そのあたりなんだろうな

919 ：デフォルトの名無しさん：2011/05/17(火) 12:13:29.04

てか狙いがわからない

920 ：デフォルトの名無しさん：2011/05/17(火) 22:06:30.69

安岡センセイRegional Indicator Symbol Letterを奇数個とかワケわからん
認識の誤りを指摘されてもたださずに同じことを言い続ける老害レベル

921 ：デフォルトの名無しさん：2011/05/18(水) 00:47:47.67

花園明朝UCS漢字完全対応キタコレ

922 ：デフォルトの名無しさん：2011/05/18(水) 01:21:10.04

あれは曲線がなあ。直線で擬似的に作っているから引き延ばすと悲惨。

923 ：デフォルトの名無しさん：2011/05/18(水) 01:42:02.39

まあ漢字のLast Resort Fontだから品質は仕方ない
IPAmj明朝が公開されていればなあ…

924 ：デフォルトの名無しさん：2011/05/18(水) 02:11:22.58

KAGE形式のデータから直線の代わりにベジェ曲線か何かで
アウトラインを生成するアルゴリズムが次の研究課題だな

925 ：デフォルトの名無しさん：2011/05/18(水) 09:32:15.43

>>923
IPAmj明朝はCJK拡張C・Dはサポートしてないし
拡張Bも27000字くらいなのでUCS漢字完全対応には遠い

926 ：デフォルトの名無しさん：2011/05/18(水) 13:50:21.73

文書いっぱいヘルシンキのagendaもいっぱい

927 ：デフォルトの名無しさん：2011/05/18(水) 14:47:42.88

WG2 N3987どうなるの？

928 ：デフォルトの名無しさん：2011/05/18(水) 22:07:19.98

IPAmj明朝公開キター
ttp://www.ipa.go.jp/about/press/20110518.html

929 ：デフォルトの名無しさん：2011/05/18(水) 22:49:49.39

Tフォントも2月に公開されたし
今年は多漢字フォントの当たり年だな

930 ：デフォルトの名無しさん：2011/05/18(水) 23:42:25.78

> 文字情報一覧　文字情報一覧表 ver.000.01 (検証版)
zipでくれ

931 ：デフォルトの名無しさん：2011/05/19(木) 01:06:01.41

これってきっとInDesignみたいにグリフを直接呼び出せるアプリじゃないと
フルには使えないよね。

932 ：デフォルトの名無しさん：2011/05/19(木) 07:53:31.59

未符号化文字はPUAに入っているわけではなくて本当に何の符号も与えられていないから
グリフID指定で直接呼び出せるアプリでないと使えないのね。

933 ：デフォルトの名無しさん：2011/05/19(木) 07:59:15.36

安岡センセイ涙目ｗ

934 ：デフォルトの名無しさん：2011/05/19(木) 17:38:04.19

Macの文字ビューアでも使えるらしい

935 ：デフォルトの名無しさん：2011/05/21(土) 05:59:57.04

DLしてみたものの使いどころがない…

936 ：デフォルトの名無しさん：2011/05/21(土) 13:29:22.86

それでもDLしちゃうのよね

937 ：デフォルトの名無しさん：2011/05/21(土) 13:35:02.65

>>934
ヒラギノのCIDしか付いていないグリフを利用するための仕組みの流用だな

938 ：デフォルトの名無しさん：2011/05/21(土) 13:40:47.70

DLしてニヤニヤながめてればおｋ

939 ：デフォルトの名無しさん：2011/05/21(土) 21:27:39.34

WindowsではSIL ViewGlyphで見ることだけはできるが
他のアプリに貼り付けられないのでほとんど意味がない

940 ：デフォルトの名無しさん：2011/05/22(日) 02:45:12.27

Macだと貼り付けも出来るの？

SILってこんなのも作ってたのか。
IPAフォントのイメージしかなかった。

941 ：デフォルトの名無しさん：2011/05/22(日) 11:12:04.77

>>940
Glyph Access Protocolに対応しているアプリ(標準のTextEditとか)には
貼り付けできるはず

942 ：デフォルトの名無しさん：2011/05/22(日) 11:35:09.88

情報処理推進機構と国際音声記号の頭文字がかぶっているのを何とかしてほしい

943 ：デフォルトの名無しさん：2011/05/22(日) 12:37:50.82

同感
前者が改めるべきだな

944 ：デフォルトの名無しさん：2011/05/22(日) 12:53:58.56

連坊に頼めば？

945 ：デフォルトの名無しさん：2011/05/22(日) 15:19:27.95

>>942
http://ossipedia.ipa.go.jp/ipafont/faq.html#q007-1

946 ：デフォルトの名無しさん：2011/05/22(日) 15:45:31.65

>文字セット名を表す場合は少ないことが一般的

固有名詞としてはそうかもしれんけど、普通名詞として
IPA fontって言い方がされることはあるだろうに。

実際IPA(本物)の方も使っている呼び方だし。
ttp://www.langsci.ucl.ac.uk/ipa/ipafonts.html

947 ：デフォルトの名無しさん：2011/05/22(日) 19:26:36.15

IPA明朝とあるのを見て、ああ音声記号も収録した日本語フォントなのね、そんなのは別にいいや
とか長いこと思ってた人間が実際にいる。自分とか
というか組織名だと知らなきゃそうとしか解釈できなかった

948 ：デフォルトの名無しさん：2011/05/22(日) 20:34:51.20

モリサワ明朝とかAdobeゴシックとか命名するようなもんか

949 ：デフォルトの名無しさん：2011/05/23(月) 10:23:32.21

まあMS明朝とかMSゴシックと命名されたフォントもあるし

950 ：デフォルトの名無しさん：2011/05/23(月) 14:18:22.63

反省して、メイリオでは何もつけませんでした。

951 ：デフォルトの名無しさん：2011/05/23(月) 17:16:23.70

マイクロソフトの社名入りフォント名は
MS なんとか　ってのと　Microsoft なんとか　ってのがあって
これはこれでなんか不統一感

952 ：デフォルトの名無しさん：2011/05/23(月) 18:19:52.21

MS Sans Serifはラスタフォント(ビットマップフォント)で、
Microsoft Sans Serifはそれとは異なるTrueTypeフォントだとかもうワケワカメ

953 ：デフォルトの名無しさん：2011/05/24(火) 21:31:39.33

>>951
MSとＭＳってのもある。

MSゴシック系はたった3つでこの有様。

ＭＳゴシック
MS Gothic

ＭＳＰゴシック
MS PGothic

MS UI Gothic
MS UI Gothic

「ＭＳゴシック」と「ＭＳＰゴシック」の場合、
「ＭＳ」「Ｐ」は全角で、その間に挟まるスペースは半角。

ラテン表記の書体名では「MS」と「P」の間にスペースが挟まり、
「P」と「Gothic」は続けて書く。

一方、「MS UI Gothic」にはカナ表記の書体名が存在しないので
上2つのような「ＭＳＵＩゴシック」は通らない。
ラテン表記では「UI」と「Gothic」はなぜか離れててPGothicと不統一。

954 ：デフォルトの名無しさん：2011/05/24(火) 21:54:33.27

花園明朝のvmtxテーブルひどいことになってるなぁ

955 ：デフォルトの名無しさん：2011/05/25(水) 00:02:32.42

縦に書くと文字が全部重なるって奴か

956 ：デフォルトの名無しさん：2011/05/25(水) 00:04:40.15

UKもIRGN1757に反対
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n4075.pdf

Ken LundeがUTS #37の次の版の話をしているようだが、
まさかIRGN1757を後付けで正当化するつもりじゃなかろうな。

957 ：デフォルトの名無しさん：2011/05/25(水) 01:09:03.69

うーむ、まだ実用には程遠いか

958 ：デフォルトの名無しさん：2011/05/25(水) 02:09:53.25

縦書き時の文字の高さが15になってる
そりゃ重なるわ

959 ：デフォルトの名無しさん：2011/05/25(水) 14:40:31.80

USはなんでNo action is requiredな文書をこのタイミングでポストしたんだろう。

960 ：デフォルトの名無しさん：2011/05/25(水) 20:59:40.82

御意見無用？

961 ：デフォルトの名無しさん：2011/05/26(木) 08:59:55.65

ご意見無用
でも読め！
真意やいかに

962 ：デフォルトの名無しさん：2011/05/26(木) 12:27:14.78

言ってみただけ～♪

963 ：デフォルトの名無しさん：2011/05/26(木) 13:50:20.72

>>744
安岡センセイから返事きた
http://slashdot.jp/%7Eyasuoka/journal/531917

964 ：デフォルトの名無しさん：2011/05/26(木) 15:05:22.53

IVSだけじゃなくligatureにも言える問題だよなぁ
英語力ある人はCSS3 Fontsのエディターと掛け合ってみてほし

965 ：デフォルトの名無しさん：2011/05/26(木) 17:27:46.89

そもそもfont-familyってフォールバックさせるためのものじゃないんじゃないの？

966 ：デフォルトの名無しさん：2011/05/26(木) 18:11:59.42

じゃ何のため？

967 ：956：2011/05/27(金) 08:07:58.16

スンマセン勘違いしてました…

968 ：デフォルトの名無しさん：2011/05/27(金) 08:09:45.31

あ、956じゃなくて965だった…

969 ：デフォルトの名無しさん：2011/05/27(金) 18:14:40.91

>>963
W3Cメーリングリストに飛び火
ttp://lists.w3.org/Archives/Public/public-html-ig-jp/2011May/0018.html

970 ：デフォルトの名無しさん：2011/05/27(金) 20:19:34.93

グリフ探索を2周以上するってのは難しいと思うなあ。
1文字ずつやるわけだし速度的に相当なコストになりそう。

971 ：デフォルトの名無しさん：2011/05/27(金) 23:33:09.81

UTS37の新editorsの面子がおもしろひ

972 ：デフォルトの名無しさん：2011/05/28(土) 00:50:41.64

現実的にやるのが難しくても、
「正しくはこっちだからね?」と決めておくのは大事じゃないかな。

973 ：デフォルトの名無しさん：2011/05/28(土) 01:30:58.68

最近のCSS3 FontsはほとんどFirefox仕様の引き写しになっているから、
Mozillaの中の人を説得するしか。

974 ：デフォルトの名無しさん：2011/05/28(土) 02:03:52.06

>>970
現状～近未来において、IVSを使った文字が大量に連続するのって
それこそ漢字一覧表ぐらいのものじゃないか？

5年も10年も後ならまたリソースの状況が違ってくるだろうし

975 ：デフォルトの名無しさん：2011/05/28(土) 02:23:57.80

人名の漢字一つだけ違うフォントで表示されたら
たとえ正しい異体字が出てても違和感があるんじゃないかな

976 ：デフォルトの名無しさん：2011/05/28(土) 06:05:34.82

違和感あるなしの問題じゃないだろうｊｋ

977 ：デフォルトの名無しさん：2011/05/28(土) 08:49:19.58

　　　　　　　　まもなくここは　乂1000取り合戦場乂　となります。

　　　＼∧＿ﾍ　　　　　／￣￣￣￣￣￣￣￣￣￣￣￣
　,,､,､,,,　/ ＼〇ノゝ∩ ＜　1000取り合戦、いくぞｺﾞﾙｧ！！　　　　　　　,,､,､,,,
　　　　/三√ ﾟДﾟ)　/　　＼＿＿＿＿＿＿＿＿＿＿＿＿　　,,､,､,,,
　　　　/三/| ﾟＵﾟ|＼　　　　　　,,､,､,,,　　　　　　　　　　　　　　　　　　　　　　　,,､,､,,,
　,,､,､,,,　Ｕ（:::::::::::）　　,,､,､,,,　　　　　　　　　＼オーーーーーーーッ！！／
　　　　//三/|三|＼　　　　　∧＿∧∧＿∧ ∧＿∧∧＿∧∧＿∧∧＿∧
　　　　　　∪　 ∪　　　　　　（　　　　）　　　（　　　　）　　　（　　　　）　　　）
　,,､,､,,,　　　　　　　,,､,､,,,　　∧＿∧∧＿∧∧＿∧ ∧＿∧∧＿∧∧＿∧∧＿∧
　　　　　　,,､,､,,,　　　　　　（　　　　）　　　（　　　　）　　　（　　　　）　　　（　　　　）

978 ：デフォルトの名無しさん：2011/05/28(土) 10:43:48.10

IVSが65535個を超えたら、どうしてOption 1は破綻するの？

979 ：デフォルトの名無しさん：2011/05/28(土) 17:31:03.36

1ファイルに収録できなくなるからじゃない?
互いに重複したbase characterを収録していない複数のファイルに分ければ
いいだけだと思うけど。
個人的にはOption 2を支持したいけど
あんな文字鏡関係者並みの下手くそな言い訳は説得力なくなるからやめてほしいもんだ
http://www.pcc.or.jp/hyojun/1-3hitsuyousei.htm
> しかし、フォント仕様（OpenType等）の制限により240のバリエーションは使用できず、
> 実質的には1～２桁少なくなる。（フォントが一つの面につき65ｋ字までしか表現できない
> ので、仮にBMPの27,000字の漢字がIVSCを使うとすると65,000÷27,000≒2.4字となる）。

980 ：デフォルトの名無しさん：2011/05/28(土) 22:42:18.82

"一つの面につき"は不要

981 ：デフォルトの名無しさん：2011/05/29(日) 00:11:36.79

>>980
まさにそこが馬鹿なところ

982 ：デフォルトの名無しさん：2011/05/29(日) 00:13:13.60

980超えたので次スレ立てた

文字コード総合スレ part7
http://hibari.2ch.net/test/read.cgi/tech/1306595564/

983 ：デフォルトの名無しさん：2011/05/29(日) 09:23:11.12

>982
乙

誘導パピコ

文字コード総合スレ part7
http://hibari.2ch.net/test/read.cgi/tech/1306595564/

984 ：デフォルトの名無しさん：2011/05/30(月) 03:08:32.07

まとめを誰か