Unicode 309Fってなに? 「ち」と「ろ」の中間みたいな文字
3 :
名無し象は鼻がウナギだ! :02/12/27 08:24
解説してくれ
5 :
名無し象は鼻がウナギだ! :02/12/27 21:04
6 :
名無し象は鼻がウナギだ! :02/12/27 22:24
表記がW系で、発音がV系ということは、 ドイツ語っぽい感じがするが。
>>5 上田敏訳のヴェルレーヌの名詩を知らんか?
秋の日の ヴィオロンの ためいきの……
ヴィは本当は「ヰ゛」で表記だ。
他にもワ行の濁音は戦前の文書で時々見かける。
>>5 ヸオロン、ヹルレエヌなどという表記は明治の文学なんかに
たまに出てきますよ。
コトの合字は、戦前の一般の書籍にもよく出てきます。
「よくわからん」のは読書不足のせいではないですか?
>>8 戦前の書物は読まないからなぁ。。
ご教授ありがとうございます。
10 :
名無し象は鼻がウナギだ! :02/12/28 00:43
JIS X 0213:2000の用例にあるよね
>>7-8
芝野耕司『増補改訂 JIS漢字字典』があればこのスレッド要らないんでないかい?
(^^)
>>12 質問は0131でなく、0132(IJ)と0133(ij)についてだと思われるが、0133の説明
にDutchとあるのがヒントとなる。
試しに「オランダ語 ij」で検索すれば参考となる頁が見つかる。オランダ語はよく
知らないので不正確な引用になるかもしれないが、要するにオランダ語ではijは一字
扱いであり、yと交替する場合もあるようだ(ijをyに近くデザインする例あり)。
なお、大文字があるのはIJで始まる固有名詞などに使うらしい。
たまーにVan Dijck(Dyck)をヴァン・ディジックとか読んでいる人がいまつね
16 :
名無し象は鼻がウナギだ! :03/01/20 19:20
ij の綴りはオランダ語の特徴の一つでしゅ。 ちなみに、 発音は ai と ei の中間くらいになりましゅ。 筆記体で書くときには、y の筆記体の上に点々を書くのが通でしゅ。
17 :
名無し象は鼻がウナギだ! :03/01/21 21:59
これから 「ヴァカ」を「ワ゛カ」 「ヴォケ」を「ヲ゛ケ」 と書くのはどうよ?
¶ Unicodeではないのだが、普通の記号一覧にも載ってるこの文字ってなんですか?
20 :
名無し象は鼻がウナギだ! :03/01/22 20:47
>>19 パラグラフ。JIS漢字字典には「段落記号」とある。
U+0061 U+0067 U+0065
(^^)
\ が Latin-1 Supplement に含まれてるのも不思議だ。
(^^)
∧_∧ ( ^^ )< ぬるぽ(^^)
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
∧_∧ ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。 =〔~∪ ̄ ̄〕 = ◎――◎ 山崎渉
期待あげ
__∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉 ~ ̄ ̄ ̄ ̄
31 :
名無し象は鼻がウナギだ! :03/10/13 01:00
浮上
32 :
名無し象は鼻がウナギだ! :03/10/23 17:01
33 :
漏れも教えて君 :03/10/24 17:20
34 :
漏れも教えて君 :03/10/25 14:01
だれか「イ」の逆さの読み方教えてくろ
yi
36 :
名無し象は鼻がウナギだ! :03/10/26 20:56
37 :
漏れも教えて君 :03/10/27 21:44
38 :
名無し象は鼻がウナギだ! :03/10/28 00:18
>>32 こういう字って将来Unicodeに収録されるかな?
Extension Cの日本ソースは文字鏡から提案されてるらしい
41 :
名無し象は鼻がウナギだ! :03/10/29 10:19
漢字の領域は将来3面迄拡張される可能性があるらしい。 って事はExtension Cは3面に入るのかな? Extension Cの文字数がExtension Bと同じかそれ以上なら2面の空き領域には入り切らんし。
42 :
名無し象は鼻がウナギだ! :03/10/29 13:00
誤字の羅列にしか見えねー 漢字のカンブリア大爆発か
そのための用例主義・典拠主義か>X0213
47 :
名無し象は鼻がウナギだ! :03/10/30 20:49
CJK Extension B対応のフォントってSURSONG.TTFだけ?
>>47 MingLiU-HKSCSにも入ってることは入ってる
HKSCSで定義されてる漢字だけだが
あとヒラギノProにもJIS X 0213の字だけは入ってる
>>48 レスさんくす。MingLiU-HKSCS持ってるけど入ってたっけ?
BabelMapでざーっと見たけどなかったような気がする。
気になって調べてみたらDFSongStdにもポコポコ入ってた。
>>50 >念のため言っとくが普通のMingLiUとは違うぞ
るせーんな勘違いするかー
…と思ったのだが入ってたMingLiU-HKSCSのバージョンが古かった_| ̄|○
新しいの入れなおしたらちゃんと表示されたよ ありがd
>>48 ヒラギノProにはJIS X 0213の他にU+20BB7の土吉が入ってました。
他にもあるかも知れませんが。
てすと 𠮷
54 :
名無し象は鼻がウナギだ! :03/11/21 19:41
55 :
名無し象は鼻がウナギだ! :03/11/21 20:00
平行記号(//)って どうやって出すの?
失敬 スレ違い
SimSun (Founder Extended)ってBMPの漢字も入ってるの? ところでGTコード→大漢和番号の変換表ってどこかに転がってませんか。 新撰漢字総覧買わないと駄目?
58 :
名無し象は鼻がウナギだ! :03/11/24 22:44
>>57 普通のフォント並に入ってる。
Ver1.00とVer1.10の差異を確認したところ、CJK Ext Bの一部が削除?
されてた。他にもあちこち変わってる…
1つのフォントには合計65,535文字までしか入れられないから BMPに何か足したら削らざるを得ないと思われ 唯一の方法はPlane2専用フォントにすることだが
60 :
名無し象は鼻がウナギだ! :03/11/25 00:35
>>59 なんとなく思ってたけどやっぱりそうだったのか>65535文字
>>47-52 ヒラギノ明朝 Pro W3 (306 characters)
ヒラギノ丸ゴ Pro W4 (306 characters)
ヒラギノ角ゴ Pro W3 (306 characters)
DFSongStd (1,640 characters)
Simsun (Founder Extended) (36,862 characters)
MingLiU_HKSCS (1,640 characters)
おまけ
CJK Extension A(6582文字)完全対応のフォント:
DFSongStd
New Gulim
SimSun-18030
Simsun (Founder Extended)
ZYSong18030
>>61 それのBig5⇒Unicode版があると個人的に嬉しい…
63 :
名無し象は鼻がウナギだ! :03/11/25 02:23
BabelMapでVer1.00とVer1.10の比較をしてみた。収録文字数は両方とも65,530文字。 ↓の数字が増減数。 +00:Basic Latin (95 out of 128 characters) +00:Latin-1 Supplement (96 out of 128 characters) +05:Latin Extended-A (20 out of 128 characters) +03:Latin Extended-B (12 out of 183 characters) +07:IPA Extensions (9 out of 96 characters) +00:Spacing Modifier Letters (7 out of 80 characters) +00:Greek and Coptic (48 out of 120 characters) +00:Cyrillic (66 out of 246 characters) +04:Latin Extended Additional (4 out of 246 characters) +00:General Punctuation (23 out of 97 characters) +00:Currency Symbols (1 out of 18 characters) +00:Letterlike Symbols (6 out of 75 characters) +00:Number Forms (22 out of 49 characters) +03:Arrows (11 out of 112 characters) +00:Mathematical Operators (37 out of 256 characters) +00:Miscellaneous Technical (1 out of 209 characters) +00:Enclosed Alphanumerics (50 out of 160 characters) +00:Box Drawing (112 out of 128 characters)
64 :
名無し象は鼻がウナギだ! :03/11/25 02:25
+00:Block Elements (18 out of 32 characters) +00:Geometric Shapes (15 out of 96 characters) +00:Miscellaneous Symbols (5 out of 145 characters) +01:Dingbats (1 out of 174 characters) +35:CJK Radicals Supplement (35 out of 115 characters) +02:Kangxi Radicals (2 out of 214 characters) +12:Ideographic Description Characters (12 out of 12 characters) +01:CJK Symbols and Punctuation (35 out of 64 characters) +00:Hiragana (87 out of 93 characters) +00:Katakana (89 out of 96 characters) +00:Bopomofo (37 out of 40 characters) +00:Enclosed CJK Letters and Months (12 out of 241 characters) +00:CJK Compatibility (11 out of 256 characters) +00:CJK Unified Ideographs Extension A (6,582 out of 6,582 characters) +00:CJK Unified Ideographs (20,902 out of 20,902 characters) +15:Private Use Area (120 out of 6,400 characters) +01:CJK Compatibility Ideographs (22 out of 361 characters) +00:CJK Compatibility Forms (27 out of 32 characters) +00:Small Form Variants (25 out of 26 characters) +01:Halfwidth and Fullwidth Forms (101 out of 225 characters) -90:CJK Unified Ideographs Extension B (36,772 out of 42,711 characters) 単純な増減じゃないけど、一応。
そろそろTrueTypeフォントの仕様の拡張が必要だな。 65536字以上収録出来るように。 OSの拡張も必要だろうが。
66 :
名無し象は鼻がウナギだ! :03/11/25 21:42
>>65 格納文字数が増えればファイルサイズも増える…
1ファイル40MBでもきついのにこれ以上増えると困るぞw
記憶媒体の低価格・大容量化も目覚しいから問題ない。
Unicodeなんてダメだというのは15年ぐらい前から言われていたことで……
しかしまともな代替がないわけで…
15年前ってまだUnicodeなかったような…
72 :
名無し象は鼻がウナギだ! :03/11/26 18:15
UCSでCNSの繁体字と統合された日本漢字の字形が CNS3面以降に収録されている ↓ Ext.BでCNSの3面以降が追加された ↓ もちろん今さらJIS-UCSのマッピングを変更できない もうアホかと。
78 :
名無し象は鼻がウナギだ! :03/11/28 21:49
Windowsのフォントスレッド Ver.8
http://pc2.2ch.net/test/read.cgi/win/1068558586/ 220 名前:名無し~3.EXE 投稿日:03/11/27 15:00 ID:NkcRnAN1
収録文字数ランキングTop10
1 Simsun (Founder Extended) (65,530字)
2 New Gulim (46,567字)
3 Arial Unicode MS (38,917字)
4 DFSongStd (37,101字)
5 Ming(for ISO10646) (35,756字)
6 SimSun-18030 (30,464字)
7 ZYSong18030 (30,459字)
8 Code2000 (29,608字)
9 STFangsong (24,367字)
9 STKaiti (同上)
9 STSong (同上)
9 STXihei (同上)
9 STZhongsong (同上)
ランキングに食い込みそうなフォントの情報きぼんぬ
そういや「器」(U+5668)という字と同じ字形の字がU+20F96にある これってもしかして点付きの「器」と点無しの「器」を区別するようになったって事? U+5668の「器」は中国や韓国では点付きだし。
>>79 77の具体例のひとつだね。
さらに点付きの「器」がJIS X 0213互換漢字としてU+FA38にあるという始末。
もうわけがわかりません。
最初から点付きと点無しを分けて収録してれば何の矛盾も起きなかっただろうに
HYPHENとMINUSが別々に追加されて U+002DがHYPHEN MINUSになったのと似たようなものだと考えればいいのか? U+5668→点付きと点無しを包摂 U+FA38→点付き U+20F96→点無し ただしU+FA38は互換漢字だからNormalizeでU+5668に変わる。 したがってUCSでは点無しを確実に表現することはできるが 点付きを確実に表現することはできない。 なんじゃそりゃ。
龜(U+9F9C)と龜(U+F907)と龜(U+F908)の区別が付きません
>>82 付くわけありません。それらはKS X 1001では「まったく同じ字形」で
発音によって区別して収録しているのですから。
ラウンドトリップコンバージョンを保証するためにUCSでも重複して
収録されたわけです。
しいて言うなら読み上げソフトに読み上げさせるとかハングル変換
すると違いが分かるかも
で、そういう経緯で収録されたものをいくら見かけの字形が 同じだからといってJIS X 0213の康煕別掲で再利用するのは どうかと思うわけだが。
>>83 ありがとう。
あと一部撤回。DFSongStdだと区別が付いた。
JIS X0213の「逸」の旧字体がU+FA68に追加されたが 何故既にあったU+FA25に対応させなかったのだろうか?
>>86 U+FA25は一点しんにょうで
U+FA68は二点しんにょうだから
U+FA68は康煕別掲で通常の包摂規準が一切適用されないから
区別する必要がある
> U+FA68は康煕別掲で 「U+FA68に対応するJIS X 0213の文字は〜」 と言ったほうが適切か
やはり互換漢字には包摂が適用されないのか。 しかし何故IBMの拡張漢字には二点之繞でなく一点之繞に免に点 という中途半端な「逸」の異体字が有るのか不思議に思う。
包摂するならそもそも統合漢字のコードポイントで表せという話になるからね
あぼーん
めでたいので物凄い勢いで浮上してみる
>>93 漢鼎の繁体フォントはエンコーディングがGB12345なので
現時点では未対応です。GB2312かどうか判別できませんし
>>95 すみません、「漢鼎」ではなく「漢儀」です…
MicrosoftのOpenType Font Shell Extensionでは
Font Encoding Type: Big5 (Taiwan) と出たのですが違うのでしょうか?
>>96 93のURLにあるフォントには(簡体字で)漢鼎繁特楷というフォント名が
入っていますが…
「漢儀」なら「handing」ではなく「hangyi」になるはずですし。
何を根拠に「漢儀」と判断されたのでしょうか?
> Font Encoding Type: Big5 (Taiwan) と出たのですが違うのでしょうか?
OpenType Font Shell ExtensionはバグっててGB2312とBig5を逆に表示します。
このフォントのエンコーディングはGB2312ですが、実装されている字形は
繁体字(つまりGB12345)です。
>>97 申し訳ありません、こちらの間違いでした>漢鼎
手元で別にリストを作っていたのを混同したようです…
>OpenType Font Shell ExtensionはバグっててGB2312とBig5を逆に表示します。
Σ(´Д`ズガーン …このフォントの為にWin版を待ち望んでいたのに…
99 :
名無し象は鼻がウナギだ! :04/02/26 01:29
100 :
名無し象は鼻がウナギだ! :04/02/26 09:45
100文字目
101 :
名無し象は鼻がウナギだ! :04/02/29 23:24
ケータイに使用されてる文字コードがUnicodeに移行される日は来るのかな?
102 :
名無し象は鼻がウナギだ! :04/02/29 23:26
来そうな気がする
すでに一部の端末はUTF-8を受け付けますね
>>103 文字セットは未だ JIS X 0208 + 外字 な予感・・・
105 :
ヘタレノベラー ◆1c7H7LgsWY :04/03/01 23:03
教えて下さい。みなさん、UnicodeでFA25とか3230とか仰ってますが、どんなフォントだったら表示されるのですか? 当方、0x4e00から0x9fa5以外は全て「・」とか「?」になってしまいます。(一部、数字やハングルは除く) フォントは一番多い(と思われる)MS UIゴシックなんですが…。
106 :
名無し象は鼻がウナギだ! :04/03/02 00:07
ケータイにUnicodeを採用したら独仏のアクセント付きアルファベットや ハングル、草g剛の「g」等が使えるようになって便利になるだろうが 半角文字も全角文字と同じ2バイトになり情報量が増えメール料金も増えるから 一部のユーザからは苦情が来るだろうな。
>>105 なぜMS UI Gothicが一番多いと思った?
>>78 に比べたらMS UI Gothicなんてカス。
SimSun (FounderExtended)はあくまで中国語用のフォントだから 日本ソースしかない[禾+予]が入ってなかったりするけどね New Gulimも1万字くらいはハングルだし
妖精現実か
[禾+予]が入ってないとは書いてたけど 理由までは書いてなかったね つーか英語環境で表示できないから日本語PDFを作るべきでないとか Extension Bの文字はどうあがいてもIEで表示できないとか 大嘘ばかり書いてるからうのみにしてはいけません
龜が、Unicode(U+9F9C)とJIS X0208(83区93点)でけっこう字形が違うのが気になる・・・。 Unicode的には、どんな基準で字形を選んでるんだろう? 他にもそんな例があるんだろうなぁ・・・。
中国本土の字形が基本
更に康煕部首(U+2FD4)も違う字形だし。 と思ったら追加部首(U+2EF1)はU+9F9Cと同じ字形。 おまけに康煕部首と同じ字形が互換漢字に2つ(U+F907, U+F908)ある上に両者の区別がまるでつかない・・・。 JIS X0208のと同じ字形はないし。 もうわけわからん。
>>113 互換漢字の龜は韓国の KS X 1001 用。韓国では漢字を読みのハングル順に並
べたのが、龜はク・クウィ・キュンの三種類の音があったので三種類のコード
がわりふってある。
互換漢字に2つある龜の話は
>>82 -でがいしゅつ
それから当たり前だがISO/IEC 10646-1のU+9F9CのJ欄は
JIS X 0208と同じだ
116 :
名無し象は鼻がウナギだ! :04/03/08 10:26
Arial Unicode MSに入ってる中国大陸/台湾/韓国風の書体って どうやったら使えるんですか? Officeに付いてるのにOfficeから使う手段がないような気がするんですが
118 :
名無し象は鼻がウナギだ! :04/03/09 10:21
>>117 訂正。「書体」は「グリフ」に置き換えて読んでください
>>114 ちなみにBIG5のC074(U+9F9C)は上がクになっているが、
HKSCSでは8BF8(U+F907)を「上がクでなくてノの龜」用に流用している。
MingLiU_HKSCS以外のフォントをえらぶとどっちもおなじになってわけわか。
>>119 JIS X 0213だってKS互換領域を康煕別掲用に流用してるから
どっこいどっこいな気もするなあ
MingLiUはそのためだけに統合漢字のほうの示偏の形を
変えてるけど他の台湾系フォントだと区別付かんぞ
>>98 フォント名が文字化けしていますがようやく変換できるようになりました。
>>95 に書いたとおりGB2312とGB12345の自動判別はできないので、
「-trad」オプションを付けて変換してください。
付けないで変換すると、簡体字の符号位置に繁体字が実装された
フォントになります(それはそれで使いみちがあるかもしれませんが)。
Simsun (Founder Extended) ダウンロードできるところありますか?
フォント名の文字化け対策しました。
124 :
名無し象は鼻がウナギだ! :04/04/19 23:55
Unicode の日本語パートが漢字に限らず、ラテン文字や發音記號などを含めて、 使い勝手がよくなったのは、JIS補助漢字( JIS X 0212 )のおかげなんだよな。 一方、 JIS X 0213 は、Unicode を使いやすくするためにまったく貢獻していない。 せいぜい、アイヌ語で假名の若干增えたぐらいかな?
>>124 > ラテン文字や發音記號など
はX0213にもあるけどすでに含まれていたから改善されたわけではないってこと?
> まったく貢獻していない。
旧字体の追加を忘れてませんか旦那
ほかにも丸付き数字が大幅に増えたとか
陛下のお名前が入ったとか(これは国内実装互換だからUnicodeには前からあったけど)
他にも「こと」「より」「ます」の合字とか くの字点とか
127 :
名無し象は鼻がウナギだ! :04/04/26 21:12
128 :
名無し象は鼻がウナギだ! :04/04/27 01:05
>>125 丸付き文字「@AB」(Unicode數値表現なので Mac でも
見えるはず) が揩ヲたのは無意味にコードポイントを浪費しただけだろう。
それに、最新の丸付き文字を Unicode に申請したのは、
JIS X 0213 ではなく、北朝鮮だよ。
>旧字体の追加を忘れてませんか旦那
常用漢字表の内閣訓示で定義された 356文字を追加しただけでは
不十分じゃないかな?
中學生用の漢字字典でも使われている「黒」「緑」「青」の
舊字體「K」「香v「」が Unicodeで表示できるのは、
IBMや Big5(台灣の五大電氣メーカー)という私企業が
定義していたおかげだよ。
「黄」の舊字體もフォントさえあれば表示できる。
>>128 數値表現>数値表現、中學生>中学生、舊字體>旧字体、台灣>台湾、電氣>電気とか新字体にしとかんとリアル厨房の
皆様が読めませんよ
それから「黑」「綠」「靑」が「黒」「緑」「青」と分離されたのは Big5にあったからというよりCNS11643-1986の第十四字面で 分離されていたからだと思われ 原規格分離がなければUnifyされていたはずの字だから。
132 :
名無し象は鼻がウナギだ! :04/04/27 11:19
JISX0213の1-6-58〜1-6-67の二重丸付き数字1〜10はUnicodeでは 丸付き数字1(U+2460)〜10(U+2469)にU+20DDのCOMBINING ENCLOSING CIRCLE で表せってことにはしなかったんだね。
133 :
名無し象は鼻がウナギだ! :04/04/27 11:36
つーかは青の旧字体ではないわけだが
>>132 重ね打ちできない合成はしない方針だったと思われ
RISING SYMBOLとFALLING SYMBOLを突っ込み損ねて
無駄になったけど
>>133 違うの?
135 :
名無し象は鼻がウナギだ! :04/04/27 16:55
「青」は生と丹を合わせたのが原字なはずだが・・・。
136 :
名無し象は鼻がウナギだ! :04/04/27 18:05
>>123 フォント名の文字化けが残っているようですが何とか使い物になりそうです。
ありがとうございました。
>>136 .ttfをダブルクリックしたときに表示される書体名が化けるのは
仕様です(というかはっきり言ってfontview.exeの仕様がヘン)。
それ以外で文字化けする場合は詳しく教えてください。
138 :
名無し象は鼻がウナギだ! :04/04/28 10:47
139 :
名無し象は鼻がウナギだ! :04/04/28 13:45
>>134 と青は書体の差。明朝体では、楷書では昔から青。
>>139 じゃあ「明朝体活字では靑は青の旧字」なら桶?
旧字じゃなくて別字とか異字レベルだと思われ
常用漢字の字体は活字としてはふつう使われていなかったものだし 常用漢字では従来の字体は認められていないから 旧字と言ってもいいと思うのだけど。
常用漢字で明朝体の字体は定めていないと思うが。
>>138 確かにフォントが悪いのですが対応できそうなので対応しました。
変換成功しました。ありがとうございました。
>>143 確かに唯一の字体を定めているわけではないがデザイン差の範囲は例示してる
例示していないものが認められるのかどうか曖昧なのは問題だが
147 :
名無し象は鼻がウナギだ! :04/05/01 19:59
age
149 :
名無し象は鼻がウナギだ! :04/05/03 16:49
>>146 別に許容字体を網羅しているわけではないので問題なし。
>
>>136 > .ttfをダブルクリックしたときに表示される書体名が化けるのは
> 仕様です(というかはっきり言ってfontview.exeの仕様がヘン)。
Win9xではFONTVIEW.EXEが暴走する上インストールもできないという
かなり致命的な問題が判明したので、結局修正しました。
まだ文字化けが残っているようでしたらお知らせください。
おぉ、文字化け直ったヽ( ´ー`)丿ワーイ
>>149 まあ確かに「問題」ではないな。
「不満」くらいに置き換えて読んでちょ
fontviewって何よ? unicode駄目よりcodepageのがいいな。 コードパレットにして必要なコードページを65536文字以内に手動で 動的にはめ込むようにしればよかったのに。Shiftしるだけですむから それほど扱いにくくないだろ?。 …とかなんとか無理やり議論に参加してみるテスツ。 そんなことよりfontviewってのをくれ。
system32あたりにあるよ
156 :
名無し象は鼻がウナギだ! :04/05/07 19:35
>>150 fontview.exeで開いたとき、
unicmapで変換前⇒Windowsでコンピュ□タの世界が□がります
unicmapで変換後⇒The quick brown fox jumps over the lazy dog.
になるのは何か法則があるのでしょうか?
漢鼎繁特楷では上のようになりましたが漢鼎繁中行書では変換後も
変換前の文章で表示されました。
>>156 それが分からないのです。とりあえず気にしないことにしています。
「.ttfをダブルクリックしたときに〜」って上に書いたから 分かると思ったんですけど 「Windows標準の」って明記したほうがよかったですか? 標準のツールが暴走するから致命的だと思ったわけで
Arjan Mels' Font Viewe結構イイ。 文字コード表としてもかなり使える。 変なトコや不満もあるけど、なかなか便利。おすすめ。 誰か他のツールも試してみて紹介してちょ。
161 :
名無し象は鼻がウナギだ! :04/05/16 03:42
♔ฺ
>>159 文句を言う先が違います。
正しく仕様を守っているのはフォントの作者の方で、
文句を言うべき点は古いWindowsの実装です。
まあそれを言い出したらそもそもShift_JIS-2004にWindowsがちゃんと 対応してくれたらこんなツールいらないわけで。 TrueTypeの仕様の範囲内でならWindowsの実装に妥協する場合も ありますよ。 合成を1つでも定義したら縦書きできなくなるなんてのはどうしようも ないですけど
というかフォントを作った人に文句を言ってるつもりではなかったので もしそう受け取られてしまったのでしたらすみません 変換で手を抜いてた自分へのツッコミです
166 :
名無し象は鼻がウナギだ! :04/06/24 01:13
167 :
名無し象は鼻がウナギだ! :04/06/24 22:27
適当に突っ込みましたって感じだね。 西夏文字まだー?
170 :
名無し象は鼻がウナギだ! :04/08/25 10:16
だから知ってるって
unicode test
̂̃̄̅̆̇̈̉̊̋
۪ۭ۫۬ۮۯ۰۱۲۳
オマエノカーチャンデベソ
ⷺⷻⷼⷽⷾⷿ⸀⸁⸂⸃ ㇢㇣ 唊唋唌唍唎唏唐唑唒唓
177 :
名無し象は鼻がウナギだ! :04/11/21 06:58:37
ユニコードを語ってるのってこのスレだけ?
ム板とかWeb板にもあるけどどの板でも大して盛り上がってない
179 :
150 :05/02/27 00:27:58
>>156 対処方法が分かったのと、一部のアプリケーションで不具合が出るみたいなので
対策オプションを付けました。「-delempty 2」(まだ隠しオプション)を付けて変換すると
例文が英文にならなくなると思います。
このオプションを付けると変換に失敗する場合もあるので、 問題が生じたフォントでのみ指定してください。
181 :
名無し象は鼻がウナギだ! :05/02/27 00:33:04
漏れのような文字コードヲタってあんまりいないのかな?
>>181 漏れも文字コードヲタ化してる
(そもそも文字ヲタ)
>>185 「Paragraph 10」を略して書くとき、「P. 10」だとページと分かんないから
「¶ 10」と書くんだよ。
「PP. 10-20」と同じみたいに、「¶¶ 10-20」もあるよ。
188 :
名無し象は鼻がウナギだ! :2005/05/15(日) 23:54:59
Javaでプログラミングしています。 標準入力から「\u」という文字の並びを入力したいのですが、 Java側からするとUnicode文字「\u####」(####はコード番号)の 最初の2文字だけしか入力されていないというように解釈するようです。 どのようにすれば、Javaへの入力として「\u」という並びを 受け付けるようになるでしょうか? Javaのプログラムでの対処方法をお教え願えればありがたいのですが、 ユーザ入力時の対処方法でも結構です。
「\\u」とかじゃだめなん?
190 :
188 :2005/05/16(月) 00:44:46
>>189 実際にはLisp系言語Schemeのreaderを作っています。
その文字型データとして、
#\a
#\b
...
#\z
という文字の並びを受け付ける必要があるのですが、
#\u
だけが
>>188 の理由でエラーになります。
この場合、
>>189 さんのご指摘の方法を使うと、
#\\u
と入力することになりますが、これは
#\\ と u (つまり、#\ と u)
という並びに分解されてしまいます。
このような場合、どうすればよいでしょうか?
191 :
189 :2005/05/16(月) 01:37:02
うあ、いや漏れはJavaの文法規則とか分かってないから
なんとも言えないんだけど、うーん。
何か、スクリプト?を読んできてそれを解釈するみたいな
ことをしてるんだよね。
だったら、たとえば、前処理の段階で、「\」とかのいかにも
危険な文字を全部適当な文字列にエスケープしてしまう、
とかっていうのが考えられるかな…。
どっちにしても、ここは基本的には言語屋さんばかりだから、
プログラム板あたりに行って聞くのが早いかと思う。
【初心者歓迎】Java質問・相談スレッド65 Update 1
http://pc8.2ch.net/test/read.cgi/tech/1114850497/
192 :
188 :2005/05/16(月) 07:39:42
>>191 文字列入力時に処理系が勝手に\uをUnicodeの開始と
判断してしまうのが問題のようですので、仰せの通り、
parserの中で\uだけ特別扱いするしかなさそうです。
ありがとうございました。
ウニコード必要なの中国語やってる香具師くらいだろ。 欧米人は、使う必要ないからなかなか一般化しないんだわさ。 なんせ倍以上の容量になっちゃうからな。
>>193 そこんとこどうよ。多言語混在といっても確かに欧米では
アジア系言語分かる人少ないからフォントさえ入れていな
とすれば、unicodeもどうなんだかな。
たとえば、latin-1の英独仏がデフォらしいけど、西葡
のlatin-6や露のlatin-8を混在させる場合、欧米ではunicode
の必要性はないのかね。実体参照で書くのは大変だし、
áとかäとかの書き方あるの?
195 :
名無し象は鼻がウナギだ! :2005/05/16(月) 22:28:18
上げとくよ。
>194 実際その辺が面倒でUTF-8使ってる場合もあるやね。 漏れはケルト語使うんだけど、ISO-8859-14と日本語を同時に表示させる必要もあったりするんでUnicode使う必要は以外と 多い。 ドイツ語みたいにウムラウト付きやらエスツェットを分解できる言語だとSJISでも問題ないけど、アクセント記号が多くて 無いと意味が違って来ちゃう言語の場合は困るね。確かに。
なんで?
中国語と日本語の混在ということだよ。 英独仏ならunicode使わなくても混在可能。
200 :
名無し象は鼻がウナギだ! :2005/05/18(水) 19:55:49
ISO-2022でいいじゃん
>>200 それって一つのコードじゃないよ。
emacsのコードでは、改行コードの扱い(DOS,mac,unix)も含めて
64個あったけど、改行コードの部分と瑣末なものを除くと、こんな
にあるぞ。
iso-2022-7bit
iso-2022-8bit
iso-2022-jp
iso-2022-kr
iso-2022-cjk
iso-2022-cn
iso-2022-int-1
じゃあ、ウイグル文字モンゴル語とペルシア語をする必要のある俺って・・・
>>201 みんなISO-2022という「1つのコードセット」のサブセットだよ。
iso-2022なんて指定してもエラーになるだけだよ。
それぞれ別々のフォントセットだよ。
だから
>>200 の言う、isoでやれば多言語混在ができるなんて
夢のまた夢。
チベット文字はあることはあるが使えん・・・
チベット語だろうが、タイ語だろうがTigrigna語だろうがLaoだろうがHindiだ ろうがArabicだろうがAmharicだろうか、emacs+bdfフォントでみんな快適に 使えてますが。文字は入力できるが何を自分が打ってるかは分からない。
よく「emacsではこんなに沢山の文字が使えます」みたいなことを言ってる奴が あるけど、画面を見るとたいていアラビア文字が左から右に書いてあったり、 チベット文字が下半分消えてたりするんだよね。
隊長、負け犬が吠えてますぜ。
212 :
名無し象は鼻がウナギだ! :2005/06/13(月) 22:57:13
AA書いていて、「丕ッ」と変換されてしまう文字があるのですが、 これってUNICODEだと何の文字でしょうか?
213 :
名無し象は鼻がウナギだ! :2005/11/10(木) 01:10:38
オモシロソウナノデアゲ
214 :
名無し象は鼻がウナギだ! :2005/11/18(金) 23:07:55
携帯からは化けてしまう雲丹硬度の文字を解説、AA、または文字鏡などで表現・表示してもらえますか?
215 :
名無し象は鼻がウナギだ! :2005/12/03(土) 07:46:44
㍈
218 :
名無し象は鼻がウナギだ! :2006/05/17(水) 19:05:42
今後新しく追加される文字にN'koなんて物がある。 これの発音ってもしかして…
ヽ(・∀・)ノ●ヽ(・∀・)ノ●ヽ(・∀・)ノ●
なんか、Unicodeが使えないスレで、ハートとか書き込んでる人いたけど、どうやったら出来るの? Unicodeが使えないスレでは?になるんじゃないの?
♥とか書いてるんじゃないの?知らないけど
223 :
名無し象は鼻がウナギだ! :2006/10/28(土) 22:07:04
会社で使ってるOffice2003のArial Unicode MSをATOKのコード表で 閲覧してみたけど、Office2Kのと変わってないね。 CJK ExtensionAもがら空きだし、BMP以外にグリフが入ってない。 これじゃ「つち吉」出せるメイリオの方がずっと使えるじゃん。 最新のArial Unicode MSフォントはどれになるのかなぁ? 収録グリフは今どれくらいが最高なんだろ
224 :
名無し象は鼻がウナギだ! :2006/11/10(金) 18:22:02
互換漢字の「逸」の異体字U+FA25(IBM拡張漢字の中途半端な異体字)とU+FA67(JISX0213の康煕字典体)は 良く見てみると之繞が1点か2点の違いだけでなく「兔」の部分の3画目以降の「日」を倒したもの の真ん中の縦線と「儿」の左側の部分を続けて書くか分けて書くかの違いもあった。
>>224 「免」か「兔」かの違い(点があるかないか)もある。
&632;
ɸ 無声両唇摩擦音
228 :
てすと :2007/01/10(水) 05:04:42 BE:886680858-2BP(0)
&632;
229 :
できませんね :2007/01/10(水) 05:07:38 BE:133002623-2BP(0)
ɸ
230 :
名無し象は鼻がウナギだ! :2007/07/19(木) 02:55:06 0
age
エイジ
232 :
名無し象は鼻がウナギだ! :2007/07/26(木) 18:08:45 0
雷マークってunicode上にありますか?
233 :
名無し象は鼻がウナギだ! :2007/07/27(金) 15:16:18 0
「?」 最近これをよく見かけるのだがこれもUnicode? Vistaとかだとこれが標準になってたりするのかなあ
234 :
名無し象は鼻がウナギだ! :2007/07/27(金) 15:20:15 0
↑ ありゃ出てねえ 「〜」 これのぎこちないやつなんだが
235 :
名無し象は鼻がウナギだ! :2007/07/30(月) 19:28:25 0
いいたいことはわかる ~と〜の問題だろ
Shift+^で Windowsだと全角チルダが入力されて Macだと波ダッシュが入力される たぶんそれ
角が直角な波線じゃないの? 「/\/」な感じの
239 :
名無し象は鼻がウナギだ! :2007/09/09(日) 17:01:11 0
☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺
電源マーク(丸の上部が欠けて縦線)ってある? 探し方が悪いのかな。
241 :
名無し象は鼻がウナギだ! :2008/01/14(月) 12:51:05 0
U+2011E 𠄞 U+20F96 𠾖 U+2592E 𥤮 この文字はBMPの統合漢字とどう違うの?
242 :
名無し象は鼻がウナギだ! :2008/01/14(月) 17:09:40 0
歌詞などの初めに歌詞であることを示すために付ける記号の ユニコードは何番?
243 :
名無し象は鼻がウナギだ! :2008/01/14(月) 17:43:57 0
√みたいな変な記号?
庵点(いおりてん)、U+303D。
245 :
名無し象は鼻がウナギだ! :2008/01/15(火) 00:35:46 0
〽ぴッんッくッのッもーつぁるとーー!!
>>241 ttp://kanji-database.sourceforge.net によると、以下のような認識だそうな。
U+2011E -> 類似(U+4E8C)
U+20F96 -> 重複(U+5668)
U+2592E -> 重複(U+7A81)
しかしふと文字の表を眺めると、「二」(数字)は既に
U+2F06 KANGXI RADICAL TWO
U+3193 IDEOGRAPHIC ANNOTATION TWO MARK
U+4E8C CJK UNIFIED IDEOGRAPH
もあるのね。自分の環境ではぱっと見区別がつかん。
そしてさらに括弧付き等で
U+3221 PARENTHESIZED IDEOGRAPH TWO
U+3281 CIRCLED IDEOGRAPH TWO
247 :
名無し象は鼻がウナギだ! :2008/03/01(土) 15:25:36 0
2011Eは大漢和で言うところの「上」の古字じゃないかしら。
へー、漢文の返り点まであるのか。 <sub>二</sub>じゃダメなのかねぇ。
Unicodeよくわからん…日本語Wikiが欲しいな それもたとえば「U」を引くと「u」「V」「v」「∪」「∨」「し」などの 似た形の文字がわかるとか 顔文字の目のパーツに使えそうな文字一覧とかあると嬉しい
langid-proposalとかどういう扱いになるんだろうねぇ(w つか個人的には漢字はもういいからU+12000(Supplementary Multilingual Plane)のCuneiformが 足りなすぎるのをなんとかしてほしー(笑)
☑
252 :
名無し象は鼻がウナギだ! :2008/04/22(火) 14:58:35 0
unicode 309Fの「より(『ち』と『ら』を足したような文字)」を出したく 調べたところWindowsでunicmapを使いunicodeのバージョンを3.2して使う ところまでわかったのですが旧Mac(PowerMac8600:MacOS8.6)で使う方法が わからず、参っております。 どなたか、使用方法をわかる方おられませんか?
253 :
252 :2008/04/22(火) 15:08:22 0
すいません板違いでした失礼しました。
ついにロードマップに TIP が顔を出したな
でも甲骨文字とか漢字ばっかだなぁ。漏れには縁がないorz
256 :
名無し象は鼻がウナギだ! :2008/06/06(金) 23:37:37 0
>>246 >>247 頻度の上からも上の古字が妥当だと思います。
たぶん手書きで書きわける為には二は筆で描くみたいに反って書いて。
上はまっすぐ平行に描けばいいと思う。
二は楷書で、上は甲骨文だから。
(確か大漢和では上はゴシックだった気が。)
それで目立ってよく覚えている。
まわり三文字位。
回り明朝なのに。
その近くの二の古文は線の長さが同じだった。
もちろんゴシック。
MINGLIUだけじゃなくて
MS明朝とかで64画のてつ(4龍)を打ちたい。
MINGLIUって文字のデザインが汚いから。
>>246-247 頻度の上からも上の古字が妥当だと思います。
たぶん手書きで書きわける為には二は筆で描くみたいに反って書いて。
上はまっすぐ平行に描けばいいと思う。
二は楷書で、上は甲骨文だから。
(確か大漢和では上はゴシックだった気が。)
それで目立ってよく覚えている。
まわり三文字位。
回り明朝なのに。
その近くの二の古文は線の長さが同じだった。
もちろんゴシック。
MINGLIUだけじゃなくて
MS明朝とかで64画のてつ(4龍)を打ちたい。
MINGLIUって文字のデザインが汚いから。
☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺ ☻ ☺
ISO/IEC 10646
U+0A74ってネズミ?
あまり知られていませんが英語ではネズミは小さいのがマウスで大きいのがマイス。 小さいのがビー、大きいのがホーネットと呼ばれるハチと同じように、ネズミも2つの単語を持っているんです。よくばりさんですね。
まあ、1匹より2匹以上を合わせたほうが大きいとも言えるが。
???イ??ズ
キタ━━(?ω?)━━!!!!!
??
267 :
名無し象は鼻がウナギだ! :2009/08/10(月) 21:29:54 0
??
268 :
名無し象は鼻がウナギだ! :2009/08/11(火) 00:28:41 0
>>261 あまり知られていませんが日本語では、
小さいのがチンチン、大きいのはティンポ。
よくばりさんですね。
大きいのはマラじゃなかろうか
☠ฺ
絵文字がらみで、十二支それぞれに絵文字が提案・議論されたとき、 ネズミ年のネズミがハツカネズミな国用に、mouse, クマネズミな国用にrat、 両方が提案されていたな。
273 :
名無し象は鼻がウナギだ! :2009/09/09(水) 17:25:28 0
そういえば携帯絵文字をUnicodeに入れる話って結局どうなったの?
274 :
名無し象は鼻がウナギだ! :2009/09/30(水) 12:19:11 0
第三面も漢字になるらしいが… 実装はいつになるんだよwwwww
277 :
名無し象は鼻がウナギだ! :2009/11/04(水) 14:35:39 0
そんなに場所余ってるなら家紋とか収録してくれないかな
278 :
名無し象は鼻がウナギだ! :2009/11/15(日) 13:53:48 0
ARIB外字みたいなのに紛れ込ませればそのまま無条件で入れてもらえそう
JIS第5水準つくろうぜwww
280 :
名無し象は鼻がウナギだ! :2009/11/19(木) 12:57:53 0
まずは神代文字を入れてもらうか。 普通のひらがなカタカナとは別がいいけど、 各神代文字は異体字セレクタで十分かな。
281 :
名無し象は鼻がウナギだ! :2009/11/19(木) 22:19:54 0
大 一 大 大 万 吉 これは入れられてしかるべき
282 :
名無し象は鼻がウナギだ! :2009/12/04(金) 11:29:40 O
未だに「埼」の異体字 土竒 が収録されない。 IVS登録もされてないから異体字セレクタでも指定できない。
283 :
名無し象は鼻がウナギだ! :2009/12/11(金) 01:14:34 0
なんとここか
しーしーしこたま
@AB
𓀀𓀁𓀂𓀃𓀄
𓏘𓃭𓇋𓍯𓊪𓄿𓂧𓂋𓄿 CLEOPATRA
SJISの―(ダッシュ)もUnicodeで扱うと化けることがあるんだな
U+2010辺りの横棒シリーズは みんなちゃんと使い分けているのだろうか? 結局みんなU+002Dで済ませてる気が
292 :
290 :
2010/08/04(水) 14:45:42 0