文字コード総合スレ part8

このエントリーをはてなブックマークに追加
1デフォルトの名無しさん
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
2デフォルトの名無しさん:2012/11/30(金) 13:19:29.05
3デフォルトの名無しさん:2012/11/30(金) 14:18:38.86
■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
ISO-IR - 2.8.1 Coding systems with Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
http://lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006-March/000002.html
JISX4061
日本語文字列照合順番
http://www.jisc.go.jp/
4デフォルトの名無しさん:2012/11/30(金) 14:19:08.83
■これまでに行われた議論
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
 内部的には Unicode -> CP932 -> CP5022x って変換な気もする
・人名をソートかけたらバストサイズ順の並びになる?
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に
 機種依存文字はサポートされるか?
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・なぜ携帯業界はunicode化しないのか?
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
5デフォルトの名無しさん:2012/11/30(金) 14:19:56.25
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
 ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
 中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ
 UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで)
 サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い)
 ((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
6デフォルトの名無しさん:2012/11/30(金) 14:20:29.23
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。
・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定
  → ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
 Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
 コントロールパネル-地域と言語のオプション-[言語]タブで
 「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!!
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
 陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。
7デフォルトの名無しさん:2012/11/30(金) 14:28:31.92
テンプレ乙でござるよ
8デフォルトの名無しさん:2012/11/30(金) 15:02:44.42
もうひとつの過去スレ:
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/

隔離スレ:
UnicodeとUTF-8の違いは?
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/
9デフォルトの名無しさん:2012/11/30(金) 15:13:16.40
10デフォルトの名無しさん:2012/11/30(金) 15:14:10.43
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
 表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
 charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
 U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
 再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
 あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか
11デフォルトの名無しさん:2012/11/30(金) 15:15:50.02
JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
http://std.dkuug.dk/JTC1/SC2/WG2/

ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
http://appsrv.cse.cuhk.edu.hk/~irg/

日本の委員 (JSC2)
http://www.itscj.ipsj.or.jp/meibo/020000.pdf
12デフォルトの名無しさん:2012/11/30(金) 18:18:17.85
スレ立てサンキュ
13デフォルトの名無しさん:2012/12/03(月) 21:21:23.27
西夏文字、女文字、インダス文字、女真文字なんかはまだなんだな。
日本や中国の研究者頑張れ。
14デフォルトの名無しさん:2012/12/03(月) 23:51:37.30
ところでさ、U+1F5FEの日本列島絵文字なんだけど、
例示図形に普通に北方四島が入ってるんだよね。
これロシアとかからクレームなかったのかな。

あるいは、奄美と沖縄が単独の点として描かれてるのに
北方四島が本土とくっついてるのはあえてどうとでも解釈できるようにしたごまかし?
でも佐渡とか壱岐対馬はそもそも存在さえ描かれてないわけで、なんかちょっと変。

では、そもそもの元になったと思われるau絵文字#214「地図」ではどうだったのかと見てみたら、
なんと日本領部分は「本土4島だけ」のシンプルなものだった。
ここからどういう経緯で北方四島と奄美沖縄が加わったんだろう。
15デフォルトの名無しさん:2012/12/04(火) 01:09:59.61
>>14
日本列島という島の絵文字であって、日本という国の絵文字じゃないということだと思う。
でないと、国旗の絵文字でアレだけ揉めたのと整合性がつかなくなる。
16デフォルトの名無しさん:2012/12/04(火) 03:19:38.20
ただ、国境以外の理由で4島と千島を区切る理屈ってのもちょっとなさそうなのよね
17デフォルトの名無しさん:2012/12/04(火) 05:19:19.05
南樺太も日本です
台湾も日本です
18デフォルトの名無しさん:2012/12/04(火) 06:09:50.32
U+1F5FCが固有名詞的な「東京タワー」じゃなくて「電波塔」という曖昧な名前で規格化する案もあったことを考えると
U+1F5FEも「弧状列島」とか表現されることになっていてもおかしくなかったかも
19デフォルトの名無しさん:2012/12/04(火) 09:09:38.01
尖閣諸島を入れて欲しかった
20デフォルトの名無しさん:2012/12/04(火) 09:45:40.17
>>18
まあ、MOYAIさんが通った時点でそのへん曖昧だよね。

これに自由の女神と並ぶレベルの公共性なんてないと思うw
21デフォルトの名無しさん:2012/12/04(火) 19:17:25.01
>>20
あれって元の携帯絵文字ではモアイ像そのものの姿で描かれてるんだし (文字名はモヤイ像なのに)、
「モアイ像」として入れたほうがユニヴァーサリティがあって良かったんじゃないかと思うんだけど
まあ渋谷とかの意味で使われる絵文字として解釈できなくなるからやっぱダメか
22デフォルトの名無しさん:2012/12/04(火) 20:12:50.27
あるいは新島
23デフォルトの名無しさん:2012/12/04(火) 23:23:51.55
>>21
> あれって元の携帯絵文字ではモアイ像そのものの姿で描かれてるんだし

まじだ……一体どうなってるんだこれ
24デフォルトの名無しさん:2012/12/14(金) 13:36:10.61
http://slashdot.jp/~yasuoka/journal/559968/
>JTC1/SC2/WG2/IRG N1883
>(大正新脩大蔵経「外字」のISO/IEC 10646追加提案)

これ結局、日本提案から外されたのね
25デフォルトの名無しさん:2012/12/19(水) 21:05:28.98
>>5
>・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか

ISO2022なら楽勝でできる多スクリプトの混合表記がunicodeではできないってスクリプトレベル
の問題を、多言語問題にすりかえるなよ

言語情報が中国語でも、それを日本漢字で表記しても何も問題はない

それどころか、日本の漢文の教科書では、言語は中国語だが、字体は日本の教科書体で表記
しないといけないっての
26デフォルトの名無しさん:2012/12/19(水) 22:53:11.62
正則漢文は中国語ではない
27デフォルトの名無しさん:2012/12/19(水) 23:54:59.27
>>25
文書そのものの言語よりむしろユーザーが理解可能なスクリプトの方が重要、
なのかなあ。

とりあえず自分のお仕事では、文書の言語情報が中国語だったら中国語のフォントを
割り当てるようにしてますけどw
例えばOSの言語設定を優先するようにしたりとかしたら... って?
...ちょっと無理かなw (ちょっと持田香織を意識してみた)

現実問題として例えば普通の日本語フォントは中国語の簡体とか持ってないから、
下手にやるとつぎはぎの脅迫文状態になってしまう。そういうのでも見たいかな?
28デフォルトの名無しさん:2012/12/20(木) 00:26:57.58
漢字のフォントって今も全部手作業で作ってるの?

偏旁の情報流し込んだらざーっとバリエーションつくってくれて、細部だけ手修正、みたいな感じなら
せっかくだから和文で使わない文字も全部含めてくれればいいのに。クオリティ落ちてもいいからさ。
29デフォルトの名無しさん:2012/12/20(木) 05:39:55.98
じゃあおまえがやれよ
30デフォルトの名無しさん:2012/12/20(木) 09:22:41.68
e漢字というプロジェクトがあってだな
31デフォルトの名無しさん:2012/12/20(木) 10:30:33.04
つまんね
32デフォルトの名無しさん:2012/12/20(木) 11:52:51.57
結局GlyphWikiみたいに人肉制作が一番成果物につながりやすいのかな
33デフォルトの名無しさん:2012/12/20(木) 19:09:10.91
Glyphwikiは曲線を実現する方法が改善されたら無敵かも。
34デフォルトの名無しさん:2012/12/20(木) 19:33:32.32
現状のGlyphWikiで作った記号とかネタレベルだもんな。
35デフォルトの名無しさん:2012/12/20(木) 21:08:27.21
花園は非漢字だけ別のフォントから借りてきた方がいいと思うんだけど
明朝だとなかなか選択肢がないのかな
36デフォルトの名無しさん:2012/12/21(金) 22:43:08.51
IPA明朝丸取りで良いやん。
37デフォルトの名無しさん:2012/12/28(金) 22:20:50.30
さて年の瀬なわけだが
38デフォルトの名無しさん:2012/12/28(金) 22:38:05.25
年の瀬くらい、おとなしくしてなさい
39デフォルトの名無しさん:2012/12/29(土) 21:59:11.75
年の瀬だから、いいじゃん
40デフォルトの名無しさん:2012/12/30(日) 14:27:54.18
こんなの始まってた
www.ipa.go.jp/about/kobo/tender-20121228-2/
>今回、変体仮名⽂字の字形を調達し、今後のフォント拡張及び文字符号の国際標準化の
>素材として使用するものとする。

変体仮名の符号化が動き出したか
41デフォルトの名無しさん:2012/12/30(日) 18:45:39.07
良くも悪くも、今回デザインされた字形が「正しい変体仮名」として未来に残っていくんだな。
42デフォルトの名無しさん:2012/12/30(日) 20:49:44.39
だろうなあ。変体仮名の字形に熟知したデザイナーなんてどれだけいるやら…

3月〆切ってことは早ければ春先にもまずIPA明朝に収納される可能性ありか。
どんなのが出てくるかちょっと楽しみ。
43デフォルトの名無しさん:2013/01/01(火) 00:46:22.92
さて年が明けたわけだが
44デフォルトの名無しさん:2013/01/01(火) 02:41:22.10
「謹賀新年」「迎春」とかは一つの文字コードを与えていいんじゃないだろうか
45 【凶】 【721円】 :2013/01/01(火) 04:40:04.62
#あけおめ #ことよろ
46デフォルトの名無しさん:2013/01/01(火) 15:26:12.83
あけおめー
47デフォルトの名無しさん:2013/01/02(水) 06:14:56.17
縦組み専用のワープロソフトも出てくるんだろうか
48デフォルトの名無しさん:2013/01/04(金) 00:56:50.23
blog.query1000.com/archives/21819386.html
>日本は今まで(他の国の提案を)撃ち落とす方で頑張って来たのに、

WG2/IRGへ邪魔しに行ってるのを認めちゃったよ
49デフォルトの名無しさん:2013/01/04(金) 03:41:54.21
>>44
戦前に「天皇陛下」の一体活字を作った新聞社じゃないんだから。
50デフォルトの名無しさん:2013/01/04(金) 04:29:39.37
ひょっとしてそれって、文選で間違えると打ち首にされるとかの回避策?
51デフォルトの名無しさん:2013/01/04(金) 04:40:26.90
文中の「陛」文字頻度が低い上に特定の熟語にしか使われないからでしょ
52デフォルトの名無しさん:2013/01/04(金) 14:51:44.58
53デフォルトの名無しさん:2013/01/04(金) 15:16:53.92
ああ、例の本の深沢さんか。参考になったわ。
54デフォルトの名無しさん:2013/01/04(金) 23:04:36.32
>>52
安岡も耄碌したな。トイレと天気の話しか出来ないのか。
55デフォルトの名無しさん:2013/01/07(月) 14:54:11.70
>>50
北朝鮮方式か
56デフォルトの名無しさん:2013/01/07(月) 14:56:08.81
あと、4文字の途中で改行することが許されないから、
(というか、直前で改行して必ず行頭に置くことになってるから)
という事情もあるな。
57デフォルトの名無しさん:2013/01/08(火) 21:03:09.32
JIS Z 8903廃止なのね
58デフォルトの名無しさん:2013/01/09(水) 07:20:34.61
ああYさんとこね

変体仮名字形の入札、濁点/半濁点つき字形のことを忘れているような
59デフォルトの名無しさん:2013/01/09(水) 16:28:46.12
>>59
戸籍にも住基にも濁点/半濁点付き変体仮名は無いから
とりあえず最初のうちは作らないみたい
でも今後どうするかは謎
60デフォルトの名無しさん:2013/01/09(水) 16:30:30.81
>>59
自分自身を指してしまったorz
61デフォルトの名無しさん:2013/01/09(水) 22:23:43.57
そうなのか…じゃあ本当に行政専用になりそうだな
62デフォルトの名無しさん:2013/01/11(金) 00:54:51.84
合成でなんとかしろって事ではないのかな。
アイヌ語の表現みたいに。
63デフォルトの名無しさん:2013/01/11(金) 02:03:45.26
欧文のストロークみたいな感じで
64デフォルトの名無しさん:2013/01/12(土) 01:02:43.90
>>63
kwsk
65デフォルトの名無しさん:2013/01/13(日) 09:21:45.76
ふむ
66デフォルトの名無しさん:2013/01/14(月) 22:23:13.81
ほう
67デフォルトの名無しさん:2013/01/14(月) 23:00:03.96
すべてが順調にいったとしても
使えるようになるのは2015年頃かのう
68デフォルトの名無しさん:2013/01/16(水) 15:44:53.71
拡張Fきてるし
69デフォルトの名無しさん:2013/01/16(水) 18:54:26.26
irgはいつの頃からか記念写真やめちゃったのね
70デフォルトの名無しさん:2013/01/19(土) 00:08:29.61
Ext Fまで来ると、もうIPAmjとGlyphWikiくらいしか
実装されないんじゃなかろーか
71デフォルトの名無しさん:2013/01/19(土) 23:36:28.62
ExtFどこにきてるの
72デフォルトの名無しさん:2013/01/20(日) 07:02:56.46
あなたのうしろよ
73デフォルトの名無しさん:2013/01/20(日) 21:41:44.70
中国語の漢字もう疲れた... 偏が簡体になったやつがやたらコードポイントを
消費しているような。
もう簡体と繁体もunifyすればよかったんじゃんw
74デフォルトの名無しさん:2013/01/20(日) 23:15:17.97
繁体:簡体が多対一で対応してるのとかへのルール作りを考えるとユニるのがめんどくさい
75デフォルトの名無しさん:2013/01/20(日) 23:26:09.98
Ext.Fどこで見られる?
76デフォルトの名無しさん:2013/01/23(水) 00:14:21.88
unicode とか JIS X 0208 だと、ASCII文字(記号含む)の全角版って、互換性維持の為にあるものだよね?
JIS X 0208 だと、ほぼ使うなと同等なことが書いてあるけど、
今の unicode standard だと使っても全然問題ないみたいに書いてある。

現実的に、フォントと多くの表示環境では、レンダリングされるときのマージンとかスペーシングを考えると、
日本語を書くときは全角を使った方が見栄えが良くなると思う。
ASCII文字の全角版を使わないという選択はとれないんではないの?

日本人は分かち書きなんてしないから、マージンとかスペーシングを気にしないのかもしれないが、
ラテン文字を使う外国人はマージン・スペーシングに関して全角の方が見栄えがいいから、
unicode standard で禁止されてないし、全角文字を使う風潮が流行るんではないかな。このままほっとくと。

実際、CJK文字を含むテキストで何で半角記号(括弧とか、&とか))を使うのか?全角記号を使うべきではって外国人に言われたし。
まともな反論できなかったわ。
77デフォルトの名無しさん:2013/01/23(水) 00:32:25.32
英数字に全角文字使えよ
78デフォルトの名無しさん:2013/01/23(水) 00:40:31.84
>>77
まあ、日本語で書くときの話をしてるから。それに解決になってないし。

追記しとくと、
(日本語)
みたいに全角括弧でくくった場合、括弧の前後にマージンがあるフォントとないフォントがあると思う。
これを半角にしてしまうと、ほとんどのフォントでマージンがないから、前後に空白文字を入れないと、マージンが無くなってしまう。
これが見た目に影響してしまうんだよね。

また、縦書きの場合に
おしっこ&うんこ
みたいに書くと、全角&は正立するが、半角&は90度回転する環境がほとんどだと思う。(?!とかもそうかもね)
じゃあ、CJKだと普通の文字は正立するから、全角で書かないといけないよねってことになる。
今すぐ役に立つものを作る場合は、規格より、現実を優先させないといけないしなぁ。

っつーか、なんでunicodeの互換エリアって使っても問題ないみたいになってしまったんだ?
79デフォルトの名無しさん:2013/01/23(水) 01:01:38.61
>>78
全角って単にコードの話で、
マージンやスペーシングがどうかなんて規定されてないだろ。
横幅が半分でもコードが全角ならそれは全角だよ。
80デフォルトの名無しさん:2013/01/23(水) 01:15:32.71
>>79
そりゃそうだけど、じゃあどうするべきなの?
俺はマージンとか縦書きの時の配置はレンダラが適切に処理しろと思うけど、
現実PCの表示環境でそんなの気にしてないし。

フォント制作者も文字の効用に合わせて作ってるんだろ?
半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。

現実に合わせても将来がない上に、規格にそってもまともなレンダリングがされない現状って。
81デフォルトの名無しさん:2013/01/23(水) 07:33:02.14
NEC PC-98シリーズには、2バイト半角文字がある。
82デフォルトの名無しさん:2013/01/23(水) 08:00:06.14
括弧とかは全角版を「スペースが予め含まれた括弧」みたいに再定義しておくべきだったかもしれんね。
83デフォルトの名無しさん:2013/01/23(水) 12:42:32.90
縦書きの時に何を正立させて何を回転させるかは今UTR50でやってる。
もっとも、外野が口を突っ込みすぎて座礁しかかってるけど。
84デフォルトの名無しさん:2013/01/23(水) 13:40:47.76
どうせSJIS⇔Unicode変換には演算入るんだから英数やキリルのJIS全角文字はダイアクリティカルマーク様にコンバインで収録すべきだった
85デフォルトの名無しさん:2013/01/23(水) 14:13:01.99
East Asian WidthがAmbiguousなやつどうすんだよって問題も未だ解決されてないし
どんなとき縦中横にするのかとか文字コードだけで解決できる問題とは思えないよな
86デフォルトの名無しさん:2013/01/23(水) 15:05:26.83
>>80
それは単にあんたの使ってる環境やフォントの機能不足だろ。
>半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。
ヒラギノは文字幅の設定8種類持ってて切替えられる。
OSX上でプロポーショナルにも全角/半角側に統一とかも設定次第で好きにできる。
87デフォルトの名無しさん:2013/01/23(水) 16:45:24.79
「AAAAAA」が全く同じ文字の連続に見えるようなフォントって話だと思ってたけど
OSX+ヒラギノの環境ではそれが可能ってことであってる?
88デフォルトの名無しさん:2013/01/23(水) 17:14:59.80
>>87
そう、OpenTypeの機能。
OSXは標準のテキストエンジンでサポートしてる。
他のプラットフォームでも真面目にサポートしてれば使える。
89デフォルトの名無しさん:2013/01/23(水) 17:43:27.76
WinだとDirectWriteでやることになるのかな
90デフォルトの名無しさん:2013/01/23(水) 17:56:57.04
同じ文字には同じコードを割り当てるべきだと思うの
91デフォルトの名無しさん:2013/01/23(水) 18:44:14.32
あれ、なんか話題のレベルが落ちてきてない?
92デフォルトの名無しさん:2013/01/23(水) 19:20:18.78
ンとソのちがいは、日本人ならわかるけど
カタカナのベ
ひらがなのべのちがいは、日本人でもわからん
93デフォルトの名無しさん:2013/01/23(水) 19:23:02.00
シとツのちがい
うとラのちがい
94デフォルトの名無しさん:2013/01/23(水) 19:27:37.37
95デフォルトの名無しさん:2013/01/23(水) 21:38:01.20
>>92
何故へとヘではなくべとベなのか
96デフォルトの名無しさん:2013/01/24(木) 01:29:41.99
>>86
OSXは使った事ないし知らなかったわ。すまん。
その外国人もマックユーザっぽいから、そういう風なレンダリングできるのを自分で見れば納得するかも。
You & I も あなた&わたし も ひろゆき(2ch管理人) も hirokyuki (the founder of 2ch) も
前後の文字を見て適切な字形とマージンを自動選択できる表示ソフトがあるってことだよね。
その外国人は上みたいな文字列を適切に表示させることが出来る環境なんて見たことないって言ってたから、
なにか適切な設定してやらないといけないってことかな。どうすればうまく表示させられるの?
97デフォルトの名無しさん:2013/01/24(木) 04:29:08.26
Unicode Consortiumの内部文書へのパスワードを解除するって
ものすごい決断だなあ。これまで水面下でしてきたことも
これからすることもすべて丸裸か…
98デフォルトの名無しさん:2013/01/24(木) 05:26:08.43
>>90
思うね。ふたつあるΩに、つい「オメーガ悪い!」と叫んじまったぜぃ
99デフォルトの名無しさん:2013/01/24(木) 13:30:47.01
ユニコードは日中韓の同じ文字に同じコードを割り当てた所に問題が有った訳だが・・・
100デフォルトの名無しさん:2013/01/24(木) 15:05:11.07
iモードはなぜJIS X 0208にすでにある♪を絵文字に追加したのかw
101デフォルトの名無しさん:2013/01/24(木) 17:40:08.34
http://www.nttdocomo.co.jp/service/communication/imode_mail/function/pictograph/
「るんるん」であって八分音符じゃないから
まあ意味も同じな「!」まで追加してるし色つけたいとかアイコンのかわりに使いたいとか
絵文字の水増ししたいとかそういう理由なんだろうな
どちらかといえば「黒ハート(赤)」のほうが納得いかないし
102デフォルトの名無しさん:2013/01/24(木) 18:28:41.15
絵文字なんて、ミクシィみたく数値参照みたいな形式でいいのに。
なんでコードポイントなんか与える必要があるんだよ。
103デフォルトの名無しさん:2013/01/24(木) 20:38:24.03
絵文字は、排除すべきだ
104デフォルトの名無しさん:2013/01/24(木) 21:39:41.69
無理です
105デフォルトの名無しさん:2013/01/24(木) 21:47:40.50
使うものだけを各自subset化する
106デフォルトの名無しさん:2013/01/25(金) 06:30:50.06
>>103
排除はどうかと思うが、
Unicodeに日本の3キャリアのみの変換テーブルねじ込んだのは許せん
しかも往復できないし
107デフォルトの名無しさん:2013/01/25(金) 09:59:10.09
>しかも往復できないし

ここだよね。

キャリアの絵文字相互変換はぶっちゃけ「なんとなくこんな感じだよね」レベルなんだから、
ユニコード収録のタイミングで半ば強引に整理して、
キャリアのサーバー側を“権威ある国際規格”にあわせるべきだった。

中の人も「後世まで残すとわかってたらもっとマジメに作ったのに」って思っただろ絶対。
108デフォルトの名無しさん:2013/01/25(金) 10:38:04.63
各キャリアの私用領域絵文字は緩やかに廃止して
全部画像ベースのデコメ絵文字に移行すれば何も問題なかったのに
文字コードオタクが調子に乗るから
109デフォルトの名無しさん:2013/01/25(金) 10:55:54.76
>中の人も「後世まで残すとわかってたらもっとマジメに作ったのに」って思っただろ絶対。

ないわ
110デフォルトの名無しさん:2013/01/25(金) 17:19:55.61
>>88
それってCoreTextでfont featureをセットするみたいな話のことですか?
CoreTextをあまり真剣に使ったことがなかったので後学のために。
111デフォルトの名無しさん:2013/01/25(金) 17:48:51.40
>>110
普通にフォントパネルから指定できる。
左下のポップアップメニューからTypography選んでみ。
ずっと前からサポートしてるOSXの基本機能/基本操作だよ。
112デフォルトの名無しさん:2013/01/27(日) 04:02:47.85
>>111
はい。
UI的にはそうなんですけど、プログラム的にはNSTextViewとNSFontPanel
の組み合わせで、だけどそれをコントロールするAPIはないような、と。
ちなみにこのメニューってOS Xのどのバージョンからありましたっけ。

「ターミナルでの」半角全角というのはレガシーなエンコーディングにおいて
1バイトか2バイトかで文字幅処理していた名残だから、フォントのデザインという
より文字コードの問題なんだけど、OpenTypeのフィーチャーは有効かな? と。
あくまでもターミナルでの全角半角問題に限定しての話ですが。

で、OS XのターミナルはCoreTextで作られているので... というのが個人的な今ココ。
ちょっとごにょごにょ試してみます。
113デフォルトの名無しさん:2013/01/27(日) 14:38:22.59
>>112
フォントによってサポートしてるfeature違うから、適切なオプションを設定すれば良いはず。
>ちなみにこのメニューってOS Xのどのバージョンからありましたっけ。
OSX 10.2辺りからじゃないかな? 手元で一番古い10.4でも普通に使える。
>で、OS XのターミナルはCoreTextで作られているので...
それは最近の話だね。CoreText以前もfont featureはATSUIでサポートされてる。
114デフォルトの名無しさん:2013/01/28(月) 22:43:40.82
「ここに晒しておく。」なんて
あの人は発想がちゃねら並みだな…
115デフォルトの名無しさん:2013/01/28(月) 23:05:39.65
実名でやってるだけ俺らよりマシだろ
116デフォルトの名無しさん:2013/01/31(木) 10:37:53.41
安岡センセイ
実はバリバリのちゃねらーだろ
117デフォルトの名無しさん:2013/01/31(木) 10:57:25.02
>>114
安岡センセイが「晒しておく」って書いてる時は文体にかなり怒りを感じる。
本気で怒ってるんだろうと思う。

http://slashdot.jp/~yasuoka/journal/562403
http://slashdot.jp/~yasuoka/journal/535124
http://slashdot.jp/~yasuoka/journal/514117
http://slashdot.jp/~yasuoka/journal/494946
118デフォルトの名無しさん:2013/02/01(金) 00:57:01.23
ふむ
119デフォルトの名無しさん:2013/02/01(金) 03:06:59.67
阿辻教授の方へ訊きに行ったのが気に障ったのかしら
120デフォルトの名無しさん:2013/02/01(金) 06:27:21.26
>>117
センセイも時々ボケはるからお互い様な感じはする
IVSの時はただの馬鹿かと思った
121デフォルトの名無しさん:2013/02/01(金) 21:58:56.46
>>120
kwsk
122デフォルトの名無しさん:2013/02/01(金) 22:02:49.89
>>117
「晒しておく」とは書いてないが、かなり怒ってる感じだぞ
http://joi.jlc.jst.go.jp/DN/JST.JSTAGE/johokanri/55.826
123デフォルトの名無しさん:2013/02/01(金) 23:43:45.98
124デフォルトの名無しさん:2013/02/02(土) 17:53:12.36
??
125デフォルトの名無しさん:2013/02/02(土) 20:59:26.62
リンク切れてるぞ
126デフォルトの名無しさん:2013/02/03(日) 00:32:44.49
落ちてるのかな
127デフォルトの名無しさん:2013/02/03(日) 09:20:06.52
昨日はPDFでダウンロードできたよ
128デフォルトの名無しさん:2013/02/03(日) 22:02:28.55
>>113
少し遊んでみました。なるほどヒラギノというのはいろんなテーブルを持ってるんですね。
こういうテーブルのせいでフォントが過剰に大きくなったりしないのかな。

個人的にOS Xからしばらく遠のいていましたが、ふと気がつくとテキストエディットが
縦書き対応に、SafariはIVSに対応しているようで。
しかしIVS->グリフの対応はどのレイヤーで処理しているのかな?
129デフォルトの名無しさん:2013/02/04(月) 00:18:37.69
>>122
やっと読めた
怒ってるというよりは業を煮やした感じ
130デフォルトの名無しさん:2013/02/04(月) 05:38:16.47
>>128
ヒラギノ角ゴがときどき怪しげな表示をするのは、そのせいなんだろうか。
文字が重なったり、わけのわからんところでボーンとアキができたり。
こういうのはスレチ? MacとかWordとかのスレでやったほうがいいの?
131デフォルトの名無しさん:2013/02/04(月) 06:06:07.77
うん
132デフォルトの名無しさん:2013/02/06(水) 15:17:40.96
住基ネットって今年3月廃止なの?
133デフォルトの名無しさん:2013/02/06(水) 23:33:11.40
地方自治情報センターが仕分け対象になっただけ。
134デフォルトの名無しさん:2013/02/09(土) 02:19:05.92
つまりどういうこと?
改組するだけ?それさえなし?
135デフォルトの名無しさん:2013/02/11(月) 03:08:54.33
変体仮名はタイプバンクが作ることになったのか
136デフォルトの名無しさん:2013/02/11(月) 07:05:33.91
変体仮名づくり自体が未知数すぎてコメントしづらい
137デフォルトの名無しさん:2013/02/11(月) 09:12:16.70
変体仮名はフォントの問題な気がする
138デフォルトの名無しさん:2013/02/11(月) 09:48:38.40
納入期限まであまり日がなかったよな
春過ぎには変体仮名入りのIPAmjが出るんだろうか
139デフォルトの名無しさん:2013/02/11(月) 19:42:34.26
変体仮名は楷書書体の知識が全く通用しないからな。
金があれば知識ある人を引っ張ってこれるはずだが役所仕事はアレだからな。
140デフォルトの名無しさん:2013/02/11(月) 23:23:35.07
これはどうなるのかマジで不安

だめなのが出てきたときにリジェクトってできるの?
141デフォルトの名無しさん:2013/02/12(火) 00:03:42.36
外野が物言いを付けるタイミングとしては
・グリフがIPAmj明朝に入った時にフィードバックする
・そのフォントをもとにした符号化提案書がWG2へ回ってきた時にコメントする
のどっちかだと思う。

プロジェクトを指揮してる主体が見えないんでそれぞれ
いつ頃起こるかは分からないけど。
142デフォルトの名無しさん:2013/02/12(火) 05:04:57.64
ううむ
143デフォルトの名無しさん:2013/02/13(水) 21:40:41.76
漢字6万字の時は
2011/3/14がグリフの納入期限→2011/5/18にIPAmj明朝検証版公開

今回の変体仮名は
2013/3/18がグリフの納入期限→?
144デフォルトの名無しさん:2013/02/15(金) 00:23:14.23
内部では基本形はもうできあがってんのかな
145デフォルトの名無しさん:2013/02/15(金) 05:11:17.45
入札公告から数えても期限まで80日程
これで200字強か
146デフォルトの名無しさん:2013/02/16(土) 02:33:57.81
外字登録についてご存じの方がいたら教えて下さい。

ドコモの絵文字をサロゲートペアのPUA(15面)に外字登録したいのですが、
フリーのツールなどで可能な方法はありますか?

Windowsの外字エディタではサロゲートペアの領域には外字登録できないので。。。
147デフォルトの名無しさん:2013/02/19(火) 20:17:50.30
>>146
FontForge使えばできるよ
148デフォルトの名無しさん:2013/02/20(水) 06:29:14.37
板の趣旨とまったく関連ないよねこのスレ。
149デフォルトの名無しさん:2013/02/20(水) 10:07:07.44
確かにw


ただ、文字コードの総合スレってどこに行けばいいのかよくわからんのよね。
「PC」に限ったもんでもないと思うし。

広義の「ソフトウェア」として捉えようにも、あそこは実質Windowsアプリ板だし。
150デフォルトの名無しさん:2013/02/20(水) 15:01:12.39
プログラムで扱うデータ構造だからプログラム板で良いのでは
151デフォルトの名無しさん:2013/02/20(水) 22:57:52.15
安岡センセイ荒れてるなあ
http://slashdot.jp/~yasuoka/journal/563428
152デフォルトの名無しさん:2013/02/20(水) 23:29:24.54
IVSに言及されてるのにUCS-2がdeprecatedになったことや
UCS-4の範囲が制限されてることは知らなかったり
色々とちぐはぐな論文だこと
153デフォルトの名無しさん:2013/02/21(木) 09:22:44.08
H立は研究所がすごいという感があるが、F通の研究所はなんかこういうのばかりという印象があるなw
154デフォルトの名無しさん:2013/02/21(木) 11:29:36.87
不治痛は官公庁がらみの仕事が多くて
文字setにうるさい割に能力は適当な希ガス
155デフォルトの名無しさん:2013/02/21(木) 16:38:53.44
>現時点での常用漢字と人名用漢字がどうなっているかぐらい

つまり、どうなっているの?
156デフォルトの名無しさん:2013/02/21(木) 17:34:48.82
「富士通総研経済研究所研究レポート」ってエッセイ集でしょ?
157デフォルトの名無しさん:2013/02/22(金) 11:01:29.14
>>156
査読とかが無いみたいだから
こんなのが出てくるんだな
158デフォルトの名無しさん:2013/02/22(金) 11:38:37.20
大学でいうと紀要のようなもんだな。玉石。
10年ぐらい前にも紀要論文で、同レベルの文字コード論があったという記憶がある。
159デフォルトの名無しさん:2013/02/22(金) 18:10:31.98
安岡センセイが暴走中
http://opendata.openlabs.go.jp/ja/idea/00089/
160デフォルトの名無しさん:2013/02/22(金) 19:29:07.64
00091の方が大事だな
161デフォルトの名無しさん:2013/02/22(金) 19:37:59.78
>>160
マイクロソフトの中の人?
162デフォルトの名無しさん:2013/02/22(金) 19:40:00.44
それっぽいね。同姓同名の他人じゃなければ
163デフォルトの名無しさん:2013/02/23(土) 01:49:18.18
00089も00091もコメントついてるけど
何かやり取りがちぐはぐな気が
164デフォルトの名無しさん:2013/02/23(土) 15:04:59.97
うむ
165デフォルトの名無しさん:2013/02/23(土) 18:05:17.50
>>147
ありがとうございます。
FontForge(fontforge-cygwin_2012_08_02)をインストールしてみました。
Webで調べて、フォントからフォントへのコピーの方法は分かったのですが
保存しても0バイトになってしまい、ただいま格闘中です。
166デフォルトの名無しさん:2013/02/23(土) 18:15:58.01
セキュリティで言えば高木先生に相当するのがその安岡って人?
167デフォルトの名無しさん:2013/02/23(土) 18:31:33.20
半年ROMれ
168デフォルトの名無しさん:2013/02/23(土) 21:31:22.08
あまり深く考えたことなかったけど
東アジア人文情報学研究センターって何なんだろうな
図書館の凄い版?
169デフォルトの名無しさん:2013/02/24(日) 16:48:38.49
Unicode IVS/IVD入門 ―JIS規格の歴史、異体字問題の解説から、Windows 8での対応方法まで
とかいう本がでるらしいのだが

これは買いですか?糞ですか?
170デフォルトの名無しさん:2013/02/24(日) 17:12:09.85
「UnicodeによるJIS X0213実装入門」の続編みたいな内容でしょ。
新たに加わった著者はUnicodeの人だよね。
171デフォルトの名無しさん:2013/02/24(日) 17:21:41.13
Unicode対応って言うか
Windowsは早くシステムロケール
UTF8に対応してケロ
172デフォルトの名無しさん:2013/02/24(日) 17:54:27.91
コマンドプロンプトはutf-8を選べるようになったの?
173デフォルトの名無しさん:2013/02/24(日) 18:05:47.70
(´‥∀‥`)ほう
174デフォルトの名無しさん:2013/02/24(日) 19:26:36.90
175デフォルトの名無しさん:2013/02/24(日) 19:48:59.90
>>171
むりぽ
blogs.msdn.com/b/michkap/archive/2006/10/11/816996.aspx
176デフォルトの名無しさん:2013/02/24(日) 19:54:52.45
今出来ないのはわかるけど
将来にわたって無理?
177デフォルトの名無しさん:2013/02/24(日) 20:32:51.83
最後の一節はかなり悲観的ですなあ
7年前の記事ではあるけど
178デフォルトの名無しさん:2013/02/25(月) 08:15:24.93
別に全部サポートせんでも
UTF8にする選択肢だけ
用意すりゃええが
179デフォルトの名無しさん:2013/02/25(月) 19:19:03.04
UTF-8にしたら、サイズが1.5倍になるんでしょ。アホかとおもう
180デフォルトの名無しさん:2013/02/25(月) 21:34:04.45
Unicode使いたくてWindows使ってる人は何かの修行ですか?
posixサポートも廃止なんだからUTF-8サポートなんて絶望的だろ。
181デフォルトの名無しさん:2013/02/25(月) 21:43:58.01
Windowsはコンソールを完全にUTF-16仕様にしてくれるだけでいいんだけどな
SJISはcommand.comで対応することにして
182デフォルトの名無しさん:2013/02/25(月) 22:01:45.41
というかいい加減にShift JIS捨てろとw
183デフォルトの名無しさん:2013/02/25(月) 22:09:34.90
とりあえずcygwinで満足する努力が必要。
184デフォルトの名無しさん:2013/02/25(月) 22:11:30.84
Shift_JISですらないよ、未だにWindows-31J
文字化けするのはUnicode使う方が悪いw
185デフォルトの名無しさん:2013/02/26(火) 02:35:23.96
マジ同感。
文字化けはWindwosのせい
186146:2013/02/26(火) 22:22:56.55
>>147
できました!ありがとうございました!
187デフォルトの名無しさん:2013/02/26(火) 22:48:20.68
minttyいいね
188デフォルトの名無しさん:2013/02/28(木) 22:10:27.25
JEFのコードブックって
まだ手に入るの?
189デフォルトの名無しさん:2013/03/08(金) 22:20:35.27
(´・ω・`)?
190デフォルトの名無しさん:2013/03/25(月) 15:59:14.92
変体仮名グリフの納入が終わったはずだが、さて。
191デフォルトの名無しさん:2013/03/27(水) 23:17:38.52
和文モールスと武雄市図書館が
つながるとは思わんかった
192デフォルトの名無しさん:2013/04/01(月) 16:40:23.23
住基文字完全変更って大変だな
http://slashdot.jp/story/13/03/31/163258/
193デフォルトの名無しさん:2013/04/01(月) 17:35:25.64
4/1やっていいのは午前中までだ
194デフォルトの名無しさん:2013/04/01(月) 22:34:59.80
スラドなんて年中エイプリルフールだろ
195デフォルトの名無しさん:2013/04/01(月) 22:41:06.50
失礼な
昔の東スポよりマシだぞ
196デフォルトの名無しさん:2013/04/03(水) 09:37:09.74
エイプリルフールじゃなかったのか?

>住基ネットで文字化け 231市町村の1万人分 プログラムミス
http://www.asahi.com/shimen/articles/TKY201304020675.html
197デフォルトの名無しさん:2013/04/03(水) 11:09:33.32
今気付いたが今月はもう4月じゃないか
198デフォルトの名無しさん:2013/04/03(水) 12:37:39.49
原発事故で行政はどこも信用できなくなった
199デフォルトの名無しさん:2013/04/03(水) 16:20:46.09
>>198
それまで信用してたなんて奇特な人だね
200デフォルトの名無しさん:2013/04/03(水) 19:09:21.79
得体の知れない文字コードで管理されている個人情報
201デフォルトの名無しさん:2013/04/03(水) 19:26:15.74
>>198
そこで民間企業が作ったユニコードというわけですね。わかります。
202デフォルトの名無しさん:2013/04/04(木) 07:31:01.03
さて
203デフォルトの名無しさん:2013/04/06(土) 15:58:22.34
そんなわけで
204デフォルトの名無しさん:2013/04/06(土) 17:39:03.94
うん
205デフォルトの名無しさん:2013/04/06(土) 18:00:17.69
話題なさすぎワラタ
206デフォルトの名無しさん:2013/04/07(日) 00:33:20.23
Javaのnative2asciiが出すエスケープ変換をC/C++のプログラム中でやりたいのですが
簡単な方法はありますかね?
あ、入力はUTF-8なんですが。

そういえばあれって名前はasciiと言ってるけど実際にはISO 8859-1以外をエスケープ
するという噂を耳にしたんですが...
207デフォルトの名無しさん:2013/04/07(日) 02:33:07.04
>>206
1.UTF-8をUTF-16に変換します
2.80hより大きなコードポイントをエスケープします

ほらできた!
208デフォルトの名無しさん:2013/04/07(日) 02:43:29.97
>>207
んーと、
UTF-8 -> UTF-16はどうしたらいいですかね。何かおすすめのライブラリはあります?
あるいは自前で変換します?
ASCIIより上をエスケープすべきという主張ですね。
あとサロゲートはどうしたらいいんですかね。
できるだけnative2asciiの挙動と一致させたいのですが。
209デフォルトの名無しさん:2013/04/07(日) 02:51:00.36
ttp://www.seiai.ed.jp/sys/text/java/utf8table.html
UTF-8は1〜4バイト(初期の定義では6バイトまで)の可変長コード
00-7x 1バイト文字 US-ASCIIにおなじ
8x,9x,Ax,Bx 多バイト文字の2バイト目以降
Cx,Dx 2バイト文字の開始バイト
Ex 3バイト文字の開始バイト
Fx 4バイト以上の文字の開始バイト

つまり
00-7fは元の文字
c0-ffなら「u」+バイト列をそれぞれ出せばいいわけだろ

UTF-16なんて必要ないな
native2asciiの挙動?
使いもしねえもの知るかよ
210デフォルトの名無しさん:2013/04/07(日) 02:58:03.93
>>208
1.Unicode規格を読みます
2.規格に従い、UTF-8をUTF-32に変換します
3.規格に従い、UTF-32をUTF16にへんかんします。
このとき、サロペも処理します。

ただしJavaがjarで使用するニセUTF-8が入力の場合は
UTF-8を直接UTF-16に変換する必要があります。

ほらできた!
211デフォルトの名無しさん:2013/04/07(日) 04:27:18.60
# cl引数を変換
--
#include <stdio.h>
#include <string.h>

int main(int argc, char *argv[]) {
unsigned char* b; unsigned char* h = argv[1];
int i, hlen; hlen = strlen(h); memcpy(b, h, hlen);
printf("ori:\n%s\nuni:\n",h);
for(i = 0; i < hlen; i++) {
if ((*(h + i)) < 128) {/* [0-7]*なら元の文字 */
printf("%c", *(h + i));
}else{
if ((*(h + i)) > 191) { printf("\\u"); }/* [cdef]*なら\u追加 */
printf("%02X", *(h + i));
}
}
printf("\n");
}
--
>na r元の8文字
ori:
r元の8文字
uni:
r\uE58583\uE381AE8\uE69687\uE5AD97
212デフォルトの名無しさん:2013/04/07(日) 04:27:30.15
馬鹿には無理
213デフォルトの名無しさん:2013/04/07(日) 05:39:51.63
>>208 適当に書いてみた。こんな感じ。
http://ideone.com/2StvbL
214213:2013/04/07(日) 10:01:46.67
Windows限定ならこんな漢字
------------
#include <cstdio>
#include <vector>
#include <Windows.h>
using namespace std;

int main()
{
 char const *p_org="\xE3\x81\xBE\xE3\x82\x93\xE3\x81\x93z"; // UTF-8文字列。

 auto len = ::MultiByteToWideChar(65001, MB_ERR_INVALID_CHARS, p_org, -1, nullptr, 0);
 vector<wchar_t> utf16s(len);
 ::MultiByteToWideChar(65001, MB_ERR_INVALID_CHARS, p_org, -1, &utf16s[0], (int)utf16s.size());

 for ( auto &ch : utf16s )
 {
  if ( ch == 0 )
   break;
  else if ( ch < 0x80 )
   printf("%c", (int)(ch));
  else
   printf("\\u%04x", (int)(ch));
 }
}
215デフォルトの名無しさん:2013/04/09(火) 03:27:39.08
どうせ、UTF8とかサロゲートペアとか順番に解釈しないといけなくなるんだったら、
コードページ切り替え方式でよかったのにな
216デフォルトの名無しさん:2013/04/09(火) 17:21:58.60
ブラジルポルトガル語 と ポルトガルポルトガル語の
アルファベットは同じでしょうか??

ポルトガルポルトガル語のフォントでブラジルポルトガル語が
表現できるのかを調べています。

ご存知の方回答よろしくお願いします。
217デフォルトの名無しさん:2013/04/09(火) 17:34:57.34
同じなので表示できます。
218デフォルトの名無しさん:2013/04/09(火) 17:35:46.30
>>217
 回答ありがとうございました。m(__)m
219デフォルトの名無しさん:2013/04/09(火) 17:59:23.08
そーゆーのの違いて基本colorとcolourみたいなもんだろ
220デフォルトの名無しさん:2013/04/09(火) 18:04:39.90
>>219
 やっぱり、スペルと発音だけの違いですか。
221デフォルトの名無しさん:2013/04/09(火) 20:05:31.51
厳密に知りたいならポルトガル語 正書法でググるよろし
222デフォルトの名無しさん:2013/04/10(水) 12:13:56.89
>>219
そうか?繁体字と簡体字くらいの違いはあるかも知れんぞ
223デフォルトの名無しさん:2013/04/12(金) 15:20:03.40
なんかそういうのあったな。
ダイアクリティカルマークだったか合字だったか忘れたけど、
コードポイントは同じでも国によって微妙なデザインを使い分けないと現地民にプギャられるってやつ。
224デフォルトの名無しさん:2013/04/12(金) 21:42:52.95
ちょっと点の向きや形が違うと言って大騒ぎ。
しまいにゃ文字幅がどうこう言い出す始末。
そんな現地民が東アジア方面にいるとかいないとか
225デフォルトの名無しさん:2013/04/12(金) 22:15:53.06
ピンインの二声・四声の話かな?
どれぐらい現地民が気にしてるのかわからないけど。
226デフォルトの名無しさん:2013/04/13(土) 02:20:28.57
その国には "立" の一画目が横か縦かを真面目な学問として
研究して金をもらっている連中もいるらしい
227デフォルトの名無しさん:2013/04/13(土) 03:44:23.55
あまり面白い皮肉じゃないな
228デフォルトの名無しさん:2013/04/13(土) 23:10:53.74
研究してる奴らって立たなくなった奴ばっかりなんだろ
229デフォルトの名無しさん:2013/04/15(月) 12:09:40.57
>>226
「龍」の方がおもしろいな
230デフォルトの名無しさん:2013/04/15(月) 21:27:01.56
「正しい字形」は横なのに縦で教えるダブスタ大杉
231デフォルトの名無しさん:2013/04/15(月) 23:43:58.32
>>208
iconv
232デフォルトの名無しさん:2013/04/16(火) 04:06:42.93
>>209
>UTF-16なんて必要ないな
InDesignというDTPソフトにunicodeテキストを配置する場合、
UTF-16BEなんてもんにしなくちゃいけないんざますの。
233デフォルトの名無しさん:2013/04/16(火) 04:58:55.88
>>209はutf8を\u****形式に変換する話してるのに>>232
知障ですか?
234デフォルトの名無しさん:2013/04/16(火) 06:20:11.15
要るんです、という話をしただけですのよ。ちなみにわたくしエディタで変換してますわ。
235デフォルトの名無しさん:2013/04/28(日) 14:29:25.02
そして誰も
236デフォルトの名無しさん:2013/04/29(月) 22:33:06.77
今はもう
237デフォルトの名無しさん:2013/04/30(火) 03:22:01.47
初夏
238デフォルトの名無しさん:2013/05/01(水) 15:50:42.12
5月か
早いな
239デフォルトの名無しさん:2013/05/01(水) 23:51:25.22
アレってどうなったんだっけ
240デフォルトの名無しさん:2013/05/03(金) 22:41:27.92
ドレ?
241デフォルトの名無しさん:2013/05/03(金) 23:27:41.29
何の&#x30FF;?
242デフォルトの名無しさん:2013/05/04(土) 19:08:59.48
コト点でないのか
243デフォルトの名無しさん:2013/05/05(日) 00:20:52.26
BBS_UNICODE=passは万能ではないってこと?
244デフォルトの名無しさん:2013/05/05(日) 00:47:04.03
てすと ヿ
245デフォルトの名無しさん:2013/05/05(日) 11:06:17.17
数値参照だと出るの?ヿ
246デフォルトの名無しさん:2013/05/05(日) 13:44:32.35
241は & が変換されてる
247デフォルトの名無しさん:2013/05/05(日) 17:19:43.57
テスト
&#x30FF;
248デフォルトの名無しさん:2013/05/05(日) 17:20:33.68
変換されるなあ
249デフォルトの名無しさん:2013/05/10(金) 02:10:52.50
Open2chの文字コードは、UTF-8だ

<html lang="ja">
<head>
<title>宝くじ@open2ch掲示板</title><style>body{ margin:0; padding:0;}</style>
<link rel="alternate" type="application/rss+xml" title="RSS" href="http://http://engawa.open2ch.net/loto/index.rdf" />
<link rel="alternate" type="application/atom+xml" title="Atom" href="http://http://engawa.open2ch.net/loto/atom.xml" />
<script type="text/javascript" src="/lib/jquery/jquery-1.7.2.min.js"></script>
<script type="text/javascript" src="/lib/common.js?v2"></script>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<link href="/lib/main.css?x" type="text/css" rel="stylesheet" />
</head><body text=#000000 link=#0000FF alink=#FF0000 vlink=#660099 background=/image/ba.gif>
250デフォルトの名無しさん:2013/05/12(日) 00:29:20.32
Old Hungarianは泥沼だな…
251デフォルトの名無しさん:2013/05/12(日) 15:25:57.78
よく知らない人でもわかるように簡単な解説希望
252デフォルトの名無しさん:2013/05/12(日) 23:40:04.51
Eversonが昔出した提案を前進させようとしたらハンガリー国内よりカウンター提案が
出てきた
そっちは稚拙だったのでEversonペースで進みかけたけど、カウンター提案者が
ハンガリーNBの座を獲得したので意向を無視できなくなった

以後ハンガリー国内で支持が割れて、この度ハンガリー国内から「今のEversonベースの
符号化案のまま行ってくれ」という署名リスト(N4420)と、「今の符号化案を投票から
外せ」という署名リスト(N4422)が届いた
253デフォルトの名無しさん:2013/05/12(日) 23:53:19.67
おっおおう…頭抱えたくなる状況だな
254デフォルトの名無しさん:2013/05/13(月) 12:17:49.20
なんか難しい話だな。
n4368(Everson)とn4367の戦いってことみたいだけど、
一例にdzの話を読むと、(梯子zの横に棒がついた文字)
これはもともとold hungerianになかった音/文字で、
n4368は現代では使わないから必要ないって立場(n4368 1.2)
n4367はこれは単なるd+zじゃないんだよ(n4367 5.4.1)

読み込めてないけど、
n4368は現代ハンガリー語に対応する正書法の提案も含まれていて、
n4367は歴史的な経緯を踏まえた提案になっている感じか。
たぶんold hungerianを、現代に復活させようとしている派(n4368)と、
歴史的な文字として登録しようとしている派(n4367)の戦いじゃないか。
n4420の"everyday use"とか、n4368 1.2の後半読むと。
学校でold hungerianを使わせる計画があるみたいだ。
255デフォルトの名無しさん:2013/05/13(月) 13:54:42.87
こういうのっていろんな分野で政治行政と歩調を合わせないといけないからほんと難しいよね。
単に自分(規格がらみ)が各方面と一対一で調整するだけじゃなくて、そいつら同士の橋渡しまで面倒見ないと何もまとまらないし。
256デフォルトの名無しさん:2013/05/13(月) 17:37:20.80
254です。
2,3時間読んでみただけで言うのも無責任だけど、
n4367の方がよさそうな気がするなあ。
Everson版は目的を限定しすぎてて、文字数も相当少ない。
かと言って合字が定義されてるわけでもない。
最初に網羅的にやっとかないと後で公開することになるはず。
あと、n4422によれば間違いも多いと書かれている。
実際どうか検証する知識はないけど、
n4367の方が引用している資料も多いし、一文字に対する検証も徹底的。
Eversonさんは膨大なスクリプトについてUnicodeに多大な貢献があるのは事実だけど、
専門家の意見も謙虚に聴くべきではないか?
まあUnicode専門家の意見も尊重しないといけないがね。
257デフォルトの名無しさん:2013/05/13(月) 22:34:08.76
>最初に網羅的にやっとかないと

日本人が言うとすごい説得力あるよねこれ
258デフォルトの名無しさん:2013/05/24(金) 01:09:40.80 ID:JuHX2I0P!
259デフォルトの名無しさん:2013/05/24(金) 11:45:41.18
>>252は勘違いで、Everson案がUnicode的稚拙さで、
専門家が本格的な改正案を出してきたってところみたいだな。
260デフォルトの名無しさん:2013/06/01(土) 11:09:43.05
そういうものなのかね
261デフォルトの名無しさん:2013/06/24(月) 03:10:36.60
過疎ってるな
262デフォルトの名無しさん:2013/06/24(月) 06:46:38.91
ねたが無いからね
263デフォルトの名無しさん:2013/06/24(月) 15:04:34.93
坂村健みたいな逸材が必要とされている
264デフォルトの名無しさん:2013/06/27(木) 16:58:52.16
http://d.hatena.ne.jp/akane_neko/20130621/1371766405
これ読む限りだと安岡センセイもネタ切れなのかと
265デフォルトの名無しさん:2013/06/29(土) 23:43:50.69
安岡は基地外だから もう引退した方がいい
266デフォルトの名無しさん:2013/06/30(日) 02:05:47.38
最近のWG2の文書の中だとcedillaと下付commaの件が面白いな
結局下付commaの方は別途符号化することになったようだけど
267デフォルトの名無しさん:2013/06/30(日) 13:12:55.51
>>263 >>265 まだ基地外TRON信者いたんだ
268デフォルトの名無しさん:2013/07/02(火) NY:AN:NY.AN
さて
269デフォルトの名無しさん:2013/07/02(火) NY:AN:NY.AN
来週の
270デフォルトの名無しさん:2013/07/02(火) NY:AN:NY.AN
キテレツ大百科は
271デフォルトの名無しさん:2013/07/02(火) NY:AN:NY.AN
ツレテキ
272デフォルトの名無しさん:2013/07/10(水) NY:AN:NY.AN
スレが凍りついているわけだが
273デフォルトの名無しさん:2013/07/10(水) NY:AN:NY.AN
unicodeの歴史について勉強しようと思ったら初めからいきなり2バイト固定にしようとしていてズっこけた。
当時日本人はだれも突っ込まなかったんだろうか
あるいは当時のマシンスペックとの妥協とか政治的な何かとか理由があった?
274デフォルトの名無しさん:2013/07/11(木) NY:AN:NY.AN
いろんな人が突っ込んでたよ
275デフォルトの名無しさん:2013/07/11(木) NY:AN:NY.AN
スペックもあるだろうけどメモリが高価で容量も小さかったせいじゃないかな
当初は日常で使う字だけを符号化して特殊な字や古代の字はPUAを使わせるつもりだったとか
過去スレでそんな話題してるところがあったはず
276デフォルトの名無しさん:2013/07/11(木) NY:AN:NY.AN
そもそもUnicodeが使われる日が来るなんてみんな本気で信じて無かった
277デフォルトの名無しさん:2013/07/11(木) NY:AN:NY.AN
漢字ROMと文字一覧表(本?)でおk
278デフォルトの名無しさん:2013/07/11(木) NY:AN:NY.AN
ちょっと(かなり?)スレ違いなんだけど、
発音記号もそのうちIPA(国際音声記号)に統一されるのかしら。
279デフォルトの名無しさん:2013/07/11(木) NY:AN:NY.AN
汎用のものとしてはIPAを改正していくのが正攻法でしょう。
2005年にも唇歯はじき音が追加。
280デフォルトの名無しさん:2013/07/12(金) NY:AN:NY.AN
代用になるようなものもないからねえ…
281デフォルトの名無しさん:2013/07/13(土) NY:AN:NY.AN
その場しのぎの積み重ねでこんがらがった醜さはUnicodeよりも先輩だな
282デフォルトの名無しさん:2013/07/23(火) NY:AN:NY.AN
古文書がIPAで表されるのを想像……できん
283デフォルトの名無しさん:2013/07/23(火) NY:AN:NY.AN
想像してもいいんだぜ?
284デフォルトの名無しさん:2013/07/27(土) NY:AN:NY.AN
a%20%20%20a
285デフォルトの名無しさん:2013/07/28(日) NY:AN:NY.AN
(´・ω・`)?
286デフォルトの名無しさん:2013/08/01(木) NY:AN:NY.AN
ここ数ヶ月は話題なしか
287デフォルトの名無しさん:2013/08/14(水) NY:AN:NY.AN
http://www.itscj.ipsj.or.jp/domestic/sc02/hanyo-denshi/20100331/

最終更新日:2013年7月26日

情報規格調査会Webサイトの改ざんについて


6月17日(月)、情報規格調査会のサイト(http://www.itscj.ipsj.or.jp)が不
正と思われるアクセスを受け改ざんされたことを確認いたしましたので、直ち
に当該サイトを停止いたしました。

その後の調査で当該サイトに不正な javascript が埋め込まれていることを確
認いたしました。

6月15日(土)箸キ6月17日(月)に当該サイトを閲覧された方は、直ちに最新のウイ
ルス対策ソフトで感染の確認と駆除を実施いただきますよう、重ねてお願いい
たします。

現在、セキュリティ専門会社に詳細な分析を依頼しており、閲覧された皆様に
新たな対策が必要となりましたとき、或いは、追加情報が得られた場合には、
改めて情報規格調査会ホームページにてご案内いたします。

当該サイトを閲覧された方、また、関係者の方々にはに多大なご迷惑をおかけ
しましたことを深くお詫び申し上げます。不正アクセスへの対策を講じた後、
安全性を確認した上で再開の予定ですので、今しばらくお待ち頂きますようお
願いいたします。

情報規格調査会 委員長 伊藤 智
288デフォルトの名無しさん:2013/08/14(水) NY:AN:NY.AN
ちょっと笑った
289デフォルトの名無しさん:2013/08/20(火) NY:AN:NY.AN
紺屋の白袴
290デフォルトの名無しさん:2013/08/20(火) NY:AN:NY.AN
違うか、医者の不養生かな
291デフォルトの名無しさん:2013/08/20(火) NY:AN:NY.AN
おまわりさんが痴漢
292デフォルトの名無しさん:2013/08/20(火) NY:AN:NY.AN
そうか、そっちか
293デフォルトの名無しさん:2013/09/01(日) 02:40:49.67
さて
294 【大吉】 :2013/09/01(日) 13:43:28.79
9月になりましたが
295デフォルトの名無しさん:2013/09/01(日) 13:50:07.64
2ちゃん落ちるのって今日だっけ?
296デフォルトの名無しさん:2013/09/01(日) 15:40:01.66
うそなんでしょう?
297デフォルトの名無しさん:2013/09/01(日) 17:59:04.17
よく見ろ 3ちゃんねるに変わってるだろ
298デフォルトの名無しさん:2013/09/01(日) 18:34:41.38
 _, ._
(; ゚ _゚ ) …
299デフォルトの名無しさん:2013/09/02(月) 03:09:55.31
>>297
めったなことを言うんじゃありません。
頑張って見る>>298のような素直な人もいるんだから。
って、勝手に文字コードの数字がズレたら嫌だな。
通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。
300デフォルトの名無しさん:2013/09/08(日) 21:02:59.58
>通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。
EBCDICディスってるのか
301デフォルトの名無しさん:2013/09/08(日) 21:31:07.18
ディスられて当然のゴミコードがどうかした?
302デフォルトの名無しさん:2013/09/09(月) 00:08:59.56
UNICODEも添字系が無茶苦茶
303デフォルトの名無しさん:2013/09/09(月) 11:58:12.44
添字系?
304デフォルトの名無しさん:2013/09/09(月) 18:23:36.13
字は添えるだけ。
305デフォルトの名無しさん:2013/09/09(月) 20:26:20.42
Superscripts and Subscripts
306デフォルトの名無しさん:2013/09/09(月) 21:20:07.96
http://www.unicode.org/charts/PDF/U2070.pdf
これか。なるほどこれひどい
307デフォルトの名無しさん:2013/09/10(火) 18:37:08.00
小さすぎて読めない
308デフォルトの名無しさん:2013/09/10(火) 20:39:14.29
なんでiが1の位置にあるんだろう?

「数字の1を意味する上付き文字」を全部統合するつもりだった?
309デフォルトの名無しさん:2013/09/10(火) 21:22:03.40
SuperScript 1〜3は別の場所にある。
2: U+00B2
3: U+00B3
1: U+00B9
310デフォルトの名無しさん:2013/09/10(火) 21:25:05.86
oh....
311デフォルトの名無しさん:2013/09/11(水) 04:58:45.13
>>307ちゃんとダウンロードして拡大して見ろ>私 ゴメン
312デフォルトの名無しさん:2013/09/11(水) 09:54:06.83
まあ、前後とか上中下とか甲乙丙丁とかI II III IV V VI VII VIII IX Xとか、
特定の用法においてナンバリングに使われる文字も位置はばらばらで、
こういうのを名前に含むファイルをソートするとうわあああってなるから
実用上は似たようなもんかもしれん
313デフォルトの名無しさん:2013/09/11(水) 10:22:47.43
確かに前後はいつも逆になって鬱陶しい
314デフォルトの名無しさん:2013/09/12(木) 22:36:56.49
一九五三四七十二八六

結構イラッとくる
315デフォルトの名無しさん:2013/09/12(木) 22:54:00.51
WikipediaのCollationのページに対応する日本語ページってないんだね
316デフォルトの名無しさん:2013/09/13(金) 04:14:55.98
欲しければ作れば?
317デフォルトの名無しさん:2013/09/16(月) 07:42:40.82
>>314
これぐらいは順番に並べて欲しいわなあ
318デフォルトの名無しさん:2013/09/16(月) 11:45:02.26
>>314 >>317
だれが決めたん?
センスないね
319デフォルトの名無しさん:2013/09/16(月) 12:18:33.64
あほかい。
漢字の読みの順に並んでいるんだから、寧ろ「一二三四五六七八九」の方がいらっと来るわ。
320デフォルトの名無しさん:2013/09/16(月) 12:23:33.36
えぇっ!?
321デフォルトの名無しさん:2013/09/16(月) 13:04:28.81
>>319
確かに
322デフォルトの名無しさん:2013/09/16(月) 13:29:36.80
読み順で並んでるメリットって何?
323デフォルトの名無しさん:2013/09/16(月) 13:46:41.82
読み順以外を選ぶメリットって何?
324デフォルトの名無しさん:2013/09/16(月) 14:16:25.26
読み順というか文字コード順でソートしているからこうなるので、
漢数字がいい感じで並ぶ順を定義して実装して使えばいい
325デフォルトの名無しさん:2013/09/17(火) 01:24:13.67
メリットって…
他のところが音読み順なのにそこだけ変えるほうがおかしいだろ
というか>>314 >>317 >>322あたりはもしかしてこの十文字が連続して並んでるとか思ってるんじゃないだろうな
326デフォルトの名無しさん:2013/09/17(火) 02:23:12.95
CJK Numeralsとかの別枠にしてほしかったってことでしょ
327デフォルトの名無しさん:2013/09/17(火) 02:32:41.19
訓呉音漢音の優先順位あやふやにローマ字で並べてある
ような始末におえん状況よりはマシでしょ
328デフォルトの名無しさん:2013/09/17(火) 02:38:15.05
Unicodeの漢字って日本読み順なの?
329デフォルトの名無しさん:2013/09/17(火) 03:24:48.54
読み順を選べば読み順、画数順を選べば画数順、なんじゃないの?
330デフォルトの名無しさん:2013/09/17(火) 03:57:19.63
(´‥∀‥`)?
331デフォルトの名無しさん:2013/09/17(火) 05:26:00.76
>>329は見なかったことにしといて
332デフォルトの名無しさん:2013/09/17(火) 14:11:11.79
(´・‥∀・‥`)?
333デフォルトの名無しさん:2013/09/17(火) 17:35:55.62
>>314 はJIS順なのかな
Unicode順なら 一七三九二五八六十四
334デフォルトの名無しさん:2013/09/17(火) 18:49:54.69
漢数字を文字コードだけで機械的にソートするとか、どんだけ
335デフォルトの名無しさん:2013/09/17(火) 19:46:20.12
0100
0100
〇一〇〇
零百
十〇
〇壱〇〇
最適解が欧文の比じゃない数有るからなあ
336デフォルトの名無しさん:2013/09/17(火) 20:49:55.10
そういうのはフリガナとかヨミガナとかのソートの種を入れますし。
337デフォルトの名無しさん:2013/09/17(火) 21:07:54.19
1024*1024のビットマップフォントにして
黒の数でソートしようず
338デフォルトの名無しさん:2013/09/17(火) 21:56:58.21
それが黒だと誰が決めた
339デフォルトの名無しさん:2013/09/17(火) 22:02:47.20
黄色でもいいけどよ
モノクロ二値にすんだよハゲっが
340デフォルトの名無しさん:2013/09/17(火) 23:58:51.49
意味ない
341デフォルトの名無しさん:2013/09/18(水) 00:06:35.40
yes
342デフォルトの名無しさん:2013/09/18(水) 02:19:26.91
文字コードについて説明してある本が古くて使いものにならない、ってことになるとは、
最初に書いた人は想像してなかったろうな
343デフォルトの名無しさん:2013/09/18(水) 03:05:07.93
>>328
康熙字典の部首順。
だから漢数字が一七三九二五八六十四の順になったりする。
344デフォルトの名無しさん:2013/09/18(水) 03:21:07.49
なるほど部首か
345デフォルトの名無しさん:2013/09/21(土) 00:40:43.90
>>342
なわけねえべ。
346デフォルトの名無しさん:2013/09/23(月) 20:39:39.37
950 名前:あまチゴ ◆TIGOI/DrzHH9 投稿日:2013/09/23(月) 18:35:39.06 ID:i/lAwQriP
&#x9A38;豚か。


951 名前:名無しの報告 投稿日:2013/09/23(月) 18:45:49.59 ID:21igwRGo0
>>950
文字実体参照、16進の数値文字参照を全板で禁止
数値文字参照は10進のみ、BBS_UNICODE=passの板で可


952 名前:あまチゴ ◆TIGOI/DrzHH9 投稿日:2013/09/23(月) 19:38:39.06 ID:i/lAwQriP
せん馬のせんがぁあああ


953 名前:名無しの報告 投稿日:2013/09/23(月) 19:49:53.10 ID:P916m9xr0
せん馬

去勢された牡馬の性別を表す競馬用語。センとも書かれる。
せんは馬に扇で、一部の雑誌やサイトでは騙という字が当てられていることがあるが、それは間違い。


http://qb5.2ch.net/test/read.cgi/sec2chd/1379117300/951 【規制議論板】質問でも雑談でもOKのスレッド★359
347デフォルトの名無しさん:2013/09/23(月) 22:53:29.07
何で10進参照だけ生き残ったの?
348デフォルトの名無しさん:2013/09/24(火) 08:49:43.08
2chの運営(=バカ)にまともな理屈を期待しても無駄
349デフォルトの名無しさん:2013/09/28(土) 07:58:37.70
この本屋って新宿駅近くにあるんだけど
部屋の区割り自体が迷路のように入り組んでいて
火事で停電になったら出口判らず逃げ遅れて死者多数出ると思う
http://www.dotup.org/uploda/www.dotup.org4535669.jpg
350デフォルトの名無しさん:2013/09/28(土) 11:57:32.13
何?唐突に怖いんだけど…よく見たら心霊系、みたいなネタ画像?
351デフォルトの名無しさん:2013/09/28(土) 15:20:17.67
文字コード本の棚
352デフォルトの名無しさん:2013/09/28(土) 16:41:06.05
どこだよ
ブックファーストか?
353デフォルトの名無しさん:2013/09/28(土) 16:58:52.10
ジャンク堂書店?
354デフォルトの名無しさん:2013/09/28(土) 20:22:57.57
コクーンのB1やね
355デフォルトの名無しさん:2013/09/30(月) 17:14:26.45
どうやらこのスレの住人は5人+1人のようです。
356デフォルトの名無しさん:2013/09/30(月) 18:39:30.69
why?
357デフォルトの名無しさん:2013/09/30(月) 19:02:26.98
それはきっと誤認
358デフォルトの名無しさん:2013/09/30(月) 19:44:52.52
いや六人だろ
359デフォルトの名無しさん:2013/10/01(火) 07:46:21.47
10月ですね
360 【大吉】 :2013/10/01(火) 08:08:36.28
もう今年も僅かですね
361デフォルトの名無しさん:2013/10/01(火) 08:34:07.82
あと11月と12月しか残ってないなんて!
362デフォルトの名無しさん:2013/10/06(日) 11:59:55.05
てす
363デフォルトの名無しさん:2013/10/10(木) 22:28:23.40
『歴博』No.180 けっこうおもしろかった
364デフォルトの名無しさん:2013/10/10(木) 22:36:55.30
ここは基地外安岡信者が教祖を持ち上げるスレですね。
安岡用語でレスしないで下さい。
365デフォルトの名無しさん:2013/10/11(金) 10:24:30.38
基地外TRON信者はOS板に帰れ
366デフォルトの名無しさん:2013/10/11(金) 12:30:47.63
>>363のように安岡の取り巻きしか理解できない
レスをする方が基地外ではないかと
367デフォルトの名無しさん:2013/10/11(金) 12:33:53.50
数日ぶりに書き込みがあったと思えばいきなり争いごとか
368デフォルトの名無しさん:2013/10/11(金) 13:53:42.69
『歴博』No.180 [特集]文字とコンピュータ2013〜文字コードは踊る〜
> 鈴木卓治:文字とコンピュータと人間と 
> 安岡孝一:日本の文字コードの半世紀−国際社会との軋轢を越えて−
> 小形克宏:Windows外字と、その互換性をめぐる争い
> 川幡太一:異体字とIVS (異体字シーケンス)
> 上地宏一:グリフウィキ−あらゆる漢字・異体字を集積・共有する文字字形データベース
> 高田智和:コンピュータで書き表せる地名漢字
> 狩野宏樹:(インタビュー)フォントとIVS〜フォントベンダーの立場から〜
369デフォルトの名無しさん:2013/10/11(金) 13:57:13.42
>>368
安岡の取り巻きしかいないだろ
370デフォルトの名無しさん:2013/10/11(金) 18:24:19.95
単なる文字コード特集に見える
371デフォルトの名無しさん:2013/10/11(金) 21:55:32.62
>>368
http://www.book61.co.jp/book.php/N07886
これか。定価560円ってのは、高いのか安いのか。
372デフォルトの名無しさん:2013/10/11(金) 22:08:25.63
>Windows外字と、その互換性をめぐる争い
丸数字とか時計文字とか?
373デフォルトの名無しさん:2013/10/12(土) 12:21:44.57
>>372
「@」とか「_」とか「」とか「~」とか
374デフォルトの名無しさん:2013/10/12(土) 12:24:00.80
@
JISでシフトJISに定義された文字がどうかしましたか?
375デフォルトの名無しさん:2013/10/12(土) 20:16:36.94
(´‥∀‥`)?
376デフォルトの名無しさん:2013/10/13(日) 00:59:36.46
3点リーダやダーシには、いまだに悩まされてるわ
377デフォルトの名無しさん:2013/10/13(日) 01:23:39.24
378デフォルトの名無しさん:2013/10/13(日) 03:29:03.11
判ってないな
バベルの塔の逸話は
争ってないで協力しろって意味だよ
379デフォルトの名無しさん:2013/10/13(日) 04:20:47.49
できる人がしてください。奴隷は言いなりです。
380デフォルトの名無しさん:2013/10/15(火) 21:24:01.50
さて、台風が来るわけだが
381デフォルトの名無しさん:2013/10/15(火) 22:48:23.76
買ってきたコロッケをコード番号順に並べ換えてみようか。
ここは雑談スレじゃねえよ>俺
382デフォルトの名無しさん:2013/10/16(水) 19:35:44.13
さて、台風が行ってしまったわけだが
383デフォルトの名無しさん:2013/10/16(水) 23:58:48.34
Unicode6.3リリースされたけど誰も話題にしないね。
384デフォルトの名無しさん:2013/10/17(木) 00:18:02.40
何だっけ?
385デフォルトの名無しさん:2013/10/17(木) 00:32:13.34
んー、7.0.0が出たらネタも沢山あるが...
386デフォルトの名無しさん:2013/10/17(木) 22:06:30.58
文字の追加は6.2の時みたいにかなり少ないけどStandardized Variantsに互換漢字に対応するのが追加されたんだっけ。
387デフォルトの名無しさん:2013/10/17(木) 22:30:34.91
ああ、例のやつか
388デフォルトの名無しさん:2013/10/18(金) 23:50:33.84
ただでさえAdobe-Japan1と汎用電子でVSが分けられて問題になってるのにさらに混乱をもたらす事になりそうだ。
例えば「海」の旧字体はこれまでの6D77 E0100(Adobe-Japan1)と6D77 E0103(汎用電子)で表せてたが、更に互換漢字FA45の置換として6D77 FE00が追加されて異体字シーケンスが3通りになってしまったんだな。

あと「あれ?漢字の場合BMPのVSは使わないんじゃなかったっけ?」って言う人に対してちょっと面倒な説明をしないといけなくなったな。
389デフォルトの名無しさん:2013/10/19(土) 05:48:51.52
互換漢字はラウンドトリップ用というのが建前だから
新規文書では使わないのが正解
汎用電子もフォントがIPAmjと花園くらいしかないから消去法でAJ1
390デフォルトの名無しさん:2013/10/19(土) 23:57:56.88
字体差でなく韓国のKS X 1001の発音の違いによって分離されてる字や台湾のBig5の誤って重複収録された字に対応する互換漢字にまで割り当てられたんだな。
391デフォルトの名無しさん:2013/10/20(日) 01:36:27.33
まるで手書きの戸籍簿のようだ
392デフォルトの名無しさん:2013/10/20(日) 08:57:42.32
OS Xって >>96 みたいなことをできるテキストレンダリングAPIが標準でついてるの?
組版ソフトつかっても、フォントに合わせて手動で設定しないといけないことがままあるのに、どうやってやってるのか気になるわ。
これが本当ならmac買いにいく。
393デフォルトの名無しさん:2013/10/20(日) 10:48:41.05
組版ソフトは何を使ってる?
394デフォルトの名無しさん:2013/10/20(日) 21:07:21.25
>>392=>>96か?
それとも基地外が基地外に反応したのか?
395デフォルトの名無しさん:2013/10/21(月) 10:02:49.98
文字コードに対して幅とかマージンが決められてないんだから、スレ違いだろ。
まあ、そもそもフォントとOSで対応できるとか言ったやつが悪いんだけどな。
文字コード的には他のエンコードとの変換のためのコードは使わない。ということは選択肢は1つしかない。
文字コードは文字列の全体的な見た目まで定義してない。仮にmacできれいに表示されたとしてもそれはたまたまってこと。
396デフォルトの名無しさん:2013/10/21(月) 12:37:25.80
互換性を考えない、一人で完結ならそれでもいいんじゃない
397デフォルトの名無しさん:2013/10/22(火) 13:16:40.56
キャラクターとグリフを分けて考えるようになってからややこしくなってきたよな。
「異体字なのか」「同じ字の字形の違い」なのかとかいろいろ
398デフォルトの名無しさん:2013/10/22(火) 16:10:09.10
できる事が増えた。特にUnicodeの異体字は処理が簡単。
399デフォルトの名無しさん:2013/10/22(火) 16:23:09.07
Unicodeの場合、なし崩し的にどんどん包摂の範囲が狭くなっていってるから初期のものとの整合性がぐちゃぐちゃで
400デフォルトの名無しさん:2013/10/22(火) 16:27:12.06
まあその辺は6以降で。
401デフォルトの名無しさん:2013/10/22(火) 17:01:02.23
まあ「文字グリフ分離」はここ数年間での文字コードとフォントの進化の頂点だよな。
あとは包摂の範囲や粒度、字形の問題とか規格で決めることをどう決着つけるのかと
フォントベンダーがちゃんとしたものを手抜きしないで作ってくれるかだよな。
402デフォルトの名無しさん:2013/10/22(火) 17:03:02.82
ユーザー次第だと思うね。
メーカーがちゃんとコスト掛けてるものについて、それをちゃんと評価し、使うかどうか。
403デフォルトの名無しさん:2013/10/22(火) 17:05:46.86
そうだね、凄い手間とお金がかかっているからね。
404デフォルトの名無しさん:2013/10/26(土) 02:43:56.58
フォントのグリフ集合に関してはAJ1の一人勝ちになってるから
その辺Adobe次第なのよね
405デフォルトの名無しさん:2013/10/27(日) 23:12:43.53
406デフォルトの名無しさん:2013/10/28(月) 06:01:33.32
よくわからんけど、silフォントみたいなやつ?
407デフォルトの名無しさん:2013/10/29(火) 00:31:26.29
>>405
で、その幅っていうのは具体的にどれだけなんだい?
408デフォルトの名無しさん:2013/10/29(火) 00:36:08.36
等幅フォントを使って
スペース文字で文字間を調節するって
活版印刷みたいだな。
409デフォルトの名無しさん:2013/10/29(火) 07:12:24.68
ところで入札までした変体仮名グリフはどこへ行ったんだ
410デフォルトの名無しさん:2013/10/30(水) 17:42:06.45
いわれてみれば
411デフォルトの名無しさん:2013/10/30(水) 17:49:35.04
ローマ字で長音はサーカムフレックス付けるのに
なんでJISに全角の「サーカムフレックス付O(オー)」が無いんだ?
412デフォルトの名無しさん:2013/10/30(水) 18:39:25.87
そこでいうJISって何?
413411:2013/10/30(水) 18:54:48.92
文字集合JIS X 0208のことです。
414411:2013/10/30(水) 19:04:54.16
文字コードにそれほど詳しいわけではないのですが
どの日本語文字エンコーディングでも「サーカムフレックス付O(オー)」は保存できません。
そもそも文字集合のなかに無いのでしょうか?

ローマ字も日本語なのに無いのは変だと思うんですよね。
ギリシャ文字やキリル文字はあるのに。
415デフォルトの名無しさん:2013/10/30(水) 19:14:42.08
ユニコードにはあるけど。
416411:2013/10/30(水) 19:23:32.84
ユニコード環境なら使えるのは知っています。
大文字と小文字の2文字を追加するだけで良いのになんで日本語の文字集合に入れなかったんでしょうか?
漢字の異体字みたいに青天井化する恐れも無かったのに。
417デフォルトの名無しさん:2013/10/30(水) 19:30:02.53
ちょっとごめん。サーカムフレックスって「^」ですよね?
ローマ字だとマクロンじゃないですか?
418411:2013/10/30(水) 19:45:41.02
交通機関や民間では地名人名にヘボン式ローマ字でマクロンが使われることがありますが

正式な日本語のラテン文字転記である訓令式ではサーカムフレックスが使われます。

>1947年(昭和22年)の文部省通達[17](訓令式とヘボン式の両方を解説していた)ではサーカムフレックスとアポストロフィを使うとしており、
1937年(昭和12年)の内閣訓令が事務的な手違いで誤っていたと言われているが、昭和20年代の教育現場(小学校4〜6年生)ではどちらでも良いと教えるように文部省が指導していた。


例:市の公文書でサーカムフレックス付きオーが使われています。
http://www.city.nagaoka.niigata.jp/dpage/kokubun/chikyuhiroba/konnichiwa/newsletter/Vol.252.pdf
419デフォルトの名無しさん:2013/10/30(水) 20:04:24.94
歳がバレただけか。言わなきゃよかった
420デフォルトの名無しさん:2013/10/30(水) 21:30:42.70
JISに「合成用丸」があることからも分かるように、
アクセント記号は合成でなんとかするつもりだったんだろうよ。
421デフォルトの名無しさん:2013/10/30(水) 21:32:09.65
今は合成用丸という名前じゃなくなってるのか…
422デフォルトの名無しさん:2013/10/30(水) 21:43:15.81
◯囲い文字は青天井化しそうだから合成するのは合理的かもしれないけど
ローマ字で長音は母音だけだよ。AIUEOaiueoそれぞれにマクロン付きとサーカムフレックス付きを入れても20文字だけじゃん。
なんで入れなかったんだろうね。
423デフォルトの名無しさん:2013/10/30(水) 21:51:09.94
JIS X 0213に入ってるんだからええやん
424411:2013/10/30(水) 23:01:56.66
それもそうですね。
425デフォルトの名無しさん:2013/10/31(木) 04:21:14.96
昔は「漢字コード」って言ってたくらいだから
みんな非漢字部分にはあまり意識を払ってなかったのかもね
426デフォルトの名無しさん:2013/10/31(木) 12:21:54.63
日本人はローマ字なんて殆ど使ってないしなあ。

0208や0212の頃は、漢字でさえまだあれやこれが足りないって議論が盛んにあった頃で、
ローマ字の長音表記に使う長音記号付きの母音字なんてどうでも良かったんじゃない?
変体仮名や西欧のアクセント記号付きアルファベットの方がまだ需要があったんじゃないかと。

和言葉には長音字はないから国語屋も興味薄そう。
427デフォルトの名無しさん:2013/10/31(木) 23:44:32.72
これらのカタカナをユニコードに入れてほしい。
一時期存在したわけだし、入れる資格はあると思う。

ヤ行イ - Wikipedia
http://ja.wikipedia.org/wiki/%E3%83%A4%E8%A1%8C%E3%82%A4

ヤ行エ - Wikipedia
http://ja.wikipedia.org/wiki/%E3%83%A4%E8%A1%8C%E3%82%A8

わ行う - Wikipedia
http://ja.wikipedia.org/wiki/%E3%82%8F%E8%A1%8C%E3%81%86

そうすれば
ear 耳 イアー
year 年 ⊥アー (似た記号で代用)
を区別できるのにね。

韓国のわけのわからない試作ハングルよりは実用価値はあると思う。
428デフォルトの名無しさん:2013/11/01(金) 00:00:51.79
一定の用例があれば符号化される可能性はあるだろうけど
五十音図だけだと厳しい気がする。文を綴った例がないと
429デフォルトの名無しさん:2013/11/01(金) 00:37:49.21
既に入ってる「江」「衣」が有効活用されてるかといえばされてないのよね。
やっぱり、文字コードに入るだけじゃなくて主要な環境でデフォルトで表示できて、入力も出来るというのが普及の最低ラインになるんじゃなかろうか。
430デフォルトの名無しさん:2013/11/01(金) 00:52:02.50
> 普及の最低ライン

何の話だ?
431デフォルトの名無しさん:2013/11/01(金) 01:12:42.55
金属活字の活版印刷の時代にそれらのカナの活字が造られて使われていたかどうかが大きかったのかも。
432デフォルトの名無しさん:2013/11/01(金) 01:27:53.75
フォント屋向けにUnicodeの日本語用サブセットみたいなのが必要なんだろうな
今だとAJ1がそれに近いか
433デフォルトの名無しさん:2013/11/01(金) 01:45:50.33
どのフォントでも対応するレベルの現実的な規模のサブセットは0213なんだろうな。
だからそこから外れてるKana Supplementはほったらかされる。
434デフォルトの名無しさん:2013/11/01(金) 01:56:41.54
JIS X 0213もAdobe-Japan1も最後に改訂されたのは9年前だっけ
後者は汎用電子がトリガーになって1-7が来るかなと思ったもんだけど
435デフォルトの名無しさん:2013/11/01(金) 02:42:50.59
JIS X 0213は今後もサブセット集合として存在意義があると思う。Shift-JIS200Xとかはお笑い種になっちゃったけど
436デフォルトの名無しさん:2013/11/01(金) 02:44:49.61
そうだね
JIS信者 安岡信者の心のより所として必要だね
437デフォルトの名無しさん:2013/11/01(金) 12:22:17.42
>>435
JIS X 0213なんて意義はもうほぼないだろw
文字コード屋以外には。
世間では既にUnicode+Adobe-Japan1で廻ってる。
438デフォルトの名無しさん:2013/11/01(金) 12:23:29.58
> Adobe-Japan1
< Adobe-Japan1フォント
439デフォルトの名無しさん:2013/11/01(金) 13:24:11.90
JavaScriptにようやく正規化とサロゲートペアのメソッドが入るみたいで安心
440デフォルトの名無しさん:2013/11/01(金) 15:38:04.53
>>436 TRON信者は電波お花畑板という適切な板に行ってください
441デフォルトの名無しさん:2013/11/01(金) 16:51:12.98
>>439
Unicodeすらまともにサポートしてなかったのか
442デフォルトの名無しさん:2013/11/01(金) 19:49:26.19
Adobe-Japan1フォントは、欧文がダメだからなー
443デフォルトの名無しさん:2013/11/01(金) 22:50:40.29
JavaScriptは仕様を巡る争いで数年無駄にしたからなあ
444デフォルトの名無しさん:2013/11/01(金) 22:55:49.16
仕様を巡る争いなんてないよ。
そもそもネットスケープの独自言語だったわけだし。

単に標準化委員会が、XHTMLなんかはやらせようとしてて
JavaScirptに見向きもしなかっただけ。

標準化委員会が最低限のDOM以外なにも決めようとしないので
各ブラウザベンダーは独自で便利な機能を実装していった。
この時代に標準はない。

それに業を煮やしたブラウザベンダーがJavaScriptを
ふんだんに取り入れたHTML5を作り出した。
ここからやっとJavaScriptの仕様の話に入る。
445デフォルトの名無しさん:2013/11/01(金) 22:58:20.53
ECMAScript 4でググるよろし
446デフォルトの名無しさん:2013/11/01(金) 23:23:10.92
図解雑学文字コードは分かりやすくて良い本なので
2002年以降の動向を追加した改訂版を出してほしい。
447デフォルトの名無しさん:2013/11/02(土) 03:46:05.18
グリフ集合のデファクトを一企業に握られてるというのは
あんまり健全じゃないよな
448デフォルトの名無しさん:2013/11/02(土) 12:52:30.79
Adobeのことかー!!
449デフォルトの名無しさん:2013/11/02(土) 23:40:23.63
Winも8.1でAJ16フォントを採用したもんなー
450デフォルトの名無しさん:2013/11/03(日) 00:24:53.83
ん、そうなのか
451448:2013/11/03(日) 00:26:29.81
ノリで言っただけで
>>447がどの企業のことを指していたのかはわからないんだけどね。
452デフォルトの名無しさん:2013/11/05(火) 01:31:55.84
WG2更新されてゅぅ
でも日本に関係あるのは梵字くらいか
453デフォルトの名無しさん:2013/11/05(火) 05:30:08.53
ユニコード戦記の新古書を神田古本まつりでゲット
454デフォルトの名無しさん:2013/11/05(火) 21:37:05.50
安岡信者がこんなところにも
http://www.mishimaga.com/tonarimachi/26.html
455デフォルトの名無しさん:2013/11/06(水) 01:58:32.56
ここはお前個人の閻魔帳じゃないんだからせめて何が気に入らないのか第三者に伝わるようなレベルで具体的に説明してくれ。
456デフォルトの名無しさん:2013/11/06(水) 21:30:15.62
マジ基地のTRON信者だから、何を言っても無駄です
457デフォルトの名無しさん:2013/11/06(水) 23:06:31.14
安岡センセイも最近はマイナンバーとタイプライターばかりだからな
458デフォルトの名無しさん:2013/11/06(水) 23:08:18.62
安岡は最近は2ちゃんで自分への否定的なレスを見つけては
TRON信者だ!とか騒ぐだけ
459デフォルトの名無しさん:2013/11/07(木) 01:44:24.77
良くも悪くも特別視することないと思うけど
別にJSC2の委員ってわけでもないし>>11
460デフォルトの名無しさん:2013/11/07(木) 11:36:23.41
タイプライターの件で必死に噛みついてた狂信的坂村信者以外に、
安岡氏のやることなすことケチつける奴なんて考えられんw
461デフォルトの名無しさん:2013/11/07(木) 23:26:55.37
>>445
4で数年も無駄にしてない。
462デフォルトの名無しさん:2013/11/08(金) 02:07:42.03
ルーブル記号が決まったらUnicode 7.0の前に6.4が来るかな…
463デフォルトの名無しさん:2013/11/10(日) 03:44:23.37
>>459
1997からJIS委員対反JISの戦いなんてないしな。
文句ある奴は意見出せって流れになったので。

争点としては残った包摂基準の良し悪しについても、今はIVSがあるし。

争点がほとんどないのがこのスレの伸びにも現れてる。
464デフォルトの名無しさん:2013/11/10(日) 20:44:11.17
ITU定義の電話ボタンの*(star)と#(square)が、それぞれ、
U+26B9 SEXTILE
U+2317 VIEWDATA SQUARE
に包摂される模様。
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n4495.pdf
465デフォルトの名無しさん:2013/11/10(日) 20:56:57.81
しめす偏の「ネ」の字形も「示」の字形差も包摂しちゃって書体のデザイン差にしてしまえば良いのだ。
466デフォルトの名無しさん:2013/11/11(月) 02:12:34.24
>>464
いいから、その埃だらけの画像はやめてくれw
467デフォルトの名無しさん:2013/11/11(月) 11:37:46.13
>>464
一昨年の話↓が、やっと決着するのか
http://slashdot.jp/~yasuoka/journal/537609
468デフォルトの名無しさん:2013/11/11(月) 12:37:38.51
なんと、そんな経緯が
469デフォルトの名無しさん:2013/11/11(月) 16:06:38.67
電電公社のプッシュホンの#も
a/bが凄く小さかったり、
αが90度じゃないがあるんだな。

よく見ると目の前の内線電話も#だけ傾いてるな。
470デフォルトの名無しさん:2013/11/11(月) 18:01:36.75
経緯を無視して特定の時期のデザインを基準にしちゃうのもなんだけど
今更☆と◇には戻せないしなあ。
471デフォルトの名無しさん:2013/11/11(月) 18:06:53.31
IVSで好きな字形選べるしなw
472デフォルトの名無しさん:2013/11/13(水) 03:05:02.46
>>167
半年ROMったがお前がクズだということがわかった
とっとと死ね
473デフォルトの名無しさん:2013/11/13(水) 03:08:05.71
半年ROMれとか何様だよこの老害
まじむかついてきた
くたばれ
474デフォルトの名無しさん:2013/11/13(水) 08:58:17.34
すべったか
475デフォルトの名無しさん:2013/11/13(水) 09:48:01.75
>>473
半万年ROMれ
476デフォルトの名無しさん:2013/11/14(木) 21:09:00.74
>>464
ITU-T E.161だな。
>>469
推奨値にすぎないが、斜めになるとa/bが0.18になる。
a/bが大きいのに90度なのは、推奨ではない独自のシェイプということになる。
http://www.itu.int/rec/T-REC-E.161-200102-I/en
ISOだと、ISO/IEC 9995-8。

どうしてa/b、90度を標準的なグリフに変更するように求めているんだろう。
477デフォルトの名無しさん:2013/11/14(木) 21:17:49.28
ところでISO/IEC 9995-10に関する提案も出ているんだけど、
http://std.dkuug.dk/jtc1/sc2/wg2/docs/n4464.pdf
http://std.dkuug.dk/jtc1/sc2/wg2/docs/n4444.pdf
を見るとびっくりするような記号までキーボードに関連付けられているのだけど。

ドイツ人は、コンマ付きのアポストロフィとか、
ダブルレフトアングルとか、比のスラッシュとか、割り算のスラッシュとか、
いちいちキーボードのキーに割り当てていたんだね。
478デフォルトの名無しさん:2013/11/14(木) 23:26:41.19
来週からIRGだってのにあまりドキュメントがポストされませんな
479デフォルトの名無しさん:2013/11/14(木) 23:51:44.80
U+26B9 ⚹
U+2317 ⌗
480デフォルトの名無しさん:2013/11/14(木) 23:59:48.74
これらを含む日本語フォントがどれだけあるやら
481デフォルトの名無しさん:2013/11/15(金) 01:19:13.46
SEXTILEはWebページならスタイルシートでアスタリスクを90度回転させればいいな。
482デフォルトの名無しさん:2013/11/15(金) 01:25:46.20
いや、見た目だけでいいなら画像貼ればいいんじゃねと思う。
アスタリスクは回転させてもアスタリスクだし、なんとも中途半端じゃないかね。
483デフォルトの名無しさん:2013/11/15(金) 01:27:10.30
じゃあ×もいらないな。+を45度(ry
484デフォルトの名無しさん:2013/11/15(金) 02:11:51.46
今はWebFontで特定の文字だけ好きな埋め込みフォントで表示させられる時代ですよ奥さん
485デフォルトの名無しさん:2013/11/15(金) 05:13:40.26
盲人用読み上げソフトや
全文検索エンジンが困るだろう。
486デフォルトの名無しさん:2013/11/15(金) 13:44:23.53
現段階じゃ実質的にWebFontってフォントを自作できる人にしか活用できん罠
487デフォルトの名無しさん:2013/11/16(土) 01:04:14.26
○度回転させる制御文字をUnicodeで定義しておけばいいんじゃね?
488デフォルトの名無しさん:2013/11/16(土) 01:19:07.60
IRGN1959<AJ1・汎用電子に続く第3のIVDを登録するよ!
だって
489デフォルトの名無しさん:2013/11/16(土) 18:09:38.96
490デフォルトの名無しさん:2013/11/16(土) 18:44:41.16
なんや!
491デフォルトの名無しさん:2013/11/16(土) 19:15:02.84
ラニマル文字
492デフォルトの名無しさん:2013/11/16(土) 21:30:45.57
>>489の母体はこれかな
ttp://mojikiban.ipa.go.jp/
493デフォルトの名無しさん:2013/11/16(土) 23:52:46.10
議事録面白い
変体仮名の検討つづいてたんだ
494デフォルトの名無しさん:2013/11/17(日) 01:23:43.73
なんの議事録?
495デフォルトの名無しさん:2013/11/17(日) 02:05:15.96
492の委員会活動状況ってところ
何をどう符号化するかみたいな話がのってる
496デフォルトの名無しさん:2013/11/17(日) 03:12:57.30
変体仮名ってどんだけ使用実績あるの?
戸籍統一文字と相互変換することなんてありえないし。
またゴリ押しして複雑化するのだけはやめて欲しい。
497デフォルトの名無しさん:2013/11/17(日) 11:17:00.18
またというのは?
498デフォルトの名無しさん:2013/11/17(日) 11:52:59.91
変体仮名は和歌の世界では日常茶飯時で当然活字もある。
499デフォルトの名無しさん:2013/11/17(日) 15:58:49.35
古典を電子化するために必要ってことだよね。
でも変体仮名ってゴシック体とか明朝体の活字が使われる頃には既に使われなくなっていたから
楷書体の字形しか無いよな?
ゴシック体の変体仮名ってマヌケそう。
500デフォルトの名無しさん:2013/11/17(日) 18:52:14.42
散々言われ尽くしたことを何故いまさら
501デフォルトの名無しさん:2013/11/18(月) 01:20:17.70
>>500
結論出たならいいけどさ
登録するなら必要な話でしょ。
手書き限定ならそもそも活字化出来ない→誰も実装しない→登録する必要性なし
って判断されるかもよ。
502デフォルトの名無しさん:2013/11/18(月) 01:21:25.80
>>498
活字なんてあったっけ?
503デフォルトの名無しさん:2013/11/18(月) 02:12:31.08
行政で必要なものだけ符号化すりゃいいんだよ的な話になってるのは気になるけど
どのみち於可古志八みたいな有名どころは入ることになるか
504デフォルトの名無しさん:2013/11/18(月) 11:47:29.93
>>502
当然あった。例えば「築地活文舎 変体仮名」でググれ。
基本的なことも知らないのだから活字には無知だろうに、
どうして「あったっけ?」なんていい方が出来るのか...
505デフォルトの名無しさん:2013/11/18(月) 18:52:54.82
この会社ならいい感じの変体仮名のフォント作れそうだな。
http://fontworks.co.jp/font/tsukushi/tsukushiboldmin/R.html
506デフォルトの名無しさん:2013/11/18(月) 22:20:12.19
そもそも常識的に考えて「変体仮名の活字はなかった」なんておかしいだろ
507デフォルトの名無しさん:2013/11/18(月) 23:35:43.62
弘道軒清朝体が出てきて懐かしくなった
508デフォルトの名無しさん:2013/11/19(火) 16:23:32.63
>>4-6
UTF-8に統一しろよって言いに来たけどテンプレ読んで頭が下がりました。
すいませんでした。
509デフォルトの名無しさん:2013/11/19(火) 16:51:04.04
>>4
>・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?

テキストVRAMに書き込むのは、BIOSかコマンドの仕事。
直接書き込みたければコマンドが自分で変換する必要がある。
ちなみに1byteごとに色等の修飾属性1byteがつくから、漢字は4byte。
510デフォルトの名無しさん:2013/11/19(火) 22:02:59.00
98のbiosは文字描画無いんじゃなかったっけ?
511デフォルトの名無しさん:2013/11/19(火) 22:19:25.06
そもそもMS-DOSはShift_JISじゃないし。
>>4の様な安岡信者は相変わらず気が触れているな。
512デフォルトの名無しさん:2013/11/19(火) 22:25:22.58
学参明朝などという八百長書体のせいで
字形の違いとデザイン差の問題がでたらめになってしまった。

学参明朝を撲滅せよ!
513デフォルトの名無しさん:2013/11/20(水) 02:36:10.18
>>511
安岡のおっちゃんもCP932とShift_JISくらい区別ついてるよ
514デフォルトの名無しさん:2013/11/20(水) 12:01:24.92
安岡はCP932とShift_JISの区別は付いているけど
シフトJISとShift_JISの違いがついていなくて
Shift_JISを妄信しているから困る
515デフォルトの名無しさん:2013/11/20(水) 18:16:02.66
意味のわかんないことを一人で必死に連投してるのは何?
516デフォルトの名無しさん:2013/11/20(水) 18:52:26.42
勉強してきて、どうぞ
517デフォルトの名無しさん:2013/11/21(木) 10:41:36.55
「シフトJIS」なんて厳密な定義ない。>>514は馬鹿。
518デフォルトの名無しさん:2013/11/21(木) 10:44:02.10
厳密な定義のない広義のシフトJISとShift_JISとが
区別できてないってことだろ
519デフォルトの名無しさん:2013/11/21(木) 13:53:21.11
520デフォルトの名無しさん:2013/11/21(木) 16:13:00.62
MS-DOS全盛の時代にWindows-31Jがあったとは思えないんだが
521デフォルトの名無しさん:2013/11/21(木) 16:49:54.99
>>519
これ読むと
誤解されてる方の意味での
「シフトJIS」ってのは
EUCにふさわしい名前だな
522デフォルトの名無しさん:2013/11/21(木) 17:21:16.17
>>519
これは「シフトJIS」と「Shift_JIS」を混同している(>>514)んじゃなくて、
世間的にASCII+Microsoftが起源と思われている「シフトJIS」が
実は漢字CP/M由来であるという話の中で、
Shift JIS系のコードの総称として「シフトJIS」と言う言葉を使ってるんじゃないのかな?
523デフォルトの名無しさん:2013/11/21(木) 19:02:01.88
>Shift JIS系のコードの総称として「シフトJIS」
というのが世間の認識なんだけど、
安岡氏は代表であるMSのそれを「MS漢字コード」
という別物としてとらえている感があるような
524デフォルトの名無しさん:2013/11/21(木) 19:12:37.27
「完敗」って書いてるじゃん
525デフォルトの名無しさん:2013/11/23(土) 03:13:57.39
>>523
なんか前半と後半で文書繋がってないけど。
・総称をシフトJISと呼ぶことが多い
・CP932を安岡はMS漢字コードと言ってる
・シフトJISにCP932は含まれる
ってだけじゃないの。

で、スラドに書いてあるのはシフトJIS起源はどの会社かって話でしょ。
これに関しては安岡説は間違ってたと当人が認めてる。
526デフォルトの名無しさん:2013/11/23(土) 08:31:16.26
読解力ないな
スラドのテーマは
「誤解されてる方の意味」の

>「Windowsの前身にあたるMS-DOS開発時にマイクロソフト社などによって考え出されたのが
>「JIS漢字のコード領域をごっそり1バイト文字の領域と重ならないコード領域にズラしてしまえ」という方法、
>すなわち「シフトJISコード」でした」

を言ったのはどこの会社の誰かソース出せ
ってことだろ
527デフォルトの名無しさん:2013/11/23(土) 09:51:05.75
誤解されてる方
って何だ?
528デフォルトの名無しさん:2013/11/23(土) 12:02:46.92
「これを読む限りでは」って限定してるじゃん
しかも今じゃ読めないし
529デフォルトの名無しさん:2013/11/23(土) 12:07:18.05
安岡はともかく>>4あたりがよく分かっていないのは間違いない
530デフォルトの名無しさん:2013/11/23(土) 12:48:58.53
4がっつーか当時の書き込みがそのまま使われてるだけだろ
www.bookshelf.jp/2ch/tech/1143375639.html
531デフォルトの名無しさん:2013/11/23(土) 15:22:40.61
質問なのですが
CP932のNEC選定IBM拡張漢字と、IBM拡張漢字の領域で
重複している漢字がいくつかありますが
UTF8から変換した時、どちらに変換するのが正しいんでしょうか?

例) \(U+7E8A)

NEC選定IMBだと
0xED40

IBMだと
0xFA5C
532デフォルトの名無しさん:2013/11/23(土) 15:37:34.29
自己解決しました
Wikipedia先生に答えが書いてありました

> 「NEC選定IBM拡張文字」「IBM拡張文字」が重複する場合は、「IBM拡張文字」に統一

ありがとうございました
533デフォルトの名無しさん:2013/12/01(日) 00:08:42.45
ふむ
534デフォルトの名無しさん:2013/12/11(水) 00:37:39.94
ほう
535デフォルトの名無しさん:2013/12/11(水) 03:30:11.10
へえ
536デフォルトの名無しさん:2013/12/12(木) 16:23:27.72
ところでPRI 259は
537デフォルトの名無しさん:2013/12/12(木) 20:41:09.81
TwitterでNさんが夜中にキレてたね
538デフォルトの名無しさん:2013/12/14(土) 00:35:38.20
文字コードの判定の精度を確かめたいのですが
よく使われているテストセットみたいのってありますか?
539デフォルトの名無しさん:2013/12/14(土) 00:38:42.17
>>536
IPAmjフォント専用みたいな感じだから
良くも悪くも一般ユーザーには関係なさそう
540デフォルトの名無しさん:2013/12/14(土) 01:41:47.13
>>538
テスト用にサンプル集めてるところだわ
パスはUTF8で
http://www2.age2.tv/rd2/src/age5249.zip.html
どれもウェブページとかウェブから拾える

KOI7-switched windows-125[2347] IBM-12{61|64|65|68|76} ISO-2022-KR Big5-HKSCS辺りは見つけられてねえ
541デフォルトの名無しさん:2013/12/15(日) 04:27:51.02
Encode::Detect::CJK
Unicode::Japanese
CharsetDetector
Lingua::DetectCharset
activeperlで使えるこの4つ総合してもcp1256とkoi8が判別しにくいようだが
ファイル単位でなら80-ff調べれば一目瞭然だね
totalとの差は80-bfの分
cp1256: 0xc0-0xdf:229, 0xe0-0xff:178 total:422
koi8r: 0xc0-0xdf:62356, 0xe0-0xff:976 total:63359.
koi8u: 0xc0-0xdf:6341, 0xe0-0xff:96 total:6455.

Encode::Detect::CJKの判別能力はかなり高い
>>540の不足分(はテストできないのでそれ)以外だと
koi8とcp1256を区別できないのと
big5とiso-2022-cnとcp1251とgb2312とiso-8859-6とiso-8859-11で誤判定がある程度

ちなみに
Encode::First Lingua::ZH::HanDetect Lingua::DetectCyrillic Lingua::RU::Detect Encode::Guess
は使い物にならなかった
542デフォルトの名無しさん:2013/12/16(月) 00:10:20.08
文字コードの判定の"精度" という言い方が引っかかるんだよなぁ。
なんでかって考えてみたら、品質が良くなれば精度があがるみたいな
ことを思ってしまうからかな?精度が悪いものはダメみたいな。

文字コードの判定っていうのは、仕様なんだよね。
あるバイナリ列があったとき、それがAという文字コード、
Bという文字コードの両方の当てはまることはあるんだよ。
こういうのは「AかBの文字コード」というのが正しい答えになる。

この場合にどちらを答えるかというのは、精度の問題ではなく単に仕様でしかないんだよ。
例えば、日本語にしか対応していないやつなら外国の文字コードに
当てはまる場合でも答えないだろう。これは精度ではなく、外国の文字コードに
対応していないという話。考え方によっては、低機能と言える。

多くの文字コードに対応していればいるほど、判定の精度は低くなる。
というか精度ではなく、対応しているものが多いから、
多くの文字コードに当てはまることを正確に教えてくれる。

だから判別能力が高いとか低いじゃなくて
迷った時は○○コードよりの判定をしてくれるとか、
日本語だけしか対応してないから、外国の文字コード
判定されることはないとか、そういう話にしなきゃ。
543デフォルトの名無しさん:2013/12/16(月) 00:17:37.68
1文字で調べても意味ないからね。1文字では正しく判定できたとしても
その文字が含まれている2文字、3文字だったら誤判定することもある。
544デフォルトの名無しさん:2013/12/16(月) 00:23:04.91
> Encode::Detect::CJK
> Unicode::Japanese
> CharsetDetector
> Lingua::DetectCharset
> activeperlで使えるこの4つ総合してもcp1256とkoi8が判別しにくいようだが

こういうのもね。ライブラリの精度の問題じゃないんだよ。

cp1256とkoi8が区別しにくいのは、文字の問題。
同じバイナリ列にかぶってるんでしょ?

区別しにくい(誤判定する)のは文字自体の問題で、
それをどのように判定するのは、ライブラリの癖というか仕様。

Encode::Guess が使いものにならないというのは、
Encode::Guess が日本語以外の多くの文字コードに対応していて、
対応しているもの全てを列挙するからだよ。一番正確。
545デフォルトの名無しさん:2013/12/16(月) 00:30:43.89
ベイズ推定かな
546デフォルトの名無しさん:2013/12/16(月) 00:39:29.90
>>545
うん、そうそう。そういうこと。

結局のところ、文字で判断している以上
それは精度ではなく仕様という話でしか無い。
複数の文字コードで解釈できるというのは事実でしか無いからね。

精度という話をするのなら、文字ではなく文字列、文章として考え、
それがどの文字コードであれば意味が通る文字列、文章として解釈できるか?
っていう話に持っていかないといけない。

まあその場合の精度も、どんな辞書を使っているかって所が
差が出る一番の要因で、アルゴリズム的なところではあまり差は出ないだろうけど。

文字列、文章で判断するのなら高い精度で判定できるようになるけど
1文字だったら誤判定する確率はやっぱり高いだろうな。
その文字をよく使っている文字コードはどれ?という程度の判断基準になるからね。
547デフォルトの名無しさん:2013/12/16(月) 05:17:08.56
Encode::Detect::CJKはデフォでcharset指定見てるからで
判断材料にしないようにするとかなり落ちるな

精度に反論してる奴がいるけどさ
実際はとりあえず選択して試してみる必要があるわけで
実用面ではある程度当たればいいわけだよ

Encode::Guess が全てを列挙するというんだけど
それが本当なら良いけど実際列挙しないしな
548デフォルトの名無しさん:2013/12/16(月) 07:44:53.21
用途にも拠るかね。
100%の精度が必要な自動データ処理系か、
ブラウザやエディタのように人の目で判断して文字コードを修正出来るものか、とか。
549デフォルトの名無しさん:2013/12/16(月) 08:04:17.71
組版ソフトだと設定で勝手に換えてくれちゃったりするから、
他のところに持って行くとぐだぐだ
550デフォルトの名無しさん:2013/12/16(月) 10:28:46.12
Mac Binary 最強ですねわかります
551デフォルトの名無しさん:2013/12/16(月) 23:45:08.75
なんでMac Binaryやめたんだろうね。
糞だったのかな?
552デフォルトの名無しさん:2013/12/16(月) 23:49:11.89
>>551
意味分かって喋ってる?
553デフォルトの名無しさん:2013/12/17(火) 01:09:41.50
>>552
はい、わかっていますが
言いたいことがあるのならどうぞ。
554デフォルトの名無しさん:2013/12/17(火) 11:33:31.15
>>553
MacBinaryはtar等と同様の単なるシリアライズフォーマットだが、
どこが文字コードと関係するのかね?
555デフォルトの名無しさん:2013/12/17(火) 22:20:19.60
>>554
Macバイナリの話を始めたのは>>550ですよ?
変なことをいいますね。
556デフォルトの名無しさん:2013/12/17(火) 22:28:06.16
>>555
意味分かってないじゃん
557デフォルトの名無しさん:2013/12/17(火) 22:46:14.63
これ立てたのお前かよ

Apple固有技術のMac Binaryは復活するべきだと思う
http://anago.2ch.net/test/read.cgi/mac/1387205359/
558デフォルトの名無しさん:2013/12/23(月) 20:11:46.30
559デフォルトの名無しさん:2013/12/23(月) 22:37:34.34
CNETで絵文字コラムをやってたころのかな
あの連載って完結したんだっけか
560デフォルトの名無しさん:2013/12/24(火) 00:20:14.25
確かに最終回を見た記憶がない
561デフォルトの名無しさん:2013/12/24(火) 00:33:36.47
小形さんの連載の最終回はどれも見たことがないような…
562デフォルトの名無しさん:2013/12/24(火) 01:21:06.74
それでも仕事が取れるのか…
563デフォルトの名無しさん:2013/12/27(金) 18:44:55.17
某氏が呟いてた葬り去られるフォントって入札のあれかな
564デフォルトの名無しさん:2013/12/29(日) 07:02:40.09
カタカナの「ツ」が海外で顔文字になってるの知ってた? - ねとらぼ
http://nlab.itmedia.co.jp/nl/articles/1312/20/news111.html
2013年12月20日 15時43分
565デフォルトの名無しさん:2013/12/29(日) 12:37:53.32
それ聞いたとき、へー日本語使えるんだぁ、と思った。(´・ω・`)も行っちゃえ〜w
566デフォルトの名無しさん:2013/12/30(月) 12:16:35.95
utf-16って一文字で表せる文字と2文字で表せる文字があるらしいじゃないですか?
そういうばあい
char16_t x[2]="一文字で表せない文字"
ってやらないといけないんですか?
567デフォルトの名無しさん:2013/12/30(月) 12:27:51.42
サロゲートペアとか結合文字とかIVSでググれ
もっと面倒だから
568デフォルトの名無しさん:2013/12/30(月) 14:19:00.60
ユニコードの文字って全種類IMEで出せますか?
569デフォルトの名無しさん:2013/12/30(月) 15:02:59.62
無理。
なぜならUnicodeというのはバージョンアップするものだから。
分かりやすく言えば、今も文字は増えている。

直近だと
2010年10月11日  Unicode 6.0.0  109,449文字
2012年1月31日  Unicode 6.1.0  110,181文字
2012年9月26日  Unicode 6.2.0  110,182文字
2013年9月30日  Unicode 6.3.0  110,187文字

更に言うのならIMEでは全種類出す能力はあっても
フォントが用意されていなければ表示されない。
IMEだけの話では解決しない。
570デフォルトの名無しさん:2013/12/30(月) 19:07:27.35
フォントあっても表示系が対応せんといかんし。
複数のフォントを組み合わせてできるだけ多くの文字に対応したり。
571デフォルトの名無しさん:2013/12/30(月) 20:21:19.41
お前らなら知っているかもしれないと思って質問するんだけど

多角形(三角形、四角形、五角形 …)
星型多角形(五芒星、六芒星)
はキャラクターも英語名もそんざいするけど

1本(ある意味放射状2本)― |
2本(ある意味放射状4本) + ×
放射状6本(sextile)
http://en.wikipedia.org/wiki/Sextile
はわかるんだけど

↓この図形を何て呼ぶか(和名、英名)誰か知らないかい?
http://i.imgur.com/0gPjO4B.gif
572デフォルトの名無しさん:2013/12/30(月) 22:11:43.70
分位数と同じでよければ
3ならtertile
5ならquintile
573デフォルトの名無しさん:2013/12/30(月) 22:17:08.38
   ∧_ ∧    喰らえ!
  (´∀` )
    (⊃⌒*⌒⊂)
     /__ノ''''ヽ__)
574デフォルトの名無しさん:2013/12/30(月) 22:34:45.24
>>572
うーん、sextileから判断して分位数で表しても、「本当にそう呼ぶのか」が疑問ですよね。

占星術でもquintileは別の記号ですよね。
http://en.wikipedia.org/wiki/File:Quintile-symbol.svg

ちなみに前述の記号って文字集合にはあるのかな?
575デフォルトの名無しさん:2013/12/30(月) 23:05:35.40
Quintileは天文のでっかいボールドQ
http://en.wikipedia.org/wiki/Wikipedia:WikiProject_Astrology/Glyphs
576デフォルトの名無しさん:2013/12/30(月) 23:36:03.83
だからそういうことじゃなくて
http://i.imgur.com/0gPjO4B.gif
この記号は何て呼ぶのかな?っていうことなんだけど…
577デフォルトの名無しさん:2013/12/31(火) 00:42:08.90
左はsplit decision
578デフォルトの名無しさん:2013/12/31(火) 01:26:36.37
579デフォルトの名無しさん:2013/12/31(火) 10:13:27.57
文字としては3本のほうはわからないが、5本はアスタリスクのデザイン差と
いうことになってる。Unicodeの例示図形ではU+FE61のsmall asteriskが5本。
580デフォルトの名無しさん:2013/12/31(火) 11:01:05.49
確かに5本はよく見かけるな。
581デフォルトの名無しさん:2013/12/31(火) 14:12:49.32
5本って鶏の足の形のことか?
582デフォルトの名無しさん:2014/01/01(水) 02:01:17.54
にわとりって足指5本もあるの?
583 【凶】 【512円】 :2014/01/01(水) 02:52:27.08
アスタリスクを文字ビューアで見ると,フォントによって字形がさまざま。
中には8本のものも。Helveticaは5本,Timesの類は5本だったり6本だったり。
584デフォルトの名無しさん:2014/01/01(水) 10:11:02.99
小塚さんも明朝とゴシックで向きが違うのね
585デフォルトの名無しさん:2014/01/01(水) 14:00:06.51
あら,ふぉんとだw 安定のヒラギノ
586デフォルトの名無しさん:2014/01/01(水) 16:47:01.43
字にはヒラギノール
587デフォルトの名無しさん:2014/01/01(水) 19:16:15.53
>>586
くそ、お前が俺の初笑いだわ
588デフォルトの名無しさん:2014/01/01(水) 20:03:36.29
589デフォルトの名無しさん:2014/01/04(土) 17:27:58.24
Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか?
ttp://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q11116062531
590デフォルトの名無しさん:2014/01/04(土) 19:02:59.06
裏技コードみたいなものになってるんだな
591デフォルトの名無しさん:2014/01/04(土) 20:39:41.22
592571:2014/01/06(月) 21:11:52.76
結局誰もわからないのかよ…

>>583
欧文書体の世界では
セリフ(明朝体)は6本
サンセリフ(ゴシック体)は5本
が標準のようです。
593デフォルトの名無しさん:2014/01/06(月) 22:15:37.37
記号じゃなく図形聞きたいのかね
594571:2014/01/06(月) 22:24:24.27
記号でも図形でも名称があるかどうかが知りたいのですよ。

自分で勝手に名づけても通用しないわけでしょ?
595デフォルトの名無しさん:2014/01/07(火) 00:56:31.16
おれはそもそも詳しくないからあれなんだけど、
たとえ知ってる人がいてもきっと質問意図を測りかねてると思うんだな。

画像の図形を本か何かで見たのならもっと具体的に文脈を明らかにしたほうが助けになると思うし、
あるいは「こういう形の図形って世界のどこかにあるのかなあ?」という素朴な疑問なのか。
596571:2014/01/07(火) 01:19:41.54
質問の意図としては
同じ長さの棒が一点から等角度で4本放射状に棒が出ている「十字」
同じ長さの棒が一点から等角度で6本放射状に棒が出ている「セクスタイル」
があるのだから3本、5本なども記号として存在して名称があるのではないかと思ったのです。
http://i.imgur.com/0gPjO4B.gif
この図はPohotshopで自分で描いたので引用元の図書などはありません。
597デフォルトの名無しさん:2014/01/07(火) 01:32:53.53
お前が勝手に作っただけじゃん
そういうのが混乱のもとになるっていうのが分からないの?
598571:2014/01/07(火) 01:41:42.68
この程度の幾何学図形は創作でもなんでもないだろ。
なんて呼ぶかわからないから検索のしようがなくて自分で描いただけで
俺が描くまでは地球上に存在しなかった図形のわけないじゃん。
誰もわからないのならこのスレではもうやめるよ。
599デフォルトの名無しさん:2014/01/07(火) 01:43:46.40
6本がそれでいいなら>>572でいいんじゃないのか…?
1週間以上前だけどUnicodeの表はどこまでチェックしてみたんだろう…?
600デフォルトの名無しさん:2014/01/07(火) 01:58:31.62
わかってるとは思うけど「6本の図形の名前=セクスタイル」ではなく、
「6本の図形を占星術で使う場合の名前=セクスタイル」。
まったく同じ図形でも使われかたによっては「アスタリスク」にもなるし、そのへんはほんと文脈次第。

すでに出てるように5本のは「アスタリスク」として通用するので答えは「それの名前はアスタリスクだ」でおkなんだけど、たぶん聞きたいのはそういうことじゃないよね?
もしそうなら3本のは「うーん、“ダイムラー”とかでいいんじゃないかな」と答えれば済むんだけど。
http://www.daimler.com/Projects/c2c/channel/images/762972_1391486_389_328_713349_1290685_389_328_1998M389.jpg
601デフォルトの名無しさん:2014/01/07(火) 02:10:59.47
いやアスタリスクで調べたらわかると思うんだけどなw
十字でいいなら(逆)Y字でもいいと思うけどw
602デフォルトの名無しさん:2014/01/07(火) 04:03:19.01
地図用の記号で「三叉路」でもいいかな
603デフォルトの名無しさん:2014/01/07(火) 08:55:07.93
アスタリスクは small star という意味のギリシャ語由来だから、星に見えれば
なんだってアスタリスクだぞ。5だろうが6だろうが8だろうが。
604デフォルトの名無しさん:2014/01/07(火) 10:55:59.05
>600なら、3 pointed starだけどね。
ただ、ある程度の幅のある図形を想定しているから、5 pointed starはpentagramになっちゃうねぇ。
605デフォルトの名無しさん:2014/01/07(火) 12:31:26.12
あまり一般的な図形じゃないから汎用的な名前はないでしょ。
五本はたしか線文字Aにあったはず。
線文字っていうくらいだから太くない。
606デフォルトの名無しさん:2014/01/07(火) 17:57:31.54
>>571
さすまた、菊
607デフォルトの名無しさん:2014/01/08(水) 11:37:42.05
一人十大木光米
608デフォルトの名無しさん:2014/01/08(水) 15:55:51.22
×




609デフォルトの名無しさん:2014/01/11(土) 21:49:25.01
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10117115845

LINEでUnicode相手に送って重くさせた場合犯罪なの?

相手から送ってこいって言われて送ったんだけど

犯罪犯罪ってうるさくて

* ベストアンサーに選ばれた回答

oretyan_0928さん

Unicodeでの攻撃は
電子計算機損壊等業務妨害という
犯罪になります。
5年以下の懲役または
100万円以下の罰金の重罪です。

相手が訴えればの話ですが…
610デフォルトの名無しさん:2014/01/11(土) 21:51:29.09
「ユニコードは犯罪だからやめてください」の衝撃
http://yanok.net/2014/01/post-301.html
Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか?
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q11116062531
611デフォルトの名無しさん:2014/01/12(日) 02:12:51.62
UNICODEのコードポイントとUTF-8のバイト列の対応表とかってありますか?
612デフォルトの名無しさん:2014/01/12(日) 02:32:38.83
arimasuyo
613デフォルトの名無しさん:2014/01/12(日) 09:20:44.18
>>612
どこにあります?
614デフォルトの名無しさん:2014/01/19(日) 00:30:13.05
ユニコードの攻撃か... ここに新たなユニコード戦記が
615デフォルトの名無しさん:2014/01/25(土) 22:09:00.99
>>611
そういうのは Unicode から UTF-8 のコードをどうやって作るかを調べれば自作出来ると思うが。
まあでもそれが分かればそんな対応表作る気なくなると思うなあ。
616デフォルトの名無しさん:2014/01/25(土) 22:12:46.97
Wikipedia に書いてあった。要するにビット単位で抜き出して配置してるだけ。
1バイト目の上位ビットを見ると全体が何バイトかが分かる。
http://ja.wikipedia.org/wiki/UTF-8
617デフォルトの名無しさん:2014/01/25(土) 22:46:21.43
C#だったら、
char ch = Convert.ToChar(128); // コードポイント 128の場合
byte[] bytes = Encoding.UTF8.GetBytes(new char[]{ch});
でUTF8のバイト列が得られるな。
618デフォルトの名無しさん:2014/01/25(土) 22:49:04.37
ucs2とutf-8のバイト変換ツールをexcel関数で作ったことが有るな。
DEC2BIN関数使って2進数に変換してMID関数でビット毎に取り出して判定して、、というやつ。
619611:2014/01/26(日) 09:47:42.77
ありがとうございます.
勉強のためunicode同士でコード変換するプログラムを作ったのですが
そのテストのために必要でした
620デフォルトの名無しさん:2014/01/28(火) 02:47:59.92
西夏文字はようやく符号化提案書の段階までたどり着いたのね
621デフォルトの名無しさん:2014/01/28(火) 15:39:21.53
よくわからんがいろいろ大変なんだなあ
622デフォルトの名無しさん:2014/02/01(土) 14:39:56.97
日本語の文章にいわゆる半角括弧(U+0028,U+0029)を使ったら、全角括弧(U+FF08,U+FF09)を使えと言われました。
ほとんどのフォントでは、全角括弧はひらがなと漢字と調和するデザインになっており、
半角括弧はいわゆる半角英数字に調和するデザインになっているからだそうです。
文字コードに対して、フォントの字形を定義する規格があるのでしょうか。

前から、いろいろな人に言われてたんですが、フォントが駄目なだけだろと思っていたので、無視していました。
ですが、言い負かすか、言い負かされるかを決断しないといけなくなったのでお願いします。

JISの文字コード規格でも、組版規格でも全角括弧を使え見たいなことは書いてないので、
個人的には全角括弧を使いたくないです。
623デフォルトの名無しさん:2014/02/01(土) 15:00:26.97
そのへんはまだ「コレダ!」という結論が出るほど成熟してない気がするね。

きれいに見える括弧の幅は和文欧文で違うから、フォントが「駄目」とも言い切れないし、
かといってレンダリング側で機械的に和文欧文を判断してグリフを割り振って問題が出ないレベルのものでもないし。

ほんとは全角・半角がそれぞれ「和文用・欧文用」と定義されてれば有無を言わさぬ現実解になったと思うんだけどな。(括弧以外の記号や全角ラテンを含め。)
今後、電子出版が広がるなかで「あれ、これどうすんの?」って改めて注目されて何らかの仕組みが出来ればいいな。
624デフォルトの名無しさん:2014/02/01(土) 15:45:09.77
>>622
半角括弧にこだわっているようだが句読点は気にしていない時点で
ただのあなたのわがままに過ぎないことがわかる。
横書きでは公文書は「,。」(技術文書は「,.」)という指針がある。

そこまで半角括弧にこだわるなら半角カンマと半角ピリオドも使えや。
625デフォルトの名無しさん:2014/02/01(土) 15:48:39.76
括弧は半角がいいよ派と全角だよ派、いやいや半角の外側に半角スペースを入れるよ派の三つ巴だな。
626デフォルトの名無しさん:2014/02/01(土) 16:30:13.98
括弧の中身に合わせるのが見やすいかな
>>622 のように半角英数記号だけの場合は半角括弧使う
627デフォルトの名無しさん:2014/02/01(土) 16:56:20.99
出すときに一括置換するだけだろ
628デフォルトの名無しさん:2014/02/01(土) 17:24:04.12
「アプリはアプリケーション(application)の略である。」
みたいな文章があったとして()を半角にするのか全角にするのか
629デフォルトの名無しさん:2014/02/01(土) 17:31:08.11
それなんだよな。一概にはいえない。
630デフォルトの名無しさん:2014/02/01(土) 18:03:32.27
>>622
>半角括弧はいわゆる半角英数字に調和するデザインになっているからだそうです。
むしろ半角の括弧類は全角文字に「調和しない」と考えたほうがいいでしょう。
ベースラインが異なるからです。(横組みの場合、半角は少し下がって見えませんか?)
太さや位置などを確認するのには、
国国(国)国(国)国[国]国[国]国<国>国<国>国〈国〉国
などを、フォントを変えて見てみるのがいいと思います。

>>628-629
まあ、そうですね。不統一は避けたいですが。
631デフォルトの名無しさん:2014/02/01(土) 18:07:00.71
確かWikipedia日本語版あたりは「半角も全角も禁止はしないが、全角を半角に修正するのは禁止」みたいなやや全角寄りの微妙なルールがあった気がする。
632デフォルトの名無しさん:2014/02/01(土) 18:21:42.52
というより、こいつメンヘラだろ
633デフォルトの名無しさん:2014/02/01(土) 18:31:20.31
半角カッコを使うときは、
あああ (hoge) みたいに
括弧の前後を空白で開ける。
634デフォルトの名無しさん:2014/02/01(土) 18:34:27.81
>>633
括弧の中に入るものが1文字とかだとどうするか少し悩む
635デフォルトの名無しさん:2014/02/01(土) 18:43:22.44
たとえば (i) こんなのか?
636デフォルトの名無しさん:2014/02/01(土) 18:48:17.77
>文字コードに対して、フォントの字形を定義する規格
それは知らないがJISX0213にはU+0028,U+0029を使えって書いてあるし
JISX4051を参照してもU+0028,U+0029だ
よかったな
637デフォルトの名無しさん:2014/02/01(土) 18:49:16.64
>>625 半角の外側に半角スペースを入れるよ
絶対にやめてください。
638デフォルトの名無しさん:2014/02/01(土) 18:49:46.43
>>633
やめてください
639デフォルトの名無しさん:2014/02/01(土) 18:51:17.77
>>638
お前のレベルまで落ちるつもりはない。
勝手に変なことしていれば良い。
640デフォルトの名無しさん:2014/02/01(土) 18:53:29.54
トルツメ
641デフォルトの名無しさん:2014/02/01(土) 18:53:35.18
642デフォルトの名無しさん:2014/02/01(土) 18:54:12.12
Unicodeでは、丸括弧 (……)・波括弧 {……}・角括弧 [……] にはいわゆる半角のもの(JIS X0201で規定されているもの)のほかに、全角形の(……)・{……}・[……]が規定されています。
括弧の中にいわゆる半角の文字だけがある場合は、いわゆる半角の括弧を用います。
括弧の中にいわゆる全角の文字のうち、漢字・仮名・和文記述記号がある場合は、全角形の括弧を用いるべきだという意見と用いないという意見の2つがありますが、目下の合意はありません。
未了 これについては、当ガイドラインのノートで議論されています。
いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。
直前に、ほかの開き括弧類がある。直後に、句読点やほかの閉じ括弧類が続く。
直前や直後に、和文の句読点や和文の括弧類がある。
括弧が固有名詞や型式番号などの一部で、括弧の前や後を空けずに表記される。
段落の始まりや終わり。
643デフォルトの名無しさん:2014/02/01(土) 18:54:59.60
> いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。

なるほど

> いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。

うん、なるほど
644デフォルトの名無しさん:2014/02/01(土) 18:58:04.76
括弧の外側にスペースを入れるのって、
ソフトウェアのUIなんかで「アルファベットと和字の間にスペースを入れる」のとかとも絡んでくるのかな。
645デフォルトの名無しさん:2014/02/01(土) 19:00:58.26
トルツメだな
646デフォルトの名無しさん:2014/02/01(土) 19:01:58.28
>>644
単なる英文の文化だからだろ?

半角英数字 = 英文
全角英数字 = 日本語


半角 = 英文を使うなら、その文化に従えってだけの話。
英語は単語をスペースで区切ります。言い換えると単語の前後にスペースを入れます。
そして括弧の前後にもスペースを入れます。
647デフォルトの名無しさん:2014/02/01(土) 19:09:28.90
>半角英数字 = 英文

ちょっと待て誰が決めた
648デフォルトの名無しさん:2014/02/01(土) 19:10:57.03
やっぱりこの種の話題は宗教戦争化しやすいな。
649デフォルトの名無しさん:2014/02/01(土) 19:11:51.46
>>647
昔から。

そもそもコンピュータの文字なんてのは
最初アルファベットしかなく。
それは日本ではなく、外国(アメリカだっけ?)で
生まれたものなんだよ。

そのアルファベットというのは当然半角で
その文字は英語のために作られた文字。
650デフォルトの名無しさん:2014/02/01(土) 19:17:49.86
ローマ字表記は英文じゃない派
651デフォルトの名無しさん:2014/02/01(土) 19:20:32.03
英文は訂正しよう。

英字

ローマ字も英字
652デフォルトの名無しさん:2014/02/01(土) 19:22:25.16
>>649
いろいろぐちゃぐちゃすぎワラタ
653デフォルトの名無しさん:2014/02/01(土) 19:24:36.59


J
654デフォルトの名無しさん:2014/02/01(土) 19:25:19.70
>>652
反論はなさそうだねw
655デフォルトの名無しさん:2014/02/01(土) 19:26:34.88
12 月 31 日みたいにいちいち空白入れるとか馬鹿げてるだろ
こんなものは詰めた方が見やすいし
656デフォルトの名無しさん:2014/02/01(土) 19:26:36.61
>>646
jisc6220は英語だったのか
657デフォルトの名無しさん:2014/02/01(土) 19:29:18.14
みんな英字と呼ぶけど、あれはラテン語のものだからラテン語のルールに従うべきだな。
658デフォルトの名無しさん:2014/02/01(土) 19:29:29.09
コイン(10円硬貨など)3枚

とか開始と終了で全半角での挟まれ方が異なる場合でも
矛盾なくできるならローカルルールで使いわけてもいいんだろうがな
659デフォルトの名無しさん:2014/02/01(土) 19:31:11.58
>>657
そして漢字は中国式で、算用数字はインド式を要求されるのだ。なんという悪夢。
660デフォルトの名無しさん:2014/02/01(土) 19:32:45.80
>外国(アメリカだっけ?)

ワラタ
661デフォルトの名無しさん:2014/02/01(土) 19:33:59.26
>>658
やっぱ一概に「こうするのが正しい!」は無理だよなあ。
662デフォルトの名無しさん:2014/02/01(土) 19:40:59.45
なに、インド産のくせにアラビア数字と詐称していたのか ゆるせん
663デフォルトの名無しさん:2014/02/01(土) 19:43:16.28
英でもcharacter(s)みたいな場合にはスペース入れないしねえ。
664デフォルトの名無しさん:2014/02/01(土) 19:44:42.01
>>662
インド産のものがアラビア数字と呼ばれ、
アラビア産のものがインド数字と呼ばれている悲劇
665デフォルトの名無しさん:2014/02/01(土) 19:47:43.49
>>645
?
666デフォルトの名無しさん:2014/02/01(土) 20:13:29.79
最初の質問は、>>630の言うベースラインのズレがUNICODEとかの
規格で決まっているかどうかじゃないの?
リファレンス字形みたいのを示せば一発では。
667デフォルトの名無しさん:2014/02/01(土) 20:26:16.64
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。

質問自体はこれだがunicodeなんかにはそのようなものはないと思う
しかし他の規格に無いとは言い切れない悪魔の証明と化すので
そこへは立ち入らない
668デフォルトの名無しさん:2014/02/01(土) 21:18:56.57
なんで同じ字形で全角と半角との2種類の存在が許されてるの?
669デフォルトの名無しさん:2014/02/01(土) 21:20:38.81
は?
670デフォルトの名無しさん:2014/02/01(土) 21:58:02.58
671622:2014/02/02(日) 02:47:48.68
>>623
どうも、わたしの近辺では全角括弧が和文用、半角括弧が欧文用としてデファクトスタンダードになっているようです。
>>630
MS ゴシックだとベースライン一緒なんですよね。だからあんまり問題にならなかった。
Windows Vista以降のメイリオとかAndroid他を考えると、文字コード規格や組版規格に従えといっても現実的には無理なんですよね。
あと、全角括弧のベースラインをひらがなや漢字に合わせると、全角英数字のベースラインはどうなるんだっていうところも気になります。
>>633
OSの文字列レンダラに渡すとスペースを入れた方が見栄えがいいけれど、
ワープロソフトで入力すると勝手に前後にアキを入れてくれたりして、なかなか共通にしにくいですね。
>>636
これを言ったら、お前はJIS規格のコードじゃなくて、Unicodeを使っているはずだとか言われました。
あと、昔のfjによくいた、現実を無視したキモイつっこみを入れる奴と一緒だなみたいなことを言われました。
まあ、実際そういう性格に近いですが。
672デフォルトの名無しさん:2014/02/02(日) 03:24:30.23
>>622
> 日本語の文章にいわゆる半角括弧(U+0028,U+0029)を使ったら、全角括弧(U+FF08,U+FF09)を使えと言われました。
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。
それがUnicodeだろ
673デフォルトの名無しさん:2014/02/02(日) 03:38:22.96
>>672
字形という言い方が正しくなかったかもしれません。すいません。
ある文字が他のある文字と調和する形状・位置であるかどうかを定義する規格と言ったらいいでしょうか。
674デフォルトの名無しさん:2014/02/02(日) 04:03:49.23
それは言語そのものであって繁体字と簡体字の関係あるいは極論アルファベットが全部同根であるようなもの
675デフォルトの名無しさん:2014/02/02(日) 04:13:33.39
>>671
絶対ルールでなく、あなたのコミュニティーのルールに従うのが良いと思います。
676デフォルトの名無しさん:2014/02/02(日) 05:00:58.24
グリフイメージ(字形)
フォントイメージ(実際に表現されたデザイン)
の話を混同している上に
そもそもどちらも文字コードが扱う問題じゃないんだよな。
677デフォルトの名無しさん:2014/02/02(日) 05:41:00.57
ああ、言っちまったぁ
678デフォルトの名無しさん:2014/02/02(日) 06:27:00.76
文字のないところに文字コードはないとでも言えばわかるのか
679デフォルトの名無しさん:2014/02/02(日) 08:08:17.34
組版については,
「日本語組版処理の要件」
http://www.w3.org/TR/jlreq/ja/
を見たらどうでしょうか。
括弧などの約物処理について詳しく書いてあります
680デフォルトの名無しさん:2014/02/02(日) 08:52:52.39
>>679
クラの編集者に見せたい
681デフォルトの名無しさん:2014/02/02(日) 09:34:54.11
>>676
じゃあ、例示字形ってなんなの?
682デフォルトの名無しさん:2014/02/02(日) 10:43:50.50
> じゃあ、例示字形ってなんなの?
例として示す字形に決まってるじゃん。
^^^^^^^^
絶対これにしろ、と決めるものではない。
683デフォルトの名無しさん:2014/02/02(日) 14:36:33.41
>>679
それの元が>>636のJISX4051で結果が>>671なんだし無駄なことだろ
684デフォルトの名無しさん:2014/02/02(日) 15:24:48.86
その文章にルールが必要なら決まりに従う、または、決めればいい
入力は誰しも間違うから verifier を用意すること
間違ったからお前が悪いとかあほなことは言わない
685デフォルトの名無しさん:2014/02/02(日) 16:32:39.69
不統一なものを一括処理するスクリプトでも書いておく、と
686デフォルトの名無しさん:2014/02/03(月) 11:24:18.72
ああ、それがいい
687デフォルトの名無しさん:2014/02/04(火) 00:30:36.47
二階建てのaとgの文字コードが欲しいよな。
フォントが指定できない環境で一階建てのaとgとの違いを説明するのに必要だから。
688デフォルトの名無しさん:2014/02/04(火) 02:03:46.18
純粋な字形の説明なんて文字コードの守備範囲外だろう。
それやりだすと「下に棒のある1とない1」「上が閉じている4と開いている4」「横棒が1本の\と2本の\」みたいに収拾がつかなくなるぞ。
689デフォルトの名無しさん:2014/02/04(火) 05:03:58.19
「$」の中の棒を2本にしろとか言われるしorz
690デフォルトの名無しさん:2014/02/04(火) 06:44:55.07
どうしてもプレーンテキストでやりたいなら↓これでどうにかなる

_■■■
____■____■■■
_■■■■___■___■
■___■__■___■
■___■__■___■
_■■■____■■■_■
691デフォルトの名無しさん:2014/02/04(火) 07:14:45.36
そもそも、JIS X 0208で英数記号をISO 646と重複符号化したことが問題。
便宜上全角・半角と呼ばれて字形を区別しているフォントが多いが、本来は全角・半角なんて概念は文字コード自体に存在しない。
692デフォルトの名無しさん:2014/02/04(火) 08:20:17.20
半角2バイト文字とか、いや〜ん
693デフォルトの名無しさん:2014/02/04(火) 10:23:20.18
流石にそれは98機種依存だけどなw
694デフォルトの名無しさん:2014/02/04(火) 21:31:34.29
>>625
つ mathモードのカッコを好みのサイズに引き伸ばして使う派
695デフォルトの名無しさん:2014/02/04(火) 21:32:40.85
>>628
(applicationが好き)だとどうなるのだろうか?
696デフォルトの名無しさん:2014/02/04(火) 21:37:40.51
>>691
けどomicronとかEPWINGみたいな使い方を想定したんでしょ?
697デフォルトの名無しさん:2014/02/04(火) 21:45:07.81
一応一階建てのaとgはU+0251とU+0261に符号化されてる。
発音記号用に符号化されてる(特にaについては一階建てか二階建てかで別の発音を表す)がそれ以外の字形の説明等の用途に使ってもいい筈。
でも二階建て専用コードは無いんだな。活字系のフォントではU+0061とU+0067は二階建てであることが多いが。
一部のフォントでは一階建てになってしまうから、厳密に二階建てであることを示さなければいけないときの為に符号化してほしいよな。
VSを使ってU+0061 U+FE00,U+0067 U+FE00とかでもいいから。
698デフォルトの名無しさん:2014/02/04(火) 21:51:42.38
二階建てa用のコードポイントがなくても発音記号用途は現状うまくまわってるの?
699デフォルトの名無しさん:2014/02/05(水) 00:12:17.20
「そ」の上が「ソ」と「フ」どっちなのか「き」「さ」「り」繋がっているかとかは割と話題に上るが
「え」「ん」の「〜」部分の山は角なのか丸なのか直前の斜線と一部同化するのか
「ね」「れ」「わ」の「フ」が「|」にかかるのかあたりはあまり聞かないな
漢字だったらさぞ大騒ぎすることだろう
700デフォルトの名無しさん:2014/02/05(水) 01:27:02.52
固有名詞が平仮名で字形が厳密に決められてる例というと、「さいたま」の「さ」(繋がってる字形)ぐらいか。
でも離した字形使って間違ってるから直せと言われたとか怒る人がいるという話しは聞いた事が無い。
701デフォルトの名無しさん:2014/02/05(水) 01:39:48.97
明朝体だと「お」の左下とか「や」の右上も気になる
702デフォルトの名無しさん:2014/02/05(水) 03:17:13.10
>>695
成り行きの改行で閉じの丸括弧を行頭に来させたくないなら、全角で。
703デフォルトの名無しさん:2014/02/05(水) 03:28:33.08
コード表で Unicode ラテン1補助(aとeがくっついてるの<00E6>があるあたり)見てるんだけど、
こんなところに"×"が入ってるんだな。だから○×と並べるの×が小さく見えるの? 関係ない?
704デフォルトの名無しさん:2014/02/05(水) 03:38:53.22
バツではなく掛け算記号だからしょうがない
705デフォルトの名無しさん:2014/02/05(水) 03:49:32.08
まあね。テヘッ
706デフォルトの名無しさん:2014/02/05(水) 14:07:24.00
×✕✖
707デフォルトの名無しさん:2014/02/05(水) 16:23:52.95
脱法ハーフスナック報道車

脱法ハーフスナック報道車

脱法ハーフスナック報道車

脱法ハーフスナック報道車
708デフォルトの名無しさん:2014/02/06(木) 01:22:07.85
このサイトの文字コードはほんと悩まされた、何でこんな珍しい文字コード使ってるのかってのない?
基本はShift-jis,euc-jp,utf-8で終わってしまうけど
709デフォルトの名無しさん:2014/02/06(木) 01:56:44.96
昔、x-macjapaneseを見た記憶がある。
もうないと思うけど。
710デフォルトの名無しさん:2014/02/06(木) 04:16:23.05
エディタのエンコーディングリストに
「無損失ASCII(Non-lossy ASCII)」ってのがあるんだけど、これなんだろう。
711デフォルトの名無しさん:2014/02/06(木) 06:59:18.67
>>696
規格票読む限りはその意図はない。
JIS X 0208はJIS X 0201のスーパーセットを作ろうとしただけのはず。
712デフォルトの名無しさん:2014/02/06(木) 08:03:16.72
>>711=アスペ

X 0201のAとX 0208のAが重複してるだろ。
713デフォルトの名無しさん:2014/02/06(木) 09:48:29.41
認定厨死ね。

重複は問題じゃない。

確か、ほんとうはちゃんとスーパーセットにするつもりだったのに、
結局スーパーセットになってないのが問題。
714デフォルトの名無しさん:2014/02/06(木) 10:21:37.55
>>708
2chがいまだにutf8化せずにcp932なのがアレ
715デフォルトの名無しさん:2014/02/06(木) 13:48:22.87
他スレに質問したのですが、このスレ見つけたので移動してきました

[\u3000-\u9fff]とは何を意味しているのでしょうか?
u3000はユニコードの全角空白のようですが、
u9fffは分かりません
おそらくユニコードによる漢字の最後の文字じゃないかと思うのですが
716デフォルトの名無しさん:2014/02/06(木) 15:10:55.51
717デフォルトの名無しさん:2014/02/06(木) 21:28:49.97
>>711
スーパーセットつくろうとしたなら、
JIS X 0208を単独で使う意図があったんじゃないの?
実際使われていたし。
718デフォルトの名無しさん:2014/02/06(木) 21:40:05.37
mohta氏はそのように運用してはいたけど...
719デフォルトの名無しさん:2014/02/06(木) 21:45:31.67
今みたいにプロポーショナルフォント環境が多ければ、あれも違和感無く受け入れられたかも
720デフォルトの名無しさん:2014/02/06(木) 22:14:17.02
ISO 2022で言うところの、
G0にJIS X 0208に指示して、GLにG0を呼び出しっぱなしにした
文字エンコードはあちこちで使われていたよ。(G1-3, GRは使わない)
古くはJISコードというのはこういうもののことを言った。
JUNETコードを指す狭い使い方はずっと時代が下ってからの話。
721デフォルトの名無しさん:2014/02/07(金) 00:27:02.92
いわゆるKI/KOコード?
722デフォルトの名無しさん:2014/02/07(金) 04:45:07.67
>>718
加齢臭のする思い出クソワロタ
723デフォルトの名無しさん:2014/02/07(金) 10:41:04.89
ja_JP.UTF-8とUFT-8とは何が違うのですか?
724デフォルトの名無しさん:2014/02/07(金) 21:23:20.21
>ja_JP.UTF-8
何ですか?それは

>UFT-8
Unicode規格で定められたテキスト円コーディングのこと
725デフォルトの名無しさん:2014/02/07(金) 21:52:06.24
ドル建てで
726デフォルトの名無しさん:2014/02/07(金) 21:57:57.94
>>724
>>ja_JP.UTF-8
>何ですか?それは

ANSI C ロケール名です。

language[_territory][. codeset] [@modifier]
727デフォルトの名無しさん:2014/02/07(金) 23:29:37.63
728デフォルトの名無しさん:2014/02/08(土) 01:08:20.49
>>709
x-japmacanese HAHAHA!
729デフォルトの名無しさん:2014/02/08(土) 06:12:59.83
>>726
「ANSI C ロケール名」とは何なのか。
定義を教えて下さい。
730デフォルトの名無しさん:2014/02/08(土) 11:03:51.90
書いてあるがな
731デフォルトの名無しさん:2014/02/08(土) 12:19:47.04
なるほど。では改めて。

>UFT-8
Unicode規格で定められたテキスト円コーディングのこと

>ja_JP.UTF-8
>>723が考えた書式の文字列。特に意味はない。
732デフォルトの名無しさん:2014/02/08(土) 12:54:03.29
君の頭の中では面白いのか?
733デフォルトの名無しさん:2014/02/08(土) 13:00:43.22
>>723
文字集合とエンコード方式の違い

なぜかOracleだが丁寧に書いてあるからいいだろう
国際化対応言語環境の利用ガイド
http://docs.oracle.com/cd/E26924_01/html/E27144/glmbx.html
734デフォルトの名無しさん:2014/02/08(土) 13:03:11.48
知らない言葉を見れば分からないといって荒らし
知っている言葉があれば関係ないところでひけらかして暴れる

サウイフモノニ
ワタシハナリタイ
735デフォルトの名無しさん:2014/02/08(土) 13:06:16.13
>>733
Sun由来のSolarisドキュメント
736デフォルトの名無しさん:2014/02/08(土) 15:35:34.13
特定のソフトウェア製品で使われる
あることを意味する文字列と
一般的な文字コードの名称を一緒にするなってことだろ
737デフォルトの名無しさん:2014/02/08(土) 15:39:36.12
ANSI Cロケールと無縁なシステムなんてないだろw
738デフォルトの名無しさん:2014/02/08(土) 15:46:35.94
>>731 いつまで嘘垂れ流し続けるんだ
739デフォルトの名無しさん:2014/02/09(日) 00:42:57.53
>>710
Macのやつね。Javaのnative2asciiと同じ形式(完全に同じかはわかんない)
740デフォルトの名無しさん:2014/02/09(日) 01:44:36.74
>>708
ていうか Shift-jisってcp932とは違うと思うんだけど実際には多くのサイトが
cp932の意味で使ってるよね。あと euc-jp にも似たような事情が。

こういうのに悩まされたことが、俺にはありました。
741デフォルトの名無しさん:2014/02/09(日) 02:52:50.51
cp932はShift-jisなので問題ない
742デフォルトの名無しさん:2014/02/09(日) 05:29:52.25
>>739
ごめん言ってみただけなの、なのに、ありがとう。
743デフォルトの名無しさん:2014/02/09(日) 12:09:50.75
CP932はシフトJISだがシフトJISがCP932とは限らない
744デフォルトの名無しさん:2014/02/09(日) 12:11:18.01
CP9ってなんだっけ?
745デフォルトの名無しさん:2014/02/09(日) 12:18:27.99
9は存在しない(あるいはすでに廃止されている)ようだ。
http://www-01.ibm.com/software/globalization/ccsid/ccsid_registered.html
746デフォルトの名無しさん:2014/02/11(火) 06:33:45.22
シフトJISだがShift_JISではないということ。
747デフォルトの名無しさん:2014/02/12(水) 15:59:51.17
\xe3って何ですか?
調べてみても、あまりよく分からなかったのですが
Unicodeだと思うのですが
748デフォルトの名無しさん:2014/02/12(水) 16:20:39.29
それはどこに出てきたの?
749デフォルトの名無しさん:2014/02/12(水) 17:39:05.51
Shift-JISのサイトってどっかない?
有名どころがいいんだけど
ニュースサイトとか
750デフォルトの名無しさん:2014/02/12(水) 18:32:39.71
2ちゃんねるっていうサイトがShift-JISで有名だよ
751デフォルトの名無しさん:2014/02/12(水) 18:37:46.88
なんてこった、文字通り灯台下暗しだな......
でも教えてくれてありがと、助かった
752デフォルトの名無しさん:2014/02/12(水) 18:52:22.74
和んだ
753デフォルトの名無しさん:2014/02/13(木) 06:10:27.65
>>747
それが出てきた文脈が大事なんだけど…
何かの処理系で非ASCIIをエスケープシーケンスを用いたUnicodeで表記したものじゃないの?
U+00E3ならãを表してる。
754デフォルトの名無しさん:2014/02/13(木) 15:53:43.39
正規表現じゃない?
755デフォルトの名無しさん:2014/02/13(木) 19:42:23.41
これが入札した変体仮名グリフなのかな
mojikiban.ipa.go.jp/3467.html
756デフォルトの名無しさん:2014/02/13(木) 19:54:45.85
757デフォルトの名無しさん:2014/02/15(土) 23:52:34.39
可の符号位置は上の横棒があるのとないのとで2つ必要な気がする
758デフォルトの名無しさん:2014/02/24(月) 23:25:58.95
EUC-JPがASCIIの「拡張」であって「上位互換」でないのはなぜ?
8ビットコードで0X7F以下はASCIIそのものなんだから上位互換でないの?
759デフォルトの名無しさん:2014/02/24(月) 23:29:14.48
上位互換でいいんじゃないの。
両方ISO 2022に適合してるわけだし。
760758:2014/02/25(火) 00:11:50.69
PHP使ってる人だとわかると思うんだけど
PHPのhtmlspecialchars()の第3引数にエンコードを指定するんだ
本家のドキュメントにこの関数に与える引数において事実上同等のエンコードが列挙されてるんだが
そこになぜEUC-JPが入ってないのがわからない
761デフォルトの名無しさん:2014/02/25(火) 00:31:50.61
PHPとか知らんが、http://jp1.php.net/htmlspecialcharsを見る限り
ASCII, ISO-8859-1, UTF-8しか順序関係はないんじゃないの?
762デフォルトの名無しさん:2014/02/25(火) 00:48:04.45
いくつか資料を見てもASCIIをそのままま持ってくるようなこと書いてあるけど
ASCIIの0x5cはバックスラッシュだしEUC-JPの0x5cは円記号だよね
763デフォルトの名無しさん:2014/02/25(火) 01:45:14.76
>>762
いいえ、バックスラッシュです。
764758:2014/02/25(火) 01:50:52.80
>>761
うーん そうなんですかね
マニュアルにこう書いてあるんだから、意味は深く考えなくていいじゃん 
で解決といえば解決なんですけども

>>762
バックスラッシュです
GL領域はまんまASCIIだったはず
765デフォルトの名無しさん:2014/02/25(火) 01:55:49.74
資料疑うなら根拠を書けよw
766758:2014/02/25(火) 01:59:52.01
& ' " < > これらを変換するためのhtmlspecialchars()は関数なんですね
http://jp1.php.net/htmlspecialcharsに挙げられてる同等に扱われるエンコーディングは
↑の文字をASCIIと同じ符号位置で扱ってるエンコーディングなんです 
符号表的に同じ位置にあるから引数にどれをいれても動作は同等ですよー とドキュメントに書いてる
でもEUC-JPが入ってないのはどうしてなの?これも同じ符号位置に& ' " < >があるはずなのに!ってのが疑問です
767デフォルトの名無しさん:2014/02/25(火) 02:08:59.64
マイナーエンコーディングだからじゃないの?
必要ならpatch書いて送ろう。
768デフォルトの名無しさん:2014/02/25(火) 22:58:26.60
むかしむかし、ある男がSafariの中の人に
「どうしてSafariはEUC-JPの0x5cを円記号で表示するんだよ! バグじゃね?」
と聞いてみたそうな。
中の人いわく、「インターネットでメジャーなブラウザに挙動を合わせている」
とのことじゃった。

そうしてそのメジャーなブラウザとSafariでは0x5cが円記号で表示されるのじゃった。
めでたしめでたし
769デフォルトの名無しさん:2014/03/01(土) 06:36:12.48
もう一回言って?
770デフォルトの名無しさん:2014/03/01(土) 16:36:12.72
むかしむかし、ある男がSafariの中の人に
「どうしてSafariはEUC-JPの0x5cを円記号で表示するんだよ! バグじゃね?」
と聞いてみたそうな。

中の人思った「日本ではバックスラッシュは円記号で表示されるだけで同じ文字なんだよ。
これは国とフォントの問題だ。でもこいつバカっぽいから話もてわからないだろうな。
よし馬鹿向けの回答で」

中の人いわく、「インターネットでメジャーなブラウザに挙動を合わせている」
とのことじゃった。

>>768は納得した。
771デフォルトの名無しさん:2014/03/01(土) 17:01:38.49
結局「当人も馬鹿なのでそうなった」というパターンに見えるがw
772デフォルトの名無しさん:2014/03/01(土) 17:13:11.00
Safariの場合はEUC-JPの0x5CをU+00A5にわざわざ変換する処理によるもの
なのでフォント以前の問題
773デフォルトの名無しさん:2014/03/01(土) 17:15:58.03
中の人思った「でも馬鹿にはその説明は理解できないから」

中の人いわく、「インターネットでメジャーなブラウザに挙動を合わせている」

>>768は納得した。
774デフォルトの名無しさん:2014/03/01(土) 17:21:00.98
チョイッ \(..*\) (/*..)/ ポイッ
775デフォルトの名無しさん:2014/03/01(土) 20:24:39.77
>>770
>日本ではバックスラッシュは円記号で表示されるだけで同じ文字なんだよ。

別に馬鹿による解答はお願いしていませんが
776デフォルトの名無しさん:2014/03/01(土) 23:34:03.52
>>770が馬鹿だと納得した。
777デフォルトの名無しさん:2014/03/02(日) 11:40:45.99
急にレベル落ちたな
778デフォルトの名無しさん:2014/03/07(金) 20:55:49.73
文字コード関連の論文ってどこがメジャーですか?
探しても全然でてこない
779デフォルトの名無しさん:2014/03/07(金) 21:33:27.70
>>778

>>3
Unicode Home Page
http://www.unicode.org/
ISO-IR - 2.8.1 Coding systems with Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
780デフォルトの名無しさん:2014/03/07(金) 22:35:48.09
論文とはちょっと違うような。
文字コード関連で論文書いてると言ったら
http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/publications.html
が真っ先に思い浮かんだ
781デフォルトの名無しさん:2014/03/07(金) 22:42:10.26
UnicodeやISOのTRその他の方が激しい追求を受けると思いますが。
782デフォルトの名無しさん:2014/03/08(土) 09:20:49.63
でも上記のリンクはTRじゃないよ
むしろこっちでしょ
http://std.dkuug.dk/jtc1/sc2/wg2/
783デフォルトの名無しさん:2014/03/08(土) 09:23:43.86
っていうか>>3から引用しただけ?
784デフォルトの名無しさん:2014/03/08(土) 17:39:51.62
はてさて
785デフォルトの名無しさん:2014/03/11(火) 23:28:53.24 ID:aGkLZTRR
786デフォルトの名無しさん:2014/03/11(火) 23:42:26.16 ID:jQzgMrsx
Unicode の EastAsianWidth.txt について、

00C1;N # LATIN CAPITAL LETTER A WITH ACUTE
00E1;A # LATIN SMALL LETTER A WITH ACUTE

のように同じ文字で大文字小文字の違いしか無さそうなのに
幅の扱いが異なるものがあるのですが、
このようなことになっている理由は何でしょうか?
787デフォルトの名無しさん:2014/03/12(水) 00:19:12.34 ID:i/nwzYk6
一方しか含まれていないコード体系があるとかじゃね
知らんけど
788デフォルトの名無しさん:2014/03/12(水) 02:11:29.05 ID:qw9ToN7v
そんなのあったっけ?
JIS X 0212から追加されてるみたいだけど
789デフォルトの名無しさん:2014/03/12(水) 16:49:07.31 ID:eyJxw9l2
なんで文字に番号振るだけなのに
研究とかしてんの?
790デフォルトの名無しさん:2014/03/12(水) 16:55:22.46 ID:vd/9/rkK
「文字とは何か」という哲学的な命題が背後にあるから
791デフォルトの名無しさん:2014/03/12(水) 19:11:13.07 ID:qALwfLVq
>>788
日本の0212はSJIS対象外だから無視w
あれはほぼPC,Macの文字コード範囲くらいしか互換対象になってない。
中国のPCで大文字だけ使えたらしい。
792786:2014/03/12(水) 22:16:09.94 ID:NZAlFHc5
>>787
調べてみたら、 GB 2312 だと小文字の方しか含まれていないようでした。
ttp://zh.wikipedia.org/wiki/%C3%81

JIS X 0212 などが反映されていない、というのは、
そもそも East Asian Width が古い文字コードとの互換性のためのものなので、
比較的新しい文字コードには対応しない、ということですかね。

うーん、ややこしい。
793デフォルトの名無しさん:2014/03/16(日) 19:03:10.60 ID:BBT9IZ2o
Unicodeで互換用に残されてるけど使うべきじゃない文字ってどこかにまとまってる?
794デフォルトの名無しさん:2014/03/20(木) 21:44:45.24 ID:heUDSwye
バベルのページ見てたら
「バベルでの変換は特に明記していない限り MS-Windows の IE をお手本にしています。」
ってあるけどIEの変換方法って公開してるんだっけ?探しても見つからないんだけど
795デフォルトの名無しさん:2014/03/20(木) 22:12:54.66 ID:N5eLnApK
バベルってのが分からんが、MS純正の文字コードAPIの変換使ってるだけなんじゃないの?
796デフォルトの名無しさん:2014/03/20(木) 23:08:51.90 ID:heUDSwye
>>795
えっそういうことなの
バベルは>>9のやつです
797デフォルトの名無しさん:2014/04/01(火) 00:33:15.13 ID:WUOo5w3/
さて
798デフォルトの名無しさん:2014/04/05(土) 21:32:13.78 ID:RgNzn3fu
cp932 = シフトJIS?
シフトJISっていう名称はどこかに登録されてる?
Shift_JISはIANAで登録されてると思うけど
799デフォルトの名無しさん:2014/04/05(土) 21:46:04.47 ID:4p3tjfYN
>>798
されていない
800デフォルトの名無しさん:2014/04/06(日) 08:01:34.90 ID:B8PUb7p+
JISの用語は「シフト符号化表現」だっけ?

あと、正式でない用語は、正確に実装されていないものとか、似たものを総称してとか、
そういうものを表現するために便利に使われている。
801デフォルトの名無しさん:2014/04/06(日) 15:32:34.79 ID:SoAcTpCI
JIS X 0208:1997ではね。
JIS X 0213:2004移行はShift_JIS-2004だよ。
JIS X 0213で文字増えた文も含むのはShift_JISX0213で。
802デフォルトの名無しさん:2014/04/06(日) 16:46:46.91 ID:8UGyvOK/
JISのシフトJISなんて当時の世の中の標準を
無視できなくなって遅れて書いただけだろ。
世間で「シフトJIS」と言ったときには
JISのそれを指すことなど安岡信者とその取り巻きを除いて
皆無に近い
803デフォルトの名無しさん:2014/04/06(日) 17:21:32.69 ID:SoAcTpCI
カッチリした規格があるのは重要。
804デフォルトの名無しさん:2014/04/06(日) 20:48:52.12 ID:M292oQRa
どの文字コードであれ正解は役所とかで実際に運用されている文字コードが正解になる
つまり何が正しいかの探求は役所への取材から始まる
805デフォルトの名無しさん:2014/04/06(日) 22:15:42.61 ID:SoAcTpCI
職場の愚痴はマ板行けよ。
806デフォルトの名無しさん:2014/04/07(月) 06:25:47.71 ID:6r6QSdOH
やなこったw
807デフォルトの名無しさん:2014/04/07(月) 09:46:47.69 ID:Y1cs/XQ6
経産省は役所じゃないのか
808デフォルトの名無しさん:2014/04/07(月) 09:49:42.18 ID:Y1cs/XQ6
>>798
Windows-31JだけどIEが対応していないので事実上使えない
Encoding StandardではShift_JIS = cp932 - PUA
809デフォルトの名無しさん:2014/04/07(月) 11:17:13.52 ID:QoYPH5Yx
ぷあっ
810デフォルトの名無しさん:2014/04/08(火) 19:37:24.54 ID:pfMGzHK8
大江健三郎もびっくり、あいまいな日本のエンコーディング
もう疲れたからユニコードでいいです。
昨日ウブンツを適当に入れて日本のホームページを見たら
一部の漢字が見慣れない形をしていましたが
そのぐらいのことは我慢します。
811デフォルトの名無しさん:2014/04/11(金) 23:11:28.88 ID:Zp0BL2uE
http://slashdot.jp/~yasuoka/journal/579915
安岡センセイ迷走してるみたいだけど結局何が言いたいのだろう
812デフォルトの名無しさん:2014/04/12(土) 01:12:45.44 ID:a2NVx4h6
むしろここで一人で安岡ヲチしてる人こそ何をしたいのかよくわからん…

このスレや過去スレを「安岡」でスレ内検索してみるとものすごく異様。
813デフォルトの名無しさん:2014/04/12(土) 13:33:41.81 ID:EgrmLH2O
安岡さんが、キーボード配列の件で坂村さんを「デマ発信源」認定したのが気にくわない、
某方面のアレな信者でしょw
814デフォルトの名無しさん:2014/04/12(土) 15:05:23.03 ID:UapBJj1i
坂村さんは今風に言えば
御用学者だよな
815デフォルトの名無しさん:2014/04/14(月) 11:59:40.17 ID:1onkTecJ
>>813
本人乙
816デフォルトの名無しさん:2014/04/15(火) 21:26:58.32 ID:xZHXZozl
>>815
坂村先生お疲れ様です

アホらし
817デフォルトの名無しさん:2014/04/15(火) 21:27:59.56 ID:xZHXZozl
じゃなきゃ南堂信者か本人
818デフォルトの名無しさん:2014/04/15(火) 21:51:19.51 ID:xZHXZozl
まあそれはともかく「ちゃんとしたIVSがほしいからあえてIVSと呼んでいる」は
本気で意味わからない。名前が気に入らないってだけ?
819デフォルトの名無しさん:2014/04/15(火) 23:18:51.37 ID:ZjWcuo2H
スラドにコメントしろよ
820デフォルトの名無しさん:2014/04/16(水) 00:47:06.39 ID:xXudedaW
うむ。
821デフォルトの名無しさん:2014/04/17(木) 21:25:09.42 ID:WnuPjrTt
本人認定とか、完全にまじキチ君だな。
822デフォルトの名無しさん:2014/04/17(木) 21:36:39.35 ID:sxwy7+Pq
どうでもいいよもう。

とりあえず安岡叩きしてる人はどこか味方のいる場所を見つけてそっちで好きなだけやってくれ。
ここで叩いても誰も賛同せずに今回みたいな流れになるだけだからさ。
823デフォルトの名無しさん:2014/04/19(土) 02:41:39.74 ID:GMRdES/l
ネットのテキストをコピーすると、たまに文字コードの異なる半角スペースがあるのが困る。
824デフォルトの名無しさん:2014/04/19(土) 05:54:36.53 ID:4rjoMz+n
825デフォルトの名無しさん:2014/04/19(土) 09:54:13.30 ID:uixitbPb
どちらかというと「安岡」という単語に猿のレベルで脊髄反射して
トロン信者認定のレスを貼る安岡信者の方がすごいと思う
826デフォルトの名無しさん:2014/04/19(土) 13:11:12.57 ID:4rjoMz+n
>>825
過去ログに残る執拗な叩きの痕跡という前提がまるで存在しないかのように、
件の彼に対する反応を「『安岡』という単語に猿のレベルで脊髄反射」ってことにするのはどうかと。
あなたが同列に「どちらがすごいか」を比べてるのが奇妙に思えるほど、件の彼の行動は異質。積み重ねがあるからね。

そしてもちろん、件の彼について話している人は
「この人はなぜ、疎まれることがわかっている場でなお1人で叩き書き込みを続けるモチベーションを持っているのだろう?」
という点を不思議に思って集まっているんであって、書き込みの動機は明確。ここから「安岡信者」と解釈はしづらい。

また、仮にもしそのなかに「安岡信者」が紛れ込んでいたとして、
その信者はこのスレで執拗に「敵」を叩き続けたりはしていない。
件の彼と違って人畜無害なのだから、ほうっておけば良い。
827デフォルトの名無しさん:2014/04/19(土) 13:15:43.09 ID:ZEjCExyP
おれなんでこのスレ常駐してんだっけ……
828デフォルトの名無しさん:2014/04/19(土) 13:43:05.46 ID:kntd4M4V
>信者はこのスレで執拗に「敵」を叩き続けたりはしていない。

これには同意。
安岡信者は被害妄想が激しく
単発のレスで偏執に被害を主張するのが特徴だからね。
829デフォルトの名無しさん:2014/04/19(土) 17:03:56.09 ID:C6iMx0Tv
>>823
NBSPが紛れこんでてイラっと来るやつかな
830デフォルトの名無しさん:2014/04/20(日) 08:23:30.09 ID:KqLq5BGH
信者とか言い出す時点でどの発言も議論として無価値
831デフォルトの名無しさん:2014/04/21(月) 10:53:47.48 ID:zriSdqBt
> 被害妄想が激しく
> 単発のレスで偏執に被害を主張するのが特徴だからね。

安岡さんに対して執拗に粘着している君の特徴じゃないかw
832デフォルトの名無しさん:2014/04/21(月) 19:22:16.02 ID:FvrWMSvP
安岡センセイもビットコインに走っちゃったから…
…おっと誰か来たようだ
833デフォルトの名無しさん:2014/04/22(火) 02:46:51.52 ID:P71sOVmH
誰も来てない
834デフォルトの名無しさん:2014/04/22(火) 16:39:21.34 ID:lALHniJm
よそでやれよ気違いども
835デフォルトの名無しさん:2014/04/23(水) 01:02:12.57 ID:sJ3rggrT
サロゲートペアがらみで文字化けとか文字落ちは未だに良くありますか?
合成文字(アイヌ語表記用)などがうまく処理できないんですけど、完全にサポートをしないと割り切った人はいますか?
836デフォルトの名無しさん:2014/04/23(水) 01:11:50.85 ID:8DMe2xVl
サロゲートペアかどうかの判定なんていちいち入れないし
固定長に可変長混ぜたら何の意味もない
837デフォルトの名無しさん:2014/04/23(水) 01:58:46.32 ID:GjUEx0RG
何か誤解してる様だが、元々Unicodeの文字表現は可変長
838デフォルトの名無しさん:2014/04/23(水) 18:34:35.68 ID:TEjyogET
はじめは16bit固定じゃないの?
839デフォルトの名無しさん:2014/04/23(水) 20:59:37.84 ID:TEjyogET
「元々」って「当初は」って意味で書いてないのか
すまん
840デフォルトの名無しさん:2014/04/23(水) 21:11:18.40 ID:7vo5B08Z
「か」と「゛」で「が」みたいに
二文字で一文字を表す合字があるんだから、
言語機能かライブラリを使うしか
現実的な対応方法ないだろ。

逆に言えば、それらを使っていれば
無視できる問題。
841デフォルトの名無しさん:2014/04/23(水) 21:34:36.00 ID:T2nRtnpg
UTF-8あたりとごっちゃになってる?
842デフォルトの名無しさん:2014/04/23(水) 21:52:29.17 ID:WcbcT70M
最初から UTF-16 も UTF-32 も可変長だけど
未だに固定長と思ってるやつなんかいるんだ?
そりゃすげーや
843デフォルトの名無しさん:2014/04/23(水) 21:58:56.82 ID:FOWeiF78
そりゃ日本の官公庁相手に仕事してる分には
たいていそれで許されるからな
844デフォルトの名無しさん:2014/04/23(水) 22:22:44.74 ID:GjUEx0RG
>>842
「code pointを複数組み合わせた可変長で文字(grapheme)を表現する」っていう
Unicodeの基本をどうしても理解できない(認めたくない)人がいるんですよ。
845デフォルトの名無しさん:2014/04/23(水) 23:13:15.72 ID:Unh9uImh
>>843

お役所が扱う人名なんて、それが許されない筆頭じゃなかろうか。
846デフォルトの名無しさん:2014/04/24(木) 11:06:30.10 ID:Cg0dX6qy
Unicode1.0の頃はUCS-2。UTF-16は2.0から。
UCS-2はBMPの固定長エンコーディング。
まだ固定長原理主義者が多い頃だったから。

けどそれじゃBMP以外や合成文字どうすんねん、
規格の中で矛盾してるだろ、固定長原理主義無理だろってことで、
その辺入れたUTF-16になった。
たしかUTF系はベル研のケン・トンプソンが考えた8が最初。

うろ覚え書き込みだから、修正よろ。
847デフォルトの名無しさん:2014/04/25(金) 00:12:43.23 ID:zWWRq5q6
修正不可能なくらい間違いまくってるよ。
そもそもUCSは文字集合を定めるものであり、UTFは個々の文字を
どう表現するかを定めるものであってまったく別の概念だし。
848デフォルトの名無しさん:2014/04/25(金) 08:45:09.27 ID:3oy/mjAO
CPUのエンディアンが複数あるため、UTF-16にはBEとLEがあります。
どのサイトも説明見ると大体こんなような事書いてあるけど意味が分からない
エンディアンがどうこうってエンコーディングの内部で解決されるべき問題でしょ?
CPUに合わせてLEを使うと速いですよって事?
849デフォルトの名無しさん:2014/04/25(金) 08:57:28.13 ID:XCREUD3T
絵文字統一か
850デフォルトの名無しさん:2014/04/25(金) 13:03:42.00 ID:t30thbGu
>>848
確かにその説明はおかしいと思う。
画像フォーマットでもtiffにはエンディアンの指定があるが、普通はどちらにも対応する。
851デフォルトの名無しさん:2014/04/25(金) 13:20:19.28 ID:B1sFbtmb
>>848
ちゃんとエンコーディングでBE,LEが考慮されてるでしょ?
それともBEとLEの存在自体が問題だといってんの?
何がおかしいかわからない
852デフォルトの名無しさん:2014/04/25(金) 13:55:02.90 ID:4klH39dY
何を悩んでいるのかしら無いけど、
初期のUTF16の話として16bit固定っていうのはわかるよね?

C言語風に書くならば、WCHAR型(16bit)となって、
WCHAR *text = "あいうえお";
こういう定義になる。

この時のメモリ配列はC言語の仕様によりCPUのエンディアンによって変わる。
このメモリ内容がUTF-16BEやUTF-16LEなんだよ。

ファイルに保存するときはどちらかに統一してもいいが、
処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
だからUTF16-BEかUTF16-LEというものが生まれることになる。

メモリ内で使うために、UTF16-BE と UTF16-LE の存在を無くすことは出来ない。
そのメモリ内容をそのまま保存することもある。テキストファイルではなくて
構造体データの一部としてテキストが含まれている場合とか、一項目ずつ保存するのではなくて
メモリの構造体データを丸ごと保存したりするからね。

だから、UTF16-BEかUTF16-LEという存在はCPUのエンディアンの存在によって生まれ、
それを保存するファイルに格納されたデータの呼び名にもなる。
853デフォルトの名無しさん:2014/04/25(金) 14:14:58.98 ID:gMbJ5qLh
テキストファイルで保存するときでもLEとBEを選べるエディタがあるんだが
それはおかしいのか?
854デフォルトの名無しさん:2014/04/25(金) 14:19:55.61 ID:jrLTZF6i
世の中に二つの形式があるのなら、
二つの形式を選べるのが普通でしょう?

エンディアンが違うCPUとの間でもファイルの交換や、
ネットワーク通信できるんだから。
855デフォルトの名無しさん:2014/04/25(金) 14:57:01.01 ID:m07o/u+5
> C言語風に書くならば、WCHAR型(16bit)となって、
> WCHAR *text = "あいうえお";
> こういう定義になる。
WCHAR *text = L"あいうえお";
じゃね?
856デフォルトの名無しさん:2014/04/25(金) 15:01:18.03 ID:jrLTZF6i
別にC言語風だからどうでもいいよ
857デフォルトの名無しさん:2014/04/25(金) 15:34:10.60 ID:XZGKxZHW
たまには。PDPエンディアンのことも思い出してあげて
858デフォルトの名無しさん:2014/04/25(金) 15:49:44.73 ID:T54U1ii9
エンディアン嘘つかない
859デフォルトの名無しさん:2014/04/25(金) 17:51:44.43 ID:4fGC8eBc
>>847
UCSとUTFの区別は最初はなかった。
最初はUCSのみ。
>>846も書いてるけど。
860デフォルトの名無しさん:2014/04/25(金) 17:56:44.39 ID:991UJ/F9
>>848
UTF-16文字列はuint16_tの並び。
uint16_tだからCPUによってバイト順が違う。
だからエンコーディングのバイトオーダーが決まってると、
逆順のシステムはネットワークにデータを流す時にバイト順を毎回変えないといけない。
それを防ぐためにバイトオーダー順違いのエンコーディングが定義されてる。
こうしておくと必要なときだけバイト順を変えればいい。
DCE/RPCみたいに接続時にバイトオーダをネゴしてもいいし、
どちらを送られても必ず扱えるようにしてもいい。
861デフォルトの名無しさん:2014/04/25(金) 18:34:47.40 ID:3oy/mjAO
レスありがとう
2つの(代表的な)エンディアンがあってだからBEとLEがありますだと理由付けとして弱い、何か他にあるんじゃないの??って疑問でした。
だから
>処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
という事情があると知り納得しました。
862デフォルトの名無しさん:2014/04/25(金) 20:13:07.53 ID:+TF8D1gC
2つしかない。
863デフォルトの名無しさん:2014/04/25(金) 20:28:19.84 ID:XFGUZTlf
Unicode規格のエンコーディングフォームと
エンコーディングスキームの区別が全く
ついていない人が集うスレはここですか?
864デフォルトの名無しさん:2014/04/25(金) 20:41:42.68 ID:nsFgzzSj
>>863
あなたもその一人です。
865デフォルトの名無しさん:2014/04/25(金) 21:32:54.46 ID:lqZ5R9lm
キター
パーソナルメディア、Unicode IVS/IVDを活用する異体字検索入力ツールを発売
http://itpro.nikkeibp.co.jp/article/ActiveR/20140422/552244/
866デフォルトの名無しさん:2014/04/26(土) 07:57:34.66 ID:ZfEIw6x8
IVS流行るんかねぇ
今3000字くらいだっけ?登録されてるの
867デフォルトの名無しさん:2014/04/26(土) 20:11:54.73 ID:Y0Dd5Dys
有料なのかよ
babelmap使えばいいな
868デフォルトの名無しさん:2014/04/27(日) 06:28:54.53 ID:ZQa6pLX5
先月までレビューをやってた新しいIVDはその後どうなったんだろ
869デフォルトの名無しさん:2014/04/27(日) 06:55:39.54 ID:1HDcLnog
>>867
しかも10ライセンス単位
それでも一般販売されるようになっただけ一歩前進
870デフォルトの名無しさん:2014/05/01(木) 02:19:11.86 ID:jqsfROWp
20年以上前に MS-DOS で
grep "\["
ってやって、関係ない漢字が大量にヒットした時の絶望感。
Microsoft を捨てる理由になり得るということを
理解してくれる人は少ない。
871デフォルトの名無しさん:2014/05/01(木) 02:54:30.27 ID:o0DjzHC6
ほー。
872デフォルトの名無しさん:2014/05/01(木) 06:02:50.85 ID:cONH9EUi
へー。
873デフォルトの名無しさん:2014/05/01(木) 17:37:23.88 ID:qBGbIEYq
MS-DOSにgrep有ったのか
874デフォルトの名無しさん:2014/05/01(木) 17:56:01.26 ID:SDsBtHY9
アスキーの Software Tools for MS-DOS 他、いろいろあったよ
875デフォルトの名無しさん:2014/05/01(木) 18:34:21.61 ID:qBGbIEYq
マイクロソフト以外のツールの出来が悪いと
Microsoft を捨てる理由になり得る のか
876デフォルトの名無しさん:2014/05/01(木) 19:06:00.71 ID:SDsBtHY9
「Microsoft漢字コード」って意味じゃねーの?
877デフォルトの名無しさん:2014/05/01(木) 21:32:54.04 ID:jqsfROWp
「Microsoft漢字コード」って意味です。
それ以外にも理由は山ほどありましたが。
その後、Pentium マシン買ってとっとと Linux 入れて
Microsoft を捨てました。前世紀のことです。
エンコーディングは当初は euc-jp , 後に utf-8 。

プリインストールされていた windows 98 を有効利用しようと
一応は努力したんですよ。10日間くらい。
878デフォルトの名無しさん:2014/05/02(金) 03:26:51.56 ID:Bonx+GYW
>>874
特に緑の256本にお世話になりました。
879デフォルトの名無しさん:2014/05/02(金) 08:40:36.13 ID:QU3ScAPG
まあバカには難しいからな
880ニュース記事より:2014/05/02(金) 12:43:16.91 ID:ufjYsrm8
UTF-16 で、+2D 91+A9 52 7D 00+9F 53+ って何ですか?
tp://headlines.yahoo.
co.jp/hl?a=20140427-00000009-asahi-int
881880:2014/05/02(金) 13:14:16.23 ID:ufjYsrm8
Internet Explorer を外したら上手くいきました。(._.)
882デフォルトの名無しさん:2014/05/07(水) 23:28:11.14 ID:FbKWdn3j
utf-1のオリジナルの仕様書はどこかに無いですかね?
883デフォルトの名無しさん:2014/05/08(木) 01:59:00.77 ID:1FoEUPwa
>>882
なにそれ? 1bit encode?
884デフォルトの名無しさん:2014/05/08(木) 02:19:16.15 ID:Ejp4CkYN
8bitだな
885デフォルトの名無しさん
数字の付け方が途中で変わったからねぇ。