文字コード総合スレ part9

1 ：デフォルトの名無しさん：2014/05/29(木) 03:29:39.61 ID:i1u97cMX

プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
（スレ再利用）UnicodeとUTF-8の違いは？ http://pc12.2ch.net/test/read.cgi/tech/1177930957/
（隔離スレ）UnicodeとUTF-8の違いは？　その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/

2 ：デフォルトの名無しさん：2014/05/29(木) 03:33:49.61 ID:i1u97cMX

■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
http://lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006-March/000002.html
JISX4061
日本語文字列照合順番
http://www.jisc.go.jp/

3 ：デフォルトの名無しさん：2014/05/29(木) 03:35:09.37 ID:i1u97cMX

■これまでに行われた議論
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
　内部的には Unicode -> CP932 -> CP5022ｘって変換な気もする
・人名をソートかけたらバストサイズ順の並びになる？
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい（統計的に文字の出現確率なんかを調べる）
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた？
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か？。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
　Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示（Unicodeに変換）する際に
　機種依存文字はサポートされるか？
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF（アイヌ語表記用小書きカタカナ）が入ってない件
・なぜ携帯業界はunicode化しないのか？
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい

4 ：デフォルトの名無しさん：2014/05/29(木) 03:36:21.03 ID:i1u97cMX

・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「?心」簡化政策によると「?(U+6076)」に統一。口偏＋?(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離（中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか）
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは？
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
　U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
　ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
　中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 （1面）」のバグ
　UTF-16: 0x304B 0x309A →　Unicode: U+FD61809A　（間違い）　（ISO/IEC10646はU+10FFFFまで）
　サロゲートペアからコードポイントを引き出す計算を無理やり適用（間違い）
　((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの？　→　ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。多言語の混在表現は（unicodeでは）できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが　→　ムリです。
・Unicodeサニタイズが面倒になるのか

5 ：デフォルトの名無しさん：2014/05/29(木) 03:37:31.55 ID:i1u97cMX

・SJISとUNICODEの判別はどのようにすればいいですか？BOM。無ければ、統計判断。ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ？　→　ウンコマークもUnicodeに追加されるんだな。
・WindowsXP でフォルダに使用できないフォルダ名はどうやって判定
　　→　ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
　Windows7では表示されない。　→　和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
　コントロールパネル-地域と言語のオプション-[言語]タブで
　「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か？海栗コードへの挿入は難しい。そこでTRONだ！！
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
　陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。　→　ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る？
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10％増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。

6 ：デフォルトの名無しさん：2014/05/29(木) 03:38:41.99 ID:i1u97cMX

もうひとつの過去スレ:
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/

隔離スレ:
UnicodeとUTF-8の違いは？
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは？　その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは？　その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/

7 ：デフォルトの名無しさん：2014/05/29(木) 03:43:39.63 ID:AMcBMTZL

■ライブラリ
IBM Globalization - ICU
http://www-306.ibm.com/software/globalization/icu/
NKF32.DLL
http://www.vector.co.jp/soft/win95/util/se020949.html
バベル
http://tricklib.com/cxx/ex/babel/
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
http://tricklib.com/cxx/ex/babel/scoremap.csv
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/

8 ：デフォルトの名無しさん：2014/05/29(木) 03:44:10.17 ID:AMcBMTZL

■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
　表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か？MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
　MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac（内部Unicodeアプリ）は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ（U+FFFD）になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
　charset=CP932で送信される場合とISO-2022-JP（もどき）で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
　U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
　U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
　U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
　U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
　U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
　U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
　解決策：取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
　MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
　再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う（機種依存文字等）。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
　'0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
　あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。

9 ：デフォルトの名無しさん：2014/05/29(木) 03:45:57.03 ID:AMcBMTZL

JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
http://std.dkuug.dk/JTC1/SC2/WG2/

ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
http://appsrv.cse.cuhk.edu.hk/~irg/

10 ：デフォルトの名無しさん：2014/05/29(木) 03:47:58.07 ID:AMcBMTZL

テンプレ
リンクきれてます（？）
会員制（？）

ISO-IR - 2.8.1 Coding systems with Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
日本の委員 (JSC2)
http://www.itscj.ipsj.or.jp/meibo/020000.pdf

11 ：デフォルトの名無しさん：2014/05/29(木) 09:10:02.90 ID:QcRCI5DY

　　　　　　　　　　　　　　ノ　　　　ﾟ.ﾉヽ　 , /}　　　　　　...
　　　　　　　　　　　　,,ｲ`"　　　　　､-' 　 `;_' '　　　　..::::::::::::::...
　　　,-､　　_.._　　　(　　　　　　　　(,(~ヽ'~　　　　　..:::::::::::::::::::::::
　）'~ 　ﾚｰ'　　〉　　ヽ　　　　　　　i`'}　　　　　　　.:::::::::::::::::::::::
　~つ　　　　'-ｰ､　　i　　　　　　　|　i'　　　　　...:::::::::::::::::::::::
　／　　　　　　 <　　/　　　　　。/ 　 !　　......:::::::::::::::::::::::::　　　　これは>>1乙じゃなくて
/　　　　　　　　　~^´　　　　 /},-''　,●::::::::::::::::::::::::::::::::::::
i､　　　　　　　　,i'　_,,...,-‐-､/　　　 i　 ::::::::　　.:::::::::::::
..ゝ　　　　　　　　<,,-＝=､　　　,,-,/　　　　　 .:::::::::::　　　　　　　　　　　　放射能がうんたら
　)　　　　　　　{~''~>`v-''`ｰﾞ`'~　　　　　　　..:::::::::　　　　　　　　　　　　　　　　　　　　　　　　　　........::.
　{　　　　　　　ﾚ_ﾉ　　　　　　　　　　　　..::::::::.　　　　　　　　　　　　　　　　　　　　　　　　　......:::::::::
ノ　　　　　　　　　''　　　　　　　　　　　..:::::::　　　　　　　　　　　　　　　　　　　　　　　 ...::.:...:::::::::
　　　　　　　　　　　　　　　　　　　　 .:::::::::　　　　　　　　　　　　　　　　　　　　　...:......::::::::::::　.
　　　　　　　　　　　　　　　　　　　　.:::::::::::.　　　　　　　　.....　　　　　 ..　　..::::::::::::::::::::::::　　　:::.
　　　　　　　　　　　　　　　　　　　　::::::::::::::::.::::::....:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::..　::　 ::..
　　　　　　　　　　　　　　　　　　　 .::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::　:::　　　　::.
　　　　　　　　　　　　　　　　　　　　:::::::::::::::::　::::::::::::::::::::::::::::::　:::::
　　　　　　　　　　　　　　　　　　　　　　　　　 .::　　　 ::.　　:::

12 ：デフォルトの名無しさん：2014/05/29(木) 13:19:34.52 ID:7VOFEqgh

よかったあ

13 ：デフォルトの名無しさん：2014/06/02(月) 01:45:05.35 ID:+iCC0J5d

なにが

14 ：デフォルトの名無しさん：2014/06/02(月) 13:24:04.80 ID:0mAz4fvl

なにもかも

15 ：デフォルトの名無しさん：2014/06/02(月) 14:12:20.33 ID:PPCsJiS0

>>10
http://itscj.ipsj.or.jp/ISO-IR/index.html から

http://itscj.ipsj.or.jp/ISO-IR/2-8-1.htm

16 ：デフォルトの名無しさん：2014/06/03(火) 03:45:21.59 ID:pB9rBZIC

テンプレ
ありがとうございます

17 ：デフォルトの名無しさん：2014/06/03(火) 19:03:41.57 ID:TIVU9A4i

さて

18 ：デフォルトの名無しさん：2014/06/04(水) 10:52:11.91 ID:V3e66VGu

あさて

19 ：デフォルトの名無しさん：2014/06/04(水) 18:18:42.51 ID:5pV3j4zN

さても

20 ：デフォルトの名無しさん：2014/06/05(木) 10:49:44.94 ID:EQvmYwTS

なんきん

21 ：デフォルトの名無しさん：2014/06/05(木) 12:49:08.09 ID:CbdkWkFK

だいぎゃくさつ

22 ：デフォルトの名無しさん：2014/06/05(木) 21:01:47.28 ID:55VBH6H6

６月４日

23 ：デフォルトの名無しさん：2014/06/06(金) 04:53:43.90 ID:hlJ+Mxxa

虫歯予防デー

24 ：デフォルトの名無しさん：2014/06/06(金) 15:23:10.27 ID:I+JvoaST

携帯電話絵文字 UNICODE　u1f330～u1f36f, u1f400～u1f41f
前スレッド >>917
>>914
>>ブラウザは何？　サーバ側で画像に差し替えてるのは、
>>UserAgent見て切り替えたりしてんじゃないの？

同じtwitterでも、以下のように表示が違う。
disktop PC(Firefox)　　カラー絵文字　　全文字表示
Nexus7(Chrome)　　　　モノクロ(font)　一部表示不可
smart phone(モバツイ)　モノクロ(font)　一部表示不可

これはUserAgentでブラウザを識別して画面表示を差し替えているのか。

上記Nexus7とsmart phoneで表示される文字と、
disktop PCにてWikipedia「Unicode一覧 1F000-1FFFF」で表示されるフォント
文字について、表示可能・不可の文字がほぼ一致しているので、
OS(platform)に入っているフォトデータは、ほど同様のものが入っていると
考えられる。

25 ：デフォルトの名無しさん：2014/06/06(金) 15:51:53.99 ID:I+JvoaST

>>24
variation selectors(字形選択子)で以下の様に識別して表示する方法がある。
VS15(Ufe0e) text style
VS16(Ufe0f) 絵文字style

26 ：デフォルトの名無しさん：2014/06/06(金) 16:14:38.31 ID:rwepUkdq

カタカナではよくあるけど、英表記でdisktopはなあ…

27 ：デフォルトの名無しさん：2014/06/06(金) 22:14:56.55 ID:OcxaL9bN

円形ごたつの上に置けば辻褄は合うんじゃね？

28 ：デフォルトの名無しさん：2014/06/06(金) 23:01:53.42 ID:1f1OIxtf

>>26
Web に堂々と書いてる企業もあるし
http://www.iimhs.co.jp/news/2009/12/44.html

29 ：デフォルトの名無しさん：2014/06/07(土) 11:25:16.55 ID:u3dUy4Sv

バカ発見のための良い指標のひとつだな

30 ：デフォルトの名無しさん：2014/06/07(土) 19:00:43.27 ID:TtMz71Y/

富士通だってこうだもん
http://software.fujitsu.com/jp/icopy/function/function_sample.html

31 ：デフォルトの名無しさん：2014/06/07(土) 19:43:32.72 ID:SxbAzKvi

いわゆる ambiguous 母音だろ
気にスンナ

32 ：デフォルトの名無しさん：2014/06/07(土) 19:47:18.33 ID:ljyTaF04

Boys, be ambiguous.

33 ：デフォルトの名無しさん：2014/06/07(土) 19:50:52.06 ID:SxbAzKvi

>>28
こっちは完全にアウトだな

34 ：デフォルトの名無しさん：2014/06/07(土) 21:20:51.63 ID:pwUo7KxC

ディスクトップはタイポじゃないの？
disktopが正しいと思ってるひとがいるの？

35 ：デフォルトの名無しさん：2014/06/07(土) 21:25:59.68 ID:TtMz71Y/

>>34
詳しくは言えないが、いるよ

36 ：デフォルトの名無しさん：2014/06/07(土) 23:05:55.30 ID:0yDbbXBE

机じゃなく皿の上に置いてるんだよ

37 ：デフォルトの名無しさん：2014/06/08(日) 03:01:40.32 ID:4qzWshc7

DTPなんて皿回してなんぼです

38 ：デフォルトの名無しさん：2014/06/08(日) 11:17:13.72 ID:t5DgyYSS

昔はフロッピーディスクがメディアの標準だったからな
その当時にデスクトップという言葉が出てきて、（フロッピー）ディスクトップと空耳する人多かった

39 ：デフォルトの名無しさん：2014/06/08(日) 23:48:04.47 ID:0ybo3LG4

そんなわけねー。

ノートPCが流行ったころ（だいたいPC-9801Nが出た頃だな。1990年代前半）が、
フロッピーディスクのデフォルトがゆるやかに5インチから3.5インチになった頃だが、
当然ノートPCと区別するためにデスクトップPCをそういう風に呼ぶ機会も増えたわけだが、
間違えて空耳のまま書く奴は、まずいなかったぞ。

40 ：デフォルトの名無しさん：2014/06/09(月) 02:33:37.86 ID:VU05Hf42

ノートというかラップトップね。てか、悪ノリでしょ。

41 ：デフォルトの名無しさん：2014/06/09(月) 08:55:28.79 ID:9rhLvykP

>フロッピーディスクのデフォルトがゆるやかに5インチから3.5インチになった頃

90年代後半だろ

42 ：デフォルトの名無しさん：2014/06/09(月) 09:40:02.10 ID:3muiQ+A2

90年代後半でわざわざ5インチ導入しないだろ
HDD搭載が当り前で、フォントや言語の制限が無くなった()時期

43 ：デフォルトの名無しさん：2014/06/09(月) 10:25:37.89 ID:0wp3BeLp

ラップトップというのは98ノートやダイナブックよりでかい奴を言う。
98LTとか。

それと、それ以前から3.5インチのFDDのマシンはあったけど、
ノートPCのFDDが3.5インチだったのが、3.5インチへの移行への大きな理由のひとつ。

44 ：デフォルトの名無しさん：2014/06/09(月) 11:27:28.78 ID:53QNO1iV

そして逆に小さいのがウルトラマンPCだ。

45 ：デフォルトの名無しさん：2014/06/09(月) 11:46:29.34 ID:EIMFvUmC

SMC-70からだなあ、3.5インチ

46 ：デフォルトの名無しさん：2014/06/09(月) 12:49:58.01 ID:r3iX82eS

小さいのはパームトップでしょ

47 ：デフォルトの名無しさん：2014/06/09(月) 14:06:19.46 ID:EIMFvUmC

http://ja.wikipedia.org/wiki/Palm_Top_PC_110

懐かしいな・・・

48 ：デフォルトの名無しさん：2014/06/09(月) 14:41:13.31 ID:WYLHhV4p

で、話を戻すと、「ディスクトップ」という誤用を目にするようになったのはWindows95普及後だと思うんだがね。

49 ：デフォルトの名無しさん：2014/06/09(月) 15:33:31.88 ID:EIMFvUmC

そう？マックの初期のころからあるけどな

50 ：デフォルトの名無しさん：2014/06/09(月) 16:04:28.62 ID:0wp3BeLp

それだとマックユーザーがアホという結論になってしまう

51 ：デフォルトの名無しさん：2014/06/09(月) 16:32:20.20 ID:3muiQ+A2

マックは普通に文字化けしてたから
マニュアルでさえ文字化けしたままの表記だったけどな

52 ：デフォルトの名無しさん：2014/06/09(月) 16:39:02.55 ID:mU4Wj5uP

腿の上に載せて使えるのがラップトップ。
小さい子供を座らせる部分がlap.

53 ：デフォルトの名無しさん：2014/06/09(月) 17:50:35.47 ID:VU05Hf42

みんな古い話が好きだねえ

54 ：デフォルトの名無しさん：2014/06/10(火) 00:27:47.88 ID:QQ+0NTJb

インスツルールとかいうのは見た

55 ：デフォルトの名無しさん：2014/06/10(火) 08:20:34.08 ID:7Ecun26C

PC-98の場合、RAは5インチ専用で、3.5インチはESとか小型デスクトップだったな。1990年ごろの話。
その次のDAで5インチと3.5インチが同じ本体で混在。でも５インチが主流。
FAのころは知らないけど、A-Mateのころは3.5インチが主流だったね。
そういえば、3.5インチが1.44MBが読めるようになったのはどのあたりからだったけ？

56 ：デフォルトの名無しさん：2014/06/10(火) 09:52:36.02 ID:IQXrTSSv

1.44は例によってIBMのPS/2からじゃないかな
日本は5インチとフォーマット同じにしてたけど
5インチの9セクタの時と同じように米はすぐ容量増やす方向に変えるからなｗ

57 ：デフォルトの名無しさん：2014/06/10(火) 10:28:04.27 ID:M0GHqhNW

文字コードと何の関係があるのですか？

58 ：デフォルトの名無しさん：2014/06/10(火) 10:29:12.33 ID:Asjcm40b

98が1440KiBフォーマットを標準で読めるようになったのは...Mate Fellowの第2世代ぐらいか？

59 ：デフォルトの名無しさん：2014/06/10(火) 10:37:12.26 ID:M0GHqhNW

文字コードと何の関係があるのですか？

60 ：デフォルトの名無しさん：2014/06/10(火) 14:06:29.61 ID:UJ/IkoJT

ユニコードの話ならまだしも

61 ：デフォルトの名無しさん：2014/06/10(火) 15:09:28.80 ID:YJFxCpBU

ふぉんとふぉんと

62 ：デフォルトの名無しさん：2014/06/10(火) 20:11:06.57 ID:EGhCAFyH

富士通オリジナルのJEFコードからS-JISに文字コード変換したい
無料ツールない？

外字の変換テーブルも定義出来るやつ

JHT(ホスト連携ツール)というwindows用の無料ツール見つけたけど、外字変換未対応

63 ：デフォルトの名無しさん：2014/06/10(火) 21:17:22.70 ID:Asjcm40b

その手のややこしい話を、商売として頼めそうなところというとこれかな。
ttp://www.mirai-ii.co.jp/moji/

ネットに上げてる情報を見る限りでは、情報収集はそれなりにしっかりしてそうには見える。
他の点についてはどうにも言いがたいが。

64 ：デフォルトの名無しさん：2014/06/11(水) 05:47:48.50 ID:to7T+b0V

>>63
情報ありがとう
有料だとFTRAN,anytran,MD-PORTなどがあるんですが、
拡張漢字などのS-JIS未定義の文字はS-JISの外字エリア割り当ててやる必要があるらしいです

65 ：デフォルトの名無しさん：2014/06/11(水) 06:44:21.21 ID:1jZIM4HC

いまさらshift jisで外字とか死にたくなるような仕事だな

66 ：デフォルトの名無しさん：2014/06/12(木) 01:00:41.74 ID:+cKCPVN6

Unicode 7.0.0は今月?

67 ：デフォルトの名無しさん：2014/06/12(木) 02:29:13.09 ID:cysKCfar

固定長処理なので、マルチバイトに出来ないのです(汗

68 ：デフォルトの名無しさん：2014/06/16(月) 15:39:38.23 ID:15LXpyTU

ぼくマルチバイトー！

69 ：デフォルトの名無しさん：2014/06/18(水) 08:38:27.14 ID:SROYhCqR

3人そろってマルチーズ

70 ：デフォルトの名無しさん：2014/06/18(水) 18:32:03.35 ID:rewzB818

絵文字あんなに増やしてどうすんの？

71 ：デフォルトの名無しさん：2014/06/18(水) 18:34:46.19 ID:wLts3cNa

UNICODEの会議じゃ絵文字が一番重要事項みたいだしなｗ

72 ：デフォルトの名無しさん：2014/06/18(水) 19:00:18.20 ID:lDuZSdyo

>>70
そのうち新しい言語ができるのかもしれない。
書くときにだんだんと変わっていって、そして、ハングルのようになる、とか

73 ：デフォルトの名無しさん：2014/06/18(水) 19:00:31.35 ID:7fGUMixx

実用的な文字が安定してきているということで、いい事じゃないか？
人間、仕事が無くなったらどうでもいい仕事を作り出すもんだ

74 ：デフォルトの名無しさん：2014/06/18(水) 19:58:08.59 ID:cYGIbVWH

ううむ

75 ：デフォルトの名無しさん：2014/06/19(木) 16:07:58.88 ID:6/iRPLD/

http://std.dkuug.dk/JTC1/SC2/WG2/docs/n4585.pdf#page=24
通用規範漢字のExt.Eまでに入らなかった3文字はいいとして、なんかUTCから
アヤシゲな漢字の提案が…。スラブ語の音訳に使われたそうだけど

76 ：デフォルトの名無しさん：2014/06/19(木) 17:45:04.27 ID:nzbo42iB

意味わかんないけど、コード表見ると頭がくらくらするわ。
音だけとるなら、それこそハングルの方が向いてない？

77 ：デフォルトの名無しさん：2014/06/19(木) 20:09:33.65 ID:hNaG+35H

なんで拡張Fじゃなくて基本面に入るんだ？

78 ：デフォルトの名無しさん：2014/06/19(木) 21:08:43.20 ID:Nuy+Z8Yr

そういうのほんとふしぎ

79 ：デフォルトの名無しさん：2014/06/20(金) 09:51:19.84 ID:13YA0ieC

漢字2つ分を一個に入れてるのかｗ

80 ：デフォルトの名無しさん：2014/06/20(金) 17:14:37.82 ID:/wHrIbSK

西夏文字が大量に提案されてるな

81 ：デフォルトの名無しさん：2014/06/20(金) 20:13:56.90 ID:Bc1EKLHV

>>79
㍻?

82 ：デフォルトの名無しさん：2014/06/21(土) 13:58:17.46 ID:AeYdIm2H

㍾㍽㍼㍻

83 ：デフォルトの名無しさん：2014/06/21(土) 14:34:25.10 ID:CDmICRGP

＞㍾㍽㍼㍻
これはこれでひとつの漢字としてみなしてもいいような気がしてたけど、
よく考えたら縦書きのときに配置が変わるからこれは漢字じゃないな。

84 ：デフォルトの名無しさん：2014/06/21(土) 14:38:18.71 ID:2OQISpPs

明治以前のも必要だろ

85 ：デフォルトの名無しさん：2014/06/21(土) 14:45:13.44 ID:LBtFHXKV

そんな需要はない
どうしてもというならビットマップで自作

86 ：デフォルトの名無しさん：2014/06/21(土) 15:00:21.68 ID:7BkNyovA

そういうの気持ち悪い。
やりたかったら長体だの平体だの掛ければいいじゃないと思うけど、
このスレの話じゃないな。

87 ：デフォルトの名無しさん：2014/06/21(土) 17:37:50.17 ID:bFN4NK+h

明治以前は必要ないけど、将来的に平成の次は需要あるんじゃないの

88 ：デフォルトの名無しさん：2014/06/21(土) 18:18:33.28 ID:ElcRoqBr

>>83
> よく考えたら縦書きのときに配置が変わるからこれは漢字じゃないな。
感じじゃないというのが、縦書だと配置が
変わるという理由であれば、それは理由にならない。

なぜなら、一文字であっても縦書で配置が変わる文字があるからだ。
それは「、」縦書だと配置が変わる。

「、」は漢字じゃないというかもしれんがｗ

89 ：デフォルトの名無しさん：2014/06/21(土) 19:47:29.97 ID:Chc2mqWD

自己完結したら話が続かない．．．

90 ：デフォルトの名無しさん：2014/06/21(土) 23:23:25.80 ID:DGONxkaQ

文字コード力によってunicodeコンソーシアムに名を連ねるような企業に入れないものかね

91 ：デフォルトの名無しさん：2014/06/22(日) 00:05:00.51 ID:bJvEf3+R

>>88
普通に漢字じゃなさすぎて反応しづらい

92 ：デフォルトの名無しさん：2014/06/22(日) 00:11:05.67 ID:nGqVjB+P

文字コードカ？

93 ：デフォルトの名無しさん：2014/06/22(日) 00:56:16.16 ID:jMI4A6MR

Unicodeコンソーシアムに名を連ねているような人は単に文字コードというより
国際化関係が多いような。

94 ：デフォルトの名無しさん：2014/06/22(日) 01:33:33.53 ID:upDz43Y5

貞観

95 ：デフォルトの名無しさん：2014/06/22(日) 14:08:49.34 ID:ZZa1vnuC

>>90
逆に自分で作った企業を紛れ込ませる方法も
(ハングルコンピューターメソッド)

96 ：デフォルトの名無しさん：2014/06/22(日) 17:47:49.52 ID:72jpPhSw

>>77
中国の分については、IRG42でExt.Fのレパートリが確定するなら待つけど
それができなかったらUROの後ろに入れろと最初から言ってた。
http://appsrv.cse.cuhk.edu.hk/%7Eirg/irg/irg42/IRGN1988_China_UNCFurtherRequest.doc

97 ：デフォルトの名無しさん：2014/06/22(日) 19:08:16.16 ID:+tQsZ4hU

>>93
>>95
文字コードに関わる仕事してるんだけど、環境がアレだから転職したいんだけど
文字コード + αないときついか
αがなんなのかわからないけど

98 ：デフォルトの名無しさん：2014/06/22(日) 21:09:57.25 ID:xCekfL2e

＞+ α

後ろについてるってなるとVSかな

99 ：デフォルトの名無しさん：2014/06/22(日) 23:12:22.87 ID:KWzMzPQg

今は日本からだと楽天ぐらいか
ttp://www.unicode.org/consortium/memblogo.html

100 ：デフォルトの名無しさん：2014/06/22(日) 23:54:37.35 ID:g6b1djpb

なんと、＋αは社内公用語だったか

101 ：デフォルトの名無しさん：2014/06/23(月) 01:35:40.64 ID:xD6VlKwP

＋αGEL

102 ：デフォルトの名無しさん：2014/06/24(火) 10:49:02.09 ID:xfPFzb2S

丶大法師（ちゅだいほうし）
まんなかに点がある

103 ：デフォルトの名無しさん：2014/06/24(火) 11:29:23.71 ID:AfD6RzLL

普通に有名な文字だけどそれが何か？
里見の謎^H^H八犬伝でも読んだの？

104 ：デフォルトの名無しさん：2014/06/24(火) 12:47:57.19 ID:/C23Uhbr

支那語モードだと読点まんなかにくるよね

105 ：デフォルトの名無しさん：2014/06/24(火) 13:30:40.14 ID:ZncR21mW

いつもどっちが句点でどっちが読点だかわからなくなる。

直感で「文中に出る順番は『、』『。』だから、それぞれ『句』『読』点なのかな」と思ったら間違いで、
もう少し考えて「句毎に使うほうが句点かな」と思ったらそれも間違いなんだ。わかりにくくて泣きそう。

106 ：デフォルトの名無しさん：2014/06/24(火) 13:35:03.13 ID:AfD6RzLL

声に出して「読」む時に息継ぎとかのためにあるほうが読点。
そっちじゃないほうが句点。

107 ：デフォルトの名無しさん：2014/06/24(火) 14:02:26.36 ID:S/1R1o36

う、うん…

108 ：デフォルトの名無しさん：2014/06/24(火) 14:22:15.50 ID:XolzJzrv

ど、… 読点

109 ：デフォルトの名無しさん：2014/06/24(火) 14:26:46.25 ID:oDNeDxJ6

撥音便
促音便
拗音便

110 ：デフォルトの名無しさん：2014/06/24(火) 18:48:28.08 ID:n9eXMXO/

>>105
「句」の真ん中に「。」っぽいのがあって、「読」の1画目が「、」って覚えてる

111 ：デフォルトの名無しさん：2014/06/25(水) 00:37:16.12 ID:IGlDE0oX

それはよさそうだな。

112 ：デフォルトの名無しさん：2014/06/25(水) 04:00:14.63 ID:gMWmO5iT

>>102の「丶」は読点でも片仮名繰り返しでもなく普通の漢字だけど……
ああ、>>88から来てるのか

113 ：デフォルトの名無しさん：2014/06/25(水) 17:03:22.67 ID:p7ubFJ8S

JIS X 0221第四次規格が出たか。
ようやく日本文字部分レパートリが独自の附属書じゃなくなるのね。

114 ：デフォルトの名無しさん：2014/06/25(水) 17:16:05.90 ID:PZUK3mFx

どうなるの？

115 ：デフォルトの名無しさん：2014/06/25(水) 19:57:28.85 ID:odc9r+PJ

「々」
とか
「ゝ」
とかって漢字？

116 ：デフォルトの名無しさん：2014/06/25(水) 20:29:36.22 ID:ZDN4WKWX

記号

117 ：デフォルトの名無しさん：2014/06/25(水) 23:36:06.10 ID:GQuGFHte

敬礼

118 ：デフォルトの名無しさん：2014/06/26(木) 03:32:28.87 ID:T2lDhtAF

>>115
［文字パレット］や［文字ビューア］で文字情報を見てみるといいよ

>>117
(｀ω´)ゝ

119 ：デフォルトの名無しさん：2014/06/26(木) 11:46:55.87 ID:SxzDgF/c

>>113
附属書JAに残ってる

120 ：デフォルトの名無しさん：2014/06/26(木) 12:59:34.09 ID:bSxHRBR2

々々ｲｪｲ! 々々々ｲｪｲ!

121 ：デフォルトの名無しさん：2014/06/26(木) 13:06:15.12 ID:Txu8uYSD

ノマ派ですか。おれクマ派

122 ：デフォルトの名無しさん：2014/06/26(木) 14:00:51.55 ID:lzGhXXy2

キープだ牛

123 ：デフォルトの名無しさん：2014/06/26(木) 14:02:42.70 ID:ey/6P2HR

そこはダルシムとするのが通
マイヤフー！

124 ：デフォルトの名無しさん：2014/06/26(木) 22:33:35.23 ID:T2lDhtAF

>>121
それはおかしい。「クマ」をくっつけても「々」にはならないよ。

125 ：デフォルトの名無しさん：2014/06/28(土) 14:52:20.60 ID:rdsgX/Oy

マックって、キーボードから 0x5C のキーを打つと文字コードは何が入るの？　半角の"￥"(0xA5)？、それとも半角の"＼"(0x5C) ？

126 ：デフォルトの名無しさん：2014/06/28(土) 16:54:56.41 ID:atMd2lNW

>>124
「フ」の部分を重ねればなんとか

127 ：デフォルトの名無しさん：2014/06/28(土) 18:54:49.36 ID:aR5H2Sqc

>>125
・［英数］キーを押してからだと
［￥］キーを押すと半角の"¥"、［option］（=alt）キーとともに［￥］キーを押すと半角の"\"。
・［カナかな］キーを押してからだと
［￥］で全角の"￥"、［option］とだとなぜか全角ではなくて半角の"\"。

全角の"＼"を出したいときは［カナかな］で全角の"￥"を出してから、
［F4］を押して候補から選択するか、
スペースキーで変換して候補から選択する。（私の場合IMEはATOK）
こんな答えでいい？

128 ：デフォルトの名無しさん：2014/06/28(土) 20:59:31.52 ID:LDQ/fpQX

>>127
ありがとう。予想以上に丁寧。感謝です。

129 ：デフォルトの名無しさん：2014/06/28(土) 21:18:35.78 ID:qOAW+p+P

ことえりの環境設定で変えられるよ
俺はプログラミングでよく使うからバックスラッシュに変えてる

130 ：デフォルトの名無しさん：2014/06/29(日) 00:14:49.38 ID:J0TW45q0

躍り字（おどりじ）は、主に日本語の表記で使用される約物（特殊記号）の一群で、々、ヽ、ゝなど
- Wikipedia

131 ：デフォルトの名無しさん：2014/06/29(日) 01:25:04.74 ID:uMPGh2FI

>>125
キーボードに0x5Cのキーなんて無いよ。
Input Source、Input Methodの設定次第でどのUnicode返すかが決まる。

132 ：デフォルトの名無しさん：2014/06/29(日) 09:42:18.75 ID:Y8ldqiR/

◎2chスレッド勢いランキングサイトリスト◎

★+ニュース板
・ 2NN (推薦)
・ 2chTimes
★+ニュース板新着
・ 2NN新着
・ Headline BBY
・ unker Headline
★+ニュース板その他
・ Desktop2ch
・記者別一覧
★全板
・全板縦断勢いランキング (推薦)
・スレッドランキング総合ランキング
・ログ速
★全板実況込み
・ 2勢 (推薦)
・ READ2CH
・ i-ikioi

※ 要タイトル名検索
※ 2chブラウザ併用推奨

133 ：デフォルトの名無しさん：2014/06/30(月) 04:03:57.93 ID:jMyDiUzF

>>83
> ＞㍾㍽㍼㍻
> これはこれでひとつの漢字としてみなしてもいいような気がしてたけど、

びっくりした。

134 ：デフォルトの名無しさん：2014/06/30(月) 06:28:34.70 ID:TSR2fyTk

日本人はあまり気にしていないかもしれないけど、
外国人が漢字を覚え始めると、
「一目で意味が判る、まるでアイコンだ、漢字スゲー」と言うそうだから、
そういう意味では、別にびっくりしなくてもいいと思うよ。

135 ：デフォルトの名無しさん：2014/06/30(月) 07:23:06.42 ID:94hmBiki

>>133
魑魅魍魎に見えた
眼科逝ってくる

136 ：デフォルトの名無しさん：2014/06/30(月) 07:24:10.72 ID:94hmBiki

>>134
漏れはアイコンじゃ意味が判らないので
やっぱ漢字スゲーと思ってる

137 ：デフォルトの名無しさん：2014/06/30(月) 08:05:15.12 ID:TSR2fyTk

ロジャー・パルバースという人が『驚くべき日本語』という本の中で、
「日本語は世界語となり得る」といったようなことを書いているそうだ。
又聞きで読んだわけではないけど。…っと、このスレなんだっけ？（ごめんよぉ）

138 ：デフォルトの名無しさん：2014/06/30(月) 09:48:35.96 ID:/NfoGo46

http://itpro.nikkeibp.co.jp/article/COLUMN/20140621/565786/

安岡センセイの新連載
同じネタを手を変え品を変え使い回し

139 ：デフォルトの名無しさん：2014/06/30(月) 09:58:08.33 ID:lJxnkRTG

Fileメニューのようなカテゴリを表わすアイコンとOpenのような動作を表わすアイコンを組み合わせれば
階層メニューなんて要らないよってどや顔していたアメリカ人の知り合いを思い出した。
日本ではそうやって漢字を拡張して使っていると説明しても納得しないので、鮨屋の湯飲みをくれてやったw

140 ：デフォルトの名無しさん：2014/06/30(月) 12:27:46.01 ID:lTC5ibMy

文字の事をGlyph(絵文字)と呼ぶくらいだし、
漢字は絵文字として豊かな表現力を持っているのは事実だろうなぁ。

アルファベット圏のあのシンプルさも好きだけど、日本のように色々取り入れて併用できる環境も素敵やん。

141 ：デフォルトの名無しさん：2014/06/30(月) 21:05:17.71 ID:gYwuV4Gr

>>138
同じようなことかもしれないけど状況は変わっていくわけで、これはこれでどうこう言われる筋合いじゃないと思う。

142 ：デフォルトの名無しさん：2014/06/30(月) 22:31:15.80 ID:NKvbhfi+

漢字ってのは英語では単語だ。

143 ：デフォルトの名無しさん：2014/07/01(火) 05:37:51.40 ID:nFzJ2FEg

日本語では漢字だ。

144 ：デフォルトの名無しさん：2014/07/04(金) 01:13:16.05 ID:ML2FpV72

>>141
結局私怨だろ
http://slashdot.jp/~yasuoka/journal/582954

145 ：デフォルトの名無しさん：2014/07/04(金) 11:10:21.27 ID:s+xY96II

ここで粘着してる奴が私怨

146 ：デフォルトの名無しさん：2014/07/04(金) 13:20:41.59 ID:dxdW+UuJ

どういう恨みがあんのか知らんがここでやんなよって思う。

147 ：デフォルトの名無しさん：2014/07/05(土) 12:04:40.33 ID:Oa4qfcNo

外国人の氏名は元々Unicodeで表されてるのに
それをわざわざ入管正字や住基文字や戸籍統一文字に
変換する道理が意味不明

148 ：デフォルトの名無しさん：2014/07/05(土) 14:31:59.27 ID:c0IvYLy1

タテワリギョーセー国傘下村地域でのみ通用する言語と文字
※オサが代わると意味も変わると言われている

149 ：デフォルトの名無しさん：2014/07/05(土) 17:30:12.95 ID:vJH6bkQ7

逆に長が変わった程度ではびくともしないから困ってる気がするが。

150 ：デフォルトの名無しさん：2014/07/06(日) 20:27:48.11 ID:C/NYHKT8

>>147
そんな事言ったら世界中の文字コードは不要になるだろ

151 ：デフォルトの名無しさん：2014/07/07(月) 11:07:48.61 ID:GTu0r9os

>>148,149
変わって欲しいところは変わらず
変わって欲しくないところが変わる

こうですね

152 ：デフォルトの名無しさん：2014/07/07(月) 18:00:51.19 ID:KNJDsbWp

世の中ままならないのが常ですわ

153 ：デフォルトの名無しさん：2014/07/10(木) 23:10:42.70 ID:fp5I0Zvk

RT >151
あるある

154 ：デフォルトの名無しさん：2014/07/27(日) 11:49:29.82 ID:b45OmH+A

Noto CJKフォントってどーよ?

155 ：デフォルトの名無しさん：2014/07/27(日) 18:12:00.63 ID:aynozLel

NotoかわいいよNoto

156 ：デフォルトの名無しさん：2014/07/28(月) 03:40:53.07 ID:ut5EuUgc

ウェイトがたくさんあるフォントがばら撒かれるのはでかいｎ

157 ：デフォルトの名無しさん：2014/07/28(月) 23:35:08.28 ID:w++kz+Go

Noto Serif CJKも水面下じゃ準備が進んでるのかな

158 ：デフォルトの名無しさん：2014/07/29(火) 00:17:48.01 ID:fZBnj+Ic

Serifもいいけど英数まで等幅のバージョンが欲しいな。
AdobeはSource Code Proっての出してるからあれにCJK追加した感じで。

テキストエディタ用に使いたい。
日本語フォントだと収録外の文字が多いからそこでずれちゃう。

159 ：デフォルトの名無しさん：2014/07/30(水) 23:32:27.72 ID:BUixUKlo

CJK互換漢字SVに対応した世界最初のフォントかな?

160 ：デフォルトの名無しさん：2014/08/01(金) 00:32:49.14 ID:qW8PjnBR

？

161 ：デフォルトの名無しさん：2014/08/02(土) 17:28:09.01 ID:whiiBojo

>>154
統一して表示されるっていい事だな

162 ：デフォルトの名無しさん：2014/08/06(水) 06:18:01.43 ID:KIGwELq2

フォント部隊がこれ作ってたからaj1-7の話が立ち消えになったんだな・・・

163 ：デフォルトの名無しさん：2014/08/06(水) 07:07:16.56 ID:VORfxcQU

どういうこと？

164 ：デフォルトの名無しさん：2014/08/06(水) 07:15:04.76 ID:KIGwELq2

Source Han Sans/Notoを作ることになったから
AJ1-7のグリフを作るための人的リソースが確保できなくなったんじゃないかなーと

165 ：デフォルトの名無しさん：2014/08/06(水) 21:47:57.35 ID:i6un7vEe

アドビの日本語フォント開発者ってascii.jpのインタビューで
名前のあがった2人以外にもいるのかな

166 ：デフォルトの名無しさん：2014/08/06(水) 22:04:42.62 ID:YK4pQga/

その二人が誰だかわからんので何とも

167 ：デフォルトの名無しさん：2014/08/07(木) 00:31:23.73 ID:8p7h7+Jd

emojiはやりたい放題だな…
> L2/14-173 Variation selectors for Emoji skin tone

168 ：デフォルトの名無しさん：2014/08/07(木) 13:31:14.27 ID:1whblxfx

この提案じゃピッコロさんの肌色を再現できない
やり直し

169 ：デフォルトの名無しさん：2014/08/07(木) 17:08:50.12 ID:cRrFjz3e

たしかに

170 ：デフォルトの名無しさん：2014/08/08(金) 00:18:25.50 ID:QwQuqp7u

色相セレクタ彩度セレクタ明度セレクタがそれぞれ8つずつぐらいあれば大抵の色はいけそうだな。

171 ：デフォルトの名無しさん：2014/08/23(土) 23:13:52.84 ID:pgISeySf

ラテン文字の拡張Fが提案されてるんだな。とうとう今度からBMP外か。

172 ：デフォルトの名無しさん：2014/08/23(土) 23:48:35.08 ID:yM+l+Abf

Unicodeのバージョンと、追加された文字達の対応ってどこかでわかりますか？

173 ：デフォルトの名無しさん：2014/08/24(日) 01:08:45.48 ID:HobB9XVw

http://www.unicode.org/charts/About.html
のVersion-Specific Chartsから、3.1～7.0までたどれるよ。

174 ：デフォルトの名無しさん：2014/08/24(日) 01:44:40.03 ID:JPGssgvQ

Unicode 7時点の一覧ならこれ。
http://www.unicode.org/Public/7.0.0/ucd/DerivedAge.txt

175 ：デフォルトの名無しさん：2014/08/24(日) 08:06:56.66 ID:p9zF2+zn

>>171
BMPはとうに締め切ってるからね
何処かの国がそれを無視して無理矢理ねじ込んだこともあるけど

176 ：デフォルトの名無しさん：2014/08/24(日) 08:08:59.17 ID:U/9l1uz2

>>173-174
ありがとうございます。目的の字が見つかりました。

古いバージョンから組文字は結構あったんですね。
ちょっとビックリしました。

177 ：デフォルトの名無しさん：2014/08/24(日) 18:41:59.56 ID:A7hXgDTc

BMPが締め切ったなんてことはないよ
現に今もCherokee Supplementってのが提案中だし
http://www.unicode.org/roadmaps/bmp/

Latin Ext-Fはこんなギリギリじゃなくて256文字分確保できる位置の方が
良いと思うんだけど、そうするとだいぶ後ろのほうになるのか
SMPも良い場所はなくなりつつあるんだな

178 ：デフォルトの名無しさん：2014/08/24(日) 22:02:05.40 ID:KLcB2CPn

漢字限定ならBMPへの追加はExtension-Aが最後だったのに
どっかの国が互換漢字にしてまでむりやりBMPにねじ込んだり
割り当てられてもいない符号位置を勝手に自国の規格に書き込んだりして
禍根を残したことがあったな

179 ：デフォルトの名無しさん：2014/08/25(月) 07:20:25.82 ID:vZhjcmbA

えっ?

180 ：デフォルトの名無しさん：2014/08/25(月) 21:56:08.49 ID:e8bSrHPI

SMPも埋まってきてるんだな。数年以内に4面あたりをTertiary Multilingual Planeと決められるかも。

181 ：デフォルトの名無しさん：2014/08/26(火) 23:11:51.09 ID:jG4KjoUF

今年度の検討始まってた
ttp://mojikiban.ipa.go.jp/3751.html

182 ：デフォルトの名無しさん：2014/08/30(土) 07:04:57.19 ID:lIKJ5wT5

変体仮名は何をもたもたやってんだろう

183 ：デフォルトの名無しさん：2014/08/30(土) 16:20:15.64 ID:xwGfWle7

ひらがなYEとカタカナEを入れるだけでもあれだけもめてた
(むしろ妨害しかしてなかった)くらいだし、
よほど強い意志を持って行動を続けなきゃ放置プレイされるだけ

184 ：デフォルトの名無しさん：2014/08/30(土) 18:50:29.14 ID:lIKJ5wT5

グリフを入札したほどだしやる気はあるんじゃないかな
ただ今からだと最速でもUnicode 10くらいになりそう

185 ：デフォルトの名無しさん：2014/08/31(日) 10:11:25.09 ID:BoEjqfWo

>>182
そりゃ定義もまちまちなのを無理に入れようとするからだろ
行政書類系で一意に定められてて使用実績もあればそれを示せばいいんだし。

186 ：デフォルトの名無しさん：2014/08/31(日) 16:28:43.99 ID:D1L0Hk7z

似て非なるものとして「行政書類系で多数の定義がありそれぞれに実績がある」ならよくあるパターンだなあ…

187 ：デフォルトの名無しさん：2014/08/31(日) 19:42:20.55 ID:knyC4Rpa

変体仮名がUnicodeに追加されるのが先か
変体仮名の戸籍名を持つ人が全滅してしまうのが先か

188 ：デフォルトの名無しさん：2014/08/31(日) 19:56:43.05 ID:PuuS0T7E

多分 >>181 を辿った先にある「資料3：【参考】変体仮名のデザイン案 (PDF)」を
ベースにやるつもりなんだろうけど
ttp://mojikiban.ipa.go.jp/3746.html

WG2に提出されたらされたでそこから先が長そう

189 ：デフォルトの名無しさん：2014/08/31(日) 22:07:27.31 ID:ZTbb0r0/

人名用漢字って法制審議会なの？

190 ：デフォルトの名無しさん：2014/09/01(月) 05:39:25.59 ID:qmwJv0SL

除籍のためにも意味はあるんじゃないの

191 ：デフォルトの名無しさん：2014/09/01(月) 10:31:37.74 ID:srwG2aQM

>>187
日本が亡くなるのが先

192 ：デフォルトの名無しさん：2014/09/01(月) 11:31:02.84 ID:riC6owF6

個人の願望は役に立ちません

193 ：デフォルトの名無しさん：2014/09/22(月) 19:19:23.24 ID:A6Epk3+7

IPAフォント初めてインストールした！
だけど、帳票作成ソフトがS-JISのみ対応だったorz

csvからpdfに出来るお奨めソフトない？

jasper reports使ってみよっかな

194 ：デフォルトの名無しさん：2014/09/23(火) 01:11:44.23 ID:W07urC2c

htmlからならwkhtmltopdfつーのが笑えるレベルだけど

195 ：デフォルトの名無しさん：2014/09/23(火) 01:32:45.71 ID:Grd+CHTX

LibreOffice, Eclipseなどで、変換できないの？

196 ：デフォルトの名無しさん：2014/09/23(火) 02:56:04.46 ID:yTWN5vXQ

EboraOffice

197 ：デフォルトの名無しさん：2014/09/23(火) 15:18:25.52 ID:EJI/lPFO

JIS X 0201ってエンコーディング方式については定めてないですよね

例えば，
「JIS X 0201で定義されている文字を利用する方法として，Shift_JIS,EUC-JP，○○などがある」
と言いたいときに，8bit符号表をそのまま使う方法は何言えばいいですか？

198 ：デフォルトの名無しさん：2014/09/23(火) 15:36:04.37 ID:MCcom9gS

>>197
「Windows-31Jを使用する。Windowsのメモ帳でANSIを選んだときの文字コードである」
「Shift_JISを使用する」
「テキストエンコーディングは、JIS X 0201の8ビット符号値をそのままバイト値に使用したものとする。例えばAは65となる」

199 ：デフォルトの名無しさん：2014/09/24(水) 11:54:32.32 ID:5bjJvoMc BE:928380653-2BP(3276)

PC-98の半角2バイト文字はUNICODEの先駆者、
UNICODEだと欧文も2バイトだしね。
半角2バイト文字は半分エスケープ文字だと解釈することもできる

200 ：デフォルトの名無しさん：2014/09/24(水) 12:07:16.14 ID:2WI09dQB

ぐちゃぐちゃだ、やりなおせ。

201 ：デフォルトの名無しさん：2014/09/24(水) 23:43:02.18 ID:Umn+P9Fh

>>198
ありがとうございます
3番目の表現を使わせてもらいます

202 ：メモ：2014/09/25(木) 15:06:03.38 ID:kNqhUUGO

言語コードページ文字数
日本語 932 7980
簡体字中国語 936 22047
韓国語 949 17304
繁体字中国語 950 13759

203 ：メモ：2014/09/25(木) 15:06:33.97 ID:kNqhUUGO

Windows 3.1 用の Windows の国際的なコードページの INF: リスト

この資料は、以前 Q131421 の下で公開
オペレーティングシステムの Microsoft Windows バージョン 3.1 のインターナショナルバージョンの Windows コードページの一覧を次に示します。

Language Code Page
-------------------------------
Arabic 1256
Hebrew 1255
United States 1252
(and West European)
Greek 1253
Turkish 1254
Cyrillic 1251
Eastern European 1250
Thai 874
Japan 932
Chinese (simplified) 936
Chinese (traditional) 950
Korean 949

西ヨーロッパ言語のバージョンには、フランス語、ドイツ語、イタリア語、
スペイン語、カタロニア語、オランダ語、フィンランド語、アイスランド語、
インドネシア語、ポルトガル語などが含まれます。東ヨーロッパ言語
バージョンには、チェコ語、ハンガリー語、スロバキア語などが含まれます。

204 ：デフォルトの名無しさん：2014/09/25(木) 19:26:37.09 ID:kNqhUUGO

---
韓国語版 Windows 3.1と韓国語版 Windows NT 3.1は発売されていたみたいだど
ハングルの大移動で文字の互換性は無いかな？
MS-DOS 6はCP949を使って問題ないが、韓国語版 Windows 3.1もCP949が使われて
いるが、TTFフォントの内部コードにUnicodeが使われており、ハングルの
タイ移動でフォントの互換性がなくなりそう。韓国語版 Windows NT 3.1では
でUnicodeが使われているから、同様に互換性が無いか？

-----
Windows 3. 51 での韓国語の Windows NT 3. 5 プログラムを表示することはできません。
http://support.microsoft.com/default.aspx?scid=kb;ja;157447

205 ：デフォルトの名無しさん：2014/09/25(木) 19:33:43.30 ID:kNqhUUGO

でも韓国語版Windows 3.1やNT 3.xの互換性の問題についてはあまり話題に
上がらないが、それは当時韓国国内でWindowsが普及していなかったのか？
それともM$があらかじめハングル大移動後のコードを予めWindowsに実装して
いる可能性もありそう。

206 ：デフォルトの名無しさん：2014/09/25(木) 19:40:02.57 ID:kNqhUUGO

やっぱりNT3.50とNT3.51の境で互換性問題があるようだな。

Compatibility Issues
http://msdn.microsoft.com/en-us/library/cc194862.aspx

For example, Unicode version 1.1 does not support Korean combining
jamos and some rare Korean hangul characters, so Windows NT 3.5
cannot display them.

207 ：デフォルトの名無しさん：2014/09/25(木) 21:39:02.25 ID:F7PJWJhe

安岡センセイの文字コード論文を『情報管理』がボツにしたとのこと
http://slashdot.jp/%7Eyasuoka/journal/585659

208 ：デフォルトの名無しさん：2014/09/26(金) 01:28:25.97 ID:Fml3jypG

http://www.ksky.ne.jp/~smile4me/charcode/index.htm
http://charset.info/surrogate.html

前スレを呼んでいて↑を見つけたんだが、

>Windows 9x を JIS X 0213 対応にする
>
>Windows 95/98/Me (以下 9x と総称) では、シフトJIS コードが内部でも使用されているので
>特に何もしなくても「JIS X 0213 対応フォント」の JIS X 0213 追加分が表示されます。
>
>しかし、Visual BASIC などのユニコードを使うソフトでは、NT 同様に NLS の修正が必要になります。
>また、MS-IME や ATOK でも JIS X 0213 追加漢字(と記号の一部)が登録できるようになるようです。

Windows3.1+Win32sでの作動がどうなるか気になったが、
Win32sじゃUnicodeは無理だから意味無いかな？
Windows3.1自体はJIS2004フォントも問題なく使える。
（ちなみにWindows3.1では日本語プロポーショナルなTTFも問題なく使用できる。）
(またNLSファイルはNT：c_932.nls、9x：cp_932.nls、Win32s：p_932.nls になっている。

209 ：デフォルトの名無しさん：2014/09/26(金) 01:53:51.14 ID:Fml3jypG

Win32sもunicode変換機能

Unicode in Win32s and Windows 95
http://msdn.microsoft.com/en-us/library/cc194796.aspx

>Although it does not support wide-character API entry points,
>Win32s does contain two important API functions—MultiByteToWideChar
> and WideCharToMultiByte—that can convert data between Unicode and
>local Windows code pages. For example, an application running on a
>Japanese edition of Windows 3.1 could call these two functions to
>convert between the Unicode and Shift-JIS encodings.

あとWin3.1でUnicodeなTTFをJIS2004にマップさせるには
GDI.EXE改造すればいけるかも。

210 ：デフォルトの名無しさん：2014/09/26(金) 10:17:33.88 ID:GdYRXubx

>>207
安岡も耄碌したな

211 ：デフォルトの名無しさん：2014/09/26(金) 10:49:18.64 ID:fN1jkSMH

そういうことなんだろうおまえの中ではな

212 ：デフォルトの名無しさん：2014/09/26(金) 11:27:33.52 ID:Fml3jypG

Win3.1のGDI.EXE自体はCP932分のテーブルしか無かったから、改造は
難しい。p_932.nlsの改造はいける。

213 ：デフォルトの名無しさん：2014/09/26(金) 19:18:05.01 ID:/iisywxi

>>207
論旨には同意するけどもうちょっと穏やかな物言いはできないのかこの人

214 ：デフォルトの名無しさん：2014/09/26(金) 20:15:08.68 ID:8yaaHtVo

この文体／物言いじゃ、内容のいかんに依らず却下だな。
誤りを皆に理解してもらいたいのにそれが実現されない行動をとって
スラドで愚痴るのがこの人の生き方なんだろう。

215 ：デフォルトの名無しさん：2014/09/26(金) 20:19:07.48 ID:fN1jkSMH

論文が、内容ではなくスラドでの文体／物言いでリジェクトされるわけがないだろw
他人の生き方を心配する前に、自分の脳味噌を心配しろよw

216 ：デフォルトの名無しさん：2014/09/26(金) 20:31:48.53 ID:TKoXt2Ra

純粋な内容でリジェクトの判断をされたのか
安岡さんミジメっすね
情報管理「この内容では却下」

217 ：デフォルトの名無しさん：2014/09/26(金) 21:37:22.96 ID:fN1jkSMH

内容が気に喰わないからリジェクト、とか、内容が高度過ぎて編集委員が理解できないからリジェクトとか、
学会とかではよくあるとは言わないけど、たまにはある話ですが、

そういうことを全く知らないことを自慢するのって楽しいですかw

218 ：デフォルトの名無しさん：2014/09/26(金) 22:22:46.86 ID:fKh0XjvQ

内容が高度過ぎてリジェクトされたのか
安岡さんさすがっすね
情報管理「言ってることよくわからんから却下」

219 ：デフォルトの名無しさん：2014/09/26(金) 23:11:29.07 ID:/iisywxi

>氏の論考は，論旨が破綻しており，氏が過去に発表した同様の論考も含めて，
>全くの妄想だと断ずるしかない

この締めの部分が特に感じ悪い

220 ：デフォルトの名無しさん：2014/09/27(土) 07:04:05.96 ID:mW7h2CYB

安岡センセイ『自由と正義』でも榎並批判？

http://www.nichibenren.or.jp/jfba_info/publication/booklet/year/2014/2014_9.html

221 ：デフォルトの名無しさん：2014/09/27(土) 17:10:44.87 ID:lJpImKEe

文字コード絡みでは、実際、陰謀論とか妄想としか言いようのない論考を見るからな。
某「文字講堂」とか。

222 ：デフォルトの名無しさん：2014/09/27(土) 21:46:06.00 ID:mW7h2CYB

>>219
スラドにコメントしろよ

223 ：デフォルトの名無しさん：2014/09/27(土) 22:08:24.00 ID:iEeCkBMy

>>212
p_932.nlsも
Unicode→CP932テーブルが
CP_932.NLSとC_932.NLSはフルセットの65536文字分だけど、
P_932.NLSは削られていて27392文字分しか無い、
CP932→UnicodeはC_932.NLSもCP_932.NLSもP_932.NLSも約15870文字分
。そしてGDI.EXEは27392文字分ある。からGDI.EXEの改造もP_932.NLSと
同じ感じでいける。

224 ：デフォルトの名無しさん：2014/09/28(日) 23:02:09.53 ID:8P+GUhC+

ベトナムも文字コードってVISCIIってのがあるみたいだな。
制御文字の0x01～0x1Fにも文字が割り当てられていてﾜﾛﾀｗ
他にはTCVN 6909等やある、やはりMS-DOSじゃWindows-1258のような
文字合成のある方式はあまり使いたくないだろうな。

225 ：デフォルトの名無しさん：2014/09/28(日) 23:12:21.19 ID:Q6ombayK

タイ語は文字合成方式だね。
アルファベットベースじゃなくて組み合わせも多いので仕方ないけど。

226 ：デフォルトの名無しさん：2014/09/29(月) 00:30:21.82 ID:LbPf1ApM

久しぶりのWG2会議

227 ：デフォルトの名無しさん：2014/09/29(月) 08:51:12.36 ID:n4n5BQU6

>>224
VSCII-2 (TCVN5712-1993)では改良されて
ちゃんと0x00～0x1Fは制御文字になったよ

228 ：デフォルトの名無しさん：2014/09/29(月) 09:28:40.75 ID:GzMQOV/O

TCVN 5712:1993は用途に合わせて3種類ある筈。VN1、VN2、VN3が
ある。VN1は制御文字にも割り当てがある。VN2は制御文字の割り当て
を無くしたバージョン。VN3は思い切って補助記号付大文字を大幅にカット版。
大文字が足りない、文字コードを使用するときは
大文字用フォントと小文字用フォントを切り替えて使用するらしい。

229 ：デフォルトの名無しさん：2014/09/29(月) 09:32:03.80 ID:GzMQOV/O

ベトナム語は文字数が多いので1バイトに収めようとしたら制御文字にも
はみ出る仕方が無い。一応使用頻度の低い文字を影響の少ない制御文字に
割り当ててあるから、影響は最小限に抑えられている。

230 ：223：2014/09/29(月) 14:17:28.30 ID:GzMQOV/O

P_932.NLSのUnnicode→CP932の文字マップ参照テーブルが解析できた。

参照されている文字(unicode)は
0000-01ff,0300-04ff,2000-26ff.3000-30ff,3200-33ff,4e00-9fff,
e000-e7ff,f900-faff,ff00-ffff
だった。ネット上でWin32sのNLSファイルの構造を解説してあるサイトが
見つかったので助かった。拡張は可能。
SJIS2004(JIS X 0213:2004)対応のP_932.NLSとGDI.EXEを作ってみだが、

231 ：223：2014/09/29(月) 14:24:17.45 ID:GzMQOV/O

改造版P_932.NLSはWin32s対応でUnicodeを使うアプリ(Greenpad)は
一応使えるようだ。（Win32sの仕様上一部文字化けする文字あり）
改造版GDI.EXEはUnicodeなTTFでSJIS2004対応の文字も表示されるように
なった。文字数の拡張はしていない為、一部記号や漢字の表示は不可。

232 ：223：2014/09/29(月) 14:25:42.12 ID:GzMQOV/O

しかしWindows3.1ではunicodeなTTFの表示でGDIエラーを起こしやすいので注意。

233 ：デフォルトの名無しさん：2014/09/29(月) 20:00:33.45 ID:2JaSDa+0

波ダッシュの例示字形変更許されるなら文字名とかCP変更もありなんじゃねえの?

234 ：デフォルトの名無しさん：2014/09/29(月) 21:01:59.60 ID:mj/8iUnW

>>220
図書館いってきた
自由と正義2014年9月号46～52ページ
マイナンバーと住基ネットの話で文字コードは無かったけど
これ榎並批判なのかな

235 ：デフォルトの名無しさん：2014/10/01(水) 00:06:36.16 ID:paW0CBBp

さて

236 ：デフォルトの名無しさん：2014/10/01(水) 02:24:53.09 ID:zq79aPi2

Windows 10ではOTFサポートがもっとまともになってるといいなあ

237 ：デフォルトの名無しさん：2014/10/01(水) 09:10:23.59 ID:AX2nUQvJ

>>230
構造の解説あったのか。
以前探した時は見つけられなかったのでURL教えてほしい。

238 ：デフォルトの名無しさん：2014/10/02(木) 11:19:42.12 ID:R0BKZCkI

>>231
その改造版P_932.NLSでWin32sのOLE使うアプリで文字化けしたので
、まだ研究段階だな。

>>238
明示的には"Win32s"とは言っていないがWin32sのNLSの構造を
紹介している
umqの日記： NLS って難しい(2)
ttp://slashdot.jp/journal/244495/NLS-%E3%81%A3%E3%81%A6%E9%9B%A3%E3%81%97%E3%81%842
umqの日記： NLS って難しい(C)
ttp://slashdot.jp/journal/246657/NLS-%E3%81%A3%E3%81%A6%E9%9B%A3%E3%81%97%E3%81%84C

239 ：デフォルトの名無しさん：2014/10/02(木) 16:49:01.12 ID:YCvfDaSd

一二三四五・・・の文字で構成されたインデックスをソートしようとしたんだけど数値順に並んでないんだな
どんだけ

240 ：デフォルトの名無しさん：2014/10/02(木) 17:06:14.22 ID:qq+mzlUz

あぁいぃうぅえぇおぉ
かがきぎくぐけげこご

あほだよな

241 ：デフォルトの名無しさん：2014/10/02(木) 17:16:14.10 ID:BNNomDCE

漢字は部首順→画数順に並べる、という慣例が漢和辞典の世界にはある。
（で、第2水準ではそれにならった）
そういうことを知らずに思いつきを言ってるなぁ、って思われるだけ。

いずれにしても、文字列の、社会的慣習を踏まえたソート（たとえば本当の「辞書順」とか）は、
単純に一文字ずつ比較するだけでは不可能なので、そういう順序にすることに意味が無い。

242 ：デフォルトの名無しさん：2014/10/03(金) 00:49:09.00 ID:8HQMxfzO

>>240
aAbBcCdDeEfF...って並べる基地外もいるんだぜ、信じられん。

243 ：デフォルトの名無しさん：2014/10/03(金) 08:06:33.69 ID:OynHM83k

>>240
ぁあぃいぅうぇえぉお
が正解
ただちぢっつづてでとど
とかイラっとくる

244 ：デフォルトの名無しさん：2014/10/03(金) 10:35:10.57 ID:Tegb1mus

何にいらついてるのか分からん

245 ：デフォルトの名無しさん：2014/10/03(金) 11:05:16.22 ID:Cqqmulyu

国語辞典とかの排列を、ちょっとでも深く考えたことが無いからだろw

246 ：デフォルトの名無しさん：2014/10/03(金) 12:37:12.56 ID:AIsixZxM

何で世界中UTF-8に統一しないの？
バカなの？
Shift-JISとか他の文字コードを使ったら逮捕にすればいいのに

247 ：デフォルトの名無しさん：2014/10/03(金) 12:41:03.37 ID:lXIQAzKJ

確かに無免許のおれおれプログラマは迷惑

248 ：デフォルトの名無しさん：2014/10/03(金) 12:43:35.18 ID:hjse6GjO

セキュリティ機能だと思えばいいさ

249 ：デフォルトの名無しさん：2014/10/03(金) 12:49:56.93 ID:Cqqmulyu

>>246 よし、まずひろゆきとJimを逮捕だなw

250 ：デフォルトの名無しさん：2014/10/03(金) 14:04:03.24 ID:8OTaypIY

そういうライブラリやアプリを使うやつを逮捕しろ

251 ：デフォルトの名無しさん：2014/10/03(金) 19:14:19.93 ID:uCcPsxJ8

wg2ｵﾜﾀ

252 ：デフォルトの名無しさん：2014/10/03(金) 20:16:28.45 ID:MM8EH8yD

>>246
サイズが1.5倍になるのをばかげているとおもわないのですか？

253 ：デフォルトの名無しさん：2014/10/03(金) 20:20:56.54 ID:MM8EH8yD

なんで統一しようとするのか？
いままで統一できた時代なんて無かったのだ

254 ：デフォルトの名無しさん：2014/10/03(金) 20:40:29.83 ID:KKLEaHKT

AmazonはShift_JISなんだよね。
意外だった。

255 ：デフォルトの名無しさん：2014/10/03(金) 20:44:21.23 ID:sUeMWuDQ

>>246
世界中の全ての文字をカバーしていない
出るのが遅すぎて他のコードが浸透してる
windowsがSJIS(内部はuni)が標準

256 ：デフォルトの名無しさん：2014/10/03(金) 20:58:37.31 ID:anb/lxLT

> windowsがSJIS(内部はuni)が標準
嘘はいくない。SJISが標準なのはWin9xだけだ。日本語版WindowsのANSIがSJISなのと混同してないか？

257 ：デフォルトの名無しさん：2014/10/03(金) 21:03:34.66 ID:Bj0U/nno

日本語版WindowsはUnicode対応でない部分(A系API)がシフトJIS標準

258 ：デフォルトの名無しさん：2014/10/03(金) 21:14:17.04 ID:sUeMWuDQ

ファイル名とか
メモ帳の標準コードとか
色々あると思うが違ったかな？

259 ：デフォルトの名無しさん：2014/10/03(金) 21:41:48.59 ID:uCcPsxJ8

互換性を重視するMSでさえMFCのMBCSサポートを
打ち切ると予告している時代
既に新機能はW系関数のみの実装だし

260 ：デフォルトの名無しさん：2014/10/03(金) 22:20:19.44 ID:KKLEaHKT

\x5cなんて嫌いだー!

261 ：デフォルトの名無しさん：2014/10/04(土) 00:20:15.91 ID:TpSP81Tv

sjisはあまり責める気がしない。
utf8にbomつけたり、unicodeと銘打って実はUTF16-le、とかの方がタチ悪い。

262 ：デフォルトの名無しさん：2014/10/04(土) 00:24:06.50 ID:DsEISyRL

ありゃ日本NBはN4624引っ込めちゃったのか

263 ：デフォルトの名無しさん：2014/10/04(土) 04:31:53.10 ID:klgp9hPC

>>260
0x5c(\u005c)、バックスラッシュ(\)はUNIX系では、
エスケープ文字として使い、直後の文字の特別な機能をなくす

C99, C++, GCC, make, シェルスクリプトなどで、
行末にバックスラッシュ(\)があれば改行せず、1行とみなす

その際、コメント内の行末に、
日本語の表(\u955c)、能(\u945c)などの文字があると、
文字の2バイト目が解釈されて、1行になってしまう
これらをダメ文字という

// 1行コメント
/* ～ */

だから、これらのコメント内では、
行末の0x5cを解釈しないように、アプリを修正すればよい

264 ：デフォルトの名無しさん：2014/10/04(土) 04:42:15.71 ID:f/g9snk1

>文字の2バイト目が解釈されて、1行になってしまう
>これらをダメ文字という

お前が言ってるだけだろ

265 ：デフォルトの名無しさん：2014/10/04(土) 05:47:51.75 ID:gNAxrtUM

コメントの行末に何かを無条件で入れておくのは？

266 ：263：2014/10/04(土) 06:33:19.40 ID:klgp9hPC

コメントのすべての行末に、\ を置くと、
全部がつながって、1行になってしまうね

行末にダメ文字があるときは、ダメ文字の後ろに、
\を置いて、表\ とすればよいけど、行がつながってしまう

267 ：デフォルトの名無しさん：2014/10/04(土) 07:48:43.39 ID:TW/R31j/

>>263
こういうのをバカ者という

268 ：デフォルトの名無しさん：2014/10/04(土) 08:26:20.70 ID:M66Mgi8t

>>263
シフトJISの文字列は、行の先頭から、ちゃんと1バイトずつよめば
1バイト目か2バイト目か判定できます。慣れてしまえば、非常にわかりやすい。
とばかしたり（途中だけよんだり）するから、判定できなくなる。

EUC-JPなんか、どうやって判定するんでしょうか。おれは、しらん。

269 ：デフォルトの名無しさん：2014/10/04(土) 09:05:55.62 ID:wHKgiuGV

そもそも自分の知らない文字コードを読み込んで正しい処理結果を期待する発想がおかしい

270 ：デフォルトの名無しさん：2014/10/04(土) 09:16:10.45 ID:X8tclADN

>>255
ところが、かのWindowsもファイルシステムは UTF-16 でしたとさ‥

271 ：デフォルトの名無しさん：2014/10/04(土) 09:23:14.02 ID:X8tclADN

深刻なのは産業界
SiftJIS が浸透しているところに、エスケープ文字の仕様がダメダメのダメリカ規格(エスケープ文字ではさんでエスケープする、とかそのエスケープ文字自体をエスケープするときどうするんだ？）を持ち込んで最下層（RS232Cを触る階層のことね）ではダメ字対応に四苦八苦。
端的にいえば送信側が楽するか受信側が楽するかの違いにすぎないんだが‥うちの会社は両方とも楽をするという極悪非道をベンダに押し付ける‥

UTF-8 が浸透するまで収まりそうもないね‥

272 ：デフォルトの名無しさん：2014/10/04(土) 09:47:20.90 ID:fOqpWE8p

>>268
>シフトJISの文字列は、行の先頭から、ちゃんと1バイトずつよめば
>1バイト目か2バイト目か判定できます。慣れてしまえば、非常にわかりやすい。
>とばかしたり（途中だけよんだり）するから、判定できなくなる。
お前さんもどっこいどっこいだよ。
テキストバッファの途中で判定できるアルゴリズムもある、と言うか普通は
速度や汎用性からそちらを使う。

273 ：デフォルトの名無しさん：2014/10/04(土) 09:52:16.66 ID:mOBbhaTu

そのアルゴリズムどこで知られてるの？

274 ：デフォルトの名無しさん：2014/10/04(土) 09:54:44.14 ID:fOqpWE8p

昔のプログラム誌とかに普通に載ってたよ。
ウェブでも探せばあるでしょ。ただ今となっては古くて必要性の低い情報だから
埋もれてるかもね。

275 ：デフォルトの名無しさん：2014/10/04(土) 10:04:20.33 ID:fOqpWE8p

ファイルしてある大昔の資料発掘してみたらC MAGAZINE 1992年5月号に載ってた。
他にも沢山あるでしょ。

276 ：263：2014/10/04(土) 10:11:10.64 ID:klgp9hPC

>>271
>エスケープ文字ではさんでエスケープする、
>とかそのエスケープ文字自体をエスケープするときどうするんだ？

エスケープ文字って、バックスラッシュ(\)のことかい？
シェルスクリプトならこうなる

\\\\ → \\
1文字目が2文字目をエスケープ
3文字目が4文字目をエスケープ

277 ：263：2014/10/04(土) 10:23:41.64 ID:klgp9hPC

C99, C++, GCC, make, シェルスクリプトなどの内部で、
寺尾進のTeraPadを呼び出して、文字コードを変換すればよい

Win8にも対応しているし、日本人だし、たぶん間違いない

それか、Ruby。これも作者(Matz)が日本人

278 ：デフォルトの名無しさん：2014/10/04(土) 10:28:51.40 ID:X8tclADN

>>276
ま、ふつうはそういう風にエスケープ文字を機能定義するもんだよね‥
ところがどっこい、「『エスケープ文字』と『エスケープ文字』ではさんだその間をエスケープ対象とする」という規格が存在するんだよ‥

ASTM1394/1381‥ああいろいろばれちゃうねえ‥文字で苦労しないダメリカの規格なんかほいほい採用しちゃだめだよね‥

279 ：デフォルトの名無しさん：2014/10/04(土) 10:31:29.66 ID:TW/R31j/

>>270
内部はでしょ？
かなりの所で表に出てくるのがどちらのコードか
http://www-06.ibm.com/jp/linux/tech/doc/007aca9b.html
勘違いしてるかな

280 ：デフォルトの名無しさん：2014/10/04(土) 10:33:25.14 ID:yOXr2OF7

>>277
今時内部Unicodeじゃないエディタなんて・・・

281 ：デフォルトの名無しさん：2014/10/04(土) 10:34:29.97 ID:fOqpWE8p

>>277
libiconvやらICUが普通に使われてるよ。
遅れてるのはWindowsだけだから。

282 ：263：2014/10/04(土) 10:42:47.81 ID:klgp9hPC

そりゃ、漢字と言えば、やっぱり日本人が一番だよ
苦労しているからね

TRON、超漢字OS

そういえば、iPhoneの地図もひどいらしいね

283 ：デフォルトの名無しさん：2014/10/04(土) 10:46:01.44 ID:fOqpWE8p

当たり前のアルゴリズムやライブラリの存在すら知らなければ、そりゃ苦労するだろうね。

284 ：デフォルトの名無しさん：2014/10/04(土) 10:47:00.61 ID:X8tclADN

>>279
その記事あやしいよ‥win95 のFAT32 LFN はすでにUTF-16 だったと記憶しているね、結構大騒ぎになった気が

285 ：デフォルトの名無しさん：2014/10/04(土) 11:01:31.05 ID:TW/R31j/

>>284
では信用できるところを教えて
経験上ファイル名はSJISコードだと思ってる
内部はuniだろうがね

286 ：デフォルトの名無しさん：2014/10/04(土) 11:04:43.36 ID:j10VjSV2

まずNTFSとFAT32を区別するところから

287 ：デフォルトの名無しさん：2014/10/04(土) 11:08:20.98 ID:X8tclADN

>>285
FAT32 では一つのファイルは ShortFileName と LongFineName の二つの名前をもち、ShortFileName は Shift-JIS, LongFileName の方は UTF-16 だったはず。

288 ：デフォルトの名無しさん：2014/10/04(土) 11:17:11.93 ID:TW/R31j/

>>287
記事が怪しいと言うから当てになる情報聞きたかったが
FAT32で「はず」って言われても…
NTFSしか使ってないし

289 ：デフォルトの名無しさん：2014/10/04(土) 11:18:32.58 ID:OmSkKYDb

FAT32にUTF-8で書き込むドライバがあっても驚かない

290 ：デフォルトの名無しさん：2014/10/04(土) 11:32:40.97 ID:yOXr2OF7

>>285
> (1) Windows カーネル内部では Unicode を使用
正しい。より正確にはUTF-16LE。

> (2) NTFS ファイルシステムに保存する際は Unicode を使用
正しい。より正確にはUTF-16LE。

> (3) CIFS プロトコルによるファイル転送の際は Unicode を使用
知らん。

> (4) FAT32 ファイルシステムに保存する際は SJIS に変換して保存
まあ、間違いではない。>>287の言うとおり。

> (5) Windows 上で稼動するアプリケーションには、Windows カーネルが SJIS に変換して渡す
びみょー。
ANSI APIを使う（古い）アプリには、SJIS（正確にはCP932）に変換して渡す。
Unicode API (Wide API)を使うアプリには、UTF-16LEのまま渡す。

291 ：デフォルトの名無しさん：2014/10/04(土) 11:40:48.79 ID:UkDdVNoH

>>285
仕様書がある。
http://msdn.microsoft.com/en-us/windows/hardware/gg463080.aspx

292 ：デフォルトの名無しさん：2014/10/04(土) 11:47:28.83 ID:X8tclADN

>>288
http://en.wikipedia.org/wiki/Design_of_the_FAT_file_system#VFAT
http://ja.wikipedia.org/wiki/File_Allocation_Table#VFAT

293 ：デフォルトの名無しさん：2014/10/04(土) 11:58:38.01 ID:TW/R31j/

>>290
なるほど
ありがとう

294 ：デフォルトの名無しさん：2014/10/04(土) 15:27:27.26 ID:1xUkQZ/n

http://www.dotup.org/uploda/www.dotup.org5344659.txt.html

このテキストファイルにある文字コードを逆アセンブルすると、どんな感じになるか、宜しければ教えてください。
アセンブル言語かそれよりも読みやすい形式ではどうなるのかが気になります・・・

295 ：デフォルトの名無しさん：2014/10/04(土) 17:03:13.90 ID:X8tclADN

>>294
いったい何なんだ？

296 ：デフォルトの名無しさん：2014/10/04(土) 17:07:30.71 ID:lwfJG00e

信州味噌

297 ：デフォルトの名無しさん：2014/10/04(土) 17:19:02.69 ID:VuaBAyqL

>>272
おじいちゃんがそういうことをするから、
他の文字コード扱うようにしようとする若者が
苦しむことになるんだよ。

いつまでもSJIS固定の知識にしがみついてんじゃないよ。

298 ：デフォルトの名無しさん：2014/10/04(土) 17:59:22.47 ID:X8tclADN

>>297
ごめんね、どうせ漢字コードをガラポンするんだったら、近世康熙字典等に典拠し仏典解釈にも耐え字喃をも抱合した東アジア文化圏を代表するコード体系にもって行きたかったんだが、外圧に負けてしまった

299 ：デフォルトの名無しさん：2014/10/04(土) 18:07:22.71 ID:VR01Pkr6

つまり後世に残る技術はいくらでもありますニダ

300 ：デフォルトの名無しさん：2014/10/04(土) 18:45:20.93 ID:qpaDPuoT

SHIFT-JIS固定ってわけでもなくて、別にUTF-8を途中から処理する技術としても使えるよな
いちいちUTF-32に直さないと何もできないと思ってるヘボも多いけど

301 ：デフォルトの名無しさん：2014/10/04(土) 19:18:22.45 ID:Aq1dRHRh

>>298
日本人が作るとTRONコードみたいなものにしかならない

302 ：デフォルトの名無しさん：2014/10/04(土) 19:36:35.69 ID:1xUkQZ/n

>>295
mugenってゲームのキャラクターに使われてるコードです。
どう言う内容が書かれているか解析されたら面白いかなと・・・

303 ：237：2014/10/04(土) 19:53:35.27 ID:il6Kvmrs

>>238
Win32s用の情報になっちゃうのか…。
知りたかったのはc_932.nlsの構造なんだけど
とりあえず見てみる。ありがとう。

304 ：デフォルトの名無しさん：2014/10/04(土) 21:07:18.31 ID:j10VjSV2

>>302
スレ違いにも程がある

305 ：デフォルトの名無しさん：2014/10/04(土) 21:26:32.94 ID:fOqpWE8p

>>297
SJIS固定の知識ではないよ。
アルゴリズム見れば判るけど1バイト2バイト混在のエンコーディング汎用に使える。

306 ：デフォルトの名無しさん：2014/10/04(土) 21:43:56.32 ID:X8tclADN

いわゆる半角カナはUTF-8 では 3バイトだ‥

307 ：デフォルトの名無しさん：2014/10/04(土) 21:44:27.50 ID:fOqpWE8p

>>300
UTF-8は先頭2bit見れば切れ目は簡単に判る。
UTF-8絡みでは先頭1byteから長さを求めるこのコードが気が利いてる。
inline uint32_t utf8_char_len(uint8_t byte) {
　return(((0xE5000000 >> ((byte >> 3) & 0x1E)) & 3) + 1);
}

308 ：デフォルトの名無しさん：2014/10/04(土) 22:08:21.15 ID:qpaDPuoT

>>307
illseq対応できない、やり直し

309 ：デフォルトの名無しさん：2014/10/04(土) 23:52:30.72 ID:Aq1dRHRh

>>307
このやり方いいな

310 ：デフォルトの名無しさん：2014/10/05(日) 02:42:24.51 ID:dZJgRaX6

UTF-8の1コードポイントの長さを判定するには
先頭バイトの上位4ビットと定められているのだけれど
どうしてこう妄想の糞コードをまき散らすんだろうか

311 ：デフォルトの名無しさん：2014/10/05(日) 02:49:08.29 ID:1vv2G9lM

ビット見るとか数値を見るとか。ドヤ顔の老害がいるから
こういうことになるんだよな。正しくAPI使えよ。

312 ：デフォルトの名無しさん：2014/10/05(日) 03:02:25.25 ID:RFQS974S

>>310 >>307は最長で4バイトと決め打ってる

>>311
UTF-8ぐらいは自前で切り分けられなきゃダメだろ、上のコードはさておき

313 ：デフォルトの名無しさん：2014/10/05(日) 03:08:26.65 ID:1vv2G9lM

>>312
老害は空気読まないし、ゆとりはコピペでおかしいコードを拾ってくるし、
頭の悪い奴にそういうことをさせてはいかん。

知ってる、できる、というのは確かに必要だけども、
そういうのは隠しておけ。

314 ：デフォルトの名無しさん：2014/10/05(日) 03:13:10.39 ID:uXSW8JsI

abcd???? >> 3 = ???abcd? & 0x1e = 000abcd0 (2~30の偶数のみ)
だから正しい結果にならないな。

315 ：デフォルトの名無しさん：2014/10/05(日) 03:36:10.03 ID:RFQS974S

>>314
そこは合ってる。0xE5000000から2ビットずつ切り出してるから。
問題は5～6バイトの対応と、FE、FFを不正扱いできないこと。
実際には冗長表現やサロゲートペアを弾いたりもしないといけないし
どうせ分岐するなら最初に < 0x80 で分岐した方がいい、と
特定の入力しかこないことがわかってるときにしか使えない競技用の最適化だな

316 ：デフォルトの名無しさん：2014/10/05(日) 03:49:15.52 ID:ybvOIS0S

>>315
Unicode規格のUTF-8は最長4バイトで
その長さの判定に不可欠なのが最初の4ビットな訳だが
何を言ってるんだ？
ついでにUTF-8の処理でなんでサロゲートペアが出てくるんだ

317 ：デフォルトの名無しさん：2014/10/05(日) 04:11:55.69 ID:RFQS974S

>>316
>>314で抜き出されてる式を見ろ、& 0x1e で「最初の4ビット」だろ
ついでに、長さを取って終わりじゃないだろ、必ず後続バイトの処理が入るだろ
そこでサロゲートペア相当の範囲を弾いておかないと、冗長表現同様の同じ文字の別ビットパターンになってしまうだろ

318 ：デフォルトの名無しさん：2014/10/05(日) 10:12:14.67 ID:cc3yWH/A

>冗長表現同様の同じ文字の別ビットパターンになってしまうだろ

不正なデータの処理などする必要など無いね。
アホがヒューリスティックな判定を突破されてﾌｧﾋﾞｮってるだけだろ。
きとんとUnicodeのencoding schemeをencoding formに変換してから文字列処理しろ。

319 ：デフォルトの名無しさん：2014/10/05(日) 11:06:22.31 ID:SJ37vndy

>きとんとUnicodeのencoding schemeをencoding formに変換してから文字列処理しろ。
どうせ変換するんだったら最初から UTF8 より処理が楽な UTF32 にするわ

320 ：デフォルトの名無しさん：2014/10/05(日) 11:12:14.57 ID:bqkZ4fJc

必要なのはencode formじゃなくてコードポイントへの変換
UTF8のまま処理するのはシフトJISで5Cが起こした問題を反省しない人

321 ：デフォルトの名無しさん：2014/10/05(日) 13:20:41.46 ID:FZuSwsnO

>>320
5C だけとは限りませんぜ。>>278

322 ：デフォルトの名無しさん：2014/10/05(日) 13:48:09.02 ID:FtNXVQE/

Cのソースも読めず、UTF-8でサロゲートペアとか言い出すのがここのレベル

323 ：デフォルトの名無しさん：2014/10/05(日) 14:11:25.34 ID:a6/ySe32

馬鹿には無理

324 ：デフォルトの名無しさん：2014/10/05(日) 18:12:44.43 ID:JBPweL8q

なんつーかまず仕様を勉強しろ
ビット配列が同じだからって勝手に仕様を推測しちゃいかん

325 ：デフォルトの名無しさん：2014/10/05(日) 20:53:08.85 ID:RFQS974S

>>318の書いたソフトウェアだけは使いたくないもんだ

326 ：デフォルトの名無しさん：2014/10/05(日) 21:27:55.58 ID:XmSTRDeP

とUTF-32で処理すべきところをUTF-8で処理して
セキュリティ脆弱性をつつかれた325が何か申しております

327 ：デフォルトの名無しさん：2014/10/05(日) 23:59:54.62 ID:OwPAT2u/

こんな不正入力対応でできた脆弱性を突いたのが昔懐かしいNimdaだよな

328 ：デフォルトの名無しさん：2014/10/06(月) 00:30:52.87 ID:lZkt3Im/

未だにnimdaのパケット飛んでくるけどなー

329 ：デフォルトの名無しさん：2014/10/06(月) 00:39:14.84 ID:Vb4yB39d

>>325のPCから飛んできた

330 ：デフォルトの名無しさん：2014/10/06(月) 14:18:04.56 ID:sZCddYLR

そういえば、コントロールな文字が例えば^Cのように表されるけど、
^^も存在するから^^と^^の見分け方はどうなるんだというのもあるようなｗ

331 ：デフォルトの名無しさん：2014/10/06(月) 16:57:50.00 ID:6P/FUU8l

ボクのコンパイラはprintln(null)するとnullと出力されるんだけど
"null"との見分けはどうなるんだというのもあるようなｗ

332 ：デフォルトの名無しさん：2014/10/06(月) 17:00:46.07 ID:ffXeUYxH

そういや、printfで(null)って出る理由が最初わからんかったな

333 ：デフォルトの名無しさん：2014/10/06(月) 17:32:52.01 ID:DaOiROEZ

逆変換を考慮したプリティプリントなら、文字列だったら "null" とかだな。

334 ：デフォルトの名無しさん：2014/10/29(水) 23:04:56.16 ID:oCDkpf7C

UTR#51ってまだレビューの始まっていない本当の下書きの段階っぽいけど
あのおっちゃんはどこから掘り出してきたんだ…

335 ：デフォルトの名無しさん：2014/10/30(木) 00:15:31.02 ID:hHjSzwHK

ケンから送られてきただろ？

336 ：デフォルトの名無しさん：2014/11/01(土) 22:50:16.95 ID:JvCP1jWo

ケツに見えた

337 ：デフォルトの名無しさん：2014/11/05(水) 22:32:25.38 ID:EQuMroEp

ケンはいつになったらaj17の作業始めるのさ

338 ：デフォルトの名無しさん：2014/11/06(木) 03:06:10.54 ID:m7lHO/KY

そんな剣呑な言い方をしなくてもいいじゃないか

339 ：デフォルトの名無しさん：2014/11/19(水) 03:20:02.23 ID:Y+N0NUca

ttp://mojikiban.ipa.go.jp/wp-content/uploads/2014/10/20141027-6.pdf

とうとう変体仮名の符号化来るのかー
フォント屋さんはデザインが大変だ

340 ：デフォルトの名無しさん：2014/11/19(水) 10:26:51.52 ID:DTfPg3SF

需要あるのかね。

歴史的假名遣ひやら舊字やらを必死で使ってるウヨ風味君たちでも、
その一割も変体仮名なんてまともに読み書きできないだろうにw

呉服屋のロゴタイプぐらいか。

341 ：デフォルトの名無しさん：2014/11/19(水) 13:05:11.72 ID:lE3ruP5g

なるほど一理ある
http://blogs.yahoo.co.jp/kudamatu1963/60376689.html
http://www10.plala.or.jp/koin/koinhentaigana.html

342 ：デフォルトの名無しさん：2014/11/19(水) 13:16:20.29 ID:57B/Jrvd

でももしOS標準フォントに変体かなが入ったとしたら、「ㄘんㄘんㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ」みたいなヘタ文字遊びに使われるばかりで
本来の読み完全無視のセマンティクス大爆発で文字屋は猛烈にモニョモニョすることになるだろうなw

343 ：デフォルトの名無しさん：2014/11/19(水) 14:31:33.53 ID:DTfPg3SF

データサイエンティスト諸兄は先日「がをられ」で爆散して、まだ再構成されてないという噂だが

344 ：デフォルトの名無しさん：2014/11/19(水) 15:05:24.30 ID:JZ2oYyd9

MeCabが泣く

345 ：デフォルトの名無しさん：2014/11/19(水) 15:09:40.28 ID:JZ2oYyd9

>>342
注音輸入法って言うのかそれ

346 ：デフォルトの名無しさん：2014/11/20(木) 00:05:26.97 ID:PNit9o2K

IPAmjフォントへグリフを入れてパブコメってのは予定にないのか
MJ&#12098;字情報&#12032;覧表へ追加ってのは書いてあるけど

347 ：デフォルトの名無しさん：2014/11/20(木) 06:04:14.30 ID:Y1aJUjcd

ちゃんと採用基準明確にしてからにしてほしいわ

348 ：デフォルトの名無しさん：2014/11/21(金) 03:45:40.52 ID:5WCyankX

いまさらだけど<005C>って嫌いだぁ

349 ：デフォルトの名無しさん：2014/11/21(金) 04:13:06.17 ID:uhFDfrMT

Windowsは游フォントではu+005cをバックスラッシュにしてほしかったな
MSフォントはもう仕方ないけど

350 ：デフォルトの名無しさん：2014/11/21(金) 18:16:55.38 ID:M6C4Rn8T

このへんで円記号をU+A5に移行しておいた方が
今後10年後に幸せになる

351 ：デフォルトの名無しさん：2014/11/22(土) 01:42:55.16 ID:hr7hEoH/

>>345
文字の名前は注音符号
「輸入法」はIMEのこと。

352 ：デフォルトの名無しさん：2014/11/22(土) 12:14:09.84 ID:h3O2Jdjt

円記号はキーボードからの入力時の割り当ても変えなきゃだめだね。
右シフトの隣だけバックスラッシュに切り替えればいいんだろうけど
昔からなんとなく円記号をそっちで打ってる人、
バックスラッシュとしてBackspaceの横を使ってる人は嫌がりそうだな。

353 ：デフォルトの名無しさん：2014/11/22(土) 19:09:41.61 ID:ShrnUmIj

Unicodeベースなのに005cに円記号グリフを割り当てているのって
もしかしてWindowsだけなのかな

354 ：デフォルトの名無しさん：2014/11/24(月) 09:37:01.97 ID:5ViLcgqq

他にも色々あるけどさ、互換性がとかもっともらしい言ってる割には結構要らないとこで修正かけてるし、新規導入文字の策定プロセスも政治的だし、過去のミスをそのままにして自己矛盾抱えてるくらいなら一度綺麗に直しちゃえばいいのに。

355 ：デフォルトの名無しさん：2014/11/24(月) 10:16:55.12 ID:vzSgLTQH

円記号は影響が大きいからなかなかそうもいかないと思うなあ。

だが「～」、お前はだめだ。

356 ：デフォルトの名無しさん：2014/12/03(水) 04:07:19.29 ID:XEiesraa

L2/14-296によると変体仮名の提案書は来春らしいな
あと香港が初のIVD登録をする予定とか

357 ：デフォルトの名無しさん：2014/12/03(水) 05:26:12.93 ID:fecIQyAn

プログラマには関係ないだろうけど、物書き系には「引用符」がつらい。

358 ：デフォルトの名無しさん：2014/12/03(水) 13:03:40.78 ID:3aAit+mk

つらいって？

359 ：デフォルトの名無しさん：2014/12/03(水) 18:48:18.99 ID:dl6y7/5j

ふむ

360 ：デフォルトの名無しさん：2014/12/04(木) 06:25:38.91 ID:IHX/i/t+

字詰めとか縦書きの文字方向とかかな

361 ：デフォルトの名無しさん：2014/12/04(木) 06:46:51.31 ID:Fs16VGMb

ワープロソフトが「便利な」要らんことするし

362 ：デフォルトの名無しさん：2014/12/08(月) 11:27:34.78 ID:+cdVgUEA

各国で違うしな

363 ：デフォルトの名無しさん：2014/12/09(火) 07:12:15.07 ID:dchb1ARp

スタートダッシュで出遅れる　どこまで行っても悩まされる
ところが名機か神Mac　居並ぶWindowsをごぼう抜き
ついでに機種まで振り落とす
走れー走れー文字コード　追い付け追い越せ世界標準

……俺、ついに頭がおかしくなったようだ

364 ：デフォルトの名無しさん：2014/12/09(火) 09:56:19.30 ID:TewCEbch

せやな

365 ：デフォルトの名無しさん：2014/12/11(木) 14:20:46.40 ID:HErT4sU5

すげー基本的かもしれないけど教えて。
windowsのサクラエディタでshift-jisとしてファイルを保存して
今度それを同じエディタで開いてutf-8のファイルとして上書き保存した。

結果として文字化けなどせずに問題ないんだけど
これは上書き保存時に中の文字がutf-8に変換されたってことなの？

366 ：デフォルトの名無しさん：2014/12/11(木) 15:39:56.50 ID:ByVGJ4dw

>>365
桜エディタがsjisのテキストファイルを読みだしてutf-8で書き出した。
それを変換と呼ぶならいいんじゃないかね

367 ：デフォルトの名無しさん：2014/12/11(木) 15:45:47.12 ID:MNI0BZQ+

メモリ内でのエンコーディングはいつも同じで
読込時保存時にそれぞれ変換してるだけ

368 ：365：2014/12/11(木) 16:02:04.54 ID:HErT4sU5

>>366
>>367
どうもありがとう
すげー納得しました。

369 ：デフォルトの名無しさん：2014/12/11(木) 19:17:24.50 ID:f28H8ZNo

SJIS->UTF8はあんまり問題にならんけど
逆は変換失敗することがあるよ

370 ：デフォルトの名無しさん：2014/12/11(木) 22:46:17.17 ID:Im7USD7v

??????
???
?????
??

371 ：デフォルトの名無しさん：2014/12/17(水) 22:46:29.52 ID:NB8mHIri

そりゃ一つの文字が3箇所に重複してたりするからな

372 ：デフォルトの名無しさん：2014/12/18(木) 16:12:11.47 ID:/+kNZ4OK

尾骶骨

373 ：デフォルトの名無しさん：2014/12/18(木) 16:15:46.29 ID:/+kNZ4OK

〜
～

374 ：デフォルトの名無しさん：2014/12/18(木) 20:12:55.55 ID:on3AHD1c

Σ
Σ

375 ：デフォルトの名無しさん：2014/12/19(金) 03:46:35.17 ID:zB/527Ib

>>371
Ωでそれをやられるたびに、オメーガ悪い！と叫んでしまうのだよ

376 ：デフォルトの名無しさん：2014/12/19(金) 09:56:22.42 ID:iA6Ogp4V

おー目が悪い

377 ：デフォルトの名無しさん：2014/12/20(土) 14:32:33.33 ID:F5JzIeqB

BOMってなに?
リトルインディアンとかビックインディアンてなーに?

378 ：デフォルトの名無しさん：2014/12/20(土) 15:27:20.90 ID:VqHS1tqD

節子それインディアンちゃう、エンディアンや

379 ：デフォルトの名無しさん：2014/12/20(土) 18:35:53.06 ID:f3mxYTFR

>>377
ビッグインディアンはアメリカのモニュメント・バレーのナバホ族公園にそびえ立つ巨岩のことらしいよ。
リトルインディアンはアメリカの民謡だな。

380 ：デフォルトの名無しさん：2014/12/20(土) 18:54:04.68 ID:lm8whnff

Ten little Indian BOMs!

381 ：デフォルトの名無しさん：2014/12/20(土) 19:07:48.26 ID:e+FqSQyU

昔読んだCの本かアセンブラの本は
エンディアンの説明で
挿絵がインディアンの絵だったから
漏れもしばらく >>377 と同じ誤解してたよ

382 ：デフォルトの名無しさん：2014/12/20(土) 19:21:19.77 ID:K4geyqtO

>>381
こんなのかな
http://nlogn.ath.cx/archives/200506/indian.gif

383 ：デフォルトの名無しさん：2014/12/20(土) 19:28:56.02 ID:e+FqSQyU

多分それじゃないと思う

384 ：デフォルトの名無しさん：2014/12/20(土) 19:53:49.95 ID:qPKBl4wW

ミドルインディアンがいない。やり直し

385 ：デフォルトの名無しさん：2014/12/20(土) 20:18:45.81 ID:OFDu+jNj

ねっとわーくばいとおーだぁー

386 ：デフォルトの名無しさん：2014/12/21(日) 03:25:32.60 ID:0WNgnvqW

頭がbomb

387 ：デフォルトの名無しさん：2014/12/21(日) 06:32:29.37 ID:gQMH/TzB

>>382
見覚えある

388 ：デフォルトの名無しさん：2014/12/21(日) 13:04:26.38 ID:LFWMhZfd

日本語の符号化方式の歴史をまとめた資料ってどこかにありますか？

389 ：デフォルトの名無しさん：2014/12/21(日) 13:08:11.49 ID:bwP6+3OF

>>388
有りません。
皆、言ってることが違います。
中でも妄想が激しくて真実からほど遠いのが安岡コウイチ氏の解説。

390 ：デフォルトの名無しさん：2014/12/21(日) 13:14:05.82 ID:Bf9LJUnb

>>388
モールス符号化あたりからなら
http://www.amazon.co.jp/dp/4320121023/

391 ：デフォルトの名無しさん：2014/12/21(日) 13:15:01.76 ID:Bf9LJUnb

>>389
ああ、そうだったのか
有りませんってことは、雑多に読み進めるしか無いのかな

392 ： ◆QZaw55cn4c ：2014/12/21(日) 13:43:08.14 ID:e2fIb+kJ

ここでガリバー旅行記云々カンヌン

393 ：デフォルトの名無しさん：2014/12/21(日) 14:08:18.44 ID:/RNkRysA

でもすごいとこから持ってきたよな
内容もよくあってるｗ

394 ：デフォルトの名無しさん：2014/12/21(日) 14:40:14.72 ID:5yL14jh0

とりあえず、Shift-JisとEUCとUTF-8とUTF-16ワンリルインディアンボム
だけを使うならWindows Mac Andoroidoで文字化けとか気にしないでいんでしょ?

395 ：デフォルトの名無しさん：2014/12/21(日) 16:26:21.69 ID:0WNgnvqW

甘いな

396 ：デフォルトの名無しさん：2014/12/23(火) 15:25:33.89 ID:ATuB6kuL

>>393
飛ぶ島ラピュタは、スペイン語で女性器
馬の国のヤフーは、ヘブライ語の「ユダヤ人」Yehudim　http://ja.wikipedia.org/wiki/%E3%83%A6%E3%83%80%E3%83%A4%E4%BA%BA#cite_note-10

スイフトの当てこすりはきついね

397 ：デフォルトの名無しさん：2014/12/23(火) 16:48:23.56 ID:pWRQK/2A

日本人だってずいぶんカリカチュア的に描かれてるしな

398 ：デフォルトの名無しさん：2014/12/23(火) 17:21:07.92 ID:guIlJsaj

カ・・・何て？

399 ：デフォルトの名無しさん：2014/12/25(木) 01:40:55.01 ID:hVvpBEcO

カ、カリがでかいて？

400 ：デフォルトの名無しさん：2014/12/25(木) 07:55:48.73 ID:qKZrZOHg

絵文字について知りたいのですが
携帯電話で書いたデコメを
amebloに送ると絵文字が表示されますが
gmailで書いたデコメだと
amebloに送ると絵文字は出ることは出るのですが
レイアウトがくずれまくります
何が違うんでしょうか？

401 ：デフォルトの名無しさん：2014/12/25(木) 09:08:25.70 ID:faeygXOh

使ってない人間が言うが、それはまず間違いなく絵文字関係ないな。

402 ：デフォルトの名無しさん：2014/12/25(木) 09:34:52.36 ID:qKZrZOHg

絵文字のときだけ可笑しいんです

403 ：デフォルトの名無しさん：2014/12/25(木) 10:21:02.73 ID:3E8dV8L4

その絵文字フォントが、表示アプリ（いわゆるブラウザ、メーラーなど）に対応してないんだろ。

404 ：デフォルトの名無しさん：2014/12/25(木) 10:58:27.39 ID:Y5il8ylR

使ってないのにレスすんなω

405 ：デフォルトの名無しさん：2014/12/25(木) 11:33:38.39 ID:NGKeja9v

以下無人

406 ：デフォルトの名無しさん：2014/12/25(木) 12:48:52.06 ID:3E8dV8L4

>>404
ごめんなさい。

407 ：デフォルトの名無しさん：2014/12/25(木) 13:29:04.72 ID:AQTw17vV

そもそも文字じゃなくて絵なんじゃないかと。

408 ：デフォルトの名無しさん：2014/12/25(木) 13:38:01.48 ID:3E8dV8L4

AAがズレるみたいな？

409 ：デフォルトの名無しさん：2014/12/26(金) 02:44:58.63 ID:3IRAqeR8

携帯電話は大体ドコモのせいでShift_JISラブになってしまって
絵文字を外字として登録したのがそもそも間違いの始まり

410 ：デフォルトの名無しさん：2014/12/26(金) 07:20:40.98 ID:GRWnXRDO

その後のゴタゴタを携帯キャリア同士で解決せずUnicodeに持ち込んだアホは万死に値する。

411 ：デフォルトの名無しさん：2014/12/26(金) 07:25:31.95 ID:GRWnXRDO

>>389
言ってることが人それぞれ違うとしながら真実から程遠い遠いと評するのは、真実が書かれた資料があると言いたいのか、矛盾してでも安岡のアホを批判したいのかどっちなんだ?
後者だろうけど。

412 ：デフォルトの名無しさん：2014/12/26(金) 09:26:49.39 ID:ZuUtgKR9

デコメは文字じゃないだろ

413 ：デフォルトの名無しさん：2014/12/26(金) 10:17:26.37 ID:pCqxNpIs

>>410
キャリアは「入れたければどうぞ」みたいなスタンスだった気が。

414 ：デフォルトの名無しさん：2014/12/26(金) 10:26:27.67 ID:vVR74RNM

絵文字がUNICODEになるとは予想してなかったが
増え続ける絵文字をどうせえと

415 ：デフォルトの名無しさん：2014/12/26(金) 11:54:56.85 ID:CmrZLX32

そもそも絵文字が生まれた頃は、携帯で文中に画像埋め込んで送受信するとか負担大きすぎるから、苦肉の策で文字として実装した
一時絵文字の豊富さを競争しかけた頃があったけど、その後キャリアは絵文字を増やすんじゃなくデコメを作ってそっちにシフトした
すでにユーザーも絵文字からデコメに移行済みだった
絵文字は緩やかに死ぬはずだった
それなのに文字オタクのアホが絵文字だけを見て考えなしにUnicodeに突っ込んだ
やるなら絵文字を完全に殺して、デコメのオープン標準規格を作ればよかった

416 ：デフォルトの名無しさん：2014/12/26(金) 12:12:12.13 ID:U37YhbAO

筋違いもいいところだ。
恨むなら、何もしなかった・できなかった、現状追認すらまともにできないクソ国内キャリアどもを恨めw
Googleもたいがいクソだが、この件では可能な限りの仕事をしたと思うぞ。

417 ：デフォルトの名無しさん：2014/12/26(金) 13:57:11.80 ID:KN+qDrDJ

中のひとですねわかります

418 ：デフォルトの名無しさん：2014/12/26(金) 21:53:37.43 ID:eFIqVV4r

スマートフォンはUnicodeで絵文字使うから、ローカル規格のデコメとやらも勝手にやれば良いじゃん。

419 ：デフォルトの名無しさん：2014/12/26(金) 22:47:40.34 ID:MBLjX4KZ

デコメールをパソコンで見る方法って?

420 ：デフォルトの名無しさん：2014/12/27(土) 12:02:27.25 ID:8H3WtYVY

クソキャリアに何を期待してるんだ

421 ：デフォルトの名無しさん：2014/12/27(土) 12:05:26.98 ID:dTLO/MuG

土管さえあればいいです

422 ：デフォルトの名無しさん：2014/12/28(日) 21:07:09.77 ID:HTXTh3CW

外字で使われていた分をUnicodeへ入れたところまではよかったけど
今やgoogleのおもちゃに成り下がった
タコスだのホットドッグだの用例もないのに「ほしいから入れる」なんて
理屈がまかり通ってる

423 ：デフォルトの名無しさん：2014/12/29(月) 01:39:43.66 ID:sbGcuVzL

しかしそこを突っ込んだところで、
AndroidでPUAに並べてほら実装例、みたいにされたら
むしろ今以上に好き勝手できそうだな。

424 ：デフォルトの名無しさん：2014/12/29(月) 11:58:00.77 ID:bj0t/8Ju

いまさら何を言ったところで、まともに対応できなかったからおもちゃを取り上げられた子供が
ダダをこねてる、としか見られないしなw

425 ：デフォルトの名無しさん：2014/12/30(火) 01:31:49.26 ID:qC3hgECd

欲しいから入れるは酷いが、
文字として日本国内では相当広く使われていた携帯(ポケベル)絵文字を、
Unicodeに登録して何が悪いのだ。
元に使われていたんだから仕方ないじゃないか。
docomo-2005とか、Unicodeとは無縁のShift_JIS亜種CESを増やした方が良かったというのか。

426 ：デフォルトの名無しさん：2014/12/30(火) 01:32:22.04 ID:qC3hgECd

元に→現に

427 ：デフォルトの名無しさん：2014/12/30(火) 11:02:25.27 ID:S+Hw3V6p

<旗記号>JP<旗記号>

428 ：デフォルトの名無しさん：2014/12/30(火) 11:06:56.71 ID:XwsmG+J3

��

429 ：デフォルトの名無しさん：2014/12/31(水) 00:05:16.96 ID:4YdVXmZC

>>413
ドコモは文字の色でイチャモンつけてた
http://slashdot.jp/journal/503205

430 ：デフォルトの名無しさん：2014/12/31(水) 02:31:36.90 ID:hEDPFzeA

一方auはあっさり自前を捨ててドコモ絵文字に乗り換えた。

せっかく作った変換マップ涙目。

431 ：デフォルトの名無しさん：2014/12/31(水) 22:26:08.89 ID:F+4v4RJx

>>430
いや、過去に携帯同士でやり取りされてたメールの表示に必要だから。
機種ごとの違いとか足りないところもあるけど非常に重要な情報。
メーカーから情報が出ない限り、今後まとめる人間はもう出てこないだろう。
あの提案にまとめられた資料はグッドジョブとしか言いようがない偉業。

432 ：デフォルトの名無しさん：2014/12/31(水) 23:21:22.40 ID:U0APx8aX

一時期のauは絵文字が豊富なことを売りにしてたな懐かしい

433 ：デフォルトの名無しさん：2015/01/01(木) 01:24:51.02 ID:XiF24rSN

auって数年おきに絵文字デザインが別物になってたな

434 ：【大吉】：2015/01/01(木) 06:37:14.61 ID:Sx9cr3wk

ドコモの「マル秘」って○じゃないんだなw

435 ：デフォルトの名無しさん：2015/01/01(木) 07:23:04.70 ID:xYbX6ZrA

>>431
自己満すなぁ…

436 ：デフォルトの名無しさん：2015/01/01(木) 10:58:58.29 ID:1jsEGgHD

腐すだけってラクな生き方だよな

437 ：デフォルトの名無しさん：2015/01/01(木) 12:49:47.71 ID:xYbX6ZrA

コワイよー鏡に向かって何かブツブツ呟いてる奴がいるよー

438 ：デフォルトの名無しさん：2015/01/01(木) 17:51:42.11 ID:csiou4G7

>>410
googleと結託して絵文字をUnicodeに持ち込んだの安岡だろ

439 ：デフォルトの名無しさん：2015/01/01(木) 22:35:07.02 ID:A76EEkVS

>>438
提案書も規格書も読んだことない馬鹿発見。

440 ：デフォルトの名無しさん：2015/01/04(日) 01:20:05.39 ID:0PWdrMwO

JIS信者の安岡氏はUnicodeに関して
便所の落書き以上の業績を残したことはありません。

441 ：デフォルトの名無しさん：2015/01/04(日) 20:40:59.56 ID:2n2BUP4o

TRON信者のキチガイが復活したか。
>>437 という自己紹介のキチガイ野郎といい、文字コードはキチガイの巣だな。

442 ：デフォルトの名無しさん：2015/01/04(日) 22:05:59.02 ID:MES8npFQ

復活というかあの人ずっといる気がする

443 ：デフォルトの名無しさん：2015/01/05(月) 00:05:02.23 ID:yfwC92/+

どう考えても安岡はそのキ○ガイの筆頭な件

444 ：デフォルトの名無しさん：2015/01/05(月) 08:12:32.63 ID:3J2GSmZ2

ほら出た

445 ：デフォルトの名無しさん：2015/01/05(月) 09:32:37.24 ID:R0XkFNG2

スラドでぶつぶつ言ってると相手してくれるメディアがスラドしかないのかよと思う。

446 ：デフォルトの名無しさん：2015/01/05(月) 09:54:01.58 ID:3J2GSmZ2

2chでぶつぶつ言ってるだけの、世界の誰にも相手にされてないおまえのようなバカどもはどうなんだよw

447 ：デフォルトの名無しさん：2015/01/05(月) 10:02:42.65 ID:eWacIfnz

土方は雲の上の喧嘩なんか、知らんがな、出されたものは食うがな

448 ：デフォルトの名無しさん：2015/01/05(月) 13:13:47.87 ID:B88/unJs

安岡が嫌いで、安岡は絵文字にほとんど何も貢献してないから駄目というのならまだ分かるが、
(彼はGoogleとAppleが絵文字をUnicodeコンソーシアムに提案する前に、
各キャリアの絵文字対応表を作りかけて挫折した)
安岡が絵文字をGoogleと一緒に推進したとか意味不明だな。
大きく寄与した日本人は他にいるだろ。

449 ：デフォルトの名無しさん：2015/01/05(月) 13:59:24.74 ID:V1obRSYW

いやあ、照れるなあ

450 ：デフォルトの名無しさん：2015/01/05(月) 18:18:04.30 ID:R0XkFNG2

>>446
普通の人なんで研究者と同じレベルで相手されなくていいです。

451 ：デフォルトの名無しさん：2015/01/05(月) 18:52:30.10 ID:PnP0yTvN

「巫」を人名用漢字に追加するだけのことに
なぜあんなシャカリキになれるんだ

452 ：デフォルトの名無しさん：2015/01/05(月) 21:53:54.28 ID:3J2GSmZ2

> 普通の人なんで研究者と同じレベルで相手されなくていいです。

普通の人じゃなくてバカだから。自覚ないようだけど。

453 ：デフォルトの名無しさん：2015/01/06(火) 10:06:52.51 ID:mEZ+Y0Rx

>>452
別に馬鹿だから相手にされてなくても困らないけど
先生が相手されてないのは困るでしょ?

454 ：デフォルトの名無しさん：2015/01/06(火) 11:09:22.27 ID:GZKmSjYi

本人は困ってないように見える

455 ：デフォルトの名無しさん：2015/01/08(木) 05:37:38.99 ID:1hURildE

>>425
何が悪いってキャリア同士の互換性問題をUnicode に持ち込んだ事だよ
そんなのはキャリア同士で解決すべきだしそういう動きもあった
ラウンドトリップの保証を捨てた事が許せん

456 ：デフォルトの名無しさん：2015/01/08(木) 09:24:08.59 ID:PNOntX36

なるほど

457 ：デフォルトの名無しさん：2015/01/08(木) 12:14:21.23 ID:vj7cQMWH

「動きもあった」じゃなくて「動こうとするそぶりが無かったわけでもなかった」だろw
結局動かないことでは定評のあるキャリア共じゃないかw

458 ：デフォルトの名無しさん：2015/01/08(木) 12:18:38.99 ID:qIfkunGX

日本が戦争に負けた理由でもある

459 ：デフォルトの名無しさん：2015/01/08(木) 18:45:59.20 ID:1f5/W2kS

>>455
emojiはprivate-use charactersじゃんか。

460 ：デフォルトの名無しさん：2015/01/08(木) 21:55:46.06 ID:9AZtbOER

過去にauやソフトバンク(←ボーダ←J)の絵文字デザインがごっそり変わってもさほど混乱も起きなかった経緯があったんだから、
少なくともUnicode採用前の絵文字はそういう大雑把なものだったと思う。

既存メール等の厳密なニュアンスを維持するために複雑怪奇な変換テーブルを用意したりするよりも、
ニュアンスの近い絵文字同士を半ば無理やり同一扱いとした「Unicodeおよび各キャリア同一基準の新絵文字」を取り決めて、
端末側では新機種から勝手に切り替えればそれが一番すっきり済んだ気がしなくもない。

461 ：デフォルトの名無しさん：2015/01/08(木) 22:21:01.55 ID:ah6saDRa

そのりくつだと
>>460が道で刺し殺されても
日本に大した混乱が起きるわけではないから問題ないな

462 ：デフォルトの名無しさん：2015/01/08(木) 23:33:54.39 ID:9AZtbOER

いやどういう理解だよ…
なんで俺刺殺されるの…

デザイン変更の影響を受けた人が無数にいるにもかかわらず混乱が起きなかった例を前提で話してるんだから、
事件で例え直すなら日本中で無数に事件が発生してるのに混乱してないって話だよ。俺だけ殺さないでよ。

463 ：デフォルトの名無しさん：2015/01/09(金) 05:18:46.40 ID:GY8OB6f3

>>459
？

464 ：デフォルトの名無しさん：2015/01/09(金) 06:23:07.14 ID:GHJOtrq4

ラウンドトリップは大事だけど
「～」の問題とかは絵文字の前からあったみたいだし
「ラウンドトリップは絶対死守」とかは無理な気がする
もちろんそうあって欲しいとは思ってる

465 ：デフォルトの名無しさん：2015/01/09(金) 06:24:21.94 ID:GHJOtrq4

>>462
放射能ですね判ります

466 ：デフォルトの名無しさん：2015/01/09(金) 07:52:32.65 ID:R4ppVUkj

誰かが交通整理したり旗降ったりしなきゃいけないのは確かだけれど
文字コード関連って他分野では活躍できないB級人材が集まってワヤワヤやってんのがありありとみてとれて
きちゃない関わりあいたくない感じなんだよね

467 ：デフォルトの名無しさん：2015/01/09(金) 07:55:58.37 ID:50+lIvWd

なるほど
一理ある

468 ：デフォルトの名無しさん：2015/01/09(金) 12:41:25.09 ID:G9m/YjUS

>>466
そりゃサーベイくらいのレベルでしか見てないからじゃない？
言語学者も参加して結構専門的な議論してるケースもあるよ。

469 ：デフォルトの名無しさん：2015/01/09(金) 18:26:00.03 ID:z189ptbm

チョーサとサーベイって何か違うの？

470 ：デフォルトの名無しさん：2015/01/10(土) 06:45:28.32 ID:fUErtY0e

>>468
それは登録に際して言語学的な判断が必要な文字だけだろ
歴史的な経緯を差し引いても尚いい加減な基準で登録するからどんどん複雑怪奇な仕様になってる
旗振りがダブスタというかポンコツなんだよ
バージョンの互換性保証を守りたいやつもいるけど、今でも例示字形差し替えたり色々崩してるんだし、どこかのバージョンで仕切り直して過去に指摘されたミスの修正すればいいのに。

471 ：デフォルトの名無しさん：2015/01/13(火) 11:47:36.65 ID:i3Lxjaiq

例示文字の差し替えは別に問題ない。

472 ：デフォルトの名無しさん：2015/01/14(水) 18:00:18.03 ID:VkuOu9jz

でも実質フォントの基準になってるし

473 ：デフォルトの名無しさん：2015/01/15(木) 11:09:55.15 ID:R+gHXs32

だからどうということはない。

474 ：デフォルトの名無しさん：2015/01/19(月) 03:54:05.78 ID:55ZE78X8

雑談になるが、中国で繁体に戻そうという動きがあるんだそうだね。

475 ：デフォルトの名無しさん：2015/01/19(月) 11:12:49.00 ID:CzsUjspG

そんなことがあれば、間違いなく臺灣とは違う字体にしてくるだろうな。

476 ：デフォルトの名無しさん：2015/01/19(月) 13:25:18.78 ID:KroxEeJe

學校
國體

477 ：デフォルトの名無しさん：2015/01/20(火) 14:28:25.64 ID:yv66EBMN

>>474
へぇ！

478 ：デフォルトの名無しさん：2015/01/25(日) 20:31:55.02 ID:NPlvEVjr

>>476
タテ読みドコ？

479 ：デフォルトの名無しさん：2015/01/26(月) 00:08:44.20 ID:CeKI7K9w

國體護持（こくたいごじ）

480 ：デフォルトの名無しさん：2015/01/26(月) 00:09:49.15 ID:CeKI7K9w

颱風

481 ：デフォルトの名無しさん：2015/01/26(月) 10:46:36.00 ID:o6RBMBnt

ジパ
｜ン

482 ：デフォルトの名無しさん：2015/01/27(火) 01:21:54.85 ID:CCrVgF1k

モンゴル人「ジーパン？」

483 ：デフォルトの名無しさん：2015/01/27(火) 03:48:16.79 ID:HbxIHmvo

普段使いとしてJIS2004の字形を使ってますか？

484 ：デフォルトの名無しさん：2015/01/27(火) 08:26:04.24 ID:PB84DGgu

まだまだUnicode非対応のソフトが多いのは難点だな
特に ttp://www.lifeboat.jp/products/alog2/index.php と同じタイプの市販ソフトは未だにシフトJISコードしか扱えないものばかり
仮にもセキュリティ系で、この現状はマジで勘弁してほしいんだが

485 ：デフォルトの名無しさん：2015/01/27(火) 08:32:28.51 ID:Dg/XO2cm

同意します

486 ：デフォルトの名無しさん：2015/01/27(火) 08:38:32.81 ID:93ZC9Ewu

初心者です。
とあるプログラミングの問題なのですが、

a = 0;
for (i = 0; i < 5; i++) {
a = a + 1;
if (i > 2) {
break;
}
}
を実行したとき、aの値は？

の解答が4となっています。
どう考えても3回しか実行されないと思うのですがなぜ4になるのでしょう？
モヤモヤしてやばいです。

487 ：デフォルトの名無しさん：2015/01/27(火) 09:09:33.08 ID:Dg/XO2cm

スレ違い

488 ：デフォルトの名無しさん：2015/01/27(火) 09:30:29.35 ID:TXI43U21

i : 0, 1, 2, 3, 4
a : 1, 2, 3, 4 のとき break

489 ：デフォルトの名無しさん：2015/01/27(火) 10:14:59.86 ID:93ZC9Ewu

スレ違いでしたかすみません。
初投稿なものでどこで質問していいか分からなくて...
iが3の時にもa+1は実行されるのですね、ややこしい...

490 ：デフォルトの名無しさん：2015/01/28(水) 22:34:55.79 ID:BBWATyRQ

PDAM2.2はフルボッコか
この調子でPDAM2.3では誓願emojiもrejectかpostponeしてもらいたい

491 ：デフォルトの名無しさん：2015/01/28(水) 23:04:44.09 ID:L0TA3+eA

アスキーアート極まった感ある
http://kai-you.net/article/12834

492 ：デフォルトの名無しさん：2015/01/28(水) 23:25:13.79 ID:TQfjTIzA

AAってフォントが変わってもなんとなく分かるのが良さだと思うんだが
それを他環境で見るとどうなるのか気になる

493 ：デフォルトの名無しさん：2015/01/29(木) 01:42:54.26 ID:u90jgBYa

大小があったら負けかなという気がする

494 ：デフォルトの名無しさん：2015/01/29(木) 08:12:29.38 ID:8k6H8xeW

>>491
>「iPhoneに組み込むように」と孫正義さんがスティーブ・ジョブズさんを説得したというエピソード

これ都市伝説だろ

495 ：デフォルトの名無しさん：2015/01/29(木) 08:16:49.64 ID:8k6H8xeW

>>492
絵文字として認識できるかどうかはどうでも良くて

山下清的アートを楽しむのが目的みたいだから
他環境のことはどうでもいいんだと思う

すぐ廃れるな

496 ：デフォルトの名無しさん：2015/01/29(木) 08:18:08.62 ID:8k6H8xeW

むしろ魚偏の字をあつめて
グレイスケールの絵を描くみたいな
昔あったのに似てる

そんなの一時流行って終わりになる

497 ：デフォルトの名無しさん：2015/01/29(木) 10:52:49.21 ID:w7ms7Ild

アスキーアート自体は60年代からあるし、なくならないけどな。流行り廃りはあるわな。

498 ：デフォルトの名無しさん：2015/01/29(木) 11:03:56.72 ID:8k6H8xeW

それは知ってるが
AAって今は流行ってないだろ
:-) とかはまだ使ってるひと居るが
これは AA じゃないだろ

499 ：デフォルトの名無しさん：2015/01/29(木) 11:36:44.90 ID:VqMHT2nM

smileyもascii artの一種

500 ：デフォルトの名無しさん：2015/01/29(木) 15:08:54.43 ID:u90jgBYa

MS-DOSのころに、モノクロ画像をAAに変換するソフトってのがあったな、と
検索したら、今でもあるんだね。

501 ：デフォルトの名無しさん：2015/01/29(木) 15:47:15.18 ID:TYTLl9KK

昔作ったけどソースどっかいった

502 ：デフォルトの名無しさん：2015/01/29(木) 17:06:15.51 ID:8dKIdKoz

img2txt
img2ascii

503 ：デフォルトの名無しさん：2015/01/30(金) 04:22:42.54 ID:QG41LqjU

自由配置可能なスタンプ機能がある環境だったら大抵同じようなことやってるじゃん

504 ：デフォルトの名無しさん：2015/01/30(金) 06:02:32.78 ID:HwiqlkLu

1x1 ピクセルの <td> 書きまくって
テーブルでグラフィックしてた時代を思い出したゎ

505 ：デフォルトの名無しさん：2015/01/30(金) 20:03:55.28 ID:b+DqtdDL

そういえば小学生の頃マリオペイントでやってた

506 ：デフォルトの名無しさん：2015/01/31(土) 19:24:17.88 ID:No0xtwOK

絵文字の行く先は埋め込み画像
ますますカオス
そのうち文字もそうなるんじゃね?
http://internet.watch.impress.co.jp/docs/special/20150131_686161.html

507 ：デフォルトの名無しさん：2015/01/31(土) 19:35:20.87 ID:RJPYPzSg

Appleは絵文字フォントには注力するけど
日本語フォントはいまだに11年前のAJ16準拠

508 ：デフォルトの名無しさん：2015/01/31(土) 20:17:28.67 ID:YzWkWj5e

ちなみにApple Watchの絵文字は3Dで動いてインタラクティブ
文字オタども3D絵文字とインタラクティブ絵文字の規格もさっさと作れよ

509 ：デフォルトの名無しさん：2015/01/31(土) 21:16:37.05 ID:GSzQXuKu

いつのまにか system locale で絵文字の肌の色まで変わる時代になってたのかω

510 ：デフォルトの名無しさん：2015/02/01(日) 20:00:14.50 ID:uNtgwaTX

それって人種と言語・国籍を混同するな、みたいなクレームはないってことか。
日本人的にはどこがNGでどこがおｋなのかよくわからん。

511 ：デフォルトの名無しさん：2015/02/02(月) 14:44:15.78 ID:53k9SdBX

>>507
JIS X 0213の非互換性問題で中の人の気力尽きたんじゃないか？

512 ：デフォルトの名無しさん：2015/02/02(月) 14:49:50.90 ID:53k9SdBX

>>506
> 飛行機を表すのに英語なら「p l a n e」と5回キーを押さねばならないが、絵文字なら「??」1回で済む。
> こうした絵文字の持つ「筆記の経済性」が、入力しづらいスマートフォンで歓迎され、
> 多くのユーザーを惹きつけることとなった。

この人はスマートフォン向けAPLキーボードでも持っているんだろうか。

513 ：デフォルトの名無しさん：2015/02/02(月) 15:09:29.69 ID:V6TcMC53

顔文字の肌の色をTone Modifierで変える例にスマイルマークが使われているが、
これが黄色なのはemoji発足させた日本人が黄色人種だからと思ってるんじゃないだろうな？
というクレームはないのだろうか？

514 ：デフォルトの名無しさん：2015/02/03(火) 02:29:22.31 ID:pt2+RdEd

Andrew WestのツイートによるとWG2のドキュメントは
もう>>9には追加されないとか

515 ：デフォルトの名無しさん：2015/02/05(木) 00:13:16.01 ID:MfA9uand

http://dx.doi.org/10.1241/johokanri.57.799
＞2014年度中に変体仮名の整備を行うこととした。

えっ？あと2ヶ月？

516 ：デフォルトの名無しさん：2015/02/07(土) 01:01:24.32 ID:PXFI24n+

変体仮名の提案書がwg2にポストされても関係者以外にはもうわからないのか…

517 ：デフォルトの名無しさん：2015/02/07(土) 09:06:31.87 ID:m/txggBl

変体仮名をUnicode だけのために整理しても意味ないじゃん

518 ：デフォルトの名無しさん：2015/02/07(土) 12:10:06.30 ID:Omk+gQK3

>>517
Unicode向けに整備されたら、それがリファレンスになるじゃないか。

519 ：デフォルトの名無しさん：2015/02/07(土) 23:03:15.43 ID:GrUGQKAo

http://isotc.iso.org/livelink/livelink?func=ll&objId=8917016
に追加されていくのかな

520 ：デフォルトの名無しさん：2015/02/08(日) 20:59:15.01 ID:ExBLSnNg

次のWG2は10月だから年度内に変体仮名の提案がまとまるなら
パブコメ募集をやるだけの時間的猶予はありそうだけどさてどうなるやら

521 ：デフォルトの名無しさん：2015/02/18(水) 00:11:36.77 ID:SODib5vf

国旗の絵文字って大騒ぎした割に使われてないよね
そもそもフォントないし
ISISのは収録されないかな

522 ：デフォルトの名無しさん：2015/02/18(水) 02:02:28.53 ID:CWKh4Lrx

3166に割り当てられれば収録されたことになるんじゃね

523 ：デフォルトの名無しさん：2015/02/19(木) 22:01:15.49 ID:nVZCv6jV

絵文字の符号化って日本じゃ某ライターが騒いでるだけだしな

524 ：デフォルトの名無しさん：2015/02/19(木) 22:37:08.57 ID:3MTaI8xl

小形さんってライターなのか？

525 ：デフォルトの名無しさん：2015/02/20(金) 03:37:06.63 ID:MaMubtWS

RT職人

526 ：デフォルトの名無しさん：2015/02/20(金) 07:55:55.13 ID:21cSDMnR

絵文字職人の朝は早い。

527 ：デフォルトの名無しさん：2015/02/26(木) 18:13:01.52 ID:owhsGahs

RT絵文字職人さんあなたがwg2に出したのはproposalじゃなくて
feedbackですよっと

528 ：デフォルトの名無しさん：2015/03/01(日) 00:08:36.94 ID:7WZWmdIJ

ライターが入ってない

529 ：デフォルトの名無しさん：2015/03/04(水) 00:15:36.29 ID:XiUc/ocD

http://kasamashoin.jp/2015/03/2620153201f.html
＞2015年3月20日(金)
＞京都大学人文科学研究所本館1Fガラス張りセミナー室
＞15:10～15:55 なぜ、WAVE DASH (U+301C)例示字形はずっと修正されなかったのか

530 ：デフォルトの名無しさん：2015/03/04(水) 07:54:33.69 ID:UWB+qgaN

(うさぱら)←なにこれ？

531 ：デフォルトの名無しさん：2015/03/06(金) 15:47:47.95 ID:c99ba3kA

WAVE DASH (U+301C)の字形が修正されても
どうせWindowsが出すのは相変わらずU+FF5Eなんでしょう？
いや今更変えられても困るけど。

532 ：デフォルトの名無しさん：2015/03/06(金) 16:55:59.31 ID:IsNTjd9u

U+FF5Eのグリフを高い位置にずらしてくれれば別にいい

533 ：デフォルトの名無しさん：2015/03/06(金) 18:44:42.24 ID:Ff67jPYI

そりゃUnicode規格のマッピングで定義されてるからね

534 ：デフォルトの名無しさん：2015/03/06(金) 18:51:52.96 ID:9PddSxv0

MS-IMEでは環境依存文字扱いだからなあ

535 ：デフォルトの名無しさん：2015/03/06(金) 19:08:14.62 ID:7hSPkkPD

そもそも縦書き用のグリフを倒す方向間違えたとかなさけない理由だったな

536 ：デフォルトの名無しさん：2015/03/08(日) 12:34:26.53 ID:lAgJjzbb

301Cの字の形が修正されようと
Unicodeコンソーシアムが出しているシフトJISマッピング表で
FF5Eなのは1991年から変わらないんだろ？

537 ：デフォルトの名無しさん：2015/03/09(月) 03:16:41.56 ID:4qtnbUP7

Shift_JISでは301C、CP932ではFF5Eだね。
http://unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/SHIFTJIS.TXT
http://unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP932.TXT

538 ：デフォルトの名無しさん：2015/03/09(月) 09:20:08.80 ID:CRFMLrc+

>>> print u'\u301c'.encode('mbcs')
?
>>> print u'\uff5e'.encode('mbcs')
～
>>> print u'\u301c'.encode('cp932')
～
>>> print u'\uff5e'.encode('cp932')
～

539 ：デフォルトの名無しさん：2015/03/09(月) 14:42:08.95 ID:MIZIuI1f

>>529
小形克宏
UnicodeのWAVE DASH例示字形が、25年ぶりに修正された理由
http://internet.watch.impress.co.jp/docs/special/20150307_691658.html
>>537
Windowsもバージョンによって違うからCP932も細分化が必要なのかもね。

540 ：デフォルトの名無しさん：2015/03/09(月) 15:16:01.92 ID:SgNhNQ2Z

ふむふむ

541 ：デフォルトの名無しさん：2015/03/09(月) 17:16:42.83 ID:NnzyOe/j

イイハナシダナー

542 ：デフォルトの名無しさん：2015/03/09(月) 17:51:01.21 ID:Ty62vxCH

>>539
例示字形の修正云々より
JISもUnicodeも最初はほとんど直線みたいな“波”だったのに
年月が経つにつれ“波”の幅が大きくなってるのが面白い

543 ：デフォルトの名無しさん：2015/03/09(月) 22:54:52.09 ID:vwLJKhDI

>>537
オブソなモンを混ぜるなよ

544 ：デフォルトの名無しさん：2015/03/11(水) 01:08:34.82 ID:j1w4ocLD

オブソとかオプソとか

545 ：デフォルトの名無しさん：2015/03/11(水) 09:34:03.15 ID:ZGeJG/a0

すこし早いとおもうけど、とりあえず移転用の土地にプレハブだけ立ててきた
使うかは各自自由の方向で
文字コード総合スレ part10
http://
ne　　xt
2ch.net/tech/1426032327

もしもっとよさげな土地があれば指摘たのむ
（ネガキャンとか宣伝うんぬんじゃなくて、単なる候補地確保。あしからず）

546 ：デフォルトの名無しさん：2015/03/11(水) 10:14:31.56 ID:3uN2N73I

宣伝乙
もうStackOverflowで間に合うからなぁ

547 ：545：2015/03/11(水) 10:29:54.55 ID:ZGeJG/a0

おーぷんとかしたらばも候補としてあるんだが
SOコメントでの雑談禁止だからなぁ
むしろSOにbbsがあればム版自体必要ない気が
内容によってはSUとSFに強制移転させられるかもしれんが

548 ：デフォルトの名無しさん：2015/03/11(水) 16:02:51.62 ID:W4WrZXob

SO?SU?SF?

549 ：デフォルトの名無しさん：2015/03/11(水) 17:45:00.66 ID:ZGeJG/a0

StackOverflow,SuperUser,ServerFault