文字コード総合スレ part9

このエントリーをはてなブックマークに追加
1デフォルトの名無しさん
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
2デフォルトの名無しさん:2014/05/29(木) 03:33:49.61 ID:i1u97cMX
■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
http://lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006-March/000002.html
JISX4061
日本語文字列照合順番
http://www.jisc.go.jp/
3デフォルトの名無しさん:2014/05/29(木) 03:35:09.37 ID:i1u97cMX
■これまでに行われた議論
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
 内部的には Unicode -> CP932 -> CP5022x って変換な気もする
・人名をソートかけたらバストサイズ順の並びになる?
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に
 機種依存文字はサポートされるか?
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・なぜ携帯業界はunicode化しないのか?
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
4デフォルトの名無しさん:2014/05/29(木) 03:36:21.03 ID:i1u97cMX
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「?心」簡化政策によると「?(U+6076)」に統一。口偏+?(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
 ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
 中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ
 UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで)
 サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い)
 ((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
5デフォルトの名無しさん:2014/05/29(木) 03:37:31.55 ID:i1u97cMX
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。
・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定
  → ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
 Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
 コントロールパネル-地域と言語のオプション-[言語]タブで
 「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!!
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
 陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。
6デフォルトの名無しさん:2014/05/29(木) 03:38:41.99 ID:i1u97cMX
もうひとつの過去スレ:
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/

隔離スレ:
UnicodeとUTF-8の違いは?
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/
7デフォルトの名無しさん:2014/05/29(木) 03:43:39.63 ID:AMcBMTZL
■ライブラリ
IBM Globalization - ICU
http://www-306.ibm.com/software/globalization/icu/
NKF32.DLL
http://www.vector.co.jp/soft/win95/util/se020949.html
バベル
http://tricklib.com/cxx/ex/babel/
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
http://tricklib.com/cxx/ex/babel/scoremap.csv
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/
8デフォルトの名無しさん:2014/05/29(木) 03:44:10.17 ID:AMcBMTZL
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
 表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
 charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
 U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
 再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
 あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか
9デフォルトの名無しさん:2014/05/29(木) 03:45:57.03 ID:AMcBMTZL
JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
http://std.dkuug.dk/JTC1/SC2/WG2/

ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
http://appsrv.cse.cuhk.edu.hk/~irg/
10デフォルトの名無しさん:2014/05/29(木) 03:47:58.07 ID:AMcBMTZL
テンプレ
リンクきれてます(?)
会員制(?)

ISO-IR - 2.8.1 Coding systems with Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
日本の委員 (JSC2)
http://www.itscj.ipsj.or.jp/meibo/020000.pdf
11デフォルトの名無しさん:2014/05/29(木) 09:10:02.90 ID:QcRCI5DY
               ノ      ゚.ノヽ  , /}      ...
            ,,イ`"     、-'   `;_' '    ..::::::::::::::...
   ,-、  _.._   (        (,(~ヽ'~     ..:::::::::::::::::::::::
 )'~  レー'  〉   ヽ       i`'}       .:::::::::::::::::::::::
 ~つ     '-ー、  i       | i'     ...:::::::::::::::::::::::
 /       <  /     。/   !  ......:::::::::::::::::::::::::    これは>>1乙じゃなくて
/         ~^´     /},-'' ,●::::::::::::::::::::::::::::::::::::
i、        ,i' _,,...,-‐-、/    i  ::::::::  .:::::::::::::
..ゝ        <,,-==、   ,,-,/      .:::::::::::            放射能がうんたら
 )       {~''~>`v-''`ー゙`'~       ..:::::::::                          ........::.
 {        レ_ノ            ..::::::::.                         ......:::::::::
ノ         ''           ..:::::::                        ...::.:...:::::::::
                     .:::::::::                     ...:......:::::::::::: .
                    .:::::::::::.        .....      ..  ..::::::::::::::::::::::::   :::.
                    ::::::::::::::::.::::::....:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.. ::  ::..
                    .:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::    ::.
                    ::::::::::::::::: :::::::::::::::::::::::::::::: :::::
                          .::    ::.  :::
12デフォルトの名無しさん:2014/05/29(木) 13:19:34.52 ID:7VOFEqgh
よかったあ
13デフォルトの名無しさん:2014/06/02(月) 01:45:05.35 ID:+iCC0J5d
なにが
14デフォルトの名無しさん:2014/06/02(月) 13:24:04.80 ID:0mAz4fvl
なにもかも
15デフォルトの名無しさん:2014/06/02(月) 14:12:20.33 ID:PPCsJiS0
16デフォルトの名無しさん:2014/06/03(火) 03:45:21.59 ID:pB9rBZIC
テンプレ
ありがとうございます
17デフォルトの名無しさん:2014/06/03(火) 19:03:41.57 ID:TIVU9A4i
さて
18デフォルトの名無しさん:2014/06/04(水) 10:52:11.91 ID:V3e66VGu
あさて
19デフォルトの名無しさん:2014/06/04(水) 18:18:42.51 ID:5pV3j4zN
さても
20デフォルトの名無しさん:2014/06/05(木) 10:49:44.94 ID:EQvmYwTS
なんきん
21デフォルトの名無しさん:2014/06/05(木) 12:49:08.09 ID:CbdkWkFK
だいぎゃくさつ
22デフォルトの名無しさん:2014/06/05(木) 21:01:47.28 ID:55VBH6H6
6月4日
23デフォルトの名無しさん:2014/06/06(金) 04:53:43.90 ID:hlJ+Mxxa
虫歯予防デー
24デフォルトの名無しさん:2014/06/06(金) 15:23:10.27 ID:I+JvoaST
携帯電話絵文字 UNICODE u1f330〜u1f36f, u1f400〜u1f41f
前スレッド >>917
>>914
>>ブラウザは何? サーバ側で画像に差し替えてるのは、
>>UserAgent見て切り替えたりしてんじゃないの?

同じtwitterでも、以下のように表示が違う。
disktop PC(Firefox)  カラー絵文字  全文字表示
Nexus7(Chrome)     モノクロ(font) 一部表示不可
smart phone(モバツイ) モノクロ(font) 一部表示不可

これはUserAgentでブラウザを識別して画面表示を差し替えているのか。

上記Nexus7とsmart phoneで表示される文字と、
disktop PCにてWikipedia「Unicode一覧 1F000-1FFFF」で表示されるフォント
文字について、表示可能・不可の文字がほぼ一致しているので、
OS(platform)に入っているフォトデータは、ほど同様のものが入っていると
考えられる。
25デフォルトの名無しさん:2014/06/06(金) 15:51:53.99 ID:I+JvoaST
>>24
variation selectors(字形選択子)で以下の様に識別して表示する方法がある。
VS15(Ufe0e) text style
VS16(Ufe0f) 絵文字style
26デフォルトの名無しさん:2014/06/06(金) 16:14:38.31 ID:rwepUkdq
カタカナではよくあるけど、英表記でdisktopはなあ…
27デフォルトの名無しさん:2014/06/06(金) 22:14:56.55 ID:OcxaL9bN
円形ごたつの上に置けば辻褄は合うんじゃね?
28デフォルトの名無しさん:2014/06/06(金) 23:01:53.42 ID:1f1OIxtf
>>26
Web に堂々と書いてる企業もあるし
http://www.iimhs.co.jp/news/2009/12/44.html
29デフォルトの名無しさん:2014/06/07(土) 11:25:16.55 ID:u3dUy4Sv
バカ発見のための良い指標のひとつだな
30デフォルトの名無しさん:2014/06/07(土) 19:00:43.27 ID:TtMz71Y/
31デフォルトの名無しさん:2014/06/07(土) 19:43:32.72 ID:SxbAzKvi
いわゆる ambiguous 母音だろ
気にスンナ
32デフォルトの名無しさん:2014/06/07(土) 19:47:18.33 ID:ljyTaF04
Boys, be ambiguous.
33デフォルトの名無しさん:2014/06/07(土) 19:50:52.06 ID:SxbAzKvi
>>28
こっちは完全にアウトだな
34デフォルトの名無しさん:2014/06/07(土) 21:20:51.63 ID:pwUo7KxC
ディスクトップはタイポじゃないの?
disktopが正しいと思ってるひとがいるの?
35デフォルトの名無しさん:2014/06/07(土) 21:25:59.68 ID:TtMz71Y/
>>34
詳しくは言えないが、いるよ
36デフォルトの名無しさん:2014/06/07(土) 23:05:55.30 ID:0yDbbXBE
机じゃなく皿の上に置いてるんだよ
37デフォルトの名無しさん:2014/06/08(日) 03:01:40.32 ID:4qzWshc7
DTPなんて皿回してなんぼです
38デフォルトの名無しさん:2014/06/08(日) 11:17:13.72 ID:t5DgyYSS
昔はフロッピーディスクがメディアの標準だったからな
その当時にデスクトップという言葉が出てきて、(フロッピー)ディスクトップと空耳する人多かった
39デフォルトの名無しさん:2014/06/08(日) 23:48:04.47 ID:0ybo3LG4
そんなわけねー。

ノートPCが流行ったころ(だいたいPC-9801Nが出た頃だな。1990年代前半)が、
フロッピーディスクのデフォルトがゆるやかに5インチから3.5インチになった頃だが、
当然ノートPCと区別するためにデスクトップPCをそういう風に呼ぶ機会も増えたわけだが、
間違えて空耳のまま書く奴は、まずいなかったぞ。
40デフォルトの名無しさん:2014/06/09(月) 02:33:37.86 ID:VU05Hf42
ノートというかラップトップね。てか、悪ノリでしょ。
41デフォルトの名無しさん:2014/06/09(月) 08:55:28.79 ID:9rhLvykP
>フロッピーディスクのデフォルトがゆるやかに5インチから3.5インチになった頃

90年代後半だろ
42デフォルトの名無しさん:2014/06/09(月) 09:40:02.10 ID:3muiQ+A2
90年代後半でわざわざ5インチ導入しないだろ
HDD搭載が当り前で、フォントや言語の制限が無くなった()時期
43デフォルトの名無しさん:2014/06/09(月) 10:25:37.89 ID:0wp3BeLp
ラップトップというのは98ノートやダイナブックよりでかい奴を言う。
98LTとか。

それと、それ以前から3.5インチのFDDのマシンはあったけど、
ノートPCのFDDが3.5インチだったのが、3.5インチへの移行への大きな理由のひとつ。
44デフォルトの名無しさん:2014/06/09(月) 11:27:28.78 ID:53QNO1iV
そして逆に小さいのがウルトラマンPCだ。
45デフォルトの名無しさん:2014/06/09(月) 11:46:29.34 ID:EIMFvUmC
SMC-70からだなあ、3.5インチ
46デフォルトの名無しさん:2014/06/09(月) 12:49:58.01 ID:r3iX82eS
小さいのはパームトップでしょ
47デフォルトの名無しさん:2014/06/09(月) 14:06:19.46 ID:EIMFvUmC
48デフォルトの名無しさん:2014/06/09(月) 14:41:13.31 ID:WYLHhV4p
で、話を戻すと、「ディスクトップ」という誤用を目にするようになったのはWindows95普及後だと思うんだがね。
49デフォルトの名無しさん:2014/06/09(月) 15:33:31.88 ID:EIMFvUmC
そう?マックの初期のころからあるけどな
50デフォルトの名無しさん:2014/06/09(月) 16:04:28.62 ID:0wp3BeLp
それだとマックユーザーがアホという結論になってしまう
51デフォルトの名無しさん:2014/06/09(月) 16:32:20.20 ID:3muiQ+A2
マックは普通に文字化けしてたから
マニュアルでさえ文字化けしたままの表記だったけどな
52デフォルトの名無しさん:2014/06/09(月) 16:39:02.55 ID:mU4Wj5uP
腿の上に載せて使えるのがラップトップ。
小さい子供を座らせる部分がlap.
53デフォルトの名無しさん:2014/06/09(月) 17:50:35.47 ID:VU05Hf42
みんな古い話が好きだねえ
54デフォルトの名無しさん:2014/06/10(火) 00:27:47.88 ID:QQ+0NTJb
インスツルールとかいうのは見た
55デフォルトの名無しさん:2014/06/10(火) 08:20:34.08 ID:7Ecun26C
PC-98の場合、RAは5インチ専用で、3.5インチはESとか小型デスクトップだったな。1990年ごろの話。
その次のDAで5インチと3.5インチが同じ本体で混在。でも5インチが主流。
FAのころは知らないけど、A-Mateのころは3.5インチが主流だったね。
そういえば、3.5インチが1.44MBが読めるようになったのはどのあたりからだったけ?
56デフォルトの名無しさん:2014/06/10(火) 09:52:36.02 ID:IQXrTSSv
1.44は例によってIBMのPS/2からじゃないかな
日本は5インチとフォーマット同じにしてたけど
5インチの9セクタの時と同じように米はすぐ容量増やす方向に変えるからなw
57デフォルトの名無しさん:2014/06/10(火) 10:28:04.27 ID:M0GHqhNW
文字コードと何の関係があるのですか?
58デフォルトの名無しさん:2014/06/10(火) 10:29:12.33 ID:Asjcm40b
98が1440KiBフォーマットを標準で読めるようになったのは...Mate Fellowの第2世代ぐらいか?
59デフォルトの名無しさん:2014/06/10(火) 10:37:12.26 ID:M0GHqhNW
文字コードと何の関係があるのですか?
60デフォルトの名無しさん:2014/06/10(火) 14:06:29.61 ID:UJ/IkoJT
ユニコードの話ならまだしも
61デフォルトの名無しさん:2014/06/10(火) 15:09:28.80 ID:YJFxCpBU
ふぉんとふぉんと
62デフォルトの名無しさん:2014/06/10(火) 20:11:06.57 ID:EGhCAFyH
富士通オリジナルのJEFコードからS-JISに文字コード変換したい
無料ツールない?

外字の変換テーブルも定義出来るやつ

JHT(ホスト連携ツール)というwindows用の無料ツール見つけたけど、外字変換未対応
63デフォルトの名無しさん:2014/06/10(火) 21:17:22.70 ID:Asjcm40b
その手のややこしい話を、商売として頼めそうなところというとこれかな。
ttp://www.mirai-ii.co.jp/moji/

ネットに上げてる情報を見る限りでは、情報収集はそれなりにしっかりしてそうには見える。
他の点についてはどうにも言いがたいが。
64デフォルトの名無しさん:2014/06/11(水) 05:47:48.50 ID:to7T+b0V
>>63
情報ありがとう
有料だとFTRAN,anytran,MD-PORTなどがあるんですが、
拡張漢字などのS-JIS未定義の文字はS-JISの外字エリア割り当ててやる必要があるらしいです
65デフォルトの名無しさん:2014/06/11(水) 06:44:21.21 ID:1jZIM4HC
いまさらshift jisで外字とか死にたくなるような仕事だな
66デフォルトの名無しさん:2014/06/12(木) 01:00:41.74 ID:+cKCPVN6
Unicode 7.0.0は今月?
67デフォルトの名無しさん:2014/06/12(木) 02:29:13.09 ID:cysKCfar
固定長処理なので、マルチバイトに出来ないのです(汗
68デフォルトの名無しさん:2014/06/16(月) 15:39:38.23 ID:15LXpyTU
ぼくマルチバイトー!
69デフォルトの名無しさん:2014/06/18(水) 08:38:27.14 ID:SROYhCqR
3人そろってマルチーズ
70デフォルトの名無しさん:2014/06/18(水) 18:32:03.35 ID:rewzB818
絵文字あんなに増やしてどうすんの?
71デフォルトの名無しさん:2014/06/18(水) 18:34:46.19 ID:wLts3cNa
UNICODEの会議じゃ絵文字が一番重要事項みたいだしなw
72デフォルトの名無しさん:2014/06/18(水) 19:00:18.20 ID:lDuZSdyo
>>70
そのうち新しい言語ができるのかもしれない。
書くときにだんだんと変わっていって、そして、ハングルのようになる、とか
73デフォルトの名無しさん:2014/06/18(水) 19:00:31.35 ID:7fGUMixx
実用的な文字が安定してきているということで、いい事じゃないか?
人間、仕事が無くなったらどうでもいい仕事を作り出すもんだ
74デフォルトの名無しさん:2014/06/18(水) 19:58:08.59 ID:cYGIbVWH
ううむ
75デフォルトの名無しさん:2014/06/19(木) 16:07:58.88 ID:6/iRPLD/
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n4585.pdf#page=24
通用規範漢字のExt.Eまでに入らなかった3文字はいいとして、なんかUTCから
アヤシゲな漢字の提案が…。スラブ語の音訳に使われたそうだけど
76デフォルトの名無しさん:2014/06/19(木) 17:45:04.27 ID:nzbo42iB
意味わかんないけど、コード表見ると頭がくらくらするわ。
音だけとるなら、それこそハングルの方が向いてない?
77デフォルトの名無しさん:2014/06/19(木) 20:09:33.65 ID:hNaG+35H
なんで拡張Fじゃなくて基本面に入るんだ?
78デフォルトの名無しさん:2014/06/19(木) 21:08:43.20 ID:Nuy+Z8Yr
そういうのほんとふしぎ
79デフォルトの名無しさん:2014/06/20(金) 09:51:19.84 ID:13YA0ieC
漢字2つ分を一個に入れてるのかw
80デフォルトの名無しさん:2014/06/20(金) 17:14:37.82 ID:/wHrIbSK
西夏文字が大量に提案されてるな
81デフォルトの名無しさん:2014/06/20(金) 20:13:56.90 ID:Bc1EKLHV
>>79
~?
82デフォルトの名無しさん:2014/06/21(土) 13:58:17.46 ID:AeYdIm2H
合紫順~
83デフォルトの名無しさん:2014/06/21(土) 14:34:25.10 ID:CDmICRGP
>合紫順~
これはこれでひとつの漢字としてみなしてもいいような気がしてたけど、
よく考えたら縦書きのときに配置が変わるからこれは漢字じゃないな。
84デフォルトの名無しさん:2014/06/21(土) 14:38:18.71 ID:2OQISpPs
明治以前のも必要だろ
85デフォルトの名無しさん:2014/06/21(土) 14:45:13.44 ID:LBtFHXKV
そんな需要はない
どうしてもというならビットマップで自作
86デフォルトの名無しさん:2014/06/21(土) 15:00:21.68 ID:7BkNyovA
そういうの気持ち悪い。
やりたかったら長体だの平体だの掛ければいいじゃないと思うけど、
このスレの話じゃないな。
87デフォルトの名無しさん:2014/06/21(土) 17:37:50.17 ID:bFN4NK+h
明治以前は必要ないけど、将来的に平成の次は需要あるんじゃないの
88デフォルトの名無しさん:2014/06/21(土) 18:18:33.28 ID:ElcRoqBr
>>83
> よく考えたら縦書きのときに配置が変わるからこれは漢字じゃないな。
感じじゃないというのが、縦書だと配置が
変わるという理由であれば、それは理由にならない。

なぜなら、一文字であっても縦書で配置が変わる文字があるからだ。
それは「、」縦書だと配置が変わる。

「、」は漢字じゃないというかもしれんがw
89デフォルトの名無しさん:2014/06/21(土) 19:47:29.97 ID:Chc2mqWD
自己完結したら話が続かない...
90デフォルトの名無しさん:2014/06/21(土) 23:23:25.80 ID:DGONxkaQ
文字コード力によってunicodeコンソーシアムに名を連ねるような企業に入れないものかね
91デフォルトの名無しさん:2014/06/22(日) 00:05:00.51 ID:bJvEf3+R
>>88
普通に漢字じゃなさすぎて反応しづらい
92デフォルトの名無しさん:2014/06/22(日) 00:11:05.67 ID:nGqVjB+P
文字コードカ?
93デフォルトの名無しさん:2014/06/22(日) 00:56:16.16 ID:jMI4A6MR
Unicodeコンソーシアムに名を連ねているような人は単に文字コードというより
国際化関係が多いような。
94デフォルトの名無しさん:2014/06/22(日) 01:33:33.53 ID:upDz43Y5
貞観
95デフォルトの名無しさん:2014/06/22(日) 14:08:49.34 ID:ZZa1vnuC
>>90
逆に自分で作った企業を紛れ込ませる方法も
(ハングルコンピューターメソッド)
96デフォルトの名無しさん:2014/06/22(日) 17:47:49.52 ID:72jpPhSw
>>77
中国の分については、IRG42でExt.Fのレパートリが確定するなら待つけど
それができなかったらUROの後ろに入れろと最初から言ってた。
http://appsrv.cse.cuhk.edu.hk/%7Eirg/irg/irg42/IRGN1988_China_UNCFurtherRequest.doc
97デフォルトの名無しさん:2014/06/22(日) 19:08:16.16 ID:+tQsZ4hU
>>93
>>95
文字コードに関わる仕事してるんだけど、環境がアレだから転職したいんだけど
文字コード + αないときついか
αがなんなのかわからないけど
98デフォルトの名無しさん:2014/06/22(日) 21:09:57.25 ID:xCekfL2e
>+ α

後ろについてるってなるとVSかな
99デフォルトの名無しさん:2014/06/22(日) 23:12:22.87 ID:KWzMzPQg
今は日本からだと楽天ぐらいか
ttp://www.unicode.org/consortium/memblogo.html
100デフォルトの名無しさん:2014/06/22(日) 23:54:37.35 ID:g6b1djpb
なんと、+αは社内公用語だったか
101デフォルトの名無しさん:2014/06/23(月) 01:35:40.64 ID:xD6VlKwP
+αGEL
102デフォルトの名無しさん:2014/06/24(火) 10:49:02.09 ID:xfPFzb2S
丶大法師(ちゅだいほうし)
まんなかに点がある
103デフォルトの名無しさん:2014/06/24(火) 11:29:23.71 ID:AfD6RzLL
普通に有名な文字だけどそれが何か?
里見の謎^H^H八犬伝でも読んだの?
104デフォルトの名無しさん:2014/06/24(火) 12:47:57.19 ID:/C23Uhbr
支那語モードだと読点まんなかにくるよね
105デフォルトの名無しさん:2014/06/24(火) 13:30:40.14 ID:ZncR21mW
いつもどっちが句点でどっちが読点だかわからなくなる。

直感で「文中に出る順番は『、』『。』だから、それぞれ『句』『読』点なのかな」と思ったら間違いで、
もう少し考えて「句毎に使うほうが句点かな」と思ったらそれも間違いなんだ。わかりにくくて泣きそう。
106デフォルトの名無しさん:2014/06/24(火) 13:35:03.13 ID:AfD6RzLL
声に出して「読」む時に息継ぎとかのためにあるほうが読点。
そっちじゃないほうが句点。
107デフォルトの名無しさん:2014/06/24(火) 14:02:26.36 ID:S/1R1o36
う、うん…
108デフォルトの名無しさん:2014/06/24(火) 14:22:15.50 ID:XolzJzrv
ど、… 読点
109デフォルトの名無しさん:2014/06/24(火) 14:26:46.25 ID:oDNeDxJ6
撥音便
促音便
拗音便
110デフォルトの名無しさん:2014/06/24(火) 18:48:28.08 ID:n9eXMXO/
>>105
「句」の真ん中に「。」っぽいのがあって、「読」の1画目が「、」って覚えてる
111デフォルトの名無しさん:2014/06/25(水) 00:37:16.12 ID:IGlDE0oX
それはよさそうだな。
112デフォルトの名無しさん:2014/06/25(水) 04:00:14.63 ID:gMWmO5iT
>>102の「丶」は読点でも片仮名繰り返しでもなく普通の漢字だけど……
ああ、>>88から来てるのか
113デフォルトの名無しさん:2014/06/25(水) 17:03:22.67 ID:p7ubFJ8S
JIS X 0221第四次規格が出たか。
ようやく日本文字部分レパートリが独自の附属書じゃなくなるのね。
114デフォルトの名無しさん:2014/06/25(水) 17:16:05.90 ID:PZUK3mFx
どうなるの?
115デフォルトの名無しさん:2014/06/25(水) 19:57:28.85 ID:odc9r+PJ
「々」
とか
「ゝ」
とかって漢字?
116デフォルトの名無しさん:2014/06/25(水) 20:29:36.22 ID:ZDN4WKWX
記号
117デフォルトの名無しさん:2014/06/25(水) 23:36:06.10 ID:GQuGFHte
敬礼
118デフォルトの名無しさん:2014/06/26(木) 03:32:28.87 ID:T2lDhtAF
>>115
[文字パレット]や[文字ビューア]で文字情報を見てみるといいよ

>>117
(`ω´)ゝ
119デフォルトの名無しさん:2014/06/26(木) 11:46:55.87 ID:SxzDgF/c
>>113
附属書JAに残ってる
120デフォルトの名無しさん:2014/06/26(木) 12:59:34.09 ID:bSxHRBR2
々々イェイ! 々々々イェイ!
121デフォルトの名無しさん:2014/06/26(木) 13:06:15.12 ID:Txu8uYSD
ノマ派ですか。おれクマ派
122デフォルトの名無しさん:2014/06/26(木) 14:00:51.55 ID:lzGhXXy2
キープだ牛
123デフォルトの名無しさん:2014/06/26(木) 14:02:42.70 ID:ey/6P2HR
そこはダルシムとするのが通
マイヤフー!
124デフォルトの名無しさん:2014/06/26(木) 22:33:35.23 ID:T2lDhtAF
>>121
それはおかしい。「クマ」をくっつけても「々」にはならないよ。
125デフォルトの名無しさん:2014/06/28(土) 14:52:20.60 ID:rdsgX/Oy
マックって、キーボードから 0x5C のキーを打つと文字コードは何が入るの? 半角の"¥"(0xA5)?、それとも半角の"\"(0x5C) ?
126デフォルトの名無しさん:2014/06/28(土) 16:54:56.41 ID:atMd2lNW
>>124
「フ」の部分を重ねればなんとか
127デフォルトの名無しさん:2014/06/28(土) 18:54:49.36 ID:aR5H2Sqc
>>125
・[英数]キーを押してからだと
[¥]キーを押すと半角の"¥"、[option](=alt)キーとともに[¥]キーを押すと半角の"\"。
・[カナかな]キーを押してからだと
[¥]で全角の"¥"、[option]とだとなぜか全角ではなくて半角の"\"。

全角の"\"を出したいときは[カナかな]で全角の"¥"を出してから、
[F4]を押して候補から選択するか、
スペースキーで変換して候補から選択する。(私の場合IMEはATOK)
こんな答えでいい?
128デフォルトの名無しさん:2014/06/28(土) 20:59:31.52 ID:LDQ/fpQX
>>127
ありがとう。予想以上に丁寧。感謝です。
129デフォルトの名無しさん:2014/06/28(土) 21:18:35.78 ID:qOAW+p+P
ことえりの環境設定で変えられるよ
俺はプログラミングでよく使うからバックスラッシュに変えてる
130デフォルトの名無しさん:2014/06/29(日) 00:14:49.38 ID:J0TW45q0
躍り字(おどりじ)は、主に日本語の表記で使用される約物(特殊記号)の一群で、々、ヽ、ゝなど
- Wikipedia
131デフォルトの名無しさん:2014/06/29(日) 01:25:04.74 ID:uMPGh2FI
>>125
キーボードに0x5Cのキーなんて無いよ。
Input Source、Input Methodの設定次第でどのUnicode返すかが決まる。
132デフォルトの名無しさん:2014/06/29(日) 09:42:18.75 ID:Y8ldqiR/
◎2chスレッド勢いランキングサイトリスト◎

★+ニュース板
・ 2NN (推薦)
・ 2chTimes
★+ニュース板新着
・ 2NN新着
・ Headline BBY
・ unker Headline
★+ニュース板その他
・ Desktop2ch
・ 記者別一覧
★全板
・ 全板縦断勢いランキング (推薦)
・ スレッドランキング総合ランキング
・ ログ速
★全板実況込み
・ 2勢 (推薦)
・ READ2CH
・ i-ikioi

※ 要タイトル名検索
※ 2chブラウザ併用推奨
133デフォルトの名無しさん:2014/06/30(月) 04:03:57.93 ID:jMyDiUzF
>>83
> >合紫順~
> これはこれでひとつの漢字としてみなしてもいいような気がしてたけど、

びっくりした。
134デフォルトの名無しさん:2014/06/30(月) 06:28:34.70 ID:TSR2fyTk
日本人はあまり気にしていないかもしれないけど、
外国人が漢字を覚え始めると、
「一目で意味が判る、まるでアイコンだ、漢字スゲー」と言うそうだから、
そういう意味では、別にびっくりしなくてもいいと思うよ。
135デフォルトの名無しさん:2014/06/30(月) 07:23:06.42 ID:94hmBiki
>>133
魑魅魍魎に見えた
眼科逝ってくる
136デフォルトの名無しさん:2014/06/30(月) 07:24:10.72 ID:94hmBiki
>>134
漏れはアイコンじゃ意味が判らないので
やっぱ漢字スゲーと思ってる
137デフォルトの名無しさん:2014/06/30(月) 08:05:15.12 ID:TSR2fyTk
ロジャー・パルバースという人が『驚くべき日本語』という本の中で、
「日本語は世界語となり得る」といったようなことを書いているそうだ。
又聞きで読んだわけではないけど。…っと、このスレなんだっけ?(ごめんよぉ)
138デフォルトの名無しさん:2014/06/30(月) 09:48:35.96 ID:/NfoGo46
http://itpro.nikkeibp.co.jp/article/COLUMN/20140621/565786/

安岡センセイの新連載
同じネタを手を変え品を変え使い回し
139デフォルトの名無しさん:2014/06/30(月) 09:58:08.33 ID:lJxnkRTG
Fileメニューのようなカテゴリを表わすアイコンとOpenのような動作を表わすアイコンを組み合わせれば
階層メニューなんて要らないよってどや顔していたアメリカ人の知り合いを思い出した。
日本ではそうやって漢字を拡張して使っていると説明しても納得しないので、鮨屋の湯飲みをくれてやったw
140デフォルトの名無しさん:2014/06/30(月) 12:27:46.01 ID:lTC5ibMy
文字の事をGlyph(絵文字)と呼ぶくらいだし、
漢字は絵文字として豊かな表現力を持っているのは事実だろうなぁ。

アルファベット圏のあのシンプルさも好きだけど、日本のように色々取り入れて併用できる環境も素敵やん。
141デフォルトの名無しさん:2014/06/30(月) 21:05:17.71 ID:gYwuV4Gr
>>138
同じようなことかもしれないけど状況は変わっていくわけで、これはこれでどうこう言われる筋合いじゃないと思う。
142デフォルトの名無しさん:2014/06/30(月) 22:31:15.80 ID:NKvbhfi+
漢字ってのは英語では単語だ。
143デフォルトの名無しさん:2014/07/01(火) 05:37:51.40 ID:nFzJ2FEg
日本語では漢字だ。
144デフォルトの名無しさん:2014/07/04(金) 01:13:16.05 ID:ML2FpV72
145デフォルトの名無しさん:2014/07/04(金) 11:10:21.27 ID:s+xY96II
ここで粘着してる奴が私怨
146デフォルトの名無しさん:2014/07/04(金) 13:20:41.59 ID:dxdW+UuJ
どういう恨みがあんのか知らんがここでやんなよって思う。
147デフォルトの名無しさん:2014/07/05(土) 12:04:40.33 ID:Oa4qfcNo
外国人の氏名は元々Unicodeで表されてるのに
それをわざわざ入管正字や住基文字や戸籍統一文字に
変換する道理が意味不明
148デフォルトの名無しさん:2014/07/05(土) 14:31:59.27 ID:c0IvYLy1
タテワリギョーセー国傘下村地域でのみ通用する言語と文字
※オサが代わると意味も変わると言われている
149デフォルトの名無しさん:2014/07/05(土) 17:30:12.95 ID:vJH6bkQ7
逆に長が変わった程度ではびくともしないから困ってる気がするが。
150デフォルトの名無しさん:2014/07/06(日) 20:27:48.11 ID:C/NYHKT8
>>147
そんな事言ったら世界中の文字コードは不要になるだろ
151デフォルトの名無しさん:2014/07/07(月) 11:07:48.61 ID:GTu0r9os
>>148,149
変わって欲しいところは変わらず
変わって欲しくないところが変わる

こうですね
152デフォルトの名無しさん:2014/07/07(月) 18:00:51.19 ID:KNJDsbWp
世の中ままならないのが常ですわ
153デフォルトの名無しさん:2014/07/10(木) 23:10:42.70 ID:fp5I0Zvk
RT >151
あるある
154デフォルトの名無しさん:2014/07/27(日) 11:49:29.82 ID:b45OmH+A
Noto CJKフォントってどーよ?
155デフォルトの名無しさん:2014/07/27(日) 18:12:00.63 ID:aynozLel
NotoかわいいよNoto
156デフォルトの名無しさん:2014/07/28(月) 03:40:53.07 ID:ut5EuUgc
ウェイトがたくさんあるフォントがばら撒かれるのはでかいn
157デフォルトの名無しさん:2014/07/28(月) 23:35:08.28 ID:w++kz+Go
Noto Serif CJKも水面下じゃ準備が進んでるのかな
158デフォルトの名無しさん:2014/07/29(火) 00:17:48.01 ID:fZBnj+Ic
Serifもいいけど英数まで等幅のバージョンが欲しいな。
AdobeはSource Code Proっての出してるからあれにCJK追加した感じで。

テキストエディタ用に使いたい。
日本語フォントだと収録外の文字が多いからそこでずれちゃう。
159デフォルトの名無しさん:2014/07/30(水) 23:32:27.72 ID:BUixUKlo
CJK互換漢字SVに対応した世界最初のフォントかな?
160デフォルトの名無しさん:2014/08/01(金) 00:32:49.14 ID:qW8PjnBR
161デフォルトの名無しさん:2014/08/02(土) 17:28:09.01 ID:whiiBojo
>>154
統一して表示されるっていい事だな
162デフォルトの名無しさん:2014/08/06(水) 06:18:01.43 ID:KIGwELq2
フォント部隊がこれ作ってたからaj1-7の話が立ち消えになったんだな・・・
163デフォルトの名無しさん:2014/08/06(水) 07:07:16.56 ID:VORfxcQU
どういうこと?
164デフォルトの名無しさん:2014/08/06(水) 07:15:04.76 ID:KIGwELq2
Source Han Sans/Notoを作ることになったから
AJ1-7のグリフを作るための人的リソースが確保できなくなったんじゃないかなーと
165デフォルトの名無しさん:2014/08/06(水) 21:47:57.35 ID:i6un7vEe
アドビの日本語フォント開発者ってascii.jpのインタビューで
名前のあがった2人以外にもいるのかな
166デフォルトの名無しさん:2014/08/06(水) 22:04:42.62 ID:YK4pQga/
その二人が誰だかわからんので何とも
167デフォルトの名無しさん:2014/08/07(木) 00:31:23.73 ID:8p7h7+Jd
emojiはやりたい放題だな…
> L2/14-173 Variation selectors for Emoji skin tone
168デフォルトの名無しさん:2014/08/07(木) 13:31:14.27 ID:1whblxfx
この提案じゃピッコロさんの肌色を再現できない
やり直し
169デフォルトの名無しさん:2014/08/07(木) 17:08:50.12 ID:cRrFjz3e
たしかに
170デフォルトの名無しさん:2014/08/08(金) 00:18:25.50 ID:QwQuqp7u
色相セレクタ彩度セレクタ明度セレクタがそれぞれ8つずつぐらいあれば大抵の色はいけそうだな。
171デフォルトの名無しさん:2014/08/23(土) 23:13:52.84 ID:pgISeySf
ラテン文字の拡張Fが提案されてるんだな。とうとう今度からBMP外か。
172デフォルトの名無しさん:2014/08/23(土) 23:48:35.08 ID:yM+l+Abf
Unicodeのバージョンと、追加された文字達の対応ってどこかでわかりますか?
173デフォルトの名無しさん:2014/08/24(日) 01:08:45.48 ID:HobB9XVw
http://www.unicode.org/charts/About.html
のVersion-Specific Chartsから、3.1〜7.0までたどれるよ。
174デフォルトの名無しさん:2014/08/24(日) 01:44:40.03 ID:JPGssgvQ
Unicode 7時点の一覧ならこれ。
http://www.unicode.org/Public/7.0.0/ucd/DerivedAge.txt
175デフォルトの名無しさん:2014/08/24(日) 08:06:56.66 ID:p9zF2+zn
>>171
BMPはとうに締め切ってるからね
何処かの国がそれを無視して無理矢理ねじ込んだこともあるけど
176デフォルトの名無しさん:2014/08/24(日) 08:08:59.17 ID:U/9l1uz2
>>173-174
ありがとうございます。目的の字が見つかりました。

古いバージョンから組文字は結構あったんですね。
ちょっとビックリしました。
177デフォルトの名無しさん:2014/08/24(日) 18:41:59.56 ID:A7hXgDTc
BMPが締め切ったなんてことはないよ
現に今もCherokee Supplementってのが提案中だし
http://www.unicode.org/roadmaps/bmp/

Latin Ext-Fはこんなギリギリじゃなくて256文字分確保できる位置の方が
良いと思うんだけど、そうするとだいぶ後ろのほうになるのか
SMPも良い場所はなくなりつつあるんだな
178デフォルトの名無しさん:2014/08/24(日) 22:02:05.40 ID:KLcB2CPn
漢字限定ならBMPへの追加はExtension-Aが最後だったのに
どっかの国が互換漢字にしてまでむりやりBMPにねじ込んだり
割り当てられてもいない符号位置を勝手に自国の規格に書き込んだりして
禍根を残したことがあったな
179デフォルトの名無しさん:2014/08/25(月) 07:20:25.82 ID:vZhjcmbA
えっ?
180デフォルトの名無しさん:2014/08/25(月) 21:56:08.49 ID:e8bSrHPI
SMPも埋まってきてるんだな。数年以内に4面あたりをTertiary Multilingual Planeと決められるかも。
181デフォルトの名無しさん:2014/08/26(火) 23:11:51.09 ID:jG4KjoUF
今年度の検討始まってた
ttp://mojikiban.ipa.go.jp/3751.html
182デフォルトの名無しさん:2014/08/30(土) 07:04:57.19 ID:lIKJ5wT5
変体仮名は何をもたもたやってんだろう
183デフォルトの名無しさん:2014/08/30(土) 16:20:15.64 ID:xwGfWle7
ひらがなYEとカタカナEを入れるだけでもあれだけもめてた
(むしろ妨害しかしてなかった)くらいだし、
よほど強い意志を持って行動を続けなきゃ放置プレイされるだけ
184デフォルトの名無しさん:2014/08/30(土) 18:50:29.14 ID:lIKJ5wT5
グリフを入札したほどだしやる気はあるんじゃないかな
ただ今からだと最速でもUnicode 10くらいになりそう
185デフォルトの名無しさん:2014/08/31(日) 10:11:25.09 ID:BoEjqfWo
>>182
そりゃ定義もまちまちなのを無理に入れようとするからだろ
行政書類系で一意に定められてて使用実績もあればそれを示せばいいんだし。
186デフォルトの名無しさん:2014/08/31(日) 16:28:43.99 ID:D1L0Hk7z
似て非なるものとして「行政書類系で多数の定義がありそれぞれに実績がある」ならよくあるパターンだなあ…
187デフォルトの名無しさん:2014/08/31(日) 19:42:20.55 ID:knyC4Rpa
変体仮名がUnicodeに追加されるのが先か
変体仮名の戸籍名を持つ人が全滅してしまうのが先か
188デフォルトの名無しさん:2014/08/31(日) 19:56:43.05 ID:PuuS0T7E
多分 >>181 を辿った先にある「資料3:【参考】変体仮名のデザイン案 (PDF)」を
ベースにやるつもりなんだろうけど
ttp://mojikiban.ipa.go.jp/3746.html

WG2に提出されたらされたでそこから先が長そう
189デフォルトの名無しさん:2014/08/31(日) 22:07:27.31 ID:ZTbb0r0/
人名用漢字って法制審議会なの?
190デフォルトの名無しさん:2014/09/01(月) 05:39:25.59 ID:qmwJv0SL
除籍のためにも意味はあるんじゃないの
191デフォルトの名無しさん:2014/09/01(月) 10:31:37.74 ID:srwG2aQM
>>187
日本が亡くなるのが先
192デフォルトの名無しさん:2014/09/01(月) 11:31:02.84 ID:riC6owF6
個人の願望は役に立ちません
193デフォルトの名無しさん:2014/09/22(月) 19:19:23.24 ID:A6Epk3+7
IPAフォント初めてインストールした!
だけど、帳票作成ソフトがS-JISのみ対応だったorz

csvからpdfに出来るお奨めソフトない?

jasper reports使ってみよっかな
194デフォルトの名無しさん:2014/09/23(火) 01:11:44.23 ID:W07urC2c
htmlからならwkhtmltopdfつーのが笑えるレベルだけど
195デフォルトの名無しさん:2014/09/23(火) 01:32:45.71 ID:Grd+CHTX
LibreOffice, Eclipseなどで、変換できないの?
196デフォルトの名無しさん:2014/09/23(火) 02:56:04.46 ID:yTWN5vXQ
EboraOffice
197デフォルトの名無しさん:2014/09/23(火) 15:18:25.52 ID:EJI/lPFO
JIS X 0201ってエンコーディング方式については定めてないですよね

例えば,
「JIS X 0201で定義されている文字を利用する方法として,Shift_JIS,EUC-JP,○○などがある」
と言いたいときに,8bit符号表をそのまま使う方法は何言えばいいですか?
198デフォルトの名無しさん:2014/09/23(火) 15:36:04.37 ID:MCcom9gS
>>197
「Windows-31Jを使用する。Windowsのメモ帳でANSIを選んだときの文字コードである」
「Shift_JISを使用する」
「テキストエンコーディングは、JIS X 0201の8ビット符号値をそのままバイト値に使用したものとする。例えばAは65となる」
199デフォルトの名無しさん:2014/09/24(水) 11:54:32.32 ID:5bjJvoMc BE:928380653-2BP(3276)
PC-98の半角2バイト文字はUNICODEの先駆者、
UNICODEだと欧文も2バイトだしね。
半角2バイト文字は半分エスケープ文字だと解釈することもできる
200デフォルトの名無しさん:2014/09/24(水) 12:07:16.14 ID:2WI09dQB
ぐちゃぐちゃだ、やりなおせ。
201デフォルトの名無しさん:2014/09/24(水) 23:43:02.18 ID:Umn+P9Fh
>>198
ありがとうございます
3番目の表現を使わせてもらいます
202メモ:2014/09/25(木) 15:06:03.38 ID:kNqhUUGO
言語 コードページ 文字数
日本語 932 7980
簡体字中国語 936 22047
韓国語 949 17304
繁体字中国語 950 13759
203メモ:2014/09/25(木) 15:06:33.97 ID:kNqhUUGO
Windows 3.1 用の Windows の国際的なコード ページの INF: リスト

この資料は、以前 Q131421 の下で公開
オペレーティング システムの Microsoft Windows バージョン 3.1 のインターナショナル バージョンの Windows コード ページの一覧を次に示します。

Language Code Page
-------------------------------
Arabic 1256
Hebrew 1255
United States 1252
(and West European)
Greek 1253
Turkish 1254
Cyrillic 1251
Eastern European 1250
Thai 874
Japan 932
Chinese (simplified) 936
Chinese (traditional) 950
Korean 949


西ヨーロッパ言語のバージョンには、フランス語、ドイツ語、イタリア語、
スペイン語、カタロニア語、オランダ語、フィンランド語、アイスランド語、
インドネシア語、ポルトガル語などが含まれます。東ヨーロッパ言語
バージョンには、チェコ語、ハンガリー語、スロバキア語などが含まれます。
204デフォルトの名無しさん:2014/09/25(木) 19:26:37.09 ID:kNqhUUGO
---
韓国語版 Windows 3.1と韓国語版 Windows NT 3.1は発売されていたみたいだど
ハングルの大移動で文字の互換性は無いかな?
MS-DOS 6はCP949を使って問題ないが、韓国語版 Windows 3.1もCP949が使われて
いるが、TTFフォントの内部コードにUnicodeが使われており、ハングルの
タイ移動でフォントの互換性がなくなりそう。韓国語版 Windows NT 3.1では
でUnicodeが使われているから、同様に互換性が無いか?

-----
Windows 3. 51 での韓国語の Windows NT 3. 5 プログラムを表示することはできません。
http://support.microsoft.com/default.aspx?scid=kb;ja;157447
205デフォルトの名無しさん:2014/09/25(木) 19:33:43.30 ID:kNqhUUGO
でも韓国語版Windows 3.1やNT 3.xの互換性の問題についてはあまり話題に
上がらないが、それは当時韓国国内でWindowsが普及していなかったのか?
それともM$があらかじめハングル大移動後のコードを予めWindowsに実装して
いる可能性もありそう。
206デフォルトの名無しさん:2014/09/25(木) 19:40:02.57 ID:kNqhUUGO
やっぱりNT3.50とNT3.51の境で互換性問題があるようだな。

Compatibility Issues
http://msdn.microsoft.com/en-us/library/cc194862.aspx

For example, Unicode version 1.1 does not support Korean combining
jamos and some rare Korean hangul characters, so Windows NT 3.5
cannot display them.
207デフォルトの名無しさん:2014/09/25(木) 21:39:02.25 ID:F7PJWJhe
安岡センセイの文字コード論文を『情報管理』がボツにしたとのこと
http://slashdot.jp/%7Eyasuoka/journal/585659
208デフォルトの名無しさん:2014/09/26(金) 01:28:25.97 ID:Fml3jypG
http://www.ksky.ne.jp/~smile4me/charcode/index.htm
http://charset.info/surrogate.html

前スレを呼んでいて↑を見つけたんだが、

>Windows 9x を JIS X 0213 対応にする
>
>Windows 95/98/Me (以下 9x と総称) では、シフトJIS コードが内部でも使用されているので
>特に何もしなくても「JIS X 0213 対応フォント」の JIS X 0213 追加分が表示されます。
>
>しかし、Visual BASIC などのユニコードを使うソフトでは、NT 同様に NLS の修正が必要になります。
>また、MS-IME や ATOK でも JIS X 0213 追加漢字(と記号の一部)が登録できるようになるようです。

Windows3.1+Win32sでの作動がどうなるか気になったが、
Win32sじゃUnicodeは無理だから意味無いかな?
Windows3.1自体はJIS2004フォントも問題なく使える。
(ちなみにWindows3.1では日本語プロポーショナルなTTFも問題なく使用できる。)
(またNLSファイルはNT:c_932.nls、9x:cp_932.nls、Win32s:p_932.nls になっている。
209デフォルトの名無しさん:2014/09/26(金) 01:53:51.14 ID:Fml3jypG
Win32sもunicode変換機能

Unicode in Win32s and Windows 95
http://msdn.microsoft.com/en-us/library/cc194796.aspx

>Although it does not support wide-character API entry points,
>Win32s does contain two important API functions—MultiByteToWideChar
> and WideCharToMultiByte—that can convert data between Unicode and
>local Windows code pages. For example, an application running on a
>Japanese edition of Windows 3.1 could call these two functions to
>convert between the Unicode and Shift-JIS encodings.

あとWin3.1でUnicodeなTTFをJIS2004にマップさせるには
GDI.EXE改造すればいけるかも。
210デフォルトの名無しさん:2014/09/26(金) 10:17:33.88 ID:GdYRXubx
>>207
安岡も耄碌したな
211デフォルトの名無しさん:2014/09/26(金) 10:49:18.64 ID:fN1jkSMH
そういうことなんだろうおまえの中ではな
212デフォルトの名無しさん:2014/09/26(金) 11:27:33.52 ID:Fml3jypG
Win3.1のGDI.EXE自体はCP932分のテーブルしか無かったから、改造は
難しい。p_932.nlsの改造はいける。
213デフォルトの名無しさん:2014/09/26(金) 19:18:05.01 ID:/iisywxi
>>207
論旨には同意するけどもうちょっと穏やかな物言いはできないのかこの人
214デフォルトの名無しさん:2014/09/26(金) 20:15:08.68 ID:8yaaHtVo
この文体/物言いじゃ、内容のいかんに依らず却下だな。
誤りを皆に理解してもらいたいのにそれが実現されない行動をとって
スラドで愚痴るのがこの人の生き方なんだろう。
215デフォルトの名無しさん:2014/09/26(金) 20:19:07.48 ID:fN1jkSMH
論文が、内容ではなくスラドでの文体/物言いでリジェクトされるわけがないだろw
他人の生き方を心配する前に、自分の脳味噌を心配しろよw
216デフォルトの名無しさん:2014/09/26(金) 20:31:48.53 ID:TKoXt2Ra
純粋な内容でリジェクトの判断をされたのか
安岡さんミジメっすね
情報管理「この内容では却下」
217デフォルトの名無しさん:2014/09/26(金) 21:37:22.96 ID:fN1jkSMH
内容が気に喰わないからリジェクト、とか、内容が高度過ぎて編集委員が理解できないからリジェクトとか、
学会とかではよくあるとは言わないけど、たまにはある話ですが、

そういうことを全く知らないことを自慢するのって楽しいですかw
218デフォルトの名無しさん:2014/09/26(金) 22:22:46.86 ID:fKh0XjvQ
内容が高度過ぎてリジェクトされたのか
安岡さん さすがっすね
情報管理「言ってることよくわからんから却下」
219デフォルトの名無しさん:2014/09/26(金) 23:11:29.07 ID:/iisywxi
>氏の論考は,論旨が破綻しており,氏が過去に発表した同様の論考も含めて,
>全くの妄想だと断ずるしかない

この締めの部分が特に感じ悪い
220デフォルトの名無しさん:2014/09/27(土) 07:04:05.96 ID:mW7h2CYB
安岡センセイ『自由と正義』でも榎並批判?

http://www.nichibenren.or.jp/jfba_info/publication/booklet/year/2014/2014_9.html
221デフォルトの名無しさん:2014/09/27(土) 17:10:44.87 ID:lJpImKEe
文字コード絡みでは、実際、陰謀論とか妄想としか言いようのない論考を見るからな。
某「文字講堂」とか。
222デフォルトの名無しさん:2014/09/27(土) 21:46:06.00 ID:mW7h2CYB
>>219
スラドにコメントしろよ
223デフォルトの名無しさん:2014/09/27(土) 22:08:24.00 ID:iEeCkBMy
>>212
p_932.nlsも
Unicode→CP932テーブルが
CP_932.NLSとC_932.NLSはフルセットの65536文字分だけど、
P_932.NLSは削られていて27392文字分しか無い、
CP932→UnicodeはC_932.NLSもCP_932.NLSもP_932.NLSも約15870文字分
。そしてGDI.EXEは27392文字分ある。からGDI.EXEの改造もP_932.NLSと
同じ感じでいける。
224デフォルトの名無しさん:2014/09/28(日) 23:02:09.53 ID:8P+GUhC+
ベトナムも文字コードってVISCIIってのがあるみたいだな。
制御文字の0x01〜0x1Fにも文字が割り当てられていてワロタw
他にはTCVN 6909等やある、やはりMS-DOSじゃWindows-1258のような
文字合成のある方式はあまり使いたくないだろうな。
225デフォルトの名無しさん:2014/09/28(日) 23:12:21.19 ID:Q6ombayK
タイ語は文字合成方式だね。
アルファベットベースじゃなくて組み合わせも多いので仕方ないけど。
226デフォルトの名無しさん:2014/09/29(月) 00:30:21.82 ID:LbPf1ApM
久しぶりのWG2会議
227デフォルトの名無しさん:2014/09/29(月) 08:51:12.36 ID:n4n5BQU6
>>224
VSCII-2 (TCVN5712-1993)では改良されて
ちゃんと0x00〜0x1Fは制御文字になったよ
228デフォルトの名無しさん:2014/09/29(月) 09:28:40.75 ID:GzMQOV/O
TCVN 5712:1993は用途に合わせて3種類ある筈。VN1、VN2、VN3が
ある。VN1は制御文字にも割り当てがある。VN2は制御文字の割り当て
を無くしたバージョン。VN3は思い切って補助記号付大文字を大幅にカット版。
大文字が足りない、文字コードを使用するときは
大文字用フォントと小文字用フォントを切り替えて使用するらしい。
229デフォルトの名無しさん:2014/09/29(月) 09:32:03.80 ID:GzMQOV/O
ベトナム語は文字数が多いので1バイトに収めようとしたら制御文字にも
はみ出る仕方が無い。一応使用頻度の低い文字を影響の少ない制御文字に
割り当ててあるから、影響は最小限に抑えられている。
230223:2014/09/29(月) 14:17:28.30 ID:GzMQOV/O
P_932.NLSのUnnicode→CP932の文字マップ参照テーブルが解析できた。

参照されている文字(unicode)は
0000-01ff,0300-04ff,2000-26ff.3000-30ff,3200-33ff,4e00-9fff,
e000-e7ff,f900-faff,ff00-ffff
だった。ネット上でWin32sのNLSファイルの構造を解説してあるサイトが
見つかったので助かった。拡張は可能。
SJIS2004(JIS X 0213:2004)対応のP_932.NLSとGDI.EXEを作ってみだが、
231223:2014/09/29(月) 14:24:17.45 ID:GzMQOV/O
改造版P_932.NLSはWin32s対応でUnicodeを使うアプリ(Greenpad)は
一応使えるようだ。(Win32sの仕様上一部文字化けする文字あり)
改造版GDI.EXEはUnicodeなTTFでSJIS2004対応の文字も表示されるように
なった。文字数の拡張はしていない為、一部記号や漢字の表示は不可。
232223:2014/09/29(月) 14:25:42.12 ID:GzMQOV/O
しかしWindows3.1ではunicodeなTTFの表示でGDIエラーを起こしやすいので注意。
233デフォルトの名無しさん:2014/09/29(月) 20:00:33.45 ID:2JaSDa+0
波ダッシュの例示字形変更許されるなら文字名とかCP変更もありなんじゃねえの?
234デフォルトの名無しさん:2014/09/29(月) 21:01:59.60 ID:mj/8iUnW
>>220
図書館いってきた
自由と正義2014年9月号46〜52ページ
マイナンバーと住基ネットの話で文字コードは無かったけど
これ榎並批判なのかな
235デフォルトの名無しさん:2014/10/01(水) 00:06:36.16 ID:paW0CBBp
さて
236デフォルトの名無しさん:2014/10/01(水) 02:24:53.09 ID:zq79aPi2
Windows 10ではOTFサポートがもっとまともになってるといいなあ
237デフォルトの名無しさん:2014/10/01(水) 09:10:23.59 ID:AX2nUQvJ
>>230
構造の解説あったのか。
以前探した時は見つけられなかったのでURL教えてほしい。
238デフォルトの名無しさん:2014/10/02(木) 11:19:42.12 ID:R0BKZCkI
>>231
その改造版P_932.NLSでWin32sのOLE使うアプリで文字化けしたので
、まだ研究段階だな。

>>238
明示的には"Win32s"とは言っていないがWin32sのNLSの構造を
紹介している
umqの日記: NLS って難しい(2)
ttp://slashdot.jp/journal/244495/NLS-%E3%81%A3%E3%81%A6%E9%9B%A3%E3%81%97%E3%81%842
umqの日記: NLS って難しい(C)
ttp://slashdot.jp/journal/246657/NLS-%E3%81%A3%E3%81%A6%E9%9B%A3%E3%81%97%E3%81%84C
239デフォルトの名無しさん:2014/10/02(木) 16:49:01.12 ID:YCvfDaSd
一二三四五・・・の文字で構成されたインデックスをソートしようとしたんだけど数値順に並んでないんだな
どんだけ
240デフォルトの名無しさん:2014/10/02(木) 17:06:14.22 ID:qq+mzlUz
あぁいぃうぅえぇおぉ
かがきぎくぐけげこご

あほだよな
241デフォルトの名無しさん:2014/10/02(木) 17:16:14.10 ID:BNNomDCE
漢字は部首順→画数順に並べる、という慣例が漢和辞典の世界にはある。
(で、第2水準ではそれにならった)
そういうことを知らずに思いつきを言ってるなぁ、って思われるだけ。

いずれにしても、文字列の、社会的慣習を踏まえたソート(たとえば本当の「辞書順」とか)は、
単純に一文字ずつ比較するだけでは不可能なので、そういう順序にすることに意味が無い。
242デフォルトの名無しさん:2014/10/03(金) 00:49:09.00 ID:8HQMxfzO
>>240
aAbBcCdDeEfF...って並べる基地外もいるんだぜ、信じられん。
243デフォルトの名無しさん:2014/10/03(金) 08:06:33.69 ID:OynHM83k
>>240
ぁあぃいぅうぇえぉお
が正解
ただちぢっつづてでとど
とかイラっとくる
244デフォルトの名無しさん:2014/10/03(金) 10:35:10.57 ID:Tegb1mus
何にいらついてるのか分からん
245デフォルトの名無しさん:2014/10/03(金) 11:05:16.22 ID:Cqqmulyu
国語辞典とかの排列を、ちょっとでも深く考えたことが無いからだろw
246デフォルトの名無しさん:2014/10/03(金) 12:37:12.56 ID:AIsixZxM
何で世界中UTF-8に統一しないの?
バカなの?
Shift-JISとか他の文字コードを使ったら逮捕にすればいいのに
247デフォルトの名無しさん:2014/10/03(金) 12:41:03.37 ID:lXIQAzKJ
確かに無免許のおれおれプログラマは迷惑
248デフォルトの名無しさん:2014/10/03(金) 12:43:35.18 ID:hjse6GjO
セキュリティ機能だと思えばいいさ
249デフォルトの名無しさん:2014/10/03(金) 12:49:56.93 ID:Cqqmulyu
>>246 よし、まずひろゆきとJimを逮捕だなw
250デフォルトの名無しさん:2014/10/03(金) 14:04:03.24 ID:8OTaypIY
そういうライブラリやアプリを使うやつを逮捕しろ
251デフォルトの名無しさん:2014/10/03(金) 19:14:19.93 ID:uCcPsxJ8
wg2オワタ
252デフォルトの名無しさん:2014/10/03(金) 20:16:28.45 ID:MM8EH8yD
>>246
サイズが1.5倍になるのをばかげているとおもわないのですか?
253デフォルトの名無しさん:2014/10/03(金) 20:20:56.54 ID:MM8EH8yD
なんで統一しようとするのか?
いままで統一できた時代なんて無かったのだ
254デフォルトの名無しさん:2014/10/03(金) 20:40:29.83 ID:KKLEaHKT
AmazonはShift_JISなんだよね。
意外だった。
255デフォルトの名無しさん:2014/10/03(金) 20:44:21.23 ID:sUeMWuDQ
>>246
世界中の全ての文字をカバーしていない
出るのが遅すぎて他のコードが浸透してる
windowsがSJIS(内部はuni)が標準
256デフォルトの名無しさん:2014/10/03(金) 20:58:37.31 ID:anb/lxLT
> windowsがSJIS(内部はuni)が標準
嘘はいくない。SJISが標準なのはWin9xだけだ。日本語版WindowsのANSIがSJISなのと混同してないか?
257デフォルトの名無しさん:2014/10/03(金) 21:03:34.66 ID:Bj0U/nno
日本語版WindowsはUnicode対応でない部分(A系API)がシフトJIS標準
258デフォルトの名無しさん:2014/10/03(金) 21:14:17.04 ID:sUeMWuDQ
ファイル名とか
メモ帳の標準コードとか
色々あると思うが違ったかな?
259デフォルトの名無しさん:2014/10/03(金) 21:41:48.59 ID:uCcPsxJ8
互換性を重視するMSでさえMFCのMBCSサポートを
打ち切ると予告している時代
既に新機能はW系関数のみの実装だし
260デフォルトの名無しさん:2014/10/03(金) 22:20:19.44 ID:KKLEaHKT
\x5cなんて嫌いだー!
261デフォルトの名無しさん:2014/10/04(土) 00:20:15.91 ID:TpSP81Tv
sjisはあまり責める気がしない。
utf8にbomつけたり、unicodeと銘打って実はUTF16-le、とかの方がタチ悪い。
262デフォルトの名無しさん:2014/10/04(土) 00:24:06.50 ID:DsEISyRL
ありゃ日本NBはN4624引っ込めちゃったのか
263デフォルトの名無しさん:2014/10/04(土) 04:31:53.10 ID:klgp9hPC
>>260
0x5c(\u005c)、バックスラッシュ(\)はUNIX系では、
エスケープ文字として使い、直後の文字の特別な機能をなくす

C99, C++, GCC, make, シェルスクリプトなどで、
行末にバックスラッシュ(\)があれば改行せず、1行とみなす

その際、コメント内の行末に、
日本語の表(\u955c)、能(\u945c)などの文字があると、
文字の2バイト目が解釈されて、1行になってしまう
これらをダメ文字という

// 1行コメント
/* 〜 */

だから、これらのコメント内では、
行末の0x5cを解釈しないように、アプリを修正すればよい
264デフォルトの名無しさん:2014/10/04(土) 04:42:15.71 ID:f/g9snk1
>文字の2バイト目が解釈されて、1行になってしまう
>これらをダメ文字という

お前が言ってるだけだろ
265デフォルトの名無しさん:2014/10/04(土) 05:47:51.75 ID:gNAxrtUM
コメントの行末に何かを無条件で入れておくのは?
266263:2014/10/04(土) 06:33:19.40 ID:klgp9hPC
コメントのすべての行末に、\ を置くと、
全部がつながって、1行になってしまうね

行末にダメ文字があるときは、ダメ文字の後ろに、
\を置いて、表\ とすればよいけど、行がつながってしまう
267デフォルトの名無しさん:2014/10/04(土) 07:48:43.39 ID:TW/R31j/
>>263
こういうのをバカ者という
268デフォルトの名無しさん:2014/10/04(土) 08:26:20.70 ID:M66Mgi8t
>>263
シフトJISの文字列は、行の先頭から、ちゃんと1バイトずつよめば
1バイト目か2バイト目か判定できます。慣れてしまえば、非常にわかりやすい。
とばかしたり(途中だけよんだり)するから、判定できなくなる。

EUC-JPなんか、どうやって判定するんでしょうか。おれは、しらん。
269デフォルトの名無しさん:2014/10/04(土) 09:05:55.62 ID:wHKgiuGV
そもそも自分の知らない文字コードを読み込んで正しい処理結果を期待する発想がおかしい
270デフォルトの名無しさん:2014/10/04(土) 09:16:10.45 ID:X8tclADN
>>255
ところが、かのWindowsもファイルシステムは UTF-16 でしたとさ‥
271デフォルトの名無しさん:2014/10/04(土) 09:23:14.02 ID:X8tclADN
深刻なのは産業界
SiftJIS が浸透しているところに、エスケープ文字の仕様がダメダメのダメリカ規格(エスケープ文字ではさんでエスケープする、とかそのエスケープ文字自体をエスケープするときどうするんだ?)を持ち込んで最下層(RS232Cを触る階層のことね)ではダメ字対応に四苦八苦。
端的にいえば送信側が楽するか受信側が楽するかの違いにすぎないんだが‥うちの会社は両方とも楽をするという極悪非道をベンダに押し付ける‥

UTF-8 が浸透するまで収まりそうもないね‥
272デフォルトの名無しさん:2014/10/04(土) 09:47:20.90 ID:fOqpWE8p
>>268
>シフトJISの文字列は、行の先頭から、ちゃんと1バイトずつよめば
>1バイト目か2バイト目か判定できます。慣れてしまえば、非常にわかりやすい。
>とばかしたり(途中だけよんだり)するから、判定できなくなる。
お前さんもどっこいどっこいだよ。
テキストバッファの途中で判定できるアルゴリズムもある、と言うか普通は
速度や汎用性からそちらを使う。
273デフォルトの名無しさん:2014/10/04(土) 09:52:16.66 ID:mOBbhaTu
そのアルゴリズムどこで知られてるの?
274デフォルトの名無しさん:2014/10/04(土) 09:54:44.14 ID:fOqpWE8p
昔のプログラム誌とかに普通に載ってたよ。
ウェブでも探せばあるでしょ。ただ今となっては古くて必要性の低い情報だから
埋もれてるかもね。
275デフォルトの名無しさん:2014/10/04(土) 10:04:20.33 ID:fOqpWE8p
ファイルしてある大昔の資料発掘してみたらC MAGAZINE 1992年5月号に載ってた。
他にも沢山あるでしょ。
276263:2014/10/04(土) 10:11:10.64 ID:klgp9hPC
>>271
>エスケープ文字ではさんでエスケープする、
>とかそのエスケープ文字自体をエスケープするときどうするんだ?

エスケープ文字って、バックスラッシュ(\)のことかい?
シェルスクリプトならこうなる

\\\\ → \\
1文字目が2文字目をエスケープ
3文字目が4文字目をエスケープ
277263:2014/10/04(土) 10:23:41.64 ID:klgp9hPC
C99, C++, GCC, make, シェルスクリプトなどの内部で、
寺尾進のTeraPadを呼び出して、文字コードを変換すればよい

Win8にも対応しているし、日本人だし、たぶん間違いない

それか、Ruby。これも作者(Matz)が日本人
278デフォルトの名無しさん:2014/10/04(土) 10:28:51.40 ID:X8tclADN
>>276
ま、ふつうはそういう風にエスケープ文字を機能定義するもんだよね‥
ところがどっこい、「『エスケープ文字』と『エスケープ文字』ではさんだその間をエスケープ対象とする」という規格が存在するんだよ‥

ASTM1394/1381‥ああいろいろばれちゃうねえ‥文字で苦労しないダメリカの規格なんかほいほい採用しちゃだめだよね‥
279デフォルトの名無しさん:2014/10/04(土) 10:31:29.66 ID:TW/R31j/
>>270
内部はでしょ?
かなりの所で表に出てくるのがどちらのコードか
http://www-06.ibm.com/jp/linux/tech/doc/007aca9b.html
勘違いしてるかな
280デフォルトの名無しさん:2014/10/04(土) 10:33:25.14 ID:yOXr2OF7
>>277
今時内部Unicodeじゃないエディタなんて・・・
281デフォルトの名無しさん:2014/10/04(土) 10:34:29.97 ID:fOqpWE8p
>>277
libiconvやらICUが普通に使われてるよ。
遅れてるのはWindowsだけだから。
282263:2014/10/04(土) 10:42:47.81 ID:klgp9hPC
そりゃ、漢字と言えば、やっぱり日本人が一番だよ
苦労しているからね

TRON、超漢字OS

そういえば、iPhoneの地図もひどいらしいね
283デフォルトの名無しさん:2014/10/04(土) 10:46:01.44 ID:fOqpWE8p
当たり前のアルゴリズムやライブラリの存在すら知らなければ、そりゃ苦労するだろうね。
284デフォルトの名無しさん:2014/10/04(土) 10:47:00.61 ID:X8tclADN
>>279
その記事あやしいよ‥win95 のFAT32 LFN はすでにUTF-16 だったと記憶しているね、結構大騒ぎになった気が
285デフォルトの名無しさん:2014/10/04(土) 11:01:31.05 ID:TW/R31j/
>>284
では信用できるところを教えて
経験上ファイル名はSJISコードだと思ってる
内部はuniだろうがね
286デフォルトの名無しさん:2014/10/04(土) 11:04:43.36 ID:j10VjSV2
まずNTFSとFAT32を区別するところから
287デフォルトの名無しさん:2014/10/04(土) 11:08:20.98 ID:X8tclADN
>>285
FAT32 では一つのファイルは ShortFileName と LongFineName の二つの名前をもち、ShortFileName は Shift-JIS, LongFileName の方は UTF-16 だったはず。
288デフォルトの名無しさん:2014/10/04(土) 11:17:11.93 ID:TW/R31j/
>>287
記事が怪しいと言うから当てになる情報聞きたかったが
FAT32で「はず」って言われても…
NTFSしか使ってないし
289デフォルトの名無しさん:2014/10/04(土) 11:18:32.58 ID:OmSkKYDb
FAT32にUTF-8で書き込むドライバがあっても驚かない
290デフォルトの名無しさん:2014/10/04(土) 11:32:40.97 ID:yOXr2OF7
>>285
> (1) Windows カーネル内部では Unicode を使用
正しい。より正確にはUTF-16LE。

> (2) NTFS ファイルシステムに保存する際は Unicode を使用
正しい。より正確にはUTF-16LE。

> (3) CIFS プロトコルによるファイル転送の際は Unicode を使用
知らん。

> (4) FAT32 ファイルシステムに保存する際は SJIS に変換して保存
まあ、間違いではない。>>287の言うとおり。

> (5) Windows 上で稼動するアプリケーションには、Windows カーネルが SJIS に変換して渡す
びみょー。
ANSI APIを使う(古い)アプリには、SJIS(正確にはCP932)に変換して渡す。
Unicode API (Wide API)を使うアプリには、UTF-16LEのまま渡す。
291デフォルトの名無しさん:2014/10/04(土) 11:40:48.79 ID:UkDdVNoH
292デフォルトの名無しさん:2014/10/04(土) 11:47:28.83 ID:X8tclADN
293デフォルトの名無しさん:2014/10/04(土) 11:58:38.01 ID:TW/R31j/
>>290
なるほど
ありがとう
294デフォルトの名無しさん:2014/10/04(土) 15:27:27.26 ID:1xUkQZ/n
http://www.dotup.org/uploda/www.dotup.org5344659.txt.html

このテキストファイルにある文字コードを逆アセンブルすると、どんな感じになるか、宜しければ教えてください。
アセンブル言語かそれよりも読みやすい形式ではどうなるのかが気になります・・・
295デフォルトの名無しさん:2014/10/04(土) 17:03:13.90 ID:X8tclADN
>>294
いったい何なんだ?
296デフォルトの名無しさん:2014/10/04(土) 17:07:30.71 ID:lwfJG00e
信州味噌
297デフォルトの名無しさん:2014/10/04(土) 17:19:02.69 ID:VuaBAyqL
>>272
おじいちゃんがそういうことをするから、
他の文字コード扱うようにしようとする若者が
苦しむことになるんだよ。

いつまでもSJIS固定の知識にしがみついてんじゃないよ。
298デフォルトの名無しさん:2014/10/04(土) 17:59:22.47 ID:X8tclADN
>>297
ごめんね、どうせ漢字コードをガラポンするんだったら、近世康熙字典等に典拠し仏典解釈にも耐え字喃をも抱合した東アジア文化圏を代表するコード体系にもって行きたかったんだが、外圧に負けてしまった
299デフォルトの名無しさん:2014/10/04(土) 18:07:22.71 ID:VR01Pkr6
つまり後世に残る技術はいくらでもありますニダ
300デフォルトの名無しさん:2014/10/04(土) 18:45:20.93 ID:qpaDPuoT
SHIFT-JIS固定ってわけでもなくて、別にUTF-8を途中から処理する技術としても使えるよな
いちいちUTF-32に直さないと何もできないと思ってるヘボも多いけど
301デフォルトの名無しさん:2014/10/04(土) 19:18:22.45 ID:Aq1dRHRh
>>298
日本人が作るとTRONコードみたいなものにしかならない
302デフォルトの名無しさん:2014/10/04(土) 19:36:35.69 ID:1xUkQZ/n
>>295
mugenってゲームのキャラクターに使われてるコードです。
どう言う内容が書かれているか解析されたら面白いかなと・・・
303237:2014/10/04(土) 19:53:35.27 ID:il6Kvmrs
>>238
Win32s用の情報になっちゃうのか…。
知りたかったのはc_932.nlsの構造なんだけど
とりあえず見てみる。ありがとう。
304デフォルトの名無しさん:2014/10/04(土) 21:07:18.31 ID:j10VjSV2
>>302
スレ違いにも程がある
305デフォルトの名無しさん:2014/10/04(土) 21:26:32.94 ID:fOqpWE8p
>>297
SJIS固定の知識ではないよ。
アルゴリズム見れば判るけど1バイト2バイト混在のエンコーディング汎用に使える。
306デフォルトの名無しさん:2014/10/04(土) 21:43:56.32 ID:X8tclADN
いわゆる半角カナはUTF-8 では 3バイトだ‥
307デフォルトの名無しさん:2014/10/04(土) 21:44:27.50 ID:fOqpWE8p
>>300
UTF-8は先頭2bit見れば切れ目は簡単に判る。
UTF-8絡みでは先頭1byteから長さを求めるこのコードが気が利いてる。
inline uint32_t utf8_char_len(uint8_t byte) {
 return(((0xE5000000 >> ((byte >> 3) & 0x1E)) & 3) + 1);
}
308デフォルトの名無しさん:2014/10/04(土) 22:08:21.15 ID:qpaDPuoT
>>307
illseq対応できない、やり直し
309デフォルトの名無しさん:2014/10/04(土) 23:52:30.72 ID:Aq1dRHRh
>>307
このやり方いいな
310デフォルトの名無しさん:2014/10/05(日) 02:42:24.51 ID:dZJgRaX6
UTF-8の1コードポイントの長さを判定するには
先頭バイトの上位4ビットと定められているのだけれど
どうしてこう妄想の糞コードをまき散らすんだろうか
311デフォルトの名無しさん:2014/10/05(日) 02:49:08.29 ID:1vv2G9lM
ビット見るとか数値を見るとか。ドヤ顔の老害がいるから
こういうことになるんだよな。正しくAPI使えよ。
312デフォルトの名無しさん:2014/10/05(日) 03:02:25.25 ID:RFQS974S
>>310 >>307は最長で4バイトと決め打ってる

>>311
UTF-8ぐらいは自前で切り分けられなきゃダメだろ、上のコードはさておき
313デフォルトの名無しさん:2014/10/05(日) 03:08:26.65 ID:1vv2G9lM
>>312
老害は空気読まないし、ゆとりはコピペでおかしいコードを拾ってくるし、
頭の悪い奴にそういうことをさせてはいかん。

知ってる、できる、というのは確かに必要だけども、
そういうのは隠しておけ。
314デフォルトの名無しさん:2014/10/05(日) 03:13:10.39 ID:uXSW8JsI
abcd???? >> 3 = ???abcd? &amp; 0x1e = 000abcd0 (2~30の偶数のみ)
だから正しい結果にならないな。
315デフォルトの名無しさん:2014/10/05(日) 03:36:10.03 ID:RFQS974S
>>314
そこは合ってる。0xE5000000から2ビットずつ切り出してるから。
問題は5〜6バイトの対応と、FE、FFを不正扱いできないこと。
実際には冗長表現やサロゲートペアを弾いたりもしないといけないし
どうせ分岐するなら最初に < 0x80 で分岐した方がいい、と
特定の入力しかこないことがわかってるときにしか使えない競技用の最適化だな
316デフォルトの名無しさん:2014/10/05(日) 03:49:15.52 ID:ybvOIS0S
>>315
Unicode規格のUTF-8は最長4バイトで
その長さの判定に不可欠なのが最初の4ビットな訳だが
何を言ってるんだ?
ついでにUTF-8の処理でなんでサロゲートペアが出てくるんだ
317デフォルトの名無しさん:2014/10/05(日) 04:11:55.69 ID:RFQS974S
>>316
>>314で抜き出されてる式を見ろ、& 0x1e で「最初の4ビット」だろ
ついでに、長さを取って終わりじゃないだろ、必ず後続バイトの処理が入るだろ
そこでサロゲートペア相当の範囲を弾いておかないと、冗長表現同様の同じ文字の別ビットパターンになってしまうだろ
318デフォルトの名無しさん:2014/10/05(日) 10:12:14.67 ID:cc3yWH/A
>冗長表現同様の同じ文字の別ビットパターンになってしまうだろ

不正なデータの処理などする必要など無いね。
アホがヒューリスティックな判定を突破されてファビョってるだけだろ。
きとんとUnicodeのencoding schemeをencoding formに変換してから文字列処理しろ。
319デフォルトの名無しさん:2014/10/05(日) 11:06:22.31 ID:SJ37vndy
>きとんとUnicodeのencoding schemeをencoding formに変換してから文字列処理しろ。
どうせ変換するんだったら最初から UTF8 より処理が楽な UTF32 にするわ
320デフォルトの名無しさん:2014/10/05(日) 11:12:14.57 ID:bqkZ4fJc
必要なのはencode formじゃなくてコードポイントへの変換
UTF8のまま処理するのはシフトJISで5Cが起こした問題を反省しない人
321デフォルトの名無しさん:2014/10/05(日) 13:20:41.46 ID:FZuSwsnO
>>320
5C だけとは限りませんぜ。>>278
322デフォルトの名無しさん:2014/10/05(日) 13:48:09.02 ID:FtNXVQE/
Cのソースも読めず、UTF-8でサロゲートペアとか言い出すのがここのレベル
323デフォルトの名無しさん:2014/10/05(日) 14:11:25.34 ID:a6/ySe32
馬鹿には無理
324デフォルトの名無しさん:2014/10/05(日) 18:12:44.43 ID:JBPweL8q
なんつーかまず仕様を勉強しろ
ビット配列が同じだからって勝手に仕様を推測しちゃいかん
325デフォルトの名無しさん:2014/10/05(日) 20:53:08.85 ID:RFQS974S
>>318の書いたソフトウェアだけは使いたくないもんだ
326デフォルトの名無しさん:2014/10/05(日) 21:27:55.58 ID:XmSTRDeP
とUTF-32で処理すべきところをUTF-8で処理して
セキュリティ脆弱性をつつかれた325が何か申しております
327デフォルトの名無しさん:2014/10/05(日) 23:59:54.62 ID:OwPAT2u/
こんな不正入力対応でできた脆弱性を突いたのが昔懐かしいNimdaだよな
328デフォルトの名無しさん:2014/10/06(月) 00:30:52.87 ID:lZkt3Im/
未だにnimdaのパケット飛んでくるけどなー
329デフォルトの名無しさん:2014/10/06(月) 00:39:14.84 ID:Vb4yB39d
>>325のPCから飛んできた
330デフォルトの名無しさん:2014/10/06(月) 14:18:04.56 ID:sZCddYLR
そういえば、コントロールな文字が例えば^Cのように表されるけど、
^^も存在するから^^と^^の見分け方はどうなるんだというのもあるようなw
331デフォルトの名無しさん:2014/10/06(月) 16:57:50.00 ID:6P/FUU8l
ボクのコンパイラはprintln(null)するとnullと出力されるんだけど
"null"との見分けはどうなるんだというのもあるようなw
332デフォルトの名無しさん:2014/10/06(月) 17:00:46.07 ID:ffXeUYxH
そういや、printfで(null)って出る理由が最初わからんかったな
333デフォルトの名無しさん:2014/10/06(月) 17:32:52.01 ID:DaOiROEZ
逆変換を考慮したプリティプリントなら、文字列だったら "null" とかだな。
334デフォルトの名無しさん:2014/10/29(水) 23:04:56.16 ID:oCDkpf7C
UTR#51ってまだレビューの始まっていない本当の下書きの段階っぽいけど
あのおっちゃんはどこから掘り出してきたんだ…
335デフォルトの名無しさん:2014/10/30(木) 00:15:31.02 ID:hHjSzwHK
ケンから送られてきただろ?
336デフォルトの名無しさん:2014/11/01(土) 22:50:16.95 ID:JvCP1jWo
ケツに見えた
337デフォルトの名無しさん:2014/11/05(水) 22:32:25.38 ID:EQuMroEp
ケンはいつになったらaj17の作業始めるのさ
338デフォルトの名無しさん:2014/11/06(木) 03:06:10.54 ID:m7lHO/KY
そんな剣呑な言い方をしなくてもいいじゃないか
339デフォルトの名無しさん:2014/11/19(水) 03:20:02.23 ID:Y+N0NUca
ttp://mojikiban.ipa.go.jp/wp-content/uploads/2014/10/20141027-6.pdf

とうとう変体仮名の符号化来るのかー
フォント屋さんはデザインが大変だ
340デフォルトの名無しさん:2014/11/19(水) 10:26:51.52 ID:DTfPg3SF
需要あるのかね。

歴史的假名遣ひやら舊字やらを必死で使ってるウヨ風味君たちでも、
その一割も変体仮名なんてまともに読み書きできないだろうにw

呉服屋のロゴタイプぐらいか。
341デフォルトの名無しさん:2014/11/19(水) 13:05:11.72 ID:lE3ruP5g
342デフォルトの名無しさん:2014/11/19(水) 13:16:20.29 ID:57B/Jrvd
でももしOS標準フォントに変体かなが入ったとしたら、「ㄘんㄘんㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ」みたいなヘタ文字遊びに使われるばかりで
本来の読み完全無視のセマンティクス大爆発で文字屋は猛烈にモニョモニョすることになるだろうなw
343デフォルトの名無しさん:2014/11/19(水) 14:31:33.53 ID:DTfPg3SF
データサイエンティスト諸兄は先日「がをられ」で爆散して、まだ再構成されてないという噂だが
344デフォルトの名無しさん:2014/11/19(水) 15:05:24.30 ID:JZ2oYyd9
MeCabが泣く
345デフォルトの名無しさん:2014/11/19(水) 15:09:40.28 ID:JZ2oYyd9
>>342
注音輸入法って言うのかそれ
346デフォルトの名無しさん:2014/11/20(木) 00:05:26.97 ID:PNit9o2K
IPAmjフォントへグリフを入れてパブコメってのは予定にないのか
MJ&amp;#12098;字情報&amp;#12032;覧表へ追加ってのは書いてあるけど
347デフォルトの名無しさん:2014/11/20(木) 06:04:14.30 ID:Y1aJUjcd
ちゃんと採用基準明確にしてからにしてほしいわ
348デフォルトの名無しさん:2014/11/21(金) 03:45:40.52 ID:5WCyankX
いまさらだけど<005C>って嫌いだぁ
349デフォルトの名無しさん:2014/11/21(金) 04:13:06.17 ID:uhFDfrMT
Windowsは游フォントではu+005cをバックスラッシュにしてほしかったな
MSフォントはもう仕方ないけど
350デフォルトの名無しさん:2014/11/21(金) 18:16:55.38 ID:M6C4Rn8T
このへんで円記号をU+A5に移行しておいた方が
今後10年後に幸せになる
351デフォルトの名無しさん:2014/11/22(土) 01:42:55.16 ID:hr7hEoH/
>>345
文字の名前は注音符号
「輸入法」はIMEのこと。
352デフォルトの名無しさん:2014/11/22(土) 12:14:09.84 ID:h3O2Jdjt
円記号はキーボードからの入力時の割り当ても変えなきゃだめだね。
右シフトの隣だけバックスラッシュに切り替えればいいんだろうけど
昔からなんとなく円記号をそっちで打ってる人、
バックスラッシュとしてBackspaceの横を使ってる人は嫌がりそうだな。
353デフォルトの名無しさん:2014/11/22(土) 19:09:41.61 ID:ShrnUmIj
Unicodeベースなのに005cに円記号グリフを割り当てているのって
もしかしてWindowsだけなのかな
354デフォルトの名無しさん:2014/11/24(月) 09:37:01.97 ID:5ViLcgqq
他にも色々あるけどさ、互換性がとかもっともらしい言ってる割には結構要らないとこで修正かけてるし、新規導入文字の策定プロセスも政治的だし、過去のミスをそのままにして自己矛盾抱えてるくらいなら一度綺麗に直しちゃえばいいのに。
355デフォルトの名無しさん:2014/11/24(月) 10:16:55.12 ID:vzSgLTQH
円記号は影響が大きいからなかなかそうもいかないと思うなあ。

だが「〜」、お前はだめだ。
356デフォルトの名無しさん:2014/12/03(水) 04:07:19.29 ID:XEiesraa
L2/14-296によると変体仮名の提案書は来春らしいな
あと香港が初のIVD登録をする予定とか
357デフォルトの名無しさん:2014/12/03(水) 05:26:12.93 ID:fecIQyAn
プログラマには関係ないだろうけど、物書き系には「引用符」がつらい。
358デフォルトの名無しさん:2014/12/03(水) 13:03:40.78 ID:3aAit+mk
つらいって?
359デフォルトの名無しさん:2014/12/03(水) 18:48:18.99 ID:dl6y7/5j
ふむ
360デフォルトの名無しさん:2014/12/04(木) 06:25:38.91 ID:IHX/i/t+
字詰めとか縦書きの文字方向とかかな
361デフォルトの名無しさん:2014/12/04(木) 06:46:51.31 ID:Fs16VGMb
ワープロソフトが「便利な」要らんことするし
362デフォルトの名無しさん:2014/12/08(月) 11:27:34.78 ID:+cdVgUEA
各国で違うしな
363デフォルトの名無しさん:2014/12/09(火) 07:12:15.07 ID:dchb1ARp
スタートダッシュで出遅れる どこまで行っても悩まされる
ところが名機か神Mac 居並ぶWindowsをごぼう抜き
ついでに機種まで振り落とす
走れー走れー文字コード 追い付け追い越せ世界標準

……俺、ついに頭がおかしくなったようだ
364デフォルトの名無しさん:2014/12/09(火) 09:56:19.30 ID:TewCEbch
せやな
365デフォルトの名無しさん:2014/12/11(木) 14:20:46.40 ID:HErT4sU5
すげー基本的かもしれないけど教えて。
windowsのサクラエディタでshift-jisとしてファイルを保存して
今度それを同じエディタで開いてutf-8のファイルとして上書き保存した。

結果として文字化けなどせずに問題ないんだけど
これは上書き保存時に中の文字がutf-8に変換されたってことなの?
366デフォルトの名無しさん:2014/12/11(木) 15:39:56.50 ID:ByVGJ4dw
>>365
桜エディタがsjisのテキストファイルを読みだしてutf-8で書き出した。
それを変換と呼ぶならいいんじゃないかね
367デフォルトの名無しさん:2014/12/11(木) 15:45:47.12 ID:MNI0BZQ+
メモリ内でのエンコーディングはいつも同じで
読込時保存時にそれぞれ変換してるだけ
368365:2014/12/11(木) 16:02:04.54 ID:HErT4sU5
>>366
>>367
どうもありがとう
すげー納得しました。
369デフォルトの名無しさん:2014/12/11(木) 19:17:24.50 ID:f28H8ZNo
SJIS->UTF8はあんまり問題にならんけど
逆は変換失敗することがあるよ
370デフォルトの名無しさん:2014/12/11(木) 22:46:17.17 ID:Im7USD7v
??????
???
?????
??
371デフォルトの名無しさん:2014/12/17(水) 22:46:29.52 ID:NB8mHIri
そりゃ一つの文字が3箇所に重複してたりするからな
372デフォルトの名無しさん:2014/12/18(木) 16:12:11.47 ID:/+kNZ4OK
尾骶骨
373デフォルトの名無しさん:2014/12/18(木) 16:15:46.29 ID:/+kNZ4OK

374デフォルトの名無しさん:2014/12/18(木) 20:12:55.55 ID:on3AHD1c
Σ
Σ
375デフォルトの名無しさん:2014/12/19(金) 03:46:35.17 ID:zB/527Ib
>>371
Ωでそれをやられるたびに、オメーガ悪い!と叫んでしまうのだよ
376デフォルトの名無しさん:2014/12/19(金) 09:56:22.42 ID:iA6Ogp4V
おー目が悪い
377デフォルトの名無しさん:2014/12/20(土) 14:32:33.33 ID:F5JzIeqB
BOMってなに?
リトルインディアンとかビックインディアンてなーに?
378デフォルトの名無しさん:2014/12/20(土) 15:27:20.90 ID:VqHS1tqD
節子それインディアンちゃう、エンディアンや
379デフォルトの名無しさん:2014/12/20(土) 18:35:53.06 ID:f3mxYTFR
>>377
ビッグインディアンはアメリカのモニュメント・バレーのナバホ族公園にそびえ立つ巨岩のことらしいよ。
リトルインディアンはアメリカの民謡だな。
380デフォルトの名無しさん:2014/12/20(土) 18:54:04.68 ID:lm8whnff
Ten little Indian BOMs!
381デフォルトの名無しさん:2014/12/20(土) 19:07:48.26 ID:e+FqSQyU
昔読んだCの本かアセンブラの本は
エンディアンの説明で
挿絵がインディアンの絵だったから
漏れもしばらく >>377 と同じ誤解してたよ
382デフォルトの名無しさん:2014/12/20(土) 19:21:19.77 ID:K4geyqtO
383デフォルトの名無しさん:2014/12/20(土) 19:28:56.02 ID:e+FqSQyU
多分それじゃないと思う
384デフォルトの名無しさん:2014/12/20(土) 19:53:49.95 ID:qPKBl4wW
ミドルインディアンがいない。やり直し
385デフォルトの名無しさん:2014/12/20(土) 20:18:45.81 ID:OFDu+jNj
ねっとわーくばいとおーだぁー
386デフォルトの名無しさん:2014/12/21(日) 03:25:32.60 ID:0WNgnvqW
頭がbomb
387デフォルトの名無しさん:2014/12/21(日) 06:32:29.37 ID:gQMH/TzB
>>382
見覚えある
388デフォルトの名無しさん:2014/12/21(日) 13:04:26.38 ID:LFWMhZfd
日本語の符号化方式の歴史をまとめた資料ってどこかにありますか?
389デフォルトの名無しさん:2014/12/21(日) 13:08:11.49 ID:bwP6+3OF
>>388
有りません。
皆、言ってることが違います。
中でも妄想が激しくて真実からほど遠いのが安岡コウイチ氏の解説。
390デフォルトの名無しさん:2014/12/21(日) 13:14:05.82 ID:Bf9LJUnb
>>388
モールス符号化あたりからなら
http://www.amazon.co.jp/dp/4320121023/
391デフォルトの名無しさん:2014/12/21(日) 13:15:01.76 ID:Bf9LJUnb
>>389
ああ、そうだったのか
有りませんってことは、雑多に読み進めるしか無いのかな
392 ◆QZaw55cn4c :2014/12/21(日) 13:43:08.14 ID:e2fIb+kJ
ここでガリバー旅行記云々カンヌン
393デフォルトの名無しさん:2014/12/21(日) 14:08:18.44 ID:/RNkRysA
でもすごいとこから持ってきたよな
内容もよくあってるw
394デフォルトの名無しさん:2014/12/21(日) 14:40:14.72 ID:5yL14jh0
とりあえず、Shift-JisとEUCとUTF-8とUTF-16ワンリルインディアンボム
だけを使うならWindows Mac Andoroidoで文字化けとか気にしないでいんでしょ?
395デフォルトの名無しさん:2014/12/21(日) 16:26:21.69 ID:0WNgnvqW
甘いな
396デフォルトの名無しさん:2014/12/23(火) 15:25:33.89 ID:ATuB6kuL
>>393
飛ぶ島ラピュタは、スペイン語で女性器
馬の国のヤフーは、ヘブライ語の「ユダヤ人」Yehudim http://ja.wikipedia.org/wiki/%E3%83%A6%E3%83%80%E3%83%A4%E4%BA%BA#cite_note-10

スイフトの当てこすりはきついね
397デフォルトの名無しさん:2014/12/23(火) 16:48:23.56 ID:pWRQK/2A
日本人だってずいぶんカリカチュア的に描かれてるしな
398デフォルトの名無しさん:2014/12/23(火) 17:21:07.92 ID:guIlJsaj
カ・・・何て?
399デフォルトの名無しさん:2014/12/25(木) 01:40:55.01 ID:hVvpBEcO
カ、カリがでかいて?
400デフォルトの名無しさん:2014/12/25(木) 07:55:48.73 ID:qKZrZOHg
絵文字について知りたいのですが
携帯電話で書いたデコメを
amebloに送ると絵文字が表示されますが
gmailで書いたデコメだと
amebloに送ると絵文字は出ることは出るのですが
レイアウトがくずれまくります
何が違うんでしょうか?
401デフォルトの名無しさん:2014/12/25(木) 09:08:25.70 ID:faeygXOh
使ってない人間が言うが、それはまず間違いなく絵文字関係ないな。
402デフォルトの名無しさん:2014/12/25(木) 09:34:52.36 ID:qKZrZOHg
絵文字のときだけ可笑しいんです
403デフォルトの名無しさん:2014/12/25(木) 10:21:02.73 ID:3E8dV8L4
その絵文字フォントが、表示アプリ(いわゆるブラウザ、メーラーなど)に対応してないんだろ。
404デフォルトの名無しさん:2014/12/25(木) 10:58:27.39 ID:Y5il8ylR
使ってないのにレスすんなω
405デフォルトの名無しさん:2014/12/25(木) 11:33:38.39 ID:NGKeja9v
以下無人
406デフォルトの名無しさん:2014/12/25(木) 12:48:52.06 ID:3E8dV8L4
>>404
ごめんなさい。
407デフォルトの名無しさん:2014/12/25(木) 13:29:04.72 ID:AQTw17vV
そもそも文字じゃなくて絵なんじゃないかと。
408デフォルトの名無しさん:2014/12/25(木) 13:38:01.48 ID:3E8dV8L4
AAがズレるみたいな?
409デフォルトの名無しさん:2014/12/26(金) 02:44:58.63 ID:3IRAqeR8
携帯電話は大体ドコモのせいでShift_JISラブになってしまって
絵文字を外字として登録したのがそもそも間違いの始まり
410デフォルトの名無しさん:2014/12/26(金) 07:20:40.98 ID:GRWnXRDO
その後のゴタゴタを携帯キャリア同士で解決せずUnicodeに持ち込んだアホは万死に値する。
411デフォルトの名無しさん:2014/12/26(金) 07:25:31.95 ID:GRWnXRDO
>>389
言ってることが人それぞれ違うとしながら真実から程遠い遠いと評するのは、真実が書かれた資料があると言いたいのか、矛盾してでも安岡のアホを批判したいのかどっちなんだ?
後者だろうけど。
412デフォルトの名無しさん:2014/12/26(金) 09:26:49.39 ID:ZuUtgKR9
デコメは文字じゃないだろ
413デフォルトの名無しさん:2014/12/26(金) 10:17:26.37 ID:pCqxNpIs
>>410
キャリアは「入れたければどうぞ」みたいなスタンスだった気が。
414デフォルトの名無しさん:2014/12/26(金) 10:26:27.67 ID:vVR74RNM
絵文字がUNICODEになるとは予想してなかったが
増え続ける絵文字をどうせえと
415デフォルトの名無しさん:2014/12/26(金) 11:54:56.85 ID:CmrZLX32
そもそも絵文字が生まれた頃は、携帯で文中に画像埋め込んで送受信するとか負担大きすぎるから、苦肉の策で文字として実装した
一時絵文字の豊富さを競争しかけた頃があったけど、その後キャリアは絵文字を増やすんじゃなくデコメを作ってそっちにシフトした
すでにユーザーも絵文字からデコメに移行済みだった
絵文字は緩やかに死ぬはずだった
それなのに文字オタクのアホが絵文字だけを見て考えなしにUnicodeに突っ込んだ
やるなら絵文字を完全に殺して、デコメのオープン標準規格を作ればよかった
416デフォルトの名無しさん:2014/12/26(金) 12:12:12.13 ID:U37YhbAO
筋違いもいいところだ。
恨むなら、何もしなかった・できなかった、現状追認すらまともにできないクソ国内キャリアどもを恨めw
Googleもたいがいクソだが、この件では可能な限りの仕事をしたと思うぞ。
417デフォルトの名無しさん:2014/12/26(金) 13:57:11.80 ID:KN+qDrDJ
中のひとですねわかります
418デフォルトの名無しさん:2014/12/26(金) 21:53:37.43 ID:eFIqVV4r
スマートフォンはUnicodeで絵文字使うから、ローカル規格のデコメとやらも勝手にやれば良いじゃん。
419デフォルトの名無しさん:2014/12/26(金) 22:47:40.34 ID:MBLjX4KZ
デコメールをパソコンで見る方法って?
420デフォルトの名無しさん:2014/12/27(土) 12:02:27.25 ID:8H3WtYVY
クソキャリアに何を期待してるんだ
421デフォルトの名無しさん:2014/12/27(土) 12:05:26.98 ID:dTLO/MuG
土管さえあればいいです
422デフォルトの名無しさん:2014/12/28(日) 21:07:09.77 ID:HTXTh3CW
外字で使われていた分をUnicodeへ入れたところまではよかったけど
今やgoogleのおもちゃに成り下がった
タコスだのホットドッグだの用例もないのに「ほしいから入れる」なんて
理屈がまかり通ってる
423デフォルトの名無しさん:2014/12/29(月) 01:39:43.66 ID:sbGcuVzL
しかしそこを突っ込んだところで、
AndroidでPUAに並べてほら実装例、みたいにされたら
むしろ今以上に好き勝手できそうだな。
424デフォルトの名無しさん:2014/12/29(月) 11:58:00.77 ID:bj0t/8Ju
いまさら何を言ったところで、まともに対応できなかったからおもちゃを取り上げられた子供が
ダダをこねてる、としか見られないしなw
425デフォルトの名無しさん:2014/12/30(火) 01:31:49.26 ID:qC3hgECd
欲しいから入れるは酷いが、
文字として日本国内では相当広く使われていた携帯(ポケベル)絵文字を、
Unicodeに登録して何が悪いのだ。
元に使われていたんだから仕方ないじゃないか。
docomo-2005とか、Unicodeとは無縁のShift_JIS亜種CESを増やした方が良かったというのか。
426デフォルトの名無しさん:2014/12/30(火) 01:32:22.04 ID:qC3hgECd
元に→現に
427デフォルトの名無しさん:2014/12/30(火) 11:02:25.27 ID:S+Hw3V6p
<旗記号>JP<旗記号>
428デフォルトの名無しさん:2014/12/30(火) 11:06:56.71 ID:XwsmG+J3
����
429デフォルトの名無しさん:2014/12/31(水) 00:05:16.96 ID:4YdVXmZC
>>413
ドコモは文字の色でイチャモンつけてた
http://slashdot.jp/journal/503205
430デフォルトの名無しさん:2014/12/31(水) 02:31:36.90 ID:hEDPFzeA
一方auはあっさり自前を捨ててドコモ絵文字に乗り換えた。

せっかく作った変換マップ涙目。
431デフォルトの名無しさん:2014/12/31(水) 22:26:08.89 ID:F+4v4RJx
>>430
いや、過去に携帯同士でやり取りされてたメールの表示に必要だから。
機種ごとの違いとか足りないところもあるけど非常に重要な情報。
メーカーから情報が出ない限り、今後まとめる人間はもう出てこないだろう。
あの提案にまとめられた資料はグッドジョブとしか言いようがない偉業。
432デフォルトの名無しさん:2014/12/31(水) 23:21:22.40 ID:U0APx8aX
一時期のauは絵文字が豊富なことを売りにしてたな懐かしい
433デフォルトの名無しさん:2015/01/01(木) 01:24:51.02 ID:XiF24rSN
auって数年おきに絵文字デザインが別物になってたな
434 【大吉】 :2015/01/01(木) 06:37:14.61 ID:Sx9cr3wk
ドコモの「マル秘」って○じゃないんだなw
435デフォルトの名無しさん:2015/01/01(木) 07:23:04.70 ID:xYbX6ZrA
>>431
自己満すなぁ…
436デフォルトの名無しさん:2015/01/01(木) 10:58:58.29 ID:1jsEGgHD
腐すだけってラクな生き方だよな
437デフォルトの名無しさん:2015/01/01(木) 12:49:47.71 ID:xYbX6ZrA
コワイよー鏡に向かって何かブツブツ呟いてる奴がいるよー
438デフォルトの名無しさん:2015/01/01(木) 17:51:42.11 ID:csiou4G7
>>410
googleと結託して絵文字をUnicodeに持ち込んだの安岡だろ
439デフォルトの名無しさん:2015/01/01(木) 22:35:07.02 ID:A76EEkVS
>>438
提案書も規格書も読んだことない馬鹿発見。
440デフォルトの名無しさん:2015/01/04(日) 01:20:05.39 ID:0PWdrMwO
JIS信者の安岡氏はUnicodeに関して
便所の落書き以上の業績を残したことはありません。
441デフォルトの名無しさん:2015/01/04(日) 20:40:59.56 ID:2n2BUP4o
TRON信者のキチガイが復活したか。
>>437 という自己紹介のキチガイ野郎といい、文字コードはキチガイの巣だな。
442デフォルトの名無しさん:2015/01/04(日) 22:05:59.02 ID:MES8npFQ
復活というかあの人ずっといる気がする
443デフォルトの名無しさん:2015/01/05(月) 00:05:02.23 ID:yfwC92/+
どう考えても安岡はそのキ○ガイの筆頭な件
444デフォルトの名無しさん:2015/01/05(月) 08:12:32.63 ID:3J2GSmZ2
ほら出た
445デフォルトの名無しさん:2015/01/05(月) 09:32:37.24 ID:R0XkFNG2
スラドでぶつぶつ言ってると相手してくれるメディアがスラドしかないのかよと思う。
446デフォルトの名無しさん:2015/01/05(月) 09:54:01.58 ID:3J2GSmZ2
2chでぶつぶつ言ってるだけの、世界の誰にも相手にされてないおまえのようなバカどもはどうなんだよw
447デフォルトの名無しさん:2015/01/05(月) 10:02:42.65 ID:eWacIfnz
土方は雲の上の喧嘩なんか、知らんがな、出されたものは食うがな
448デフォルトの名無しさん:2015/01/05(月) 13:13:47.87 ID:B88/unJs
安岡が嫌いで、安岡は絵文字にほとんど何も貢献してないから駄目というのならまだ分かるが、
(彼はGoogleとAppleが絵文字をUnicodeコンソーシアムに提案する前に、
各キャリアの絵文字対応表を作りかけて挫折した)
安岡が絵文字をGoogleと一緒に推進したとか意味不明だな。
大きく寄与した日本人は他にいるだろ。
449デフォルトの名無しさん:2015/01/05(月) 13:59:24.74 ID:V1obRSYW
いやあ、照れるなあ
450デフォルトの名無しさん:2015/01/05(月) 18:18:04.30 ID:R0XkFNG2
>>446
普通の人なんで研究者と同じレベルで相手されなくていいです。
451デフォルトの名無しさん:2015/01/05(月) 18:52:30.10 ID:PnP0yTvN
「巫」を人名用漢字に追加するだけのことに
なぜあんなシャカリキになれるんだ
452デフォルトの名無しさん:2015/01/05(月) 21:53:54.28 ID:3J2GSmZ2
> 普通の人なんで研究者と同じレベルで相手されなくていいです。

普通の人じゃなくてバカだから。自覚ないようだけど。
453デフォルトの名無しさん:2015/01/06(火) 10:06:52.51 ID:mEZ+Y0Rx
>>452
別に馬鹿だから相手にされてなくても困らないけど
先生が相手されてないのは困るでしょ?
454デフォルトの名無しさん:2015/01/06(火) 11:09:22.27 ID:GZKmSjYi
本人は困ってないように見える
455デフォルトの名無しさん:2015/01/08(木) 05:37:38.99 ID:1hURildE
>>425
何が悪いってキャリア同士の互換性問題をUnicode に持ち込んだ事だよ
そんなのはキャリア同士で解決すべきだしそういう動きもあった
ラウンドトリップの保証を捨てた事が許せん
456デフォルトの名無しさん:2015/01/08(木) 09:24:08.59 ID:PNOntX36
なるほど
457デフォルトの名無しさん:2015/01/08(木) 12:14:21.23 ID:vj7cQMWH
「動きもあった」じゃなくて「動こうとするそぶりが無かったわけでもなかった」だろw
結局動かないことでは定評のあるキャリア共じゃないかw
458デフォルトの名無しさん:2015/01/08(木) 12:18:38.99 ID:qIfkunGX
日本が戦争に負けた理由でもある
459デフォルトの名無しさん:2015/01/08(木) 18:45:59.20 ID:1f5/W2kS
>>455
emojiはprivate-use charactersじゃんか。
460デフォルトの名無しさん:2015/01/08(木) 21:55:46.06 ID:9AZtbOER
過去にauやソフトバンク(←ボーダ←J)の絵文字デザインがごっそり変わってもさほど混乱も起きなかった経緯があったんだから、
少なくともUnicode採用前の絵文字はそういう大雑把なものだったと思う。

既存メール等の厳密なニュアンスを維持するために複雑怪奇な変換テーブルを用意したりするよりも、
ニュアンスの近い絵文字同士を半ば無理やり同一扱いとした「Unicodeおよび各キャリア同一基準の新絵文字」を取り決めて、
端末側では新機種から勝手に切り替えればそれが一番すっきり済んだ気がしなくもない。
461デフォルトの名無しさん:2015/01/08(木) 22:21:01.55 ID:ah6saDRa
そのりくつだと
>>460が道で刺し殺されても
日本に大した混乱が起きるわけではないから問題ないな
462デフォルトの名無しさん:2015/01/08(木) 23:33:54.39 ID:9AZtbOER
いやどういう理解だよ…
なんで俺刺殺されるの…

デザイン変更の影響を受けた人が無数にいるにもかかわらず混乱が起きなかった例を前提で話してるんだから、
事件で例え直すなら日本中で無数に事件が発生してるのに混乱してないって話だよ。俺だけ殺さないでよ。
463デフォルトの名無しさん:2015/01/09(金) 05:18:46.40 ID:GY8OB6f3
>>459
464デフォルトの名無しさん:2015/01/09(金) 06:23:07.14 ID:GHJOtrq4
ラウンドトリップは大事だけど
「〜」の問題とかは絵文字の前からあったみたいだし
「ラウンドトリップは絶対死守」とかは無理な気がする
もちろんそうあって欲しいとは思ってる
465デフォルトの名無しさん:2015/01/09(金) 06:24:21.94 ID:GHJOtrq4
>>462
放射能ですね判ります
466デフォルトの名無しさん:2015/01/09(金) 07:52:32.65 ID:R4ppVUkj
誰かが交通整理したり旗降ったりしなきゃいけないのは確かだけれど
文字コード関連って他分野では活躍できないB級人材が集まってワヤワヤやってんのがありありとみてとれて
きちゃない関わりあいたくない感じなんだよね
467デフォルトの名無しさん:2015/01/09(金) 07:55:58.37 ID:50+lIvWd
なるほど
一理ある
468デフォルトの名無しさん:2015/01/09(金) 12:41:25.09 ID:G9m/YjUS
>>466
そりゃサーベイくらいのレベルでしか見てないからじゃない?
言語学者も参加して結構専門的な議論してるケースもあるよ。
469デフォルトの名無しさん:2015/01/09(金) 18:26:00.03 ID:z189ptbm
チョーサとサーベイって何か違うの?
470デフォルトの名無しさん:2015/01/10(土) 06:45:28.32 ID:fUErtY0e
>>468
それは登録に際して言語学的な判断が必要な文字だけだろ
歴史的な経緯を差し引いても尚いい加減な基準で登録するからどんどん複雑怪奇な仕様になってる
旗振りがダブスタというかポンコツなんだよ
バージョンの互換性保証を守りたいやつもいるけど、今でも例示字形差し替えたり色々崩してるんだし、どこかのバージョンで仕切り直して過去に指摘されたミスの修正すればいいのに。
471デフォルトの名無しさん:2015/01/13(火) 11:47:36.65 ID:i3Lxjaiq
例示文字の差し替えは別に問題ない。
472デフォルトの名無しさん:2015/01/14(水) 18:00:18.03 ID:VkuOu9jz
でも実質フォントの基準になってるし
473デフォルトの名無しさん:2015/01/15(木) 11:09:55.15 ID:R+gHXs32
だからどうということはない。
474デフォルトの名無しさん:2015/01/19(月) 03:54:05.78 ID:55ZE78X8
雑談になるが、中国で繁体に戻そうという動きがあるんだそうだね。
475デフォルトの名無しさん:2015/01/19(月) 11:12:49.00 ID:CzsUjspG
そんなことがあれば、間違いなく臺灣とは違う字体にしてくるだろうな。
476デフォルトの名無しさん:2015/01/19(月) 13:25:18.78 ID:KroxEeJe
學校
國體
477デフォルトの名無しさん:2015/01/20(火) 14:28:25.64 ID:yv66EBMN
>>474
へぇ!
478デフォルトの名無しさん:2015/01/25(日) 20:31:55.02 ID:NPlvEVjr
>>476
タテ読みドコ?
479デフォルトの名無しさん:2015/01/26(月) 00:08:44.20 ID:CeKI7K9w
國體護持(こくたいごじ)
480デフォルトの名無しさん:2015/01/26(月) 00:09:49.15 ID:CeKI7K9w
颱風
481デフォルトの名無しさん:2015/01/26(月) 10:46:36.00 ID:o6RBMBnt
ジパ
|ン
482デフォルトの名無しさん:2015/01/27(火) 01:21:54.85 ID:CCrVgF1k
モンゴル人「ジーパン?」
483デフォルトの名無しさん:2015/01/27(火) 03:48:16.79 ID:HbxIHmvo
普段使いとしてJIS2004の字形を使ってますか?
484デフォルトの名無しさん:2015/01/27(火) 08:26:04.24 ID:PB84DGgu
まだまだUnicode非対応のソフトが多いのは難点だな
特に ttp://www.lifeboat.jp/products/alog2/index.php と同じタイプの市販ソフトは未だにシフトJISコードしか扱えないものばかり
仮にもセキュリティ系で、この現状はマジで勘弁してほしいんだが
485デフォルトの名無しさん:2015/01/27(火) 08:32:28.51 ID:Dg/XO2cm
同意します
486デフォルトの名無しさん:2015/01/27(火) 08:38:32.81 ID:93ZC9Ewu
初心者です。
とあるプログラミングの問題なのですが、

a = 0;
for (i = 0; i < 5; i++) {
a = a + 1;
if (i > 2) {
break;
}
}
を実行したとき、aの値は?

の解答が4となっています。
どう考えても3回しか実行されないと思うのですがなぜ4になるのでしょう?
モヤモヤしてやばいです。
487デフォルトの名無しさん:2015/01/27(火) 09:09:33.08 ID:Dg/XO2cm
スレ違い
488デフォルトの名無しさん:2015/01/27(火) 09:30:29.35 ID:TXI43U21
i : 0, 1, 2, 3, 4
a : 1, 2, 3, 4 のとき break
489デフォルトの名無しさん:2015/01/27(火) 10:14:59.86 ID:93ZC9Ewu
スレ違いでしたかすみません。
初投稿なものでどこで質問していいか分からなくて...
iが3の時にもa+1は実行されるのですね、ややこしい...
490デフォルトの名無しさん:2015/01/28(水) 22:34:55.79 ID:BBWATyRQ
PDAM2.2はフルボッコか
この調子でPDAM2.3では誓願emojiもrejectかpostponeしてもらいたい
491デフォルトの名無しさん:2015/01/28(水) 23:04:44.09 ID:L0TA3+eA
アスキーアート極まった感ある
http://kai-you.net/article/12834
492デフォルトの名無しさん:2015/01/28(水) 23:25:13.79 ID:TQfjTIzA
AAってフォントが変わってもなんとなく分かるのが良さだと思うんだが
それを他環境で見るとどうなるのか気になる
493デフォルトの名無しさん:2015/01/29(木) 01:42:54.26 ID:u90jgBYa
大小があったら負けかなという気がする
494デフォルトの名無しさん:2015/01/29(木) 08:12:29.38 ID:8k6H8xeW
>>491
>「iPhoneに組み込むように」と孫正義さんがスティーブ・ジョブズさんを説得したというエピソード

これ都市伝説だろ
495デフォルトの名無しさん:2015/01/29(木) 08:16:49.64 ID:8k6H8xeW
>>492
絵文字として認識できるかどうかはどうでも良くて

山下清的アートを楽しむのが目的みたいだから
他環境のことはどうでもいいんだと思う

すぐ廃れるな
496デフォルトの名無しさん:2015/01/29(木) 08:18:08.62 ID:8k6H8xeW
むしろ魚偏の字をあつめて
グレイスケールの絵を描くみたいな
昔あったのに似てる

そんなの一時流行って終わりになる
497デフォルトの名無しさん:2015/01/29(木) 10:52:49.21 ID:w7ms7Ild
アスキーアート自体は60年代からあるし、なくならないけどな。流行り廃りはあるわな。
498デフォルトの名無しさん:2015/01/29(木) 11:03:56.72 ID:8k6H8xeW
それは知ってるが
AAって今は流行ってないだろ
:-) とかはまだ使ってるひと居るが
これは AA じゃないだろ
499デフォルトの名無しさん:2015/01/29(木) 11:36:44.90 ID:VqMHT2nM
smileyもascii artの一種
500デフォルトの名無しさん:2015/01/29(木) 15:08:54.43 ID:u90jgBYa
MS-DOSのころに、モノクロ画像をAAに変換するソフトってのがあったな、と
検索したら、今でもあるんだね。
501デフォルトの名無しさん:2015/01/29(木) 15:47:15.18 ID:TYTLl9KK
昔作ったけどソースどっかいった
502デフォルトの名無しさん:2015/01/29(木) 17:06:15.51 ID:8dKIdKoz
img2txt
img2ascii
503デフォルトの名無しさん:2015/01/30(金) 04:22:42.54 ID:QG41LqjU
自由配置可能なスタンプ機能がある環境だったら大抵同じようなことやってるじゃん
504デフォルトの名無しさん:2015/01/30(金) 06:02:32.78 ID:HwiqlkLu
1x1 ピクセルの <td> 書きまくって
テーブルでグラフィックしてた時代を思い出したゎ
505デフォルトの名無しさん:2015/01/30(金) 20:03:55.28 ID:b+DqtdDL
そういえば小学生の頃マリオペイントでやってた
506デフォルトの名無しさん:2015/01/31(土) 19:24:17.88 ID:No0xtwOK
絵文字の行く先は埋め込み画像
ますますカオス
そのうち文字もそうなるんじゃね?
http://internet.watch.impress.co.jp/docs/special/20150131_686161.html
507デフォルトの名無しさん:2015/01/31(土) 19:35:20.87 ID:RJPYPzSg
Appleは絵文字フォントには注力するけど
日本語フォントはいまだに11年前のAJ16準拠
508デフォルトの名無しさん:2015/01/31(土) 20:17:28.67 ID:YzWkWj5e
ちなみにApple Watchの絵文字は3Dで動いてインタラクティブ
文字オタども3D絵文字とインタラクティブ絵文字の規格もさっさと作れよ
509デフォルトの名無しさん:2015/01/31(土) 21:16:37.05 ID:GSzQXuKu
いつのまにか system locale で絵文字の肌の色まで変わる時代になってたのかω
510デフォルトの名無しさん:2015/02/01(日) 20:00:14.50 ID:uNtgwaTX
それって人種と言語・国籍を混同するな、みたいなクレームはないってことか。
日本人的にはどこがNGでどこがおkなのかよくわからん。
511デフォルトの名無しさん:2015/02/02(月) 14:44:15.78 ID:53k9SdBX
>>507
JIS X 0213の非互換性問題で中の人の気力尽きたんじゃないか?
512デフォルトの名無しさん:2015/02/02(月) 14:49:50.90 ID:53k9SdBX
>>506
> 飛行機を表すのに英語なら「p l a n e」と5回キーを押さねばならないが、絵文字なら「??」1回で済む。
> こうした絵文字の持つ「筆記の経済性」が、入力しづらいスマートフォンで歓迎され、
> 多くのユーザーを惹きつけることとなった。

この人はスマートフォン向けAPLキーボードでも持っているんだろうか。
513デフォルトの名無しさん:2015/02/02(月) 15:09:29.69 ID:V6TcMC53
顔文字の肌の色をTone Modifierで変える例にスマイルマークが使われているが、
これが黄色なのはemoji発足させた日本人が黄色人種だからと思ってるんじゃないだろうな?
というクレームはないのだろうか?
514デフォルトの名無しさん:2015/02/03(火) 02:29:22.31 ID:pt2+RdEd
Andrew WestのツイートによるとWG2のドキュメントは
もう>>9には追加されないとか
515デフォルトの名無しさん:2015/02/05(木) 00:13:16.01 ID:MfA9uand
http://dx.doi.org/10.1241/johokanri.57.799
>2014年度中に変体仮名の整備を行うこととした。

えっ? あと2ヶ月?
516デフォルトの名無しさん:2015/02/07(土) 01:01:24.32 ID:PXFI24n+
変体仮名の提案書がwg2にポストされても関係者以外にはもうわからないのか…
517デフォルトの名無しさん:2015/02/07(土) 09:06:31.87 ID:m/txggBl
変体仮名をUnicode だけのために整理しても意味ないじゃん
518デフォルトの名無しさん:2015/02/07(土) 12:10:06.30 ID:Omk+gQK3
>>517
Unicode向けに整備されたら、それがリファレンスになるじゃないか。
519デフォルトの名無しさん:2015/02/07(土) 23:03:15.43 ID:GrUGQKAo
520デフォルトの名無しさん:2015/02/08(日) 20:59:15.01 ID:ExBLSnNg
次のWG2は10月だから年度内に変体仮名の提案がまとまるなら
パブコメ募集をやるだけの時間的猶予はありそうだけどさてどうなるやら
521デフォルトの名無しさん:2015/02/18(水) 00:11:36.77 ID:SODib5vf
国旗の絵文字って大騒ぎした割に使われてないよね
そもそもフォントないし
ISISのは収録されないかな
522デフォルトの名無しさん:2015/02/18(水) 02:02:28.53 ID:CWKh4Lrx
3166に割り当てられれば収録されたことになるんじゃね
523デフォルトの名無しさん:2015/02/19(木) 22:01:15.49 ID:nVZCv6jV
絵文字の符号化って日本じゃ某ライターが騒いでるだけだしな
524デフォルトの名無しさん:2015/02/19(木) 22:37:08.57 ID:3MTaI8xl
小形さんってライターなのか?
525デフォルトの名無しさん:2015/02/20(金) 03:37:06.63 ID:MaMubtWS
RT職人
526デフォルトの名無しさん:2015/02/20(金) 07:55:55.13 ID:21cSDMnR
絵文字職人の朝は早い。
527デフォルトの名無しさん:2015/02/26(木) 18:13:01.52 ID:owhsGahs
RT絵文字職人さんあなたがwg2に出したのはproposalじゃなくて
feedbackですよっと
528デフォルトの名無しさん:2015/03/01(日) 00:08:36.94 ID:7WZWmdIJ
ライターが入ってない
529デフォルトの名無しさん:2015/03/04(水) 00:15:36.29 ID:XiUc/ocD
http://kasamashoin.jp/2015/03/2620153201f.html
>2015年3月20日(金)
>京都大学人文科学研究所本館1Fガラス張りセミナー室
>15:10〜15:55 なぜ、WAVE DASH (U+301C)例示字形はずっと修正されなかったのか
530デフォルトの名無しさん:2015/03/04(水) 07:54:33.69 ID:UWB+qgaN
(うさぱら)←なにこれ?
531デフォルトの名無しさん:2015/03/06(金) 15:47:47.95 ID:c99ba3kA
WAVE DASH (U+301C)の字形が修正されても
どうせWindowsが出すのは相変わらずU+FF5Eなんでしょう?
いや今更変えられても困るけど。
532デフォルトの名無しさん:2015/03/06(金) 16:55:59.31 ID:IsNTjd9u
U+FF5Eのグリフを高い位置にずらしてくれれば別にいい
533デフォルトの名無しさん:2015/03/06(金) 18:44:42.24 ID:Ff67jPYI
そりゃUnicode規格のマッピングで定義されてるからね
534デフォルトの名無しさん:2015/03/06(金) 18:51:52.96 ID:9PddSxv0
MS-IMEでは環境依存文字扱いだからなあ
535デフォルトの名無しさん:2015/03/06(金) 19:08:14.62 ID:7hSPkkPD
そもそも縦書き用のグリフを倒す方向間違えたとかなさけない理由だったな
536デフォルトの名無しさん:2015/03/08(日) 12:34:26.53 ID:lAgJjzbb
301Cの字の形が修正されようと
Unicodeコンソーシアムが出しているシフトJISマッピング表で
FF5Eなのは1991年から変わらないんだろ?
537デフォルトの名無しさん:2015/03/09(月) 03:16:41.56 ID:4qtnbUP7
538デフォルトの名無しさん:2015/03/09(月) 09:20:08.80 ID:CRFMLrc+
>>> print u'\u301c'.encode('mbcs')
?
>>> print u'\uff5e'.encode('mbcs')

>>> print u'\u301c'.encode('cp932')

>>> print u'\uff5e'.encode('cp932')
539デフォルトの名無しさん:2015/03/09(月) 14:42:08.95 ID:MIZIuI1f
>>529
小形克宏
UnicodeのWAVE DASH例示字形が、25年ぶりに修正された理由
http://internet.watch.impress.co.jp/docs/special/20150307_691658.html
>>537
Windowsもバージョンによって違うからCP932も細分化が必要なのかもね。
540デフォルトの名無しさん:2015/03/09(月) 15:16:01.92 ID:SgNhNQ2Z
ふむふむ
541デフォルトの名無しさん:2015/03/09(月) 17:16:42.83 ID:NnzyOe/j
イイハナシダナー
542デフォルトの名無しさん:2015/03/09(月) 17:51:01.21 ID:Ty62vxCH
>>539
例示字形の修正云々より
JISもUnicodeも最初はほとんど直線みたいな“波”だったのに
年月が経つにつれ“波”の幅が大きくなってるのが面白い
543デフォルトの名無しさん:2015/03/09(月) 22:54:52.09 ID:vwLJKhDI
>>537
オブソなモンを混ぜるなよ
544デフォルトの名無しさん:2015/03/11(水) 01:08:34.82 ID:j1w4ocLD
オブソとかオプソとか
545デフォルトの名無しさん:2015/03/11(水) 09:34:03.15 ID:ZGeJG/a0
すこし早いとおもうけど、とりあえず移転用の土地にプレハブだけ立ててきた
使うかは各自自由の方向で
文字コード総合スレ part10
http://
ne   xt
2ch.net/tech/1426032327

もしもっとよさげな土地があれば指摘たのむ
(ネガキャンとか宣伝うんぬんじゃなくて、単なる候補地確保。あしからず)
546デフォルトの名無しさん:2015/03/11(水) 10:14:31.56 ID:3uN2N73I
宣伝乙
もうStackOverflowで間に合うからなぁ
547545:2015/03/11(水) 10:29:54.55 ID:ZGeJG/a0
おーぷんとかしたらばも候補としてあるんだが
SOコメントでの雑談禁止だからなぁ
むしろSOにbbsがあればム版自体必要ない気が
内容によってはSUとSFに強制移転させられるかもしれんが
548デフォルトの名無しさん:2015/03/11(水) 16:02:51.62 ID:W4WrZXob
SO?SU?SF?
549デフォルトの名無しさん
StackOverflow,SuperUser,ServerFault