【社会】ウェブサイトの60%以上がすでにUnicodeに

このエントリーをはてなブックマークに追加
1 ◆SCHearTCPU @胸のときめきφ ★
米Googleは3日(現地時間)、公式ブログでウェブ上で使われている文字コードについての
調査結果を発表した。世界共通のコードであるUnicodeが急速に普及していることがわかった。

コンピューターでは文字にコードを割り当てて管理、表現している。このコードはそれぞれの
言語圏で独自に作成されたため整合性、互換性がなかった。インターネットが普及すると
統一されていない文字コードはトラブルを引き起こし、いわゆる文字化けの大きな原因となった。

Unicodeは全世界の文字を単一の規格にまとめたもので、1980年代に誕生した。
つまりインターネットの普及以前だが、当初はほとんど使用されなかった。
今回のGoogleの発表によれば、2001年にはほとんど0%だったUnicodeが少しずつ
使われるようになり、2005年ごろからは急速にU普及している。入れ替わるように
それまでもっとも多かったASCIIが減少している。

日本で長らく主流だったシフトJISは緩やかに減少傾向にあり、日本語のウェブサイトでも
Unicodeが使われることが増えている。

*+*+ RBB Today +*+*
http://www.rbbtoday.com/article/2012/02/04/85950.html
2名無しさん@12周年:2012/02/05(日) 06:39:41.68 ID:ZE3ekzo20
U普及しちゃいなよ
3名無しさん@12周年:2012/02/05(日) 06:41:21.26 ID:NzOjNiYQ0
生理
4名無しさん@12周年:2012/02/05(日) 06:43:38.95 ID:FJ44q1zj0
文字コードには泣かされたわ。
5名無しさん@12周年:2012/02/05(日) 06:49:13.92 ID:JZOMmaNr0
何も知らずに使ってた
6名無しさん@12周年:2012/02/05(日) 06:51:40.66 ID:rMga3+mS0
> 日本で長らく主流だったシフトJIS
ていうかシフトJISはやめとけって (´・ω・`)
7名無しさん@12周年:2012/02/05(日) 06:55:28.46 ID:rc19/yLe0
Shift-JISとかEUC-JPとか、何の冗談かとw
8名無しさん@12周年:2012/02/05(日) 06:55:50.88 ID:B2RyP4lj0
ウニコードって朝鮮人がハングルを全部割り当てろってゴネて頓挫しかけたんだよな
ハングルってひらがな程度の文字数かと思いきや漢字並みに多い
人口が少ないのに文字が多くてじゃま、とても迷惑な話
9名無しさん@12周年:2012/02/05(日) 06:57:12.77 ID:WdNPAIC80
シフト使ってるわ

ユニに変えるわ
10名無しさん@12周年:2012/02/05(日) 06:57:36.69 ID:SuZcIWE+0

日本以外の国の話だろw
11名無しさん@12周年:2012/02/05(日) 07:01:42.37 ID:4109gNzQ0
日本ではホームページビルダーのせいで8割がシフトJISだな。
12熊襲:2012/02/05(日) 07:03:10.64 ID:6Jal6MSY0
データ移行の時、漢字処理には泣かされた。
13名無しさん@12周年:2012/02/05(日) 07:04:11.14 ID:B2RyP4lj0
朝鮮が消滅すれば、ハングルの広大なエリアを特殊文字に使える
顔文字だったり〠⇔♬みたいなマークだったり
それでインターネットの世界はどんだけ豊かになれるか
つまりどんだけ朝鮮人が邪魔かって話
14名無しさん@12周年:2012/02/05(日) 07:04:25.93 ID:wMIyun4t0
UTF-8ってなに??
15名無しさん@12周年:2012/02/05(日) 07:05:41.19 ID:OAj/yZaj0
>>11
俺が使ってるDreamweaver8もデフォはshift_jisだよ
16名無しさん@12周年:2012/02/05(日) 07:07:33.17 ID:IM83sdgO0
まともなスプリクトはunicodeで書かれてる時代だしな。
17名無しさん@12周年:2012/02/05(日) 07:08:55.68 ID:5ZXzswIy0
XML関連の国際化がSJISに付き合ってくれないので
18名無しさん@12周年:2012/02/05(日) 07:09:00.08 ID:rMga3+mS0
>>7
EUCってまだ使われてるの?
19名無しさん@12周年:2012/02/05(日) 07:09:10.08 ID:B2RyP4lj0
MSが推進してたUnicodeは2バイトで256x256文字が割り当て可能だが
それで世界の文字が収まったのか?
20名無しさん@12周年:2012/02/05(日) 07:10:10.68 ID:/6W23kf70
とにかくEUC-JPはやめてほしいわ
なんでペパボはEUC-JPなんだよアホか
21名無しさん@12周年:2012/02/05(日) 07:10:26.24 ID:rc19/yLe0
>>18
一族の伝統みたいな感じで生き残ってるよ
22名無しさん@12周年:2012/02/05(日) 07:13:27.02 ID:vs/wgKQv0
>>19
サロゲートペアでぐぐれ
23名無しさん@12周年:2012/02/05(日) 07:16:30.58 ID:/6W23kf70
もうwebは全部UTF-8にしてしまえや
24名無しさん@12周年:2012/02/05(日) 07:20:18.89 ID:rMga3+mS0
>>21
そうなのかありがd
移行しちゃえばいいのにとか思っちゃうわけだけど
そーゆーとこはいろいろ面倒な理由あるんだろうなあ
25名無しさん@12周年:2012/02/05(日) 07:20:35.51 ID:a+4MkF8j0
(´・∀・`)ヘー遭難
26名無しさん@12周年:2012/02/05(日) 07:23:32.89 ID:Jmx1ihEK0
日本語限定だと60パーなんて到底いってないだろうな。
27名無しさん@12周年:2012/02/05(日) 07:26:19.00 ID:a+4MkF8j0
4バイト固定のほうが扱いやすいよ
28名無しさん@12周年:2012/02/05(日) 07:26:57.96 ID:ZaXYT5cg0
なんでエンコード規格て乱立したの?
29名無しさん@12周年:2012/02/05(日) 07:28:57.31 ID:B2RyP4lj0
ここはシフトJISだった

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">
<base href="http://uni.2ch.net/newsplus/">
<title>【社会】ウェブサイトの60%以上がすでにUnicodeに</title>
30名無しさん@12周年:2012/02/05(日) 07:29:03.28 ID:hAhCT2tH0
blogやhtml作成ソフトのデフォルトがUnicodeなのが多いから増えただけで、意識して使ってるわけじゃないだろw
31名無しさん@12周年:2012/02/05(日) 07:29:31.13 ID:bPEu+BJT0
ユニコード戦記、読んでみようかな
32名無しさん@12周年:2012/02/05(日) 07:31:11.03 ID:XHoJKCxL0
>>30
作戦成功だな
33名無しさん@12周年:2012/02/05(日) 07:31:53.38 ID:CofLR6W10


情弱&ネット素人メーカーのMS(笑)がIEの日本語デフォをおかしなShift-JISエンコードに
してばらまいたおかげで大迷惑だったよな。はやくつぶれろよ


34名無しさん@12周年:2012/02/05(日) 07:33:25.35 ID:2hpOGCpb0
高槓い
35名無しさん@12周年:2012/02/05(日) 07:34:18.01 ID:pSoJhllB0
>>30
俺もWordPressがきっかけでUTF-8に移行したしな

まあそれ以前からShiftJISはいろいろ面倒だったけど
そういう点では別に移行先はEUCでもよかった
どっちにしてもShiftJISの面倒臭さを意識しなくていいのは楽
36名無しさん@12周年:2012/02/05(日) 07:35:46.15 ID:TL60CQ4R0
懐かしの文字コード論争
37名無しさん@12周年:2012/02/05(日) 07:35:54.21 ID:Tivk4knWO
ユニコーンに見えた
もうだめかもわからんね
38名無しさん@12周年:2012/02/05(日) 07:36:52.42 ID:2Dir8aqc0
>>14
数多い文字の中で、人気投票で常にトップ8に入る8文字の事じゃ?
39名無しさん@12周年:2012/02/05(日) 07:38:53.61 ID:IM83sdgO0
最初からutf8で作ればそれで面倒無くて一番いい。
問題はすでに糞codeで作ってあるものの修正なんだよね。
40名無しさん@12周年:2012/02/05(日) 07:49:25.59 ID:C4oPbIXB0
一方2chは、、、
41名無しさん@12周年:2012/02/05(日) 07:50:23.65 ID:odx7qoa90
ハングルで約5千字を要求てw
42名無しさん@12周年:2012/02/05(日) 07:52:51.17 ID:a+4MkF8j0
バ韓国はほっといて漢字っていくつあるの?簡体字も含めて。
43名無しさん@12周年:2012/02/05(日) 08:07:29.06 ID:rMga3+mS0
>>33
マイクロソフトはマウスやキーボード、各種ゲームデバイスといった
ハードウェア作るのを得意とする会社だからな

頼むからTrackball Explorer再販してください (´・ω・`)
44名無しさん@12周年:2012/02/05(日) 08:24:37.45 ID:NArDI/EA0
まだ6割なのか
思ったより少ないな
45名無しさん@12周年:2012/02/05(日) 08:27:52.62 ID:aAcVKA290
UTF-8でなくてUnicodeが主流になってるの?
いい迷惑だわ、、、
46名無しさん@12周年:2012/02/05(日) 08:36:28.15 ID:h8gOWOHGO
unko
47名無しさん@12周年:2012/02/05(日) 08:37:07.45 ID:WdnlHk4t0
何も知らんから解説しとくれ
48名無しさん@12周年:2012/02/05(日) 08:42:57.69 ID:4D3i/YeY0
>>47
VHSだと思って買ったらβだった、みたいな話。
49名無しさん@12周年:2012/02/05(日) 08:44:32.32 ID:ox3Mk5VW0
シフトJISでサイト作ってるけど特に困ってない
DBごとUTFに移行とかめんどくさくてたまらん。
50名無しさん@12周年:2012/02/05(日) 08:45:12.51 ID:nzpkXPrM0
>>29
ワロースw
51名無しさん@12周年:2012/02/05(日) 08:47:19.60 ID:+UUnTItr0
ユニコードのハイフンがなんともいやらしい感じ。
52名無しさん@12周年:2012/02/05(日) 08:47:22.32 ID:pEMXjKkI0
UnicodeとUTF-8って同じものなの?
53名無しさん@12周年:2012/02/05(日) 08:55:18.55 ID:XS5HyN7i0
Unicodeは文字集合とコードの規格。
UTF-8はそれをテキストなどにするためにバイト列にするための規格。
54名無しさん@12周年:2012/02/05(日) 08:58:01.87 ID:95w+Mb4W0
なるほど。このスレ読んでもさっぱりわからん。
55名無しさん@12周年:2012/02/05(日) 09:06:44.75 ID:2kbx7hDk0
> 日本で長らく主流だったシフトJIS
ネットではJISを使えっていう話になってたような記憶があるけど。
Shift-JISとかのページで文字化けすると、舌打ちしてた。
56名無しさん@12周年:2012/02/05(日) 09:16:04.81 ID:vs/wgKQv0
jisじゃなくてeucじゃろ
57名無しさん@12周年:2012/02/05(日) 09:23:51.06 ID:1pkxUko10
今だメールは、UNICODEダメだよね。間違えて送ると、怒られたりする。
58名無しさん@12周年:2012/02/05(日) 09:24:44.82 ID:pEMXjKkI0
>>53
うーん、わかるようなわからんような……。
UTF-8でもUTF-9でも、表現できる文字の種類は変わらないけど、
その文字に割り振られてるコードはUTF-8とUTF-9で異なる、ってことなのかな?
59名無しさん@12周年:2012/02/05(日) 10:09:06.75 ID:eL37s5A80
文字のコードはあくまでも一種類。
でもそのコードの最大値が16bit(つまり2byte)を超えていて、
そのままコンピュータで扱うと今まで1byteで扱えていたアルファベットが
例えば4byteになり、メモリ的にすごい非効率になってしまう。
だからエンコーディングという考え方で、そのコード値をbitで分割し
そのコード値を最小のbyte数で扱えるようにしたのがUTF-8。
で、値を読む時はbyte単位にバラされている値を取り出して結合する。

ただ、アルファベットが1byteで扱えるようになるけど、漢字とかは逆に
Shift-JISの2byteから3byteに増えてしまうという欠点がUTF-8にはある。
それに対して、2byteを最小単位として扱うようにしているのがUTF-16。
これなら漢字もほとんど2byteで扱えるんだけど、アルファベットとかも
2byteサイズになってしまうという欠点がある。
ちなみにWindowsの内部コードはUTF-16。
60名無しさん@12周年:2012/02/05(日) 10:09:54.94 ID:pd34CgC+0
>>58
だいたいそんな感じ。
どんな形で1文字を分割するかの違いみたいな?

けどutf-9はさすがにマイナーすぎw
ふつうの2バイトコードはutf16です。

61名無しさん@12周年:2012/02/05(日) 10:12:59.70 ID:HpE7UwX9O
UTF-8とは一体なんだったのか
62名無しさん@12周年:2012/02/05(日) 10:24:51.90 ID:eL37s5A80
要するに、UTF-8だとかUTF-16だとかをひっくるめてUnicode
と読んでいると思えば良い。
63名無しさん@12周年:2012/02/05(日) 10:24:56.35 ID:+jHvHsQC0
ただ単に鯖が64bitに移行しまくった結果だろ。
あとMS鯖がそれほど実数で普及してないって証明だな。


ホームページビルダ??
んなもん日本限定の局地的な商品だ。
64名無しさん@12周年:2012/02/05(日) 10:26:32.20 ID:7sxEN5IX0
UTF-8だの16だのと、あの辺りも何とかして欲しい。
65名無しさん@12周年:2012/02/05(日) 10:27:43.39 ID:nzpkXPrM0
>>58
極論だが。
UTF-8はファイル上のバイトの並べ方のルール、Unicodeはプログラム内部の文字列の表現方法。
実際には全然違うけどねw
66名無しさん@12周年:2012/02/05(日) 10:33:49.02 ID:eL37s5A80
>>63
いや、サーバーの種類とかbit数は全然関係ないよ。
MSのサーバーも昔からUnicodeだし。
Webの世界での単なる取り決めみたいなもの。
昔は国内だけで使えれば良かったのが、グローバル化で全世界の
文字を同時に扱える必要が出てきたからということ。
67名無しさん@12周年:2012/02/05(日) 10:46:29.25 ID:lx/E5CMw0
>>2
68名無しさん@12周年:2012/02/05(日) 10:52:46.79 ID:cCqi/teYO
これから作業環境一新
これ絡みでゴタつくんだろうな…
69名無しさん@12周年:2012/02/05(日) 10:53:14.79 ID:CofLR6W10
>>66
>MSのサーバーも昔からUnicodeだし。

ワロタw

70名無しさん@12周年:2012/02/05(日) 11:07:07.98 ID:/YlBfT2O0
UTF-48
71名無しさん@12周年:2012/02/05(日) 11:14:33.13 ID:SRZJIGtM0
企業にとっては古い規格は邪魔なんだよな
アップルとか売れてる製品にバグでも仕込んで古いコード体系だと
文字化けするように仕組んで駆逐するのが一番
72名無しさん@12周年:2012/02/05(日) 11:14:56.68 ID:WoR49KHG0
俺の頭のバーコード比率と同じくらいだな
普及拡大の時期も大体同じ。なんか親近感湧くな
73名無しさん@12周年:2012/02/05(日) 11:34:24.59 ID:PU7/JHfe0
Unicodeの入力支援はもう少しなされていい。
せっかくあるハートとかスペードとか、肝心の入力方法が分からん(´・ω・`)
74名無しさん@12周年:2012/02/05(日) 11:36:34.09 ID:2x90ixBx0
いまどきShift_JISやEUC-JPを見るとしょぼいweb制作業者がいるんだなあと思ってしまう
75名無しさん@12周年:2012/02/05(日) 11:43:00.04 ID:dswJucIl0
まだShift_JISがなくならないのは
一部Windowsソフトと古いガラケーのせいだろう

これらが更新されていけば、ようやく日本語環境が統一されるはず
76名無しさん@12周年:2012/02/05(日) 11:46:35.21 ID:/d70TNj+0
古いホームページをiPhoneから見ると文字化けするのが困る
77名無しさん@12周年:2012/02/05(日) 11:47:03.71 ID:SPt7Daf40
ウニコデか
アレうまいよな
最近の味障にはわからないツウの味
78名無しさん@12周年:2012/02/05(日) 11:48:12.59 ID:bJ5NBdWy0
ハリコの虎に謝れ!
79名無しさん@12周年:2012/02/05(日) 11:49:09.00 ID:+jHvHsQC0
文字化けするのは製作者側の問題
EUC-JPだろうがShift_jisだろうが関係ない。
80名無しさん@12周年:2012/02/05(日) 11:51:10.63 ID:dswJucIl0
>>76
<meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">

昔は、この記述を怠っているページが多かったからね
Safari系のブラウザは、これがないと文字化けしやすい
81名無しさん@12周年:2012/02/05(日) 11:53:22.12 ID:APXa1vao0
webが中国語-英語混在、日本語-英語混在、韓国語-英語混在しかできなくて、全て
英語を通さなければできないようになっていたものだから、この間にかなりアメリカに
リードを取られたな
ユニコード化でやっとアジア各国語混在ができるようになったが、長い間ユニコードに
対応しなかったIBMホームページビルダーの罪は大きい
82名無しさん@12周年:2012/02/05(日) 11:54:17.36 ID:VGs8O0De0

歴史の中で、Javaが標準で Unicodeだったのが一番大きいと思うけど。
そのせいで最初はMS932系の問題で苦労することがたくさんあったけど、
今は文字コードの変換処理が稀になり、ずいぶん助かっている。

UTF-8 で表示して、DBにもUTF-8 で保存して、ユーザにメール投げるときも
UTF-8 。  考慮しないといけないのは古いガラケーと InternetExplorerだけ。
IE っていまだにシステム言語に依存している部分があるのよね・・。
83名無しさん@12周年:2012/02/05(日) 11:56:51.78 ID:VGs8O0De0
EUC-JPでサイト作っているところって何なの?って感じ。

fj時代の U*IX信者が幅を利かせているのか?

あんただよ、 mixi!!
84名無しさん@12周年:2012/02/05(日) 12:00:48.56 ID:8LjSWgGj0
RFCの成果かな。
85名無しさん@12周年:2012/02/05(日) 12:14:25.73 ID:2kbx7hDk0
やっとUnicodeで統一できたのはいいけど、
今度はUTF-8とUTF-16で混乱する予感。
86名無しさん@12周年:2012/02/05(日) 12:41:16.15 ID:APXa1vao0
>>85
今後、宇宙人が参入して来ることを考えればUTF-16にしておいたほうが無難だな
87名無しさん@12周年:2012/02/05(日) 12:44:55.58 ID:VndLz1G80
windowsではUTF16がUNICODEです。
つまりUTF8は、MS非公認。
881th ◆6KRJEpqjyg :2012/02/05(日) 12:47:57.17 ID:F3WU3Qpz0
自宅鯖はUTF-8だ。
89名無しさん@12周年:2012/02/05(日) 12:53:51.03 ID:fU+2FhCB0
>>87
鯖系はMSなんて鼻クソだから公認だろうが非公認だろうが無視していい。
影響あるのはapacheのデフォ設定がどうなってるか
90名無しさん@12周年:2012/02/05(日) 13:19:20.45 ID:PCdOEmn50
上のほうでも出てるが
ハングルの割り当て範囲はハングル字母(U+1100-11FF)とハングル音節文字(U+AC00-D7A3)
約11,000件、しかも通常使わない文字が多数

やっぱチョン氏ね
91名無しさん@12周年:2012/02/05(日) 13:23:20.19 ID:d5JSVP8I0
俺はUnicode、Shift-JIS、EUCは絶対に使わない。
UTF-8を使う。
92名無しさん@12周年:2012/02/05(日) 13:23:32.57 ID:jy+vdu8D0
exact audio creatorでUNICODE文字使って曲名入力すると、
できたcueシートがエラーを起こす・・・。

どうすればいいんでしょうか?
93名無しさん@12周年:2012/02/05(日) 13:23:49.41 ID:PU7/JHfe0
超漢字とUnicodeってどうコンセプトが異なるの?
94名無しさん@12周年:2012/02/05(日) 13:24:27.33 ID:u9yKAW/l0
sjis、euc廃れろ
WEBサイト以外も全部統一しろよ
95名無しさん@12周年:2012/02/05(日) 13:25:47.33 ID:d5JSVP8I0
>>92
Unicodeは使わないで、UTF-8を使えば良いよ。
何を隠そう、Unicodeはダメダメだよ。
96名無しさん@12周年:2012/02/05(日) 13:28:53.73 ID:PCdOEmn50
UTF-8だとU+0800から先が3Bytes区間なんだよな
ここにかな文字でも入れてもらえてれば・・・
97名無しさん@12周年:2012/02/05(日) 13:29:08.80 ID:rE6PBAXh0
ÆON
98名無しさん@12周年:2012/02/05(日) 13:29:53.86 ID:UM9MutsKO
>>90
長音記号付きのAIUEOがJISコードに無いせいで、日本語のローマ字表記がガタガタになったことを考えると、あちらの主張も分からんではない。
99名無しさん@12周年:2012/02/05(日) 13:31:30.91 ID:APXa1vao0
>>95
なんで同じ文字、例えば産→產、内→內、呉→吳、みたいに同じ文字なのに
違うユニコードが割り当てられてるのよ?
香港人の意見、しっかり取り入れてる?
100名無しさん@12周年:2012/02/05(日) 13:32:10.89 ID:bW0afEsB0
もうUnicodeに統一させろよ
そのほうがみんな幸せ
101名無しさん@12周年:2012/02/05(日) 13:33:10.71 ID:OIiBSZH70
1F4A9
102名無しさん@12周年:2012/02/05(日) 13:33:18.51 ID:d5JSVP8I0
>>100
やめろよ。
UTF-8に統一した方が良い。
何故なら、俺が面倒だから。
103名無しさん@12周年:2012/02/05(日) 13:33:38.67 ID:PCdOEmn50
罫線とか記号類も重複してるのがあった気がするな
後から変更されても鬱陶しいだけだが
104名無しさん@12周年:2012/02/05(日) 13:33:43.03 ID:RZwKrRTd0
SJISは2バイト、UTF-8は3バイトな。
日本語と英数字だけならSJISの方がいい。
105名無しさん@12周年:2012/02/05(日) 13:34:16.69 ID:lrmaNmxF0
規格はいろいろ有った方が何かと便利。

Unicode(UTF-8)
日本語(EUC)
日本語(SHIFT-JIS)
ナオトインティライミ(singer)
コーカサスオオカブト(beetle)
未婚女性(Mademoiselle)
南国の海(shiny blue)

106名無しさん@12周年:2012/02/05(日) 13:36:14.87 ID:PCdOEmn50
さっきからUnicodeはダメ!UTF-8が最高!みたいなのがいるが
>>53 >>59 あたりを理解しているのか
暗黙でUnicode=UTF-16と言ってるのか分からんなw
107名無しさん@12周年:2012/02/05(日) 13:36:20.27 ID:d5JSVP8I0
>>105
UTF-8って、Unicodeなの?
別物かと思ってたよ。
俺はWebクリエイターだけど、UTF-8しか使っていないからな。
108名無しさん@12周年:2012/02/05(日) 13:37:26.32 ID:nVuXELWB0
下手に ascii にこだわって &piv. とか書くより
文字一覧から ϖ を持ってきて utf-8 にするほうが楽だし
保守しやすいよね。
109名無しさん@12周年:2012/02/05(日) 13:39:00.53 ID:yR/GaD3d0
unicodeだと、2byte系のテキストが入った文字列を
自作関数で操作したり検索するの大変だろうな
流石にそんな物好きは居ないだろうし、大概は
なにがしかのライブラリを使うんだろうけど
110名無しさん@12周年:2012/02/05(日) 13:39:13.72 ID:u3Rb+LQa0
新旧プログラムが混在するシステムだと簡単にUNICODEに移行できんし
111名無しさん@12周年:2012/02/05(日) 13:39:42.07 ID:R/n5Us9I0
わかりやすいUnicodeとUTF-8のちがい


 Unicode≒無職を細かく定義
   家事見習い(28)
   自称ネットトーレーダー(32)
   穀潰し(38)
   アルバイト探してるフリ(19)


 UTF-8≒どうせ無職だから「ニート」で置き換えろよ。効率的だし。
   ニート(28)
   ニート(32)
   ニート(38)
   ニート(19)
112名無しさん@12周年:2012/02/05(日) 13:40:16.00 ID:H34ZliCq0
ガラケーサイトが4割もあるってことか。
113名無しさん@12周年:2012/02/05(日) 13:40:28.36 ID:1qBc8eFZ0
詳しいこたぁ知らんけど、いい加減、全角数字とか半角カタカナ使うのやめてほしい。
住所入力とかで、いちいち「全角で入力してください」って、何なん。
百歩譲って、それくらい自動変換できんの?
114名無しさん@12周年:2012/02/05(日) 13:40:37.43 ID:v+UOMc+B0
みんな難しい話してんな〜。
さっぱりだわ。
115名無しさん@12周年:2012/02/05(日) 13:40:42.39 ID:8Qomymbk0
これからは8ではなくUTF-16の時代だ。これなら間違いない。
ただ、2chの顔文字がShift_Jisでないと作れないし、UTF-8で表示出来ないのが問題だ。
116名無しさん@12周年:2012/02/05(日) 13:41:44.87 ID:nVuXELWB0
>>109
正規化の問題やら異体字セレクタやらいろいろあるからね。
自作は本腰入れてやらないと不可能な気がする
117名無しさん@12周年:2012/02/05(日) 13:42:45.83 ID:uFa0g1qZ0
ウニコード使ってないサイトがあるけど苦情こないのかな
118名無しさん@12周年:2012/02/05(日) 13:42:50.52 ID:d5JSVP8I0
>>111
UTF-8の方が単純でいいな。
そんな細かく分類する必要なんてない。
気にする奴は、うんこだよ。
119名無しさん@12周年:2012/02/05(日) 13:43:09.01 ID:APXa1vao0
>>110
古いシステムのほうをバーチャルな環境で包んで、その表からデータのやりとりすれば
解決できると思うけど
120名無しさん@12周年:2012/02/05(日) 13:45:41.62 ID:/dza8IB90
バックスラッシュの位置に\があるのは混乱の元だと思う( ´・ω・`)
ディレクトリ構造もバックスラッシュなら直感的にわかるのに\だとよくわからん
121名無しさん@12周年:2012/02/05(日) 13:46:00.27 ID:PCdOEmn50
Windowsなら.NETのSystem.Encodingだか使えば好きに変換できるな
1221th ◆6KRJEpqjyg :2012/02/05(日) 13:46:32.28 ID:F3WU3Qpz0
UTF-8はUnicodeだろ。
Unicodeというくくりの中に符号化のやり方としてUTFなんちゃらがある。
123名無しさん@12周年:2012/02/05(日) 13:47:22.82 ID:eQWqA1GqP
win7対応とは基本的にunicode対応を指すな
ここで投資ケチるとXPから永遠に逃れられなくなる

といいつつ、今の所、慌ててるのは
早々とvista対応やっちまった所だったりする

124105:2012/02/05(日) 13:48:08.37 ID:lrmaNmxF0
>>107 世界を一軒家に例えると
Unicode=家主
UTF-8=Unicodeさんちの居候的な
125名無しさん@12周年:2012/02/05(日) 13:48:15.35 ID:cN6F6l3d0
¥\
うむ。
126名無しさん@12周年:2012/02/05(日) 13:49:04.14 ID:APXa1vao0
>>123
Vistaはどこが糞なの?
127名無しさん@12周年:2012/02/05(日) 13:49:44.31 ID:ie+gQAKT0
UTF-16は大丈夫だけどUTF-8は読めないのまだまだありそう
たぶんテキストエディタはよほど糞でない限り大丈夫だろうけどね
10年前くらいのテキストエディタはShift-JISしか駄目なのがよくあった
128名無しさん@12周年:2012/02/05(日) 13:52:10.31 ID:h7q6IwfY0
なんで最初からunicode使わなかったんだろ
sjisやeucのせいでどんだけ無駄な金と時間が
使われたと思ってんだよ・・・
129名無しさん@12周年:2012/02/05(日) 13:52:37.35 ID:eQWqA1GqP
>>126
いや糞とかじゃなく
もうすぐサポ終了(2012年4月)なだけ

って気が付いたら後、2か月もないじゃん!
w
130名無しさん@12周年:2012/02/05(日) 13:54:26.69 ID:APXa1vao0
>>120
俺のPCはバックスラッシュを押すと\が出る
キーボードにはㄅㄆㄇㄈが書いてあるし
131名無しさん@12周年:2012/02/05(日) 13:54:33.81 ID:PCdOEmn50
フリーウェアのWindowsテキストエディタだと、Unicodeに対応してても
日本語文字しかまともに扱えないとか制限あるのばっかりでダメダメだ

なにかオススメありませんかね?
132105:2012/02/05(日) 13:54:48.06 ID:lrmaNmxF0
>>128 小僧ニャ解らんかもしれんが
昔は、カセットテープに情報を記録してた時代があってなァ
133名無しさん@12周年:2012/02/05(日) 13:55:06.78 ID:/dza8IB90
Shift-JISって富士通が出してたキーボードの事だっけ?( ´・ω・`)
134名無しさん@12周年:2012/02/05(日) 13:56:33.80 ID:ie+gQAKT0
>>128
下位互換を確保しろと言って下位互換ばかり気にした結果
8bit時代の負の遺産を引きずってしまった
未だにWindowsが32bitの遺産に引きずられているのと同じ
そういう意味ではPS2互換を捨てたPS3の選択は将来的には正しかったかもしれんが
戦略を少々ミスった感があるな
DSもこれから下位互換のせいで苦しめられると思うよ
135名無しさん@12周年:2012/02/05(日) 13:57:31.37 ID:cN6F6l3d0
動画もいろんなcodecが出ているよねえ。
136名無しさん@12周年:2012/02/05(日) 13:59:08.54 ID:QOD6XIOu0
utf8の方がメジャーだよな。
なんでM$は一部のutf16だけがunicodeだと主張するんだ
windowsの内部で使われていうるのはわかるけどさ
137名無しさん@12周年:2012/02/05(日) 13:59:17.32 ID:HNPqrg4k0
undefinedかと思った
138名無しさん@12周年:2012/02/05(日) 13:59:38.78 ID:lWNv1Vxw0
でもメールは未だにSJISが主体なんだよな。
ほとんどのメーラーはUTF-8に対応しているが、ガラケーだのはSJISじゃないと文字化けする。
139 忍法帖【Lv=40,xxxPT】 PedoBear ◆58UuJcnaMg :2012/02/05(日) 13:59:50.22 ID:JcwZg7F4O
>>133
それは親指シフトbear
140名無しさん@12周年:2012/02/05(日) 14:00:03.53 ID:/dza8IB90
>>135
圧縮形式もまとめて欲しいよね。
海外のサイトでダウンロードしようとしたら、圧縮がrarで、しかも分割ファイルだったりしたらぶっ殺したくなるよね( ´・ω・`)
141名無しさん@12周年:2012/02/05(日) 14:02:10.18 ID:szdixR4p0
日本人にだけ分かればいい時はS-JISのままでいいってことか?
142名無しさん@12周年:2012/02/05(日) 14:02:58.82 ID:eQWqA1GqP
>>138
下手すると文字化けで
自動メールが送れなくなるとか
業務に深刻な影響もたらすからなあ

気づいてる人達は
きちんと対応してるだろうけどさ



143名無しさん@12周年:2012/02/05(日) 14:03:26.29 ID:lx9/fg4r0
昔はメールでもコードの指定ミスで文字バケしてたりしたら
「ハングルwww」と言って笑ってたんだが
ハングルを内包したUnicodeが既に主体になってたのか
144名無しさん@12周年:2012/02/05(日) 14:03:35.56 ID:1FflCzHq0
>>87
サーバーではMSは完全に敗北してるから問題なし。
Windows ServerでHPを立てるのは脆弱過ぎて後々怖い。
145名無しさん@12周年:2012/02/05(日) 14:04:37.77 ID:/dza8IB90
よくわからんがUnicodeとやらで書いてあるサイトなら、外人さんにもAAが正しく理解してもらえるって事でいいのかな?
146名無しさん@12周年:2012/02/05(日) 14:04:41.61 ID:hv905x2+0
アメリカ人ってÆONとかΩとかってどうやって入力してるの?IMEモードONとか無いんでしょ?
147ラプラスの天使 ◆daemontaDA :2012/02/05(日) 14:07:37.18 ID:4Bf5jLwH0
原則、ウニコードですw

UTF−8 BOMなしが基本です
148名無しさん@12周年:2012/02/05(日) 14:08:24.39 ID:QklplcIQ0
EBCDICコードにすればいいんだよ。
パンチカードの穿孔で直接読めるし。
149名無しさん@12周年:2012/02/05(日) 14:10:51.82 ID:APXa1vao0
>>132
そんで300ボーだとか、1200ボー最強だとか言い争ってるうちに、2700ボーが
搭乗して他討ち死に〜、って時代のこと?
PCからの命令で動くデータレコーダが面白かったな
150名無しさん@12周年:2012/02/05(日) 14:13:20.06 ID:vyioqugB0
>>148
膨大なパンチテープ・・
151名無しさん@12周年:2012/02/05(日) 14:17:50.24 ID:APXa1vao0
>>148
パンチカードかよ
ずいぶんと新しいもの使ってたな
俺は紙テープで読ませてた

紙テープでパンチカードリーダー立ち上げて、パンチカードでテープローダー立ち上げて、
それでローダー読み込むとやっとハードディスクが立ち上がる
152名無しさん@12周年:2012/02/05(日) 14:26:18.45 ID:I5AkoZiU0
>55
間に7bitの串が挟まると文字化けするから
153名無しさん@12周年:2012/02/05(日) 14:30:10.73 ID:XSMexfOI0
>>146
特殊文字コピペサイトが大人気
154名無しさん@12周年:2012/02/05(日) 14:30:51.99 ID:PCdOEmn50
侮ヲw
155名無しさん@12周年:2012/02/05(日) 14:49:57.62 ID:1BJ+W4mB0
雲丹code
156名無しさん@12周年:2012/02/05(日) 15:01:04.71 ID:m0bjVDaK0
よし、ここはあえてUCS-2を使うぞ^^
157名無しさん@12周年:2012/02/05(日) 15:06:20.06 ID:v/FCpIXD0
次からはUnicodeで作るかなあ。今はEUCだけど。
158名無しさん@12周年:2012/02/05(日) 15:18:50.53 ID:50dHGa830
>>149
ダブルラジカセがほしくてたまらなかったな
159名無しさん@12周年:2012/02/05(日) 15:59:54.16 ID:7sxEN5IX0
プログラム側からだと、何文字あるのか調べるのが面倒なんだよな。
160名無しさん@12周年:2012/02/05(日) 16:01:18.02 ID:APXa1vao0
>>157
EUC、二度と使うなよ
161名無しさん@12周年:2012/02/05(日) 16:18:51.82 ID:fG08857r0
test
162名無しさん@12周年:2012/02/05(日) 16:21:07.47 ID:fG08857r0
>>136
> utf8の方がメジャーだよな。
> なんでM$は一部のutf16だけがunicodeだと主張するんだ
> windowsの内部で使われていうるのはわかるけどさ

何を根拠にそんな事言ってるの?
Win7のメモ帳だってUTF-8に対応しているというのに。
163名無しさん@12周年:2012/02/05(日) 16:34:02.14 ID:vs/wgKQv0
「MSは悪の組織」ってステマやってるところがあるらしいよ
ナードなんて簡単に騙されるからちょろいね
164名無しさん@12周年:2012/02/05(日) 16:36:11.68 ID:ZcIvg3JK0
4バイト固定の文字コードでいいよ。
世界で43億文字あれば足りるだろ。
で、Shift-Jisとかの既存の文字コードとの間で簡単に変換できるように
してほしい。
165名無しさん@12周年:2012/02/05(日) 16:39:15.14 ID:fG08857r0
UTF-8はもともとPlan9開発でできた副産物だからね。
初期のUnicodeには含まれていなかった。
初期のUnicodeは16bit固定(今で言うUCS-2 )、文字の数が足りなかったという
大きな問題があるが、凄くシンプルな仕組みだったんだよ。

その時、いち早くUnicodeに対応したのが、Windows NTやJava
当時はそれしか世の中に存在しなかったのだから仕方ない。

Plan9はなぜUTF-8なんてものを作ったのかというと、
Unicode(16bit)はC言語及びC言語で作られたライブラリと相性が悪かったから。
C言語では特定の1バイトコード(0x00や\)を特殊文字として扱うが、16bitのUnicodeでは
2バイトコードの1バイトに0x00や\が含まれる。つまり、既存のライブラリ全部作り直しということになる。

最初からUnicode対応として作られたWindowsやJavaとは違い、
コストが大きく掛かることになる。これはPlan9だけではなくUnixやLinuxも同じで
現にLinuxはいろんな文字コードに対応しているが、UTF-8以外のUnicodeには対応できない。

一方WindowsやJavaの世界ではUCS-2では文字が足りなくなったため、それを拡張したUTF-16に移行した。
166名無しさん@12周年:2012/02/05(日) 16:40:54.88 ID:oON2/OnT0
/人◕‿‿◕人\<「2ちゃんねるはUnicodeが有効な板と無効な板があるみたいだね
           有効な板じゃないと、僕の顔文字が文字化けして使えなくなってしまう
           どうして全部の板で有効にしないのか、わけがわからないよ」
167名無しさん@12周年:2012/02/05(日) 16:41:31.41 ID:fG08857r0
>>164
> 4バイト固定の文字コードでいいよ。

4バイト固定の文字コード(UTF-32)はシンプルなんだが
1文字の間に0x00や\が入るという問題がある。

UnixやLinux関係ではライブラリ全て見なおさなきゃならない。
対応は非現実的だろう。

> で、Shift-Jisとかの既存の文字コードとの間で簡単に変換できるように
> してほしい。
対応表がある。それにて変換すれば良い。
何の計算もいらないすごく単純な変換の仕組みだ。
168名無しさん@12周年:2012/02/05(日) 16:44:24.95 ID:9DfUc3J30
ガラケーはまだsjisメインなの?
昔はpcサイトとガラケーサイトを
同じサーバでphpで動かしてて、
UAで文字コード変換のフィルタをやってたけど、
最近の動向がよくわからない
169名無しさん@12周年:2012/02/05(日) 16:48:32.43 ID:B9lDrzbd0
超漢字でいこうぜ
170名無しさん@12周年:2012/02/05(日) 16:49:01.20 ID:8Z/IyM4T0
UNICODEでもUTF-8でもなんでもいいからとにかく統一しろ

文字化けでうなされんのはもう嫌だ
171名無しさん@12周年:2012/02/05(日) 16:50:49.23 ID:d5JSVP8I0
文字化けさせてる奴のページは、見る価値もない。
はっきり言って、カス。
これ、豆な。
172名無しさん@12周年:2012/02/05(日) 17:00:36.84 ID:v4m9gkQG0
LANG=Ja_JP
173名無しさん@12周年:2012/02/05(日) 17:05:04.79 ID:m0bjVDaK0
>>165
なんだ、C系列言語(C、C++、Objective Cなどなど)を捨てればいいだけなのか^^
C#は大丈夫なんじゃろ? もしかしたらC++/CLIも大丈夫かもしれん^^
単純で実に早い話じゃないか^^

変換かますと〜とか\は確実に文字化け対象だし
場合によってはAとかも文字化け対象。
データは変換せず、アプリが正しい文字符号化方式を採用したほうが安全^^
174名無しさん@12周年:2012/02/05(日) 17:05:39.14 ID:HBLP7Xxv0
つうか、メールの文字コードもさっさと統一してほしいわ
囲い文字が機種依存だって理解していない馬鹿が多すぎる
175名無しさん@12周年:2012/02/05(日) 17:09:30.86 ID:jg8cUj1A0
iPhoneは、UTF-8以外のページが文字化けするとか(Safariでは対策して
あるらしい)、ISO-2022-JPのメールが送れないとか、文字化けに
積極的に加担している印象。
176名無しさん@12周年:2012/02/05(日) 17:11:16.17 ID:8x6Qhg1u0
>Unicodeは全世界の文字を単一の規格にまとめたもので

またまた、ご冗談を
177名無しさん@12周年:2012/02/05(日) 17:22:43.35 ID:jg8cUj1A0
>>138
メールはSJISじゃなくてJISね。
178名無しさん@12周年:2012/02/05(日) 17:23:49.93 ID:fG08857r0
>>174
> 囲い文字が機種依存だって理解していない馬鹿が多すぎる
お前も間違ってる。

メールの文字コードがUnicodeであれば
囲い文字は機種依存ではない。ついでに半角カナもな。

>>175
> あるらしい)、ISO-2022-JPのメールが送れないとか、文字化けに
> 積極的に加担している印象。

ISO-2022-JPは日本語にしか対応できない文字コードだ。
こんなのはさっさと無くすべき。
179名無しさん@12周年:2012/02/05(日) 17:31:34.24 ID:utwFvdq80
TBSのサイトはISO-2022-JP
180名無しさん@12周年:2012/02/05(日) 17:31:34.28 ID:n9HcHmY90
なんかおいしそうだな。 ( ´・ω・)
181名無しさん@12周年:2012/02/05(日) 17:35:11.36 ID:wj83BVn60
>コンピューターでは文字にコードを割り当てて管理、表現している。このコードはそれぞれの
>言語圏で独自に作成されたため整合性、互換性がなかった。

えっ?ISO2022は?
182名無しさん@12周年:2012/02/05(日) 17:40:25.46 ID:dswJucIl0
>>168
最近のガラケーはUTF-8も普通に対応しているが
古い機種を使ってるユーザを切れないんだよね

ドコモのmovaがサービス終了になれば、少し状況も変わるが
それでもユーザエージェント見てShift_JISに変換するとか
しばらくは、なにかの対応が必要だろう
183名無しさん@12周年:2012/02/05(日) 17:42:51.64 ID:SLWMLurC0
うちはいまだにEBCDICコード使ってるよ
184にょろ〜ん♂( 忍法帖【Lv=40,xxxPT】 ):2012/02/05(日) 17:44:29.97 ID:akUw69XU0
それよりChromeのフォントを何とかしろよw 中国文字ばっかりw
185名無しさん@12周年:2012/02/05(日) 17:51:01.61 ID:V7Xmj4d50
>>136 UTF-8はUnicode的には実は改悪w
本来の策定目的に拠れば、多言語の文字を等長に取り扱えるUTF-16の方が原理的。
しかしUTF-8のバイト延長方法が巧妙だったので、shortだのlongだの大好きなC/C++コミュニティにとってはそちらの方が文字以外の型とも透過的で魅力的だったんだろうね。
186名無しさん@12周年:2012/02/05(日) 17:53:49.75 ID:HBLP7Xxv0
>>178
>メールの文字コードがUnicodeであれば
だから、それを理解していないやつが多いんだよ

自分のメーラーではちゃんと表示できてるからって、
相手も見えていると勘違いしてる
187名無しさん@12周年:2012/02/05(日) 18:01:53.07 ID:V7Xmj4d50
>>185 ところでUTF-8の為した本当の害は実は別にあって、それはANSIの後継として実効的な信号記号文字のテーブルに為る筈であったBMPを事実上廃止してしまい、基本面にASCIIを据え戻してしまった流れを作った事なんだ。
188名無しさん@12周年:2012/02/05(日) 18:02:40.02 ID:fG08857r0
>>185
なんか後半意味不明だが、

UTF-8はASCII互換なんだよ。
よくわかってない人には説明しにくいが、

英語圏の人 = 1文字が1バイトと考えている = それを前提にプログラムを作っている。

そういうプログラムでもUTF-8であれば、殆どの場合正しく動作する。
そのように考えられて作られてるから、既存のコードの修正が少なくてすむ。

もしUTF-8がなければ、C標準関数でさえ、
引数の型(charポインタ)を変更しなければいけなかったからね。
189名無しさん@12周年:2012/02/05(日) 18:04:54.26 ID:fG08857r0
ASCII互換のもう一つのわかりやすい利点を忘れていた。

ASCIIの範囲(7bit)においては、UTF-8とASCIIは完全に一致している。
だからASCIIしか頭にない人はASCIIとして作れば自然とUTF-8対応に
もなっているかな?というコードになるという寸法さ。
190名無しさん@12周年:2012/02/05(日) 18:07:44.43 ID:fG08857r0
なんか>>187がめちゃくちゃなことを言ってるけど、無視していいよw

> 信号記号文字のテーブルに為る筈であったBMPを

BMPというのは、Basic Multilingual Planeの略で
日本語で言えば、基本多言語面。

BMPという名前は、「多くの言語の文字が含まれる基本的な領域」という意味で
名前からして、信号記号の文字じゃないことを示してる。
191名無しさん@12周年:2012/02/05(日) 18:09:51.48 ID:V7Xmj4d50
>>187 本当はかつてのANSI文字セット面がBMPとは別にミラー様に文字表示専用に用いられることによって機能と表示の完全分離が果たされ、制御文字までものフル可読表示が可能になる筈だったのが、そのせいでポシャってしまったんだよ。
192名無しさん@12周年:2012/02/05(日) 18:10:11.05 ID:fG08857r0
>>186
俺は「囲い文字が機種依存文字」というのが
間違いと言ってるだけ。

自分のメーラーで見えるのと相手のメーラーで見えるのの
違いの話はしていない。
193名無しさん@12周年:2012/02/05(日) 18:10:20.75 ID:nIS1QMYb0
>>140
エログから落としてるのか
194名無しさん@12周年:2012/02/05(日) 18:16:20.60 ID:V7Xmj4d50
>>190 用語的には全く仰る通りで、解かり難い話をしてしまい申し訳無いんですが、
当初BMPの次の面に、全く同じ内容であるにも拘わらず、わざわざLatin−1が定められて居た意味について書いてみました。
195名無しさん@12周年:2012/02/05(日) 18:18:41.60 ID:fG08857r0
BMPの次の面ってどれのこと?
追加多言語面(Plane1)にLatin-1なんて無いけど。
http://ja.wikipedia.org/wiki/%E8%BF%BD%E5%8A%A0%E5%A4%9A%E8%A8%80%E8%AA%9E%E9%9D%A2
196名無しさん@12周年:2012/02/05(日) 18:19:39.62 ID:2g/pq4Zf0
nurupo
197名無しさん@12周年:2012/02/05(日) 18:20:55.73 ID:IPSTwEZD0
>シフトJIS
侮ヲ
198名無しさん@12周年:2012/02/05(日) 18:24:28.66 ID:A95uEb7Q0
よくわからんのだけど、草なぎとか火へんに華とか但し書きしてたものがちゃんと漢字で出るようになるってこと?
1991th ◆6KRJEpqjyg :2012/02/05(日) 18:25:50.07 ID:F3WU3Qpz0
ゲームハードでもそうだけど過去のものとの互換性は普及度を左右させるな。
200名無しさん@12周年:2012/02/05(日) 18:26:54.37 ID:V7Xmj4d50
>>195 可能ならUnicodeの古い版を遡って当たってみて下さい。
どうせ1バイト文字も型を示す桁などで多バイト化されて扱われて居るのだから、等長2バイト文字の上位バイトを型表示桁状態にする設計も可能にしようかとの試みのあった時代の痕跡を見て取ることができます。
201名無しさん@12周年:2012/02/05(日) 18:27:10.54 ID:g6ZT7AmP0
unicodeにするとS-jifより容量1.5倍になるんだっけ?
2chのような大規模文字サイトでは結構転送量くうかもしれず変更しにくいのかもね
202名無しさん@12周年:2012/02/05(日) 18:31:30.32 ID:Agg/dU890
うちのサイトを今見たら、思いっきりShift_JISって書いてあったw

でも、そこをUnicodeに書き換えるだけじゃ、デザイン狂うよね。
まんどくせーから、このままでいいや。
203名無しさん@12周年:2012/02/05(日) 18:32:15.79 ID:P+6AwrbM0
ユニコードといえば、「ハングル大移動」。
204名無しさん@12周年:2012/02/05(日) 18:32:20.25 ID:fG08857r0
>>200
なにかいいたいことがあるなら、
言いたい人が持ってきてねw
205名無しさん@12周年:2012/02/05(日) 18:36:30.87 ID:ipbiD3my0
ことWebに関してはAjaxの隆盛が一番でかいと思う。
206名無しさん@12周年:2012/02/05(日) 18:36:59.58 ID:fG08857r0
過去にあったUTF-8の問題であれば、
現在はないのであれば、今持ち出す必要はないわけで。
207名無しさん@12周年:2012/02/05(日) 18:40:23.61 ID:TuNI+Cb50
もう普通に半角カナを使ってもいいんですか?
昔はアホバカと言われました
208名無しさん@12周年:2012/02/05(日) 18:48:20.37 ID:4ckF89tv0
なんかEUCのイメージあったけど
209名無しさん@12周年:2012/02/05(日) 19:03:58.97 ID:XS5HyN7i0
>>202
そのhtmlファイルがシフトJISで保存してあるならそれで正しい。
そこをUTF-8に直したらエディタで保存する時にUTF-8で保存しないと文字化けするかもしれませんし、
それよりwebデザイナ失職です。
210名無しさん@12周年:2012/02/05(日) 19:06:21.26 ID:8Wo4iGmi0
UTF-8は日本語が3バイトになる変態コード
シフトJISなら2バイトです
みんなでシフトJISを使いましょう!
211名無しさん@12周年:2012/02/05(日) 19:12:08.51 ID:hv905x2+0
イギリス人のキーボードってさ「|\」キーのところが£なの?

ディレクトリもさ
C:£WINDOWS£Tempとかって表記なの?
212名無しさん@12周年:2012/02/05(日) 19:14:01.16 ID:p1yUOnV/0
VC++でBOM無しUTF-8でWarningやエラーが出るのどうにかしてくれ
213名無しさん@12周年:2012/02/05(日) 19:14:24.48 ID:g6ZT7AmP0
日本の\は海外じゃバックスラッシュじゃね
214名無しさん@12周年:2012/02/05(日) 19:15:35.78 ID:PCdOEmn50
そのせいで\マーク自体のことをバックスラッシュだと思い込んだ厨房時代
215名無しさん@12周年:2012/02/05(日) 19:15:57.28 ID:XkAh+P3R0
Unicodeってあれだろ?
ほら、角が生えて羽が付いてる馬だっけ?
216名無しさん@12周年:2012/02/05(日) 19:17:00.55 ID:8Wo4iGmi0
>>125
違うよメルセデス社製の特殊車両だよ
217名無しさん@12周年:2012/02/05(日) 19:17:57.44 ID:4PniBX+Z0
ヌ,ナキニイーハウー
218名無しさん@12周年:2012/02/05(日) 19:45:14.04 ID:wwKrlCIw0
@ShiftJIS
⒉Unicode
❸文字コード
⑷数字は文字化けしてるかな?
219名無しさん@12周年:2012/02/05(日) 19:55:59.76 ID:wj83BVn60
>212
プログラムってのは人間が読む物じゃ無くてコンピューターが読み込んで処理しやすいようにするべきなんだから
ソースコードにUNICODEとか使う馬鹿な物を採用するような間抜けな開発環境はゴミ箱に放り込め
220名無しさん@12周年:2012/02/05(日) 20:24:23.28 ID:fG08857r0
プログラムは、人間が書いて人間が読むものだよw

コンピュータが読み込んで処理しやすい方式なら、
それは機械語になる。
221名無しさん@12周年:2012/02/05(日) 20:27:29.33 ID:oV8pxad30
よくしらんけどウニコードって漢字の数少すぎとか聞いた記憶がある。
222名無しさん@12周年:2012/02/05(日) 20:34:34.23 ID:hpgAywOk0
昔はね
223名無しさん@12周年:2012/02/05(日) 21:32:50.15 ID:+G0CP/5D0
EUCは?
224名無しさん@12周年:2012/02/05(日) 22:08:24.46 ID:wj83BVn60
>220
いや、プログラムはコンピューターの字句解析、構文解析エンジンが読む物だよ。
人間が読むのはあくまでコンピューターがきちんと読めるか確認してるだけ
225名無しさん@12周年:2012/02/05(日) 22:14:42.68 ID:8Wo4iGmi0
>>224
んなわけねえだろw
プログラム(ソースコード)は限りなく人間が都合よく読み書きできなければならない。
コンパイラのパーサがどんなに苦労しようがどうでもいいことだ。
226名無しさん@12周年:2012/02/05(日) 22:19:23.21 ID:wj83BVn60
>225
ASCIIコードの範囲で事足りる符号範囲をわざわざマルチバイトでファイル保管するの?
ソースファイルの頭にわざわざBOMとか付けるの?
UNIXの設定ファイルをUNICODEのテキストファイルとかにするか?
そんなことがいかに間抜けだか分かるだろ?
227名無しさん@12周年:2012/02/05(日) 22:23:16.08 ID:eL37s5A80
文字列リテラルにLattin1とか埋め込むコードを書かなきゃいけない俺はどうすれば。。
228名無しさん@12周年:2012/02/05(日) 22:48:51.29 ID:pPoTVFH+0
229怒髪 ◆6Ih34Awd1Q :2012/02/05(日) 22:58:37.48 ID:+E3a1R4q0
男は黙ってShift-JIS。( ゚ω゚ )
230名無しさん@12周年:2012/02/05(日) 23:10:31.75 ID:OIiBSZH70
公孫?
231名無しさん@12周年:2012/02/05(日) 23:20:25.36 ID:rLCfOfaL0
まぁまて。どこの言語の話か知らんが、C++に関して言えば
人間が読み書きするプログラムは物理文字セットで書かれるが、
コンピュータ(コンパイラ、パーサ、etc)が読むプログラムはソース文字セットで書かれる。
コンパイル時に物理文字セット→ソース文字セットへの変換が行われる。
どんな物理文字セットを使うかは環境依存なので
そこには(基本文字セットさえ含まれていれば)どんな符号化文字集合/文字符号化方式を使おうとも勝手だ^^
232名無しさん@12周年:2012/02/05(日) 23:31:04.52 ID:+0Y4cBgE0
VS2005でUNICODE以外worning連発されてこまったのがなつかしいな
今ではcharを使うことすらなくなったがw
>>226
いまからでも遅くないからさっさと移行しないと痛い目見るよ
233名無しさん@12周年:2012/02/05(日) 23:58:33.51 ID:fU+2FhCB0
>>226
2TのHDDが1万以下で手に入る時代に何ねぼけたこと言ってんの?w
234名無しさん@12周年:2012/02/06(月) 04:12:02.61 ID:nso/7aLW0
>>233
絶賛値上がり中
235test:2012/02/06(月) 05:48:47.98 ID:tmDHxwvr0
読める?
C❽㊽
236名無しさん@12周年:2012/02/06(月) 05:51:14.63 ID:QcdP1HS70
>>8
人口が少ないって言ってもなんだかんだで南北合わせて7500万人はいる
これは言語としては世界上位15位以内に入るぐらい多く、イタリア語より多い
もっともそれで12000字ほど使っているから確かにコストパフォーマンスは悪いが
パーツだけ登録して組み合わせるようにすれば良かった
237名無しさん@12周年:2012/02/06(月) 05:56:02.52 ID:AnbWKIzX0
EBCDIC各社フォーマットとSHIFT-JISの変換プログラム書いたなぁ
もう遠い昔の話になるんだな
238名無しさん@12周年:2012/02/06(月) 06:07:43.35 ID:W0TCcpCD0
んなこと日本人には言われたくないだろうな。
日本語の方が遙かに迷惑。
239名無しさん@12周年:2012/02/06(月) 06:09:24.68 ID:NLeCwhCR0
書:きω逃sげ






























(´・ω・`)やあ
240名無しさん@12周年:2012/02/06(月) 06:10:57.11 ID:kLw6EwZs0
日本の漢字って大昔に手書きでミスった字もそのまま「そういう字もあるんだ」みたいに一つの字にしちゃったって聞いたが
そういう特殊な文字まで対応しなきゃいけないのか
241名無しさん@12周年:2012/02/06(月) 06:17:10.85 ID:EM7YNg3A0
出版業界では普通に作字して対応する
古たち伊知郎のたちとか大杉れんのれんとか
242名無しさん@12周年:2012/02/06(月) 06:22:37.81 ID:tkyZXYb60
去年作ったシステムが全てSJISですが
243名無しさん@12周年:2012/02/06(月) 06:27:40.80 ID:W0TCcpCD0
山崎の崎が立の方だとこだわるヤツもいるが、さらにそこから漢字は分かれていたりする。
「どちらの立山崎ですか?」ときくと「知らん」だってw
みんな自分の知っている範囲だとこだわるが、あいにく全ての異体字を把握している人間などいない
244名無しさん@12周年:2012/02/06(月) 06:33:26.54 ID:lMhXhfzu0
一見Unicodeに見えてローカルな外字を組み込んでいるクソ設計もあるぞ
245名無しさん@12周年:2012/02/06(月) 06:43:38.99 ID:iCraAN9O0
UnicodeからEBCDIC系の変換ライブラリって
246名無しさん@12周年:2012/02/06(月) 07:12:42.45 ID:ejmkr3mZ0
盾ヘ遠くになりにけり…
247名無しさん@12周年:2012/02/06(月) 07:56:57.91 ID:O0qc24fs0
>>24
> >>21
> そうなのかありがd
> 移行しちゃえばいいのにとか思っちゃうわけだけど
> そーゆーとこはいろいろ面倒な理由あるんだろうなあ

過去からの一貫性という問題があるから
文字コードの切り替えは
大改装するときとか新サービスへ移行とかの機会じゃないと手を付けにくい難しい課題です。

元を辿ると、日本語コードの統一、少なくとも外部コードの統一標準化に対する政府の認識の甘さが
確実に処理コストの増大を招き将来の大きな禍根となることは指摘されていたんだけどねえ。
248名無しさん@12周年:2012/02/06(月) 08:26:03.44 ID:+4oIDeaA0
>>82
Javaはutf-16beで結構異端だし関係なくね。
一番大きいのはBSDやLinuxが標準文字コードに
utf-8を徹底したこと。windowsと違って
ファイル保存のデフォが全てutf-8になったんで、
eucとか使う方が寧ろ手間になった。
サーバー製品は大抵GNUベースだからこの流れに逆らえないし。
249名無しさん@12周年:2012/02/06(月) 08:48:08.28 ID:HEYZROto0
ISO-2022-JP-2 オワタ
250南米院 ◆ULzeEom5Pip0 :2012/02/06(月) 09:09:11.16 ID:4v27NmAi0
ガンダムスレじゃ無かったか・・・。qqqqq
251名無しさん@12周年:2012/02/06(月) 09:14:29.05 ID:GwltRet60
別に、utf-8だろうが、S-JISだろうが、EUCだろうが、何だっていいけどよ、
きちんと charset= で文字コードを宣言しろよな>糞サイト
252名無しさん@12周年:2012/02/06(月) 10:14:17.03 ID:jbP1UzFS0
しかしutf8でもBOM ありとなしで微妙に対応できないエディタがある
253名無しさん@12周年:2012/02/06(月) 11:06:22.01 ID:OYMu4lFQ0
namazuのunicode化ってめんどくさくない?旧EUCからの引っ越しとか時間かかりそうだから

あとまわしにしてる
254名無しさん@12周年:2012/02/06(月) 11:14:40.89 ID:KdcqCSEp0
>>243
異体字に固執する阿呆が多いのも事実だがな。
小篆レベルで同一字だったり、三体許容だったりとか、
1000年以上も前から手書きで使われてる字体を認めないとか。
255名無しさん@12周年:2012/02/06(月) 11:44:56.78 ID:XvSgrGZn0
商売やってっと、客に手紙出すときに名前を間違えたら大変な事になるからなあ。
256名無しさん@12周年:2012/02/06(月) 12:41:05.34 ID:gyItTZvW0
Unicode 6.x からサポートされた巻き巻きウンチは日本起源。
257名無しさん@12周年:2012/02/06(月) 14:42:45.74 ID:iEBaT8Vp0
つまり、特亜除けのおまじないにShift-JISが使える。使いなさいと言う、啓発記事なのか。
258名無しさん@12周年:2012/02/06(月) 14:43:28.39 ID:d1LL0C1B0
ISO-2022-JP ってのがあって・・・
259名無しさん@12周年:2012/02/06(月) 14:58:29.44 ID:LyVL9mlI0
ソースにコード以外のリッチな情報を付加するって当然の流れじゃないのん?
エディタやコンパイラの苦労なんて知った事じゃねーんだし。
260名無しさん@12周年:2012/02/06(月) 16:15:37.17 ID:SJ+rixNH0
俺の使い方だと別にEUCでもあんまり問題ねぇな
261名無しさん@12周年:2012/02/06(月) 17:00:04.06 ID:XAkcf6+r0
官公庁に提出するデータは旧字体でもおkって通達あったけど
まぁ、触らないほうがいいな
262名無しさん@12周年:2012/02/06(月) 18:28:06.97 ID:veIj7TDn0
>>35
> 俺もWordPressがきっかけでUTF-8に移行したしな

ノシ
263名無しさん@12周年:2012/02/06(月) 21:46:33.07 ID:BU+gsBzc0
ジオシティーズにShiftJISで書かれてるけどエンコード指定の付いてないページアップロードするとYahooの挿入するEUCコードなジオタグから先の表示が化けまくりでな
264名無しさん@12周年:2012/02/06(月) 22:17:35.39 ID:t/e4oZZ/0
ここにJIS90だのJISX208だのJIS2004だのの話が混じってくると更にわけわかめ
265名無しさん@12周年:2012/02/07(火) 18:48:23.73 ID:LmIaFP0a0
jisじゃないのん
266名無しさん@12周年:2012/02/07(火) 19:57:45.60 ID:gM5A2AmE0
65001
267名無しさん@12周年:2012/02/07(火) 20:10:58.17 ID:NnYNBfTZO
Amazonはログイン画面でログイン失敗して戻るボタンで戻ると高確率で中国語に文字化けする
268名無しさん@12周年:2012/02/07(火) 21:53:21.53 ID:nWOfdREy0

これらの違いは何?
269名無しさん@12周年:2012/02/07(火) 23:44:22.56 ID:nFCtEuvk0
ほとんどの文章ではUnicodeの全文字を使うことはない。
なのに巨大なフォントを組み込んだり、一文字のコードを4バイトにしたり、
ライブラリに全言語対応のフィルタを乗っけたり…

そんなにリソースが余ってる環境ばかりじゃない。
っていうか、CPUキャッシュとかいうレベルの話になると
どんな環境でもかつかつ。

そういう現実もあって、結局ローカルな符号化文字集合や文字符号化方式が消える可能性はなし^^
270名無しさん@12周年:2012/02/08(水) 00:05:00.17 ID:3mvcnaOn0
UNICODEのテーブル全てを網羅するフォントなんて別に読み込んでないだろ
271名無しさん@12周年:2012/02/08(水) 04:09:58.03 ID:VI15xxL90
外国のパソコンって★とか♪とか使えるの?
272名無しさん@12周年:2012/02/08(水) 07:13:14.84 ID:KLn5ZyNV0
>>269
ジジイはそうやって一生潰しのきかない組込ドカタでもやってろよw
273名無しさん@12周年:2012/02/08(水) 07:59:00.15 ID:g4yTmGmF0
euc-jpだけでいい。
何で、特アと同じコード領域に共存しないといかんの?
274名無しさん@12周年:2012/02/08(水) 22:56:42.54 ID:sccL+WhR0
> euc-jp
一番ゴミみたいのをわざわざ
275名無しさん@12周年:2012/02/09(木) 15:48:21.33 ID:EmY/sqGM0
ただでさえ漢字は文字数が多いのに、
日本中国台湾と別々の規格があるから酷いな。
おまけに収録ミスも多々あると来ている。
276名無しさん@12周年:2012/02/09(木) 21:34:27.79 ID:iROk+nHa0
未だに自治体のサイトでもShiftJIS使っててしかも文字コードの指定タグがないとこがいっぱいある
どうも富士通の開発した自治体向けCMSらしい
277名無しさん@12周年:2012/02/09(木) 21:37:00.65 ID:Yys2xvLj0
EUC-JPはさっさと滅んでくれ
278名無しさん@12周年:2012/02/09(木) 21:37:54.75 ID:A7IAgz480
2バイトで全世界の文字を格納できるって思ったアメ公ってやっぱり頭が少し足りないと思う。
279名無しさん@12周年:2012/02/09(木) 21:46:32.81 ID:A7IAgz480
>>275
CJKは最悪ですな。
非漢字圏じゃなきゃおもいうかばないだろうな、あんなバカな事。
所詮、アルファベットでしか考えられない奴。
280名無しさん@12周年:2012/02/09(木) 21:50:01.33 ID:AB7mmqoF0
何で世界三大珍味にならなんだ?
281名無しさん@12周年:2012/02/09(木) 22:01:33.03 ID:fWBN9u8u0
ハングルって、理論上ありえるパターンで11172通りあるそうだけど、
それ全部入れろってか。

結局どうなったの?
282名無しさん@12周年:2012/02/09(木) 22:05:38.21 ID:SFSfssn60
jQueryでCSS読み込んだら
@charsetがutf-8なの
283名無しさん@12周年:2012/02/09(木) 22:26:20.11 ID:GjlTfnZz0
お前らってこれ全部理解できるのか
Unicode←なんて読むのかすらわからない
284名無しさん@12周年:2012/02/09(木) 23:44:32.84 ID:tqpnnPKF0
ついでに早くIE6とXP環境は消え去って欲しい。
もう保守したくない。
285名無しさん@12周年
perlはスクリプト自体のエンコードが影響するようになってて結構めんどくさい。
迷ったら、EUCにしておくのが一番無難だけど。