UNICODE(UTF8)に期待してよろしいか?

このエントリーをはてなブックマークに追加
UCS-2 は16ビット固定長だが、そいつにサロゲート導入して100万文字くらいまで拡張したのが UTF-16 だ。
UTF-32 は32ビット固定長だが UTF-16 で扱える範囲のみに限定したものだ。
31ビットまで全部使うのは UCS-4 という。

UCS-2 < UTF-16 = UTF-32 < UTF-8 = UCS-4