文字コード総合スレ part7

このエントリーをはてなブックマークに追加
619デフォルトの名無しさん
Javaがらみなのですが、native2asciiでUTF-16でサロゲートペアになる辺の文字の
逆変換がうまくいかないっぽいのですが、こういうもんでしょうか。

例えばU+21300に対して(以下某専ブラの文字参照のテストも兼ね)

% echo 𡌀 | native2ascii -encoding UTF-8
¥ud844¥udf00
% echo 𡌀 | native2ascii -encoding UTF-8 | native2ascii -reverse -encoding UTF-8
¥ud844¥udf00

そのまんまやんけ、と。