2chで外国語の特殊文字を使うには[unicode][専ブラ] 2
【2chの仕様】
2chでは各種設定が板ごとに決められており、板自体が特殊文字を書き込めない設定になっている場合もある。
特殊文字が書き込める設定かどうかは各板のSETTING.TXTを見ればわかる。
(板URLの後ろにSETTING.TXT。この板の設定は→
http://kamome.2ch.net/gogaku/SETTING.TXT )
JaneXenoなど一部の専ブラでは「Unicode: ○」「Unicode: ×」などとわかりやすく表示される。
・BBS_UNICODE=pass(Unicode: ○) … 特殊文字(Unicode)を書き込むことが出来る
・BBS_UNICODE=change(Unicode: ×) … 特殊文字(Unicode)は書き込めず、文字化けする
・BBS_UNICODEの項目が無い(Unicode: 不明) … BBS_UNICODE=changeと同じ処理(文字化けする)
※この設定は申請により変更可能。項目が無い場合も申請すればOK。
※「文字実体参照」は、BBS_UNICODE=change(Unicode: ×)の板でも書き込みが可能。
その場合も、見た目は同じ文字でも「数値文字参照」では書けないので注意。
※スレタイには特殊文字は使用できない。名前欄やメール欄では「文字実体参照」なら使用可能。
※SETTING.TXT上に項目が無くても、2chはデフォルトで「BBS_UNICODE=change」である。
※2ch以外の掲示板ではその掲示板の仕様によって異なるため、Unicodeの項目の有無では判別できない。
項目が無くても書き込める掲示板、数値10進は無理でも数値16進なら書き込める掲示板など様々。
【専ブラごとの仕様の違い】
表示 書込 書込 検索
Unicode: ○(BBS_UNICODE=pass) Unicode: ×(BBS_UNICODE=change)
直接 | 実体. |..数値10..|..数値16.. 直接 | 実体. |..数値10..|..数値16
Ü|汉 |.RTL.. Ü|汉 | Ü|汉 | 汉 Ü|汉 | Ü|汉 | 汉 . Ü | 汉
====================================================================================================
JaneXeno ○ | ○|○ ○ | ○| ○. | ○ . | ○. ○ | ×| ○. | × . | × ○ | ○
JaneStyle. ○ | ▲|× × | ×| ○. | ○ . | ○. × | ×| ○. | × . | × × | ×
JaneView. ○ | ○|▼ × | ×| ○. | ○ . | ○. × | ×| ○. | × . | × × | △
ギコナビ. ○ | ○|○ × | ×| ○. | ○ . | ○. × | ×| ○. | × . | × ○ | ○
V2C ○ | △|○ △ | △| ○. | ○ . | ○. △ | ×| ○. | × . | × ○ | ○
Live2ch. ○ | ○|○ × | ×| ○. | ○ . | ○. × | ×| ○. | × . | × × | ×
IE ○ | ○|○ ○ | ○| ○. | ○ . | ○. ▽ | ×| ○. | × . | × ○ | ○
GoogleChrome..○ | ○|○ ○ | ○| ○. | ○ . | ○. × | ×| ○. | × . | × ○ | ○
Firefox. ○ | ○|○ ○ | ○| ○. | ○ . | ○. × | ×| ○. | × . | × ○ | ○
Safari ○ | ○|○ ○ | ○| ○. | ○ . | ○. × | ×| ○. | × . | × ○ | ○
Opera. ○ | ○|○ ○ | ○| ○. | ○ . | ○. × | ×| ○. | × . | × ○ | ○
====================================================================================================
各ブラウザ、専ブラ比較 (2011/02/24時点)
※表示/書込
Ü …文字実体参照が定義されている文字(IE▽:Üなど、ラテン文字の一部(Latin-1)のみ文字化けせず書ける)
汉…それ以外の特殊文字(ただし、サロゲートペア・結合文字は考慮しない)
( ○:標準で対応 V2C△:設定から適応可能
Style▲:XP以前ではハングルや簡体字などが表示されない。フォント変更で表示可能だがAA崩れなどに影響 )
RTL(Right-To-Left)…アラビア語など、右から左に書かれる言語への対応 (View▼:2語以上の連続に未対応)
※検索
Ü …本文中の特殊文字「Ü」を「Ü」で検索可能か
汉…本文中の特殊文字「汉」を「汉」で検索可能か (View△:「汉」を「汉」で検索可能)
JaneStyle、V2Cでの特殊文字対応の仕方
▲JaneStyle(表示) 主にXP(以前)のハングルや簡体字が表示されない人向け
JaneStyleフォルダ内のsample+.zipを解凍
↓
解凍したフォルダの中にあるskin_Doeフォルダを開く
↓
skin_Doeフォルダ内のHeader.htmlをメモ帳などで開く
↓
font faceの"MS Pゴシック"のところを"MS UI Gothic"などに書き換えて保存
↓
書き換えたHeader.htmlをJane2ch.exeと同じフォルダに置く
※スキンを設定している場合は、
そのスキンフォルダ内のHeader.htmlのfont faceを同様に"MS UI Gothic"などに書き換え。
Header.htmlが無い場合は、上記と同様に書き換えたHeader.htmlをスキンフォルダ内に置く。
△V2C(表示/書込)
設定 → フォント → 「指定フォントに無い文字は他のフォントを使用」にチェック
設定 → 書き込み → 「文字化けの可能性がある文字を参照に自動変換」にチェック
◆その他
Q.2ch上に「Ü」「汉」と書きたいのにそのまま書き込んだら「Ü」「汉」になってしまう
A.「&」を文字参照「&」に置き換える。
「Ü」「汉」と書き込むと、「Ü」「汉」と表示される。
同様に、「Ü」と表示したいなら「Ü」と書き込めばよい。
Q.「BBS_UNICODE=pass(Unicode: ○)」の板なのになぜ直接書き込んでも名前欄やメール欄で使えない文字があるのか
A.2chは文字コードShift_JISベースで構成されているので、JaneXenoやV2Cを使って直接書き込んでも
実際には特殊文字(Shift_JIS範囲外の文字)は全て「文字参照」に変換されている。
2chでは名前欄・メール欄の「#」以降の文字列は〔名前欄→トリップキー〕〔メール欄→運営ボランティア★の
キャップパス〕と特殊な処理をされるので、「数値文字参照」に変換された文字はその仕様に引っかかってしまう。
スレタイで使えないのは、「&」が自動的に「&」に置き換えられるからである。
Q.なぜ「BBS_UNICODE=change(Unicode: ×)」の板でも「文字実体参照」の特殊文字は書けるのか
A.「BBS_UNICODE=change(Unicode: ×)」の板では本文中の「&#」(とそれに続く数字;)が「?」にchangeする仕様
になっている。これをchangeさせずそのままpassするのが「BBS_UNICODE=pass(Unicode: ○)」の設定。
なので「&#」の組み合わせを持たない「文字実体参照」はそのまま書ける。
Q.BBS_UNICODEの設定変更の申請はどうすればいいか
A.まずは設定変更したい板(の自治スレなど)で話をする。
話がまとまったら運用情報板の「板設定変更依頼スレッド」に書式を整えて申請。
> 板設定の変更について
>
http://info.2ch.net/wiki/?%B1%BF%CD%D1%BE%F0%CA%F3%C8%C4%A4%CE%BF%B4%C6%C0#content_1_3 項目が無い場合も同じ手順で申請すればよい。
Q.なぜBBS_UNICODEの項目が無い板があるのか
A.作られてから何の設定も変更していない板はSETTING.TXTが短く、BBS_UNICODEなどいくつかの項目が
存在しない。板作成者FOX ★の都合(仕様+気分)だと思われる。
名無しの変更など、どの項目でもよいので一度でも変更人の設定変更スクリプトでSETTING.TXTが更新されれば
項目が現れるようだ。なお、現れた際の設定は「BBS_UNICODE=change(Unicode: ×)」である。
◆まとめ1
・2chにはUnicodeが使える板と使えない板が混在しており、その設定はSETTING.TXTで確認可能。
Unicodeが使える板でもブラウザによっては直接は書けないが、「文字参照」を利用すれば書ける。
・板ごとの書ける文字、書けない文字はこんな感じ…。
BBS_UNICODE=pass BBS_UNICODE=change/項目無し
(Unicode: ○) (Unicode: ×/不明)
. レス |.名・メ欄 | スレタイ レス |.名・メ欄 | スレタイ
===========================================================
Shift_JIS ○ | ○ | ○ ○ | ○ | ○
文字実体参照 ○ | ○ | × ○ | ○ | ×
数値文字参照 ○ | × | × × | × | ×
===========================================================
・数値文字参照と文字実体参照とShift_JIS範囲の包含関係はこんな感じ…。
┌──────────数値文字参照──────────┐
│┌文字実体参照┐ │
││ ┌┼ Shift_jis. ─┐ │
│└─────┼┘ │ │
│ └──────┘ │
└──────────────────────────┘
◆まとめ2
・2chの特殊文字が読めない
→1、専ブラが表示に対応してないかも(
>>6-7)
2、レス表示に設定してるフォントが日本語にしか対応してないかも(→初期設定に戻すorフォントを変更
>>7参照)
3、一般的でない文字記号はPCが対応してない/フォントが入ってないかも(
>>2)
4、そのレスを投稿した人のミスで、最初から文字化けしてるかも
・2chに特殊文字が書けない
→1、特殊文字が直接書き込める専ブラじゃないかも(
>>3,6-7 →JaneXenoやV2Cを使用or「文字参照」を使用)
2、表示が対応してないせいかも(実際は書き込めているが自分の環境では表示されないためにわからない)
3a、その板の設定が「BBS_UNICODE=pass(Unicode: ○)」じゃないかも(
>>4)
3b、「BBS_UNICODE=change(Unicode: ×)」や「項目無し(Unicode: 不明)」の板で
「数値文字参照」を使おうとしているせいかも(
>>4,6,8,11 →「文字実体参照」を使う)
4、レス本文以外の、名前欄やメール欄に書こうとしてるせいかも(
>>8,11)
5、その掲示板、2chじゃないかも(
>>4)