datをUTF8にするのはどうだろうスレッド

このエントリーをはてなブックマークに追加
384ひろゆき@どうやら管理人 ★
sports11もread.jsの設定お願いしますー。
385動け動けウゴウゴ2ちゃんねる:2008/04/25(金) 09:56:53 ID:deYgxNnf0
ぴろりん発見
386 株価【830】 △△ ◆cZfSunOs.U :2008/04/25(金) 10:42:26 ID:3m/nTh190
>>384 人大杉時に read.js に振る設定が FOX さんに override されて
「秘密の花園」に飛ばされてしまうのですが,とりあえずやっておきます.

# 再度 override されるようなら,↓あたりの話を FOX さんと詰める必要があるのではないかと......
# http://qb5.2ch.net/test/read.cgi/operate/1208685863/15-n
387動け動けウゴウゴ2ちゃんねる:2008/04/25(金) 13:20:09 ID:g1Y2XeLi0
ぴろり菌発見w
388あぼーん:あぼーん
あぼーん
389動け動けウゴウゴ2ちゃんねる:2008/05/05(月) 17:25:01 ID:afyb9tX10
(´・ω・`)このスレ終わっちゃったの?
390動け動けウゴウゴ2ちゃんねる:2008/05/05(月) 17:58:44 ID:U3TbI2+30
>>389
「俺がUTF8化してやるぜ! utf.2ch.netという名前を付けて鯖よこせ! 」
みたいなことを言う人が現れなかったので終了しました。
391動け動けウゴウゴ2ちゃんねる:2008/05/06(火) 20:48:45 ID:ZGvvJhjr0
うお乗り遅れた

っつっても俺がやってやるから鯖よこせと言えるだけのパワーは無いけど
392動け動けウゴウゴ2ちゃんねる:2008/05/06(火) 21:05:24 ID:ztX/ckgM0
実際UTF8化した場合、簡単な設定変更で表示可能なブラウザって
IE以外だと何がありますか?(IEならエンコードは自動認識だったかな)
393動け動けウゴウゴ2ちゃんねる:2008/05/06(火) 21:19:51 ID:u8C45HHC0
ウェブブラウザのシェア統計に名前が出るブラウザなら特に設定の変更は無いです
394動け動けウゴウゴ2ちゃんねる:2008/05/06(火) 22:11:05 ID:ghDM9x940
navi2ch はすぐだな
395動け動けウゴウゴ2ちゃんねる:2008/05/06(火) 22:42:03 ID:V+cwX45t0
>>392
っていうか、むしろその IE(6) で問題が大有りなんだが… IE7 なら割と平気。
396動け動けウゴウゴ2ちゃんねる:2008/05/07(水) 00:26:42 ID:8uJffkUH0
>>394
emacs自体のユニコード処理が微妙だったり無かったり
397動け動けウゴウゴ2ちゃんねる:2008/05/07(水) 00:43:11 ID:FVQiW6yh0
今時、問題になるようなウェブブラウザはないかと。
(ウェブブラウザが見るのはhtmlだから、もし問題ならread.cgiが
SJISなhtmlを吐くようにすればいい)
対応が大変なのはdatを自分で読んでいる専ブラ。
398委員長 ◆/DABoneCRY :2008/05/07(水) 05:20:13 ID:QxFtrOUb0
専用ブラウザの場合、最悪IEコンポーネントを使っているなら
そのままUTF-8で吐き出せば表示されるかな?と思いますが
独自描画だとキツいでしょうねぇ。
内部でSJISにコンバートしてから表示ってことになるかな?

SUBJECT.TXTもUTF-8になるのなら、同じ感じですね。
スレッド一覧表示のところね。
上手く表示出来ない文字とか出るんでしょうねぇ。

SJISのままで行きましょうよ……。
399動け動けウゴウゴ2ちゃんねる:2008/05/07(水) 05:59:47 ID:YZj/IRfH0
もういいじゃないこのままで
400動け動けウゴウゴ2ちゃんねる:2008/05/07(水) 10:37:11 ID:FVQiW6yh0
ご時世を考えるとむしろ内部UTF-8な専ブラもあったりするんじゃないかと
思わないでもなかったり。

ところでトリップの話が出てますけど、トリップだけはSJISに変換して
計算すればいいんでない?
あと、トリップの強度を上げる話は、キーはSJIS8バイト以内なら現トリップ、
それよりキーが長ければ次世代トリップというように、互換性をもたせたまま
拡張する手もある。
401動け動けウゴウゴ2ちゃんねる:2008/05/07(水) 17:07:17 ID:swK7kCX6O
今こそおいらロビーインターナショナルの復活の時
402動け動けウゴウゴ2ちゃんねる:2008/05/07(水) 18:05:49 ID:PHJOcw2w0
>>400
トリップの件… 多分この板の過去スレのどこかにソースがあるはずだけど(トリップ
統一スレだっけかな?)、2ちゃんねるの仕様としては、non-ASCII なキャラクタは
トリップコードしては不正なはず。
403stream ◆PNstream2s :2008/05/07(水) 18:28:39 ID:m32b509z0
>>188
404動け動けウゴウゴ2ちゃんねる:2008/05/11(日) 10:29:19 ID:3JPX5k+W0
管理人がそう言っていたとしても、
現実使ってる奴がいる以上需要はあるかと。

対応する理由が2ch側には無いのはわかってますけどね。
405動け動けウゴウゴ2ちゃんねる:2008/05/16(金) 09:17:59 ID:oK7aNu1R0
2NNはUTF-8なんだな
406動け動けウゴウゴ2ちゃんねる:2008/05/18(日) 06:06:12 ID:yWeFaP7n0
S-JISを通信の世界に出すなと言う20年以上昔の議論の結論が今頃出てきたなw わずかな期間のわずかなリソース節約の為にどれだけのパワーが削がれてきたのか、 そして、正しき状態に戻すためにどれだけのパワーを必要とされるのか、、、南無、、、
407動け動けウゴウゴ2ちゃんねる:2008/05/18(日) 07:05:02 ID:QBG0YZC80
正しき状態とかもうね
408動け動けウゴウゴ2ちゃんねる:2008/05/18(日) 07:23:47 ID:e9j/YDzI0
欠陥の多い間に合わせの文字コードだからな。
409動け動けウゴウゴ2ちゃんねる:2008/05/18(日) 08:30:45 ID:uwERh9TE0
>>406
20年以上前は80x40の端末しか存在しなかったから
改行して読みやすくするなどの
読み手のことなど全く考慮する必要がないということですね。
410動け動けウゴウゴ2ちゃんねる:2008/05/18(日) 09:17:21 ID:jVWe2BtW0
通信の世界で使えと言ってたのはISO-2022-JPなわけだが(今でも日本語メールにその名残がある)
datをISO-2022-JPにしろとでもおっしゃいますか
アホか
411動け動けウゴウゴ2ちゃんねる:2008/05/18(日) 11:08:47 ID:HxyQJ5j/0
>>410
名残もなにも、RFC 1468(ISO-2022-JP)は現役バリバリで obsolete されていないから、
text/plain での日本語環境 mail/netnews じゃ ISO-2022-JP しか使っちゃ駄目。
412動け動けウゴウゴ2ちゃんねる:2008/05/18(日) 12:41:42 ID:LZxEStfR0
mailとnetnewsではね
2chにはあまり関係のないお話
413動け動けウゴウゴ2ちゃんねる:2008/05/19(月) 14:57:34 ID:OHADN8NA0
そこまで言うならUTF-7でいいよ
414動け動けウゴウゴ2ちゃんねる:2008/05/19(月) 19:36:53 ID:CI88+YrjO
むしろUTF-18で
415動け動けウゴウゴ2ちゃんねる:2008/05/19(月) 21:28:50 ID:ETRrbr/x0
いっそのことUTF-9で
416未承諾広告※ ◆TWARamEjuA :2008/05/19(月) 22:00:30 ID:X4v1z3oV0 BE:5881469-2BP(7088)
うっとこはJST-9だよっ♪
417動け動けウゴウゴ2ちゃんねる:2008/05/19(月) 22:56:52 ID:ZQSwr6w90
>>413
全部実在するから始末に負えない
418動け動けウゴウゴ2ちゃんねる:2008/05/19(月) 23:02:17 ID:PaaKUwwi0
こんなにあるもんなのか

UTF-7
UTF-16 (後述)で表したUnicodeをBase64で変換して表す方式。
ただし、ASCIIのアルファベット範囲等については(ry

UTF-9
8ビット単位の可変長コード(1?5バイト)にエンコードする方式。
ISO-8859-1に対して一部互換である。
しかし、UTF-8が普及しつつあり、それと比べて欠(ry

UTF-18 (エイプリルフールネタだそうで)
Unicode符号位置を単一の18ビットによりエンコードする方式。
UTF-8に対するUTF-16のようなものだが、RFC公開時点のUnicodeで文字が定義されていた(ry
419動け動けウゴウゴ2ちゃんねる:2008/05/19(月) 23:22:46 ID:ACmPGLE70
ネタもあるから注意が必要だ
有名どころではハトとか
420動け動けウゴウゴ2ちゃんねる:2008/05/19(月) 23:50:08 ID:PaaKUwwi0
HTCPCP/1.0とかもなw
421動け動けウゴウゴ2ちゃんねる:2008/05/20(火) 08:32:07 ID:Yq4y55V5O
実用的なところでは洗濯バサミとかなw
家庭内やSOHOぐらいだと意外と使えるぞ。
422動け動けウゴウゴ2ちゃんねる:2008/05/20(火) 15:02:44 ID:CxBd8N6S0
> 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
>   ひろゆきは三度、専ブラを使え(で書き込め)なくした。
>     それを受け、むむむさんは静かにqb5・6を停止した。

ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
ttp://news24.2ch.net/test/read.cgi/liveplus/1207900534/30
 嫌な予感がしてkakikomi.txt確認したら…>‎>1ネタをネタと(ry
423動け動けウゴウゴ2ちゃんねる:2008/05/23(金) 20:07:51 ID:7tXSpSoi0
よし、文字コード設計からやろう
424動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 01:23:43 ID:m9uPvIcS0
datの先頭あたりで判別できるようにすればいいんじゃないかな

Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>

ってみたいに
425動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 02:10:03 ID:zjd3Cur70
判別するだけだったら1文字か2文字でいいんじゃない?
426動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 02:32:35 ID:m9uPvIcS0
できそうなところがないじゃない
427動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 08:52:12 ID:oBnQpL6S0
UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS
428動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:23:35 ID:d7IdQZ8a0
専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない
429動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:46:32 ID:oKxq3p9z0
ファイルの途中からUTF-8に変えるのかい?
430動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:49:22 ID:PCPcTJ5b0
いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。
431動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:28:00 ID:jwQb16jz0
datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。
432動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:43:50 ID:9dlsmaAP0
XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。
433動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:50:33 ID:jwQb16jz0
圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。
434動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 09:38:23 ID:nr0ZnGPL0
XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。
435動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 13:45:49 ID:U0RJgIvu0
このスレの主旨?とはまったく異なる視点で…

・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する

ってのなら、まだ分からんでもないけど > dat?の XML 化

専ブラ開発者からみたら、メリットはないわな。
436動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 14:07:56 ID:rNTH5CZP0
これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ
437動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 15:57:25 ID:nr0ZnGPL0
> ・read.cgi が吐くものを XML で再定義する

read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。
438動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:13:36 ID:/yE7qfVJ0
>>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。

RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない?
439動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:23:33 ID:foEE4xHPP
>>438
RFC 3629
440動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:43:12 ID:nr0ZnGPL0
書き込みがちょん切れたorz

RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。

専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。
441動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 16:51:29 ID:ZKBghHLV0
うぁ… RFC の番号打ち間違えてたか、すまん orz

dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。

意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。
442動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 18:51:20 ID:xSM3vYZLO
DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。
443動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 23:05:42 ID:4dBEta1n0
そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決

とか実も蓋もないことを書いてみる
444動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 00:47:21 ID:ivI86OvK0
金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし
445動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 01:58:12 ID:PsXz3U600
そのおっさんがどうだろうって言ってるわけでふりだしに戻る
446動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 11:44:06 ID:0unnv0s00
いやもう結論でてるし
447動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 23:11:39 ID:+LT7fBA+0
そうか
IDかっこいいな
448動け動けウゴウゴ2ちゃんねる:2008/05/31(土) 11:35:12 ID:m2txMOod0
おっさんの気が変わった時に備えて議論しておこうとか
449あぼーん:あぼーん
あぼーん
450kita159028.kitanet.ne.jp :2008/09/10(水) 19:41:26 ID:3SVxHFXR0
てす
451kita159028.kitanet.ne.jp テス:2008/09/10(水) 19:47:17 ID:3SVxHFXR0
テステス
452動け動けウゴウゴ2ちゃんねる:2008/09/12(金) 06:49:48 ID:Yi4KG57V0
tes
453,,・´∀`・,,)っ-○◎●:2008/09/23(火) 16:11:48 ID:YDhzyxaB0
>>312
俺も国際標準になるんだぜ?
454動け動けウゴウゴ2ちゃんねる:2008/09/25(木) 12:45:42 ID:3T+dkcPm0
read.cgiをいじってみるよスレッド
http://qb5.2ch.net/test/read.cgi/operate/1222311594/
455動け動けウゴウゴ2ちゃんねる:2008/11/04(火) 19:47:09 ID:TFZ/W06V0
sjisをブラウザでutf8に変換してread.js使えばおkじゃねの?
456動け動けウゴウゴ2ちゃんねる:2008/11/04(火) 20:58:01 ID:FoqwzlC20
>>455
何周遅れだw
457動け動けウゴウゴ2ちゃんねる:2008/11/05(水) 00:22:36 ID:X27+ADGy0
sjisをブラウザでutf8に変換とかある意味凄い発想ではある(わらい
458動け動けウゴウゴ2ちゃんねる:2009/02/11(水) 21:18:57 ID:qUTVryWc0 BE:689577293-PLT(18613)
DBの容量食うけどutf8でよいよ。
???????がなくなるな。
459動け動けウゴウゴ2ちゃんねる:2009/04/11(土) 11:27:06 ID:0wma4iid0
おっさんがまたその気にならないかなぁ
460動け動けウゴウゴ2ちゃんねる:2009/05/25(月) 16:07:09 ID:ZveJmHBs0
utf8にしたらrockの方もutf8にする必要あるんじゃないの?

現在のshift-jisに無い文字はhtmlで使われてる&〜; で対応可能だけど
utf8になったら生を扱う事になって(ry
461未承諾広告※ ◆TWARamEjuA :2009/05/25(月) 20:47:18 ID:L9EDgs7/0 BE:1524672-BRZ(10072)
その方がごっつぅ都合良かったりします♪
462動け動けウゴウゴ2ちゃんねる:2009/05/30(土) 17:31:30 ID:WUEb7YiBP
SJISはダメ文字がうざいな。
管理人の主眼はread.jsのようだが。

専ブラの対応は、文字コード処理なんてどの言語も
関数なりライブラリなりがあるから大した手間じゃないでしょ。
と、スクリプト程度しか作れない身で思ったら、
Delphiはめんどいのか>>361


切り替えは、ある時期に旧鯖は新スレ禁止、
utf鯖に全てスレを立て直して、keyの前後で区別すればいいよ。
鯖での区別はリスト保持がめんどい>>15
463 [―{}@{}@{}-] 動け動けウゴウゴ2ちゃんねる:2009/06/03(水) 13:22:42 ID:64ScwrmkP
>>462
Delphiは2009からネイティブUnicode、
それ以前のでも表示させるのは可能だ
いまんとこJane系はNidaはUTF8も読める

スレタイにSJIS範囲外の文字が入ると化けるけど
464動け動けウゴウゴ2ちゃんねる:2009/07/08(水) 08:20:48 ID:/VI8w+Vs0
dat + read.js

XML + XSLT
は、ブラウザはどっちが軽いんだろう。
465動け動けウゴウゴ2ちゃんねる:2009/08/16(日) 14:42:17 ID:vfU/gAUo0
専用ブラウザもIEのTridentエンジン使ってるんだから大した修正なしで出来ると思うんだが
466動け動けウゴウゴ2ちゃんねる:2009/08/16(日) 14:54:13 ID:YZ6fRRAk0
全部の専ブラがTrident使ってるわけじゃないし
467動け動けウゴウゴ2ちゃんねる:2009/08/21(金) 18:22:18 ID:nM7Fld6I0
モノ知らんヤツはいいなあw
468動け動けウゴウゴ2ちゃんねる:2009/09/13(日) 03:37:40 ID:cr42RI7a0
まあまずは制限を1024KBに引き上げることだな
話はそれからだ
469 [―{}@{}@{}-] ぞうさん


規制議論板から誘導されてきました。

この板を荒らした方が面白い反応が得られそうなので、これから数ヶ月間あの手この手で荒らし続けます。

これはほんの挨拶代わりのコピペマルチポポポです。

どうか面白い反応で楽しませてください。

以上、苦情は規制議論板まで。