【神】作って!新WinCE用2chブラウザ【召還中】

このエントリーをはてなブックマークに追加
・monazillaプロジェクトの資料室をよく読む

http://www.monazilla.org/ monazillaプロジェクト
http://members.jcom.home.ne.jp/monazilla/document/index.html 資料室
・最初の板一覧は階層型のデータは存在しないので、PCでの右フレームやBBS一覧から解析する

http://www.ff.iij4u.or.jp/~ch2/bbsmenu.html 右フレーム
http://www.2ch.net/bbstable.html BBS一覧ページ
33その2の続き:02/10/12 09:52 ID:???
・解析は"【","】"を括りとし、 "TARGET="が含まれるリンクは板ではないので除外する
・サーバー移転などで転送される場合があるので、接続したページの文中に文字列"javascript"の後ろに"window.location.href"があればその示す先に飛ばす
・スレ一覧は板アドレスの最後に"subject.txt"を付加すると見える
・区切りの"<>"は板のサーバーによって異なる場合があるので、monazilla資料を漁って対応する。が、現在は事実上"<>"のみで問題ないみたい
・スレ一覧はgzip取得できる
・そのほか細かい仕様変更に伴うルールがあるが、過去ログを見ないのであればあまり気にする必要はない
・スレタイトルに"<",">"が有ると"<",">"に置き換わっている。"&"はあったっけ…・gzip転送はhttpに"Accept-Encoding"を指定すし、zlibが必要。戻り値の"Content-Encoding:"で確認できる
・なお、"subject.txt"の代わりに"SETTING.TXT"を読み込むと板固有のローカルルールが分かる・2ちゃんねる初心者のためのページにこの辺の情報が解説されているので、参照

http://www.skipup.com/~niwatori/index.html 2ちゃんねる初心者のためのページ
・スレは 板アドレス+"dat/"+(3)でのファイル の.datファイルで取得
・datファイルをhttp取得する時は"User-Agent"の先頭を"Monazilla/1.00"にしないと拒絶される(ie等では見えない)
・先述の文字列はおやくそくなので、偽装って意味ではなく、後ろに各ブラウザの識別名を追加するのが普通  例:Monazilla/1.00 (super-hikky/1.0)
・昔はgzip転送できていたらしいが、今は出来ない。
・早く読み込むためにはhttpで、範囲:"Range"や、更新日時:"Last-Modified"を指定して差分取得する
・なお、取得した生データにはNULL(0)がデータ中に含まれる場合があるので、この時に空白(0x20)に置き換えておくと便利
・内容のデータ順序は名前、メールアドレス、"YY/MM/DD"+ " " + "HH:MM" + " " + "ID:" + id、以降は内容
・ただし、"あぼーん"になっている場合があるので、日時変換などには気を付ける
・名前で</b><b>でくくられた部分はキャップやトリップ
・"http:"で始まっている部分はブラウザ側でリンクと見なす。dat中には"<a href="はない
・引用">>"の場合は"<a href="がdat中に埋め込まれている
・改行は<br>、以外でも">"は">","<"は"<"等の置き換えがされている