従来、過去ログ倉庫には重複したファイルがあり、同一スレッドにもかかわらず6個も7個もファイルがありました。これはサーバごとにスレッドを保存していたことから、板がサーバ移転するつど、ファイルが増えていたことによるものです。
今回、重複ファイルを整理・削除しディレクトリ構造を見直しました。また、まちBBSについてもすべてdat形式で保存・公開するようにしました。もちろん、取得済みのhtmlファイルはdat形式に変換しています。
1週間ほど404エラーをチェックし、可能なものは新しいもしくは正しいURLにリダイレクトするようにしていますのでURLが変わったページに気づかないかもしれませんね。
さて、以下に簡単な閲覧方法を書きましたので参考まで。
■ 一般の方向け情報
2ちゃんねるの過去ログの見方
http://mimizun.com/log/2ch/板名/スレッド番号/
例 http://mimizun.com/log/2ch/lobby/980827533/
まちBBSの過去ログの見方
http://mimizun.com/log/machi/板名/スレッド番号/
例 http://mimizun.com/log/machi/tokyo/1315296009/
※現行スレッドが存在する場合ページ最上部にリンク先を記載しています。
現行スレッドに書き込みをしたい場合はそのリンク先から書き込めます。
■ 開発者向け情報
●専ブラ開発者の方へ
datの取得方法
UserAgentについて
文字列 'Monazilla' を含む独自のUserAgentを設定してください。
※ Monazilla/1.00 (専ブラ名)
URLについて
2ちゃんねるの場合
http://mimizun,com/log/2ch/板名/スレッド番号.dat
例 http://mimizun.com/log/2ch/lobby/980827533.dat
※datの書式は既知の通り
まちBBSの場合
http://mimizun.com/log/machi/板名/スレッド番号.dat
※datの書式は2ちゃんねるとは異なりレス番号が行頭に付与されます。
尚、オリジナルが透明削除の場合、連続しないレス番号になります。
http://mimizun.com/log/machi/kana/1148994302/
http://mimizun.com/log/machi/kana/1148994302.dat
圧縮について
圧縮したものを受け取る場合
GETする際のHTTPヘッダに下記を付与してリクエストしてください。
Accept-Encoding: gzip
圧縮していないものを受け取る場合
GETでリクエストしてください。
●クローラーを使う方へ
何らかの目的で当サイトに存在するdatファイルを大量に必要とされる場合は、ダウンロードする前にメールで許可を得てください。費用を請求することはありません。以下の点についてご連絡ください。
・取得範囲
・利用目的
・連絡先メールアドレス
・法人である場合は連絡先および担当者名
同一IPアドレスから一定時間内に一定数以上のリクエストを行うと正常な取得ができなくなるようにしています。[参考]
現在の値はかなりきついです。きつきつです。
2012年12月29日変更
専ブラのUserAgentについて Monazilla を含むよう追記
クローラーを使う方への内容を事前に許可を得たうえで行うよう変更