1 :
:
02/10/30 01:21 ID:??? 2chのWEB-P板住人で掲示板スクリプトのデータフォーマット規定を作りましょう! この規定を定めることにより掲示板間のデータファイルの共有や 乗り換えが容易にできるようになります。
2get 2ch互換よりいいものをつくってください
ら ∧_∧ ∧ り ( ´∀`)`__∧ / , つ∧`__∧ ゆ /(__(__ヽ∩∧`__∧ /(__(_し'し'ヽ∩´∧`_∧ 3げっと… ///`∧_∧_(_し'し ヽ ∩´∀` )∧_∧ ( (((( ´∀`)_し'し ヽ とノ( ´∀`) /////つ つ'し (⌒) ノ ( ) ///// ,へ 〈 ~ し' | | | (((((_ノ (__) (__)_)
4 :
nobodyさん :02/10/30 01:46 ID:agk/BYvB
XMLで掲示板用の文書型ってないのかね。
5 :
nobodyさん :02/10/30 01:48 ID:agk/BYvB
6 :
nobodyさん :02/10/30 03:39 ID:yBuR7K1a
>>5 なんかむつかしそうですね。
>>1 さんが言ってるのってもっと簡単なことなんじゃないですか?
例えばデリミタは <> に統一するとか。
ちがうのかなぁ?
>例えばデリミタは <> に統一するとか。 そんなんでスレ立てられちゃかなわんな。 そんなんだったら、CGIスレやら掲示板スレでやれ。削除依頼だしとけよ、と。
8 :
nobodyさん :02/10/30 11:37 ID:p83AgH44
やっぱ、できが悪くてもデファクトスタンダードってことで、 2chのログ形式がいいな。 あと、UAがかちゅとかだったら、動的に2ch互換のログを生成するとか
何時の間に2chのログがデファクトスタンダードになったんだよ。
2chのログ形式ってどんなの?
13 :
nobodyさん :02/10/30 18:23 ID:P9f3ZiO5
2chのフォーマットはとてもじゃないけど汎用フォーマットにはなりえないよ。 思いつくだけでも ・返信元の情報が定義されてない(ツリー型掲示板と非互換) ・記事ごとのタイトルが定義されてない(記事ごとにタイトルを入れる掲示板と非互換) ・投稿者のHPアドレスが定義されてない(そういうのが入れられる掲示板と非互換) ・トリップの関係で</b>〜<b>みたいなとってつけたような形で物理タグが入ってる ・日付フィールドにIDみたいな余計な情報もいれてる ・基本的にCSV(区切り文字は<>だが)なので拡張性に乏しい
14 :
nobodyさん :02/10/30 18:39 ID:vrodE3lU
記事本体の形式としては RFC2822、記事同士の関連なら NNTP の XOVER か RDF/RSS あたりが使えれば新たに定めなくてもいいような。既存のライブラリも 多いし。
15 :
nobodyさん :02/10/30 18:54 ID:4q8hzZpW
16 :
10 :02/10/30 19:20 ID:???
サンクス
>>11 俺も
>>4 と同じで、汎用型ならXMLを使うねぇ。
XMLなら、
>>13 の問題もクリアできるだろうし
ただ、実装・負荷などで不利だと思う。
共通フォーマットに変換するスクリプトがあれば良いだけかな。
第一、『掲示板間のデータファイルの共有や乗り換え』の需要が
そんなにあるのかが疑問。
なんでデリミタって"<>"なの? "<"でもいいじゃん。
18 :
17 :02/10/30 23:16 ID:???
SJIS対策か・・・?
19 :
nobodyさん :02/10/31 01:01 ID:ZXkDOR/T
データ中にタグが現れるからでしょ ...<>aaa<br>bbb<>...
頭悪いな
タグは<と>にするのがいいかな。 <>って見やすいじゃん。
22 :
nobodyさん :02/10/31 03:06 ID:ZXkDOR/T
タグとして表現したいのをエスケープしてどうするんだよばか。
24 :
17 :02/10/31 03:50 ID:???
>>19 "<" ">"はエスケープしないのか・・・
そうすっと、要素の中では"<>"というシーケンスは記述できないわけね。
なんか気持ち悪いが・・・実用上困らないからいいのか。
25 :
nobodyさん :02/10/31 04:33 ID:ZXkDOR/T
<と>を<と>にエスケープする必要があるから 実際にタグとして表現したいところはエスケープしないんだろ。 で、タグとして<>という連鎖がありえないから区切りになるんだよ。 なんでこの程度わからんの。
26 :
17 :02/10/31 08:18 ID:???
>タグとして<>という連鎖がありえない ここを気持ち悪いと思うかどうかはセンスの問題だが、 「エスケープ」という本来の意味からすると、要素として 任意のバイナリストリームを持ってくることができた方が仕様としては美しい。 例えば将来文字コードの拡張が行われたとして、マルチバイト文字の並びの中 に"<>"というシーケンスがあったら困る、とかな。
<>カカレタラデータ破壊サレルヨ
28 :
nobodyさん :02/10/31 12:52 ID:YI8d19yY
オマエガナー
>>30 スーパーハカーの友達がいるんだろうさ(w
\t というのは?
33 :
nobodyさん :02/11/09 13:08 ID:M79jGLXj
ログを拡張する時を考慮して データー<>データー2<>拡張データー1,拡張データー2,拡張データー3<> みたいな感じで2重に区切ってるけどどう?
君の掲示板がそれで充分ならそれで良いんじゃない?
35 :
nobodyさん :02/11/09 17:00 ID:uiYVuqVI
掲示板のログ形式を統一するより、掲示板を読むアプリが 色んな形式に対応するようにした方が融通がきくような・・・
掲示板がログ形式を規定するXML文書を返してくれれば、 融通の効く一つのアプリでブラウズできるような。。。 誰かRFC書いてー。
37 :
nobodyさん :02/11/10 02:39 ID:WBc71eVW
HTML と IE で全部OK
<!--
仕様,ステータス,用途,規格化団体・企業
BBS-XML,ワーキングドラフト,掲示板,2ch
This is BBS-XML Strict DTD
ワーキングドラフト草案(w
続きは
>>41 で(w
-->
<!-- エンコードはUTF-8? -->
<!-- 互換性に重点をおくならUTFで -->
どんな種類の掲示板のフォーマット規定なのか 1.ツリー方式 2.ツリー方式以外(なんていうんだろ?、2chみたいなの…) T.一つの板に複数のスレッドがあると想定して規定 U.一つのスレッドをのための規定 T、Uはよくわからないかもしれないけれど、例えば Tだと <板 name="WEBプログラミング"> └<スレッド name="〜規定を作ろう"> └<レス no="41"> みたいな構造になると思うんだけど…
44 :
nobodyさん :02/11/13 22:34 ID:J/INLVIE
一つのXML文章で1スレッド、 ツリーにも対応 が理想
ま た X M L 厨 か 。
46 :
nobodyさん :02/11/14 02:49 ID:YeVWX2PG
CMTフォーマットだったら記事ごとに親記事のIDを指すフィールドが含まれてて 記事自体はシリアルに並んでる。 XMLだったらツリー構造をそのままXML内でもツリーで表現できるけど そうすることによるメリットって何があるかね。
>そうすることによるメリットって何があるかね。 自 分 で 探 せ
48 :
nobodyさん :02/11/14 20:50 ID:sVwpw064
>>46 XMLだったらツリー構造をそのままXML内でもツリーで表現できる。
CMTフォーマットだったら記事ごとに親記事のIDを指すフィールドが含まれてて
記事自体はシリアルに並んでるけど
そうすることによるメリットって何があるかね。
46じゃないが・・・
>>48 記事を時刻順に並べ替えて表示とか、そういう操作がしやすいね。
あるいは「関連(親)記事を複数」指定できるようにするとか、ツリー以外の構造にも柔軟に対応できるかな。
つうかXML使うにしても普通の神経してる設計者だったら掲示板のツリー構造を
そのままXMLのツリーに落としたりはしないだろう、と思われ。
>>49 >そのままXMLのツリーに落としたりはしないだろう、
つくる個人個人の"理論構造"に対する"美学"による
レスのデータとレスの構造は、別々になっていると読み込み効率がいいかも。 112 └113 └114 └116 115 たとえば、こんな感じになるかな?
52 :
49 :02/11/14 22:06 ID:???
>>50 >つくる個人個人の"理論構造"に対する"美学"による
まず、掲示板のツリー構造をそのままXMLのツリーに落とすメリットを教えてくれ。
「タグ禁止」なんて掲示板は要らないです。 マークアップ可能にしてください。
もう、これでいいや 名前<>メアド<>日付 時間 ID<>本文<>スレッドタイトル 名前<>メアド<>日付 時間 ID<>本文<>親記事の番号 名前<>メアド<>日付 時間 ID<>本文<>親記事の番号 ・ ・ ・
55 :
nobodyさん :02/11/15 15:59 ID:XZBvdeAK
ばーか
56 :
nobodyさん :02/11/15 16:30 ID:Ys0NMK/8
おお!こういう企画待ってました!!
丁度、こう言う話があったらいいなぁ〜って思っていたんだよね。
記事番号(連番)<>名前<>メアド<>URL<>西暦,月,日,曜日,時,分,秒<>タイトル<>本文(タグあり)<>
削除パスワード英数半角6文字(非暗号化)<>レス式専用領域<>ツリー型専用領域<>2ch型専用領域<>拡張領域1<>拡張領域2<>自由データ域
記事番号(連番)<>名前<>メアド<>URL<>西暦,月,日,曜日,時,分,秒<>タイトル<>本文(タグあり)<>
削除パスワード英数半角6文字(非暗号化)<>レス式専用領域<>ツリー型専用領域<>2ch型専用領域<>拡張領域1<>拡張領域2<>自由データ域
記事番号(連番)<>名前<>メアド<>URL<>西暦,月,日,曜日,時,分,秒<>タイトル<>本文(タグあり)<>
削除パスワード英数半角6文字(非暗号化)<>レス式専用領域<>ツリー型専用領域<>2ch型専用領域<>拡張領域1<>拡張領域2<>自由データ域
:
:
:
俺も「<>」区切りに賛成!
2行になってるけど、書き切れなかっただけで、本当は1行ね。
・URLは「
http:// 」から記述する。
・タイトルはタグなしで。
・本文の改行は<br>を使用。
・タグの削除や改行の変換は掲示板スクリプトで行う。
・「親記事の番号」は拡張領域に。
・ノーマル(スレッド型?)掲示板は専用領域は使わない。
・自由データ域内はその掲示板独自のデータを保存して「,」で区切ってデータを格納する。
(例えばアイコンの番号とか)
専用領域内の割り当ては後で考えるとして、こんなのはどう?
57 :
56 :02/11/15 16:37 ID:???
・「親記事番号」は専用領域の間違いでした(^^;
58 :
nobodyさん :02/11/15 17:11 ID:0vDY4OoR
まず、掲示板のツリー構造をそのままXMLのツリーに落とすメリットを教えてくれ。 メリット、デメリットならツリー構造でも非ツリー構造の親番号指定XMLでもかわらないでしょ。 しかし、最重要であるのは、 これが掲示板に投稿された文章をまとめるXMLなのか、 掲示板で表示される文章をまとめるXMLなのかということ。 前者ならばレスNOに親番号IDを指定すべき、(orツリー構造のみを専用ヘッダーに記述) 後者ならば掲示板のツリー構造をそのままXMLにマークアップすべき。 ちなみにこれ漏れの"理論構造"に対する"美学"(w
60 :
nobodyさん :02/11/15 17:49 ID:XZBvdeAK
シリアル並び+親記事ID付加のXMLからXSLTでツリー形式って作れるかな? それができればredundantにツリーを記述したヘッダとか用意しなくて済みそうだけど。
XML嫌いなんだけどこれからは掲示板程度のログ管理でもXMLが主流になっていくのか…
>>59 板全体をフロート式ツリー型掲示板だとするとそう言える
エンコードEUCのままだった……メンドクサー
めんどくさいから、E-Mailのフォーマットにマップするくらいじゃだめですか。 だめですね。逝って来ます。
さて、当然XSLも書くんだろ?
もう、これでいいや 名前<>メアド<>日付 時間 ID<> 本文 <>スレッドタイトル 名前<>メアド<>日付 時間 ID<> >>親記事の番号 <br> 本文 <> 名前<>メアド<>日付 時間 ID<> >>親記事の番号 <br> 本文 <> ・ ・ ・
71 :
65 :02/11/16 10:03 ID:dxuRB5Y0
72 :
65 :02/11/16 10:08 ID:???
ちなみに、今後やらなければならないこと、
他の関連文章(
>>14 )あたりをみて、
タグ名から内容の想像が簡単につくようにする。
>>1-2 みたいに"-"が入るとリンク個所に飛べない問題をなんとか
一番重要なこと、
誰 か 勧 告 文 と
s c h e m a 書 け
勧告文とか書けるレベルまで到達してないだろ(w
面白いのでage てか過疎化板マズー
76 :
65 :02/11/16 22:55 ID:???
やっぱりレス指定その他XLinkでやるべきなのかなぁと思ってみたり、
でも対応ブラウザ限られる(てか対応してるのあるのか?)からanchorでしのいでみたり。
>>75 >2ch標準datに変換するXSLを書きなさい、
先生、PerlでISO8601に変換した日時を2ch形式に直せません(w
77 :
nobodyさん :02/11/16 23:40 ID:aQaiSnyy
substringとかつかえばできるんじゃないの。 でも2chのスクリプトは日付フィールド解釈すること無いはずだから 日時フォーマットは違っても別に問題起こらない。
勧告文書いた香具師は、全ての掲示板スクリプト配布サイトへメールを送るべし。 言うだけなら誰にでも出来るぞ。 責任をもってきちんと実行しろよな。
何の責任やら。
80 :
65 :02/11/17 08:28 ID:???
>>77 02/11/16 22:55 ID:???
↓
2002-11-16T22:55:00+09:00 ID:???
となったり、、でもISO8601は各フィールド固定長だから簡単に切り分けられたり、
まぁ、確かに
>>77 の言うとおり。
まぁ、当面の目標はワーキングドラフトを2003/08ぐらい?
で、本気な人間いるのか(w
公式のDTDデータベースとかってあるの?
81 :
65 :02/11/17 09:08 ID:???
82 :
nobodyさん :02/11/18 18:57 ID:OsIWDNBz
XMLキター
83 :
nobodyさん :02/11/19 20:24 ID:LMx8p3pK
XMLで管理していいことあるの? 2ch標準やCMTに書き直せるってほんと?
84 :
nobodyさん :02/11/19 21:15 ID:jmDysryp
拡張性がある。 多種多様な掲示板のログ形式をカバーしようと思ったら本命はXMLでしょう。 XSLTはプレーンテキストの出力を作ることが出来るから XMLからCMTへ変換するXSLTを書くことも可能。 もちろんXSLTでなくてもいいけど。
CMTも考えているならハナからCMT形式で保存すればいいんじゃないの?
86 :
nobodyさん :02/11/19 21:49 ID:jmDysryp
拡張性って書いたでしょ。
お尻の穴も使うってこと?
CMTはクソ
<掲示板> └<messages> └<message data="(ISOよりunixtimeを使ったほうが楽だし、掲示板の文章を管理、ということにあう鴨)"> ├<ContributorInformation> │├<DisplayName> │├(ここらへん、個人情報のマークアップについて定めた規格が無い、 ││ おそらく、あと10年もすれば、どっかの団体から勧告があるとおもわれる ││ いまのところは、こちらで管理するとして、<MailAddress>で) │├<Server-UserID>(サーバーによって付けられたユーザーID、2chでいうID ││ できれば中身について定義すればいいような) │├<User-UserID>(ユーザーによってつけられたユーザーID、2chでいうトリップ) │└<RemoteHost>(投稿者の投稿時のリモートホスト) ├<Contents> │├<Subject> │├<TEXT> │├<KeyWords> │└<Reference> │ └(URIとかテキストとか) ├<ManageInfo> │└(削除フラグとか?) └<Response> └(<message>が入って…)
気色悪い構造だな
91 :
nobodyさん :02/11/20 20:47 ID:8AScm9DR
日付はW3C-DTFで、なおかつ属性じゃなく要素で表現したほうが CSSでも人間に可読な表示を作れてよいと思う。 あとUnix timeだと秒の部分をunspecifiedにできないし XSLTで普通の年月日の形式に変換するのも多分無理。
92 :
65 :02/11/20 21:24 ID:19vsiZOW
やっぱりISO8601、もといW3CDTFが由と、
(5) 年月日および時分秒
YYYY-MM-DDThh:mm:ssTZD(例:2001-08-02T10:45:23+09:00)
(6) 年月日および時分秒および小数部分
YYYY-MM-DDThh:mm:ss.sTZD(例:2001-08-02T10:45:23.5+09:00)
http://www.kanzaki.com/docs/html/dtf.html ただし、この場合タイムゾーンの扱いがけっこう手間だったり(w
例によって固定長なんでそれほどでもないか…
属性or要素の可視性についての問題はXSLでなんとかするんじゃないかと言ってみる、
漏れとしては属性についてたほうが美しい気が…
そういえば、検索するためのインデックスづけについての規格がどっかにあったような…
探すか…
ま た X M L 厨 か 。
94 :
nobodyさん :02/11/21 01:15 ID:s/ym5biF
日付を属性じゃなくて要素でていうのは XSLTじゃなくてCSSでも整形できたらベターだよねっていう話。
95 :
nobodyさん :02/11/21 01:16 ID:s/ym5biF
日付を属性じゃなくて要素でていうのは XSLTじゃなくてCSSでも整形できたらベターだよねっていう話。
96 :
nobodyさん :02/11/21 01:17 ID:s/ym5biF
二重カキコになっちゃった。すごい重いな。
97 :
nobodyさん :02/11/21 13:26 ID:toP4QAhm
内容は面白そうだけど、 XMLで作って実用性(実現性)はあるの?これ。
99 :
nobodyさん :02/11/21 15:09 ID:c8KCn5S8
実現性 - CGIとなりうるあらゆる言語に、XMLを使うためのモジュールが 追加され、改良されつつある現状を見ると、実現性は高い。 実用性 - XMLにすることで、掲示板専用クライアントが簡単に作れるようになる。 統合的なWebサービス(複数サイト内での検索サービス等)を提供できるようになる。
ああ、 XMLに騙された者が、また一人…
102 :
nobodyさん :02/11/21 20:36 ID:eFhGfzvA
>>94 まああまり見栄えに拘らなければCSSで属性を視覚化することはできるけど、
純粋な要素のメタデータで、しかも拡張性の無いものでないと属性にする
メリットは少ないね。例えば属性に子孫ノードは作れないわけで。
つーわけで同意。
>>92 XMLでやるってことは、拡張性をかなり重視してのことだと思うんだけど、
無闇に属性にするのは考え物だと思う。日付くらいならどうってこと無さ
そうだけど、まあ保険みたいなものか。RSSとかは実際要素だし。
気持ちは分かるが美しいとかっていう基準はヤメレ(w 蝿にたかられても知らんぞ。
103 :
65 :02/11/22 08:32 ID:zFwSanzN
ほほぅ、参考になるなぁ…と。 日時→要素 だね。 自分が属性にしだしたのは、HTMLのINSとかDELは実際そうだったし、 あと言葉にできない多々の理由(w だったんだけど、 確かに拡張性でいくと要素でもってたほうがイイと、 自分でもやっぱ要素かなぁ、と思ってみたり(w そういえば、メッセージ個別の規定と、 それをまた掲示板としてマークアップする規定を分けると便利だと思ったり、 ツリー構造のマークアップ/親番号指定 はどうなんだろ?
104 :
bloom :02/11/22 09:46 ID:ouswKb0x
105 :
nobodyさん :02/11/22 14:14 ID:pryQFT3p
>
http://www.atmarkit.co.jp/aig/01xml/xupdate.html >XUpdate(XML Update Language)
>XUpdateは、XMLを用いてデータベースを更新するリクエストを記述する標準言語として、The XML:DB Initiativeが開発中の言語である。
>古い資料では、XUpdateではなく、XULと記述されている場合がある。XULとした場合は、XML-based User Interface Languageと略名が衝突してしまう。
掲示板カキコにつかえる?
ここはXMLのスレでつか?
新技術についていけないヤシがぼやくスレですか?
108 :
65 :02/11/22 19:10 ID:nXwcOz9B
そういえば、この規格ってつくればチャットにも適用できるような… そんな需要があるのか知らんが(w
109 :
nobodyさん :02/11/23 15:04 ID:NMNqO3cZ
>>108 Jabberは既にそんな感じ
XMLでフォーマット決めて他のIMとの互換を実現してるとか
110 :
nobodyさん :02/11/23 17:18 ID:Hue8dIjc
メッセージ関係で、規格としてXMLを使うっていうのは結構みるんだけど、、 今までにあるみたいなんだけど、汎用の規格が見つからない。 メールでもIMでも、プロトコルを別にして純粋にメッセージのみをマークアップする規格ってあるのかね そういえば、NNTPをXML規格として立ち上げるようなことをどっかで聞いたような
111 :
nobodyさん :02/11/23 17:49 ID:NMNqO3cZ
いつも話がまとまらんが、できると結構便利なのは確か。 ここ含めて管理人が対応するかが問題だが。
112 :
nobodyさん :02/11/23 20:47 ID:Hue8dIjc
>>111 2chは微妙だなぁ、タグは圧縮率高そうだけど、
基本的にはUAごとに分けて、XML直接おくったり、HTMLに書き直したり、datとか、
(暇ならCMTとか)にXSL処理分けてやると自己満(ry
113 :
nobodyさん :02/11/24 17:45 ID:c/TdNtSz
そういや、名前とか本文の文字色決めれる掲示板もあるけど、 そういう時は <DisplayName style="color:green;">nobodyさん</DisplayName> でいいの?
114 :
nobodyさん :02/11/24 19:56 ID:DA8ULop8
属性か要素かといえばこの場合属性のほうがいいんじゃない。 属性値をCSSの文法にのっとったものにするかはまた別の話で。
どんどん腐っていくな、このスレは
XMLにしようと思うと、改めてその冗長さに萎えた・・・
117 :
nobodyさん :02/11/25 15:10 ID:3rvreIEZ
118 :
nobodyさん :02/11/25 16:02 ID:BynTFslO
圧縮のテストできる環境ある人は実験汁
119 :
nobodyさん :02/11/25 19:54 ID:kNXssUwX
あとどの程度の語彙をこの規格で最初から定義しておくかっていうのもある。
RSSなんかだとアイテムの語彙はtitle、link、descriptionだけRSSの名前空間で定義して
日付や記事執筆者のデータが必要な場合は別名前空間のDublin Coreの語彙とかで拡張する。
SlashDotのRSSだとさらにSlashDot独自の語彙を足してる(返信の数とか)。
http://slashdot.jp/slashdot.rdf 題名、名前、メール、URL、記事内容は定義しておいて問題ないだろうけど
IDとかトリップとか記事の色とかアイコンとかも含めるのかっていうのはやや怪しい。
120 :
nobodyさん :02/11/25 20:01 ID:wNPCPjLG
121 :
nobodyさん :02/11/25 20:35 ID:3rvreIEZ
>>119 題名、名前、メール、URL、記事内容
ぐらいで、あとは属性使って拡張ってとこじゃない?
ただ、将来的にみると機能が制限されすぎてる
気はする。
なぁ、データ形式よりMVCモデルのMのAPIを規定した方が柔軟性高くならんか?
124 :
nobodyさん :02/11/26 13:01 ID:8NajcPLR
【不幸のレス】 このレスを見た人間は十三日以内に死にます。 ※あなたに訪れる死を回避する方法が一つだけあります。 それはこのコピペを一時間以内に7つ、別のスレに貼り付ける事です。
126 :
nobodyさん :02/11/27 16:19 ID:KaS81nFu
http://www.kanzaki.com/docs/sw/rss.html >RSS 1.0はXML名前空間を利用した拡張性を重要な特徴としています。
>名前空間を宣言して独自の要素型を追加することもできますが、
>より高い相互運用性のために、RSS-DEV Working Groupで拡張語彙の
>標準「モジュール」を定めています[RSSMOD]。
だから、別に一つの規定ですむならそれにこしたことは無い。
ただし別の規格にしとくと、応用規格を使わない場合、
その分のDTDとかschemaを読み込まなくてすむ(w
あとバージョンアップも容易?
127 :
nobodyさん :02/11/28 00:12 ID:11v9Y0Du
おいらはタブ区切りが好きだー!! <>は邪道。 なんで、HTMLで表示する時にだけ必要な、< > & (")の変換を、プレーンテキストの データを保持するためのファイルに入れるときも、施す必要があるの?
128 :
nobodyさん :02/11/28 00:17 ID:11v9Y0Du
本当のタブは、\tで、\は、\\に変換するべし。
129 :
nobodyさん :02/11/28 01:10 ID:NsJRziKY
>>127 ・楽だから。
・タブを入力された時そのタブを何らかに変換しないといけないから。
・書込時に変換する方が、表示時に変換するより負荷が少しでもかからないから。
・そんなことも分からない
>>127 が本当に哀れだから。
>>127 htmlっぽい文字列を投稿
↓
datにリンクを貼って誘導
↓
IEが勝手にtext/htmlとみなす
↓
クロスサイトスクリプティング(゚д゚)ウマー
datは外から読めない?
ならデータフォーマットを標準化すること自体無意味だし
132 :
127 :02/11/28 12:32 ID:???
大した事ねえな。
タブ区切りにこだわる理由も同じくらいたいしたことないと思うが。
>>133 クロスサイトスクリプティングを大したことないと
言い切る神経の奴に言っても無駄。
クロスサイトスクリプティングって言いたいだけらしい。。。
137 :
nobodyさん :02/11/28 16:53 ID:I1Msea/A
>>131 XSLで変換(鯖側orクライアント側)できるってことの意味がわかってない
138 :
nobodyさん :02/11/28 18:04 ID:NsJRziKY
139 :
:02/11/28 18:49 ID:???
「共有する」ことと「IEでdatが見れる」ことは別でしょう。
>>140 スマン、最後に
俺は煽りに信念と美学を持っている。
煽りは決まると格好いいが、失敗すると惨めになる諸刃の剣
この真剣勝負の煽りこそが、2chの神髄と思ってる
俺は君との煽りは楽しかった。むしろ感謝している。
142 :
nobodyさん :02/11/29 20:56 ID:GCYtyLqb
>>89 あと返信番号みたいなのが欲しい。
スレッド表示できるように。
In-Reply-To
みたいな奴。
143 :
nobodyさん :02/11/29 21:23 ID:lNgKsnLN
>>142 多分ツリー構造もいっしょにマークアップされてるから必要ない (ほんとか?
144 :
nobodyさん :02/11/29 21:40 ID:ucEI2gxD
スレッドを読み直しなさい。
145 :
65 :02/11/29 22:01 ID:???
146 :
nobodyさん :02/11/30 00:06 ID:yZPVBH/t
>>141 正直、なんか引きますた。
煽りに美学なんて持つもんじゃないよ・・・。
149 :
127 :02/11/30 23:16 ID:pfrAQXPr
見てなかった。 文字として記録すればいいデータを、勝手に、表示方法をHTMLであると、限定して、 ファイルに&gt;とか書くのは、気持ち悪いと思ったから。 記録された、「文字」としての情報を、(HTMLなどで)表示するときに、適当に変換して出す。 っていうのの方が、素直だと思うんだけど。 人間がファイルを直接いじるときとかも簡単だし。 拡張性を犠牲にして、HTMLに依存した方法で、データを記録してまで、単純な文字の置換のコスト を減らすのは、自分は、無意味だと考える。。 IEが、text/plainをHTMLとして勝手に解釈するのは、十分にセキュリティーホールだし。。 IEの方に文句をいっておけばいい。 そもそも、IEが、DATを読む価値はあるのか?
> 記録された、「文字」としての情報を、(HTMLなどで)表示するときに、適当に変換して出す。 > っていうのの方が、素直だと思うんだけど。 表示の方が書込より回数が多いから表示時に変換だと負荷が掛かる。 > 拡張性を犠牲にして、HTMLに依存した方法で、データを記録してまで、単純な文字の置換のコスト > を減らすのは、自分は、無意味だと考える。。 自分のオナニーならそれで良いだろうが、そうでないなら負荷の問題は無意味ではない。 > IEが、text/plainをHTMLとして勝手に解釈するのは、十分にセキュリティーホールだし。。 > IEの方に文句をいっておけばいい。 IEが悪くても回避できる余計な危険を回避するのは当然の事。 あんたのは屁理屈だ。
151 :
49 :02/12/01 00:43 ID:???
まだやってたのかこのスレ。厨な議論が続いてるなあ・・・
どのようなアプリケーションにおいても、データ構造の選択は
そのアプリケーションで最適化するべき特性の選択に依存するが、
「一般的な掲示板」ということで考えてみると・・・
・処理速度
- 読み込み時の処理速度
(
>>150 読み込みの頻度が書き込みのそれよりも圧倒的に高いという前提で、
書き込み毎に各モーダル向けに表示用ファイルを同時に生成しておけば、
読み込み時の処理のオーバヘッドは無視できる)
- 書き込み時の処理速度
CMTなりのファイル末尾に追加していく形式orRDBのinsertが速いだろう
XMLは処理毎にパース・レンダリングのオーバヘッドが発生するため、
これらより遅い。
・可搬性
- 当該分野の技術革新が激しく、フォーマットのバージョン改訂の頻度が高い
ケースでは、下位互換性を容易に維持できるという点でXMLが有利。
が、掲示板フォーマットってのはかなり枯れている(ある業界に特化した
掲示板ならデータ項目の追加の発生も考えられるが、そういった特殊な
ケースではそもそもポータビリティなんていらねえ)ので、掲示板という
カテゴリに区切ったときXMLが有効であるかどうかは疑問
結論:「掲示板」というアプリケーションが十分枯れているという前提のもとではCMTで十分。
十分枯れていない(進化の過程にある)とするなら、そもそも可搬性を議論するフェーズではない(どんどん進化させてくれ。)
以上終了〜〜
152 :
nobodyさん :02/12/01 01:30 ID:f7UXNt2R
規定のフォーマットなら使い勝手の良さを重視したほうが いいという意味でXMLに一票。 XMLで統一したうえで、不満な奴は自分の作ったものに 取り込むときに変換かければいいと思われ。 ここで議論してるのは互換性のいいものを作るのが目的だろ?
ま た X M L 厨 か 。
XMLの掲示板なんて激しくヤダよなぁ。
CMTで十分ならCSVで十分と、CMT論の人に言ってみる。
>>153 みたいなCMT厨はCMTに変換するXSLT書いたら黙るんだろうか…
>(進化の過程にある)とするなら、
>そもそも可搬性を議論するフェーズではない(どんどん進化させてくれ。)
掲示板としての進化は終わったかもしれないが、
その上に乗せるコンテンツはこれからもっと進化(複雑化)していくだろうから、
ここで拡張性の高いXMLでフォーマットを定義する事には意味がある。
そもそも、進化が終わった時点で規定された勧告ってW3Cでいくとどれくらいだろう…
とりあずXSLTうんぬんは要素名決まってからだな…
>>154 UAによってはサーバーサイドでXSLTを適用する(&振り分ける)処理が可能。
例えば、
2chDAT形式対応はそれで、同じくCMT対応はそれで、
XML+XSLTをクライアントで処理できるものはXMLを、
携帯電話その他からならCHTML準拠で、
それ以外はサーバーでHTML(ないしXHTML)に書き直して送信ってことが、
一つのXMLファイルと複数のXSLTを用意する事でできる。
157 :
156 :02/12/01 08:53 ID:???
×>UAによってはサーバーサイドでXSLTを適用する(&振り分ける)処理が可能。 ○>UAによって、サーバーサイドでXSLTを適用する(&振り分ける)処理が可能。 スマソ
>>154 理由を言え。利用者にはXMLであろうとなんであろうと関係無いはずだが?
>>158 ただ154が"XML"って言葉を使いたかっただけ
160 :
nobodyさん :02/12/01 13:03 ID:1d1Iul5n
>>150 表示方法をHTMLに限定すれば、それでいいんだけどね。
161 :
nobodyさん :02/12/01 13:29 ID:vHw2oSY+
CMTって、どこの団体が勧告したフォーマットなの?
162 :
49 :02/12/01 13:39 ID:???
>>155 >その上に乗せるコンテンツはこれからもっと進化(複雑化)していくだろうから、
それはレイヤが違うじゃんよ。今の議論は「掲示板データ構造」つまり
抽象化された「書き込み」という単位からなるデータ構造の取り扱いが
主題で、それがCSVなりCMTで十分と言っているわけだ。
そこに載せるデータストリーム(「書き込み」の実装)として
何を持ってくるかはまた別の話だろう。
>>156 XSLTによるマルチモーダル対応ってのはITバブルの頃に糞ベンチャーが
よくやってたテーマなんだが、俺はかなり疑問に思っている。
というのも、フォーマットレベル(例えばCHTMLとか)への変換はOKとして、
例えば画面サイズに由来する制約とか、一度に転送できる容量の
制約だとかは根本的にXSLTでは対応できないんじゃないか?
(XSLTより下のレイヤ、つまりXML生成時の対応が必要なんじゃん?ってことね)
結局マルチモーダル間の機械(XSLT)による完全対応はムリ、っていう結論だったと
記憶しているのだが。
最近の動向は知らんので認識に誤りがあったら指摘してくれ。
163 :
nobodyさん :02/12/01 13:46 ID:vHw2oSY+
画像サイズってwidth,heightの事? それとも容量の事?
>例えば画面サイズに由来する制約とか、一度に転送できる容量の >制約だとかは根本的にXSLTでは対応できないんじゃないか? お前がそれをXSLTでやろうとしたなら神と認めます(w
微妙に異なる2つの仮説がごっちゃになってる気がする。 ・掲示板スクリプトデータフォーマット規定を作ろう →書き込みの元データをXML形式で保存する方向で。 ・掲示板書き込み内容のメタデータの規定を作ろう →CMTで十分では。
「例えば内容にsvgが入った場合どうなるか」 って事を考えた場合に、CMTよりXMLの方が理にかなっている。 >それはレイヤが違うじゃんよ。 と、書いてあるけれど、他のDTDとかschemaを持ち出して書き込み内容を拡張できるってことでは、 CMTとかとは比べ物にならない拡張性を持っていると思う。
167 :
nobodyさん :02/12/01 15:25 ID:UEbx5mYR
メタデータっていう言葉の使い方わかってるの?
いや知らんけど
169 :
49 :02/12/01 16:04 ID:???
>>166 >「例えば内容にsvgが入った場合どうなるか」
>って事を考えた場合に、CMTよりXMLの方が理にかなっている。
objection. 「理にかなっている」具体的な根拠は?
書き込みのbodyとして任意のバイナリストリームが許されるなら
body部を含む全体のフォーマットは何でもいいじゃん。何でもいいなら既存のでいいじゃん。
>>それはレイヤが違うじゃんよ。
>と、書いてあるけれど、他のDTDとかschemaを持ち出して書き込み内容を拡張できるってことでは、
>CMTとかとは比べ物にならない拡張性を持っていると思う。
「拡張性」にちょっと幻想を抱きすぎな気配。そもそも「拡張性」とは何か?
フォーマットを介してネゴシエーションを行う2者間に事前の合意がない限り、
一方が勝手にフォーマットを「拡張」しても意味がない(機械が勝手に一方の
「拡張」に対応してくれるわけではなく、そこには必ず人の介在が存在する。)
DTDを変更するということは「別のフォーマット」を策定するのと同じことで、
そのような状況下では「XML上で」という括りの持つ意味は
「テキストファイル形式で」という括りの持つそれとほとんど大差ない。
で、書き込みのbody部はともかく「掲示板データ構造」の進化は今後見込まれるのかね?
170 :
nobodyさん :02/12/01 16:19 ID:UEbx5mYR
>フォーマットを介してネゴシエーションを行う2者間に事前の合意がない限り、 > 一方が勝手にフォーマットを「拡張」しても意味がない(機械が勝手に一方の それに関してはgracefullyにdegradeした形で解釈できるっていうメリットがあるでしょ。
掲示板データフォーマットを統一するってのは現実的なの? 掲示板作者としては、出尽くした感のある普通の掲示板から脱却して それぞれ独自の機能をつけようと努力してると思います。 既存の掲示板フォーマットとしては統一されていると便利だとは思いますが、 これからユニークな掲示板を作ろうとしている人にとっては、フォーマットが 規定されてしまっていると足かせになりかねないかと思います。 XMLなら独自の意味づけで、このへんも融通が利くのでしょうか?
>>171 XMLなら適当にタグふやしたらいいんじゃない?
対応してない板ではそのタグを無視すればいいんだし。
増えた分で標準化できそうなものは規定にとりこめばいい
>>171 HTMLへの変換には(ほとんどのケースで)XSLTを使用します。
多分同じデータでもXSLTによってまったく違う表現ができると思われます。
>書き込みのbody部はともかく「掲示板データ構造」の進化は今後見込まれるのかね?
IPv6に対応とか、そういうことなら今後の展開はまったく予想できない。
>>169 >機械が勝手に一方の「拡張」に対応してくれるわけではなく、そこには必ず人の介在が存在する。
XML文章として認識されればそれで十分だろ?
バイナリストリームとキャラクタストリームの違いがわからない人には (中略)難しい
このスレって、スクリプトがデータベースとして使う ファイルのフォーマットを決めようって話じゃないよね? なんかごちゃまぜになってる人がいる気がして。
>>176 XMLで規定を作ろうとすると、そうならざるおえない。
ていうかおまいら、 XMLを使った掲示板のサンプルを晒しやがってくれませんか?(;´Д`)
出力結果としてのサンプルは
>>145 じゃないのか?
181 :
nobodyさん :02/12/01 20:07 ID:vHw2oSY+
要素の内容に任意のバイナリストリームを持ってくるなんて馬鹿な発言をしたのは誰ですか?
182 :
nobodyさん :02/12/01 20:39 ID:hXhWchhy
パフォーマンス、安全性を考慮に入れるなら 1投稿 1ファイル がいい メールみたく Subject: 題名 Date: 2003 12 1 (空行) 本文・・ ・・ 本文終わり -- ちゅうか、思ったんだけど、なんで皆ニュースグループ使わないんだよ。
ていうかおまいら、 XMLを使った掲示板のサンプルスクリプトを晒しやがってくれませんか? ていうかむしろそういう掲示板スクリプトを配布しているサイトのアドをきぼん。 といい直してみますた(;´Д`)
184 :
49 :02/12/01 21:08 ID:???
>>173 >IPv6に対応とか、そういうことなら今後の展開はまったく予想できない。
なんでIPレイヤの変更をアプリケーションレイヤが関知しますか?
つうかそもそもなんで層化してるかわかってるのか?
>>175 =181
MIMEが任意のバイナリストリームを取れなかったらどういうことになるか理解できる?
185 :
nobodyさん :02/12/01 23:02 ID:vHw2oSY+
>font-family="MS-Gothic" 氏ねや
187 :
nobodyさん :02/12/01 23:46 ID:AABAJ9Cj
ヒャッホー!! XMLのスレ発見だぜ!みんなにも知らせてこなくっちゃ!
>>188 >ヒャッホー!!
…っていまどきないだろ、それ。
その感情表現はさ・・・
電波を電波と見抜けないのは4流
>>183 規格がもめてる段階なのであと8ヶ月ほど待て
>177 :nobodyさん :02/12/01 17:48 ID:???
>
>>176 >XMLで規定を作ろうとすると、そうならざるおえない。
じゃなくて、今までは保存形式と送信形式が別々だったものを統一できるんだろ。
49が
>>174 にどう答えるのか非常に楽しみ
195 :
49 :02/12/03 00:26 ID:???
期待されているようなので。
>>187 それはまさに
>>151 の可搬性で言っているところの「下位互換性」の維持に関する
メリットなんだが、このメリットに関しては小さな疑問と大きな疑問の2つが存在する:
小さな疑問: CMTの仕様書を読んでみたが、これも識別子を追加することで
アイテムの拡張ができそう(というか更新履歴を見る限り実際している)だがどうか?
(例えばHTTPのようなkey=value形式のフォーマットと比較した場合、互換性に関する
XMLのメリットって何?)
大きな疑問:
>>151 で言っている通り、そもそも「掲示板データ構造」に今後進歩ってあるの?
>>194 =174
>XML文章として認識されればそれで十分だろ?
とだけ言われてもなあ。何に十分なの?
well-formedあるいは更新されたDTDでvalidなXMLだったら
古いプログラムも人工知能よろしく追加ノードに勝手に対応してくれるってこと?
49が一番まともな子といってる様に見える。 (XML厨は視界狭いみたいだな)
197 :
nobodyさん :02/12/03 01:30 ID:YmZ1Amf/
一応つっこんどくとCMTの識別子は27個つかったらおしまいになるよ。
198 :
nobodyさん :02/12/03 01:39 ID:YmZ1Amf/
あとCMTは記事内容として改行区切りの文字列しか入れられないけど XMLならもっとリッチな内容を含みうるというのもあるだろうか。 そういえば記事内容をXMLでどうするかっていう議論はまだ出てなかったっけ。
199 :
nobodyさん :02/12/03 01:42 ID:YmZ1Amf/
「掲示板データ構造」に今後進歩、というか
多様性は増すことはあっても減ることはないだろうと普通の考えは思うね。
その辺は
>>171 が書いてるけど。
200 :
nobodyさん :02/12/03 02:09 ID:YmZ1Amf/
あと立場として、 「CSVで十分」-「CMTで十分」-「XMLで十分」 とか並べるとして、CSVとCMTでもだいぶ違うから どういう立場で主張するかというのをはっきりさせたほうが 議論がしやすいだろうと思った。
「立場」というのとはちょっと違うかもけど、分類してみた。 CSV、2ch の .dat、など。 順序に意味があって、決まった区切りでフィールドを並べていくもの 多くは行指向と言ってもいいかも。 CMT、RFC 2822/822、.ini: key と value のペアを並べていく。場合によっては「セクション」 「カテゴリ」のようなものがある。 多くは行指向と言ってもいいかも。 XML などの mark up 系: 木構造をベタに展開したもの。 行指向ではないことが多いかと。 あとは、(lex+) yacc のお世話になるようなものがあるけど、ここでは 省きますか。
掲示板のデータをXMLでやりとりする利点を 把握してる香具師は存分に語ってください。 漏れは決めるべきことが決まっていればどんな形でもかまわんなー。 ただ、データとしての美しさよりも、 掲示板のような負荷の高いものはパフォーマンスと クライアントへの配慮(あつかいやすさ)が重要だと思う。
203 :
nobodyさん :02/12/03 05:04 ID:Yy0QufYv
XMLはUNIXツールで扱いにくそう。
XMLでもCVSでもいいがCMT推してる奴は氏んでください
>>202 単純にflashでも、htmlでも対応出来る。これしか思い浮かばない。
あとメンテが楽とか。
誰か代わりに>202に語ってくれ。
>>197 と
>>198 はダウト。つか「改行区切りの文字列」って何よ?今時改行できない掲示板なんてあんの?
207 :
nobodyさん :02/12/03 09:40 ID:8ebcifH1
そのままの意味じゃん。 どこをどう読んだら「今時改行できない掲示板なんてあんの?」ていう レスが出るのかわかんない。
>>207 CMTは改行を複数含む文字列をメッセージとして扱うことができるんだけど。
「改行区切り」ってどういう意味?何を「区切ってん」の?(藁
209 :
nobodyさん :02/12/03 10:31 ID:8ebcifH1
1行目と2行目と3行目〜を区切ってるでしょ。
210 :
nobodyさん :02/12/03 10:34 ID:8ebcifH1
キャラクターストリームがあってそのなかで改行コードが行を区切ってるってイメージ湧かないのかな。
>>209-210 …
その「区切り」はコンピュータの処理上なんかイミがあんのか…
>>198 がダウトっつってんのは、アンタの言う「改行区切りの文字列」と
XMLのノードが持つ値との間に本質的な差が無いってことだよ。ワカル?
>>204 掲示板の書き込みをversioningするっつーのもなかなか斬新だな(ワラ
>
>>194 =174
>>XML文章として認識されればそれで十分だろ?
>だけ言われてもなあ。何に十分なの?
>ell-formedあるいは更新されたDTDでvalidなXMLだったら
>古いプログラムも人工知能よろしく追加ノードに勝手に対応してくれるってこと?
掲示板に関する規定作ったところでプログラムが意味解釈してくれる訳じゃないぞ
schema書けば、要素の内容のデータ型については定義可能だが、
あくまで処理装置が意味解釈をしている訳ではない。
古いプログラムが勝手に対応してくれないから"Adobe® SVG Viewer"
みたいなもんが必要になるんだろ?
と、電波を飛ばしてみる
XMLについての設計目標は,こうである。 XMLは,インターネット上でそのまま利用可能であること。 XMLは,広範多様なアプリケーションをサポートすること。 XMLは,SGMLと互換的であること。 XML文書を処理するプログラムを書くことは,簡単であること。 XMLにおける任意的な機能の数は絶対的最小限に,理想的には0にとどめられるべきである。 XML文書は,人間が読み書きでき,相当程度に明快であるべきである。 XMLの設計は,迅速に準備されるべきである。 XMLの設計は,形式的かつ簡潔であること。 XML文書は,作成しやすいこと。 XMLマークアップの簡潔さは,最低限の重要性しかない。
アンチCMTがいるようですが、そもそもCMTってINCMのために誕生したわけだよね。 掲示板ログフォーマットと一緒くたに考える必要ないんじゃない? アプリで使う分には拡張性もあるし使いやすいだろうけど、掲示板ログとしては処理が大きくなって向かないと思う。
なんつーか社会主義的なんだよなXMLは。
217 :
nobodyさん :02/12/03 17:59 ID:IQRudvo/
このスレの経緯...
>>1 で、1がCMTの宣伝のためにスレを立てる、
>>5 でCMTの宣伝をするために、
メール欄にスペースを入力してIDを隠す、
>>2-3 で、普通に2get&応援。
>>4 で、「XML」の単語が出てくる、
>>1 焦りだす、
>>5 で、CMTフォーマットを披露、見事に無視される。
(再びCMTの単語がスレに搭乗するのが
>>46 ってのが…)
>>6- XMLやCSVについて利点などの面で話し合い。
「<>カカレタラデータハカイサレルヨ」…@
「またXML厨か」
等の電波が飛び交うがほとんど無視される。
(てか、"<>"を書かれてデータが破壊されるなら、@の書き込みをした時点で、
このスレのdatを破壊した気分になってたのだろうか?もしかして期待した?)
まぁ、
>>1 の今後に期待。
218 :
nobodyさん :02/12/03 18:02 ID:IQRudvo/
ふーん、スレに"搭乗"するのか、と自分で自分を煽ってみるテスト(w
219 :
nobodyさん :02/12/03 18:30 ID:G6bUnBgc
4も5も俺なんだけどID見えてない人がいるな。
俺はCMTはそこそこよくできた規格と思うけど
XMLでやるならそっちがベターだと思うよ。
>>211 は「XMLならもっとリッチな内容を含みうる」の意味がわかってない。
>「改行区切りの文字列」とXMLのノードが持つ値との間に本質的な差が無い
って全然違うでしょ。
(「XMLのノードが持つ値」っていうのは要素の内容のことか?)
単に要素の内容に<hoge>text</hoge>みたいなものしか使わないなら確かにそうだろうが
<hoge>a<foo>b</foo>c</hoge>ならどうよ。
>>211 はXMLをkey/valueを別のやりかたで書き換えたもの程度にしか理解してないんじゃないのか。
220 :
nobodyさん :02/12/03 18:32 ID:G6bUnBgc
例えばアンカー文字列つきのハイパーリンクを 「改行を複数含む文字列」だけでどうするかとか、そういう例を考えればいい。
221 :
nobodyさん :02/12/03 18:35 ID:G6bUnBgc
あと217は多分46と49を間違えているんじゃないだろうかと思った。 46は俺だが49ではない。
そういえばXLinkってまだ使える段階じゃないよね
>220 それは関係ないよね。 データの中身の解釈はまた別のレイヤの話だと思う。
現状でのXMLの問題点 1.XML関係のモジュールが入ってるサーバが少ない =>ツリー構造が生かせない 2.XSL経由でデータを送ると全てユニコードになってしまう =>ユニコード用のライブラリがみあたらない (Jcode.pmが入っているサーバが少ない) CSVとXMLの比較の例 例:データからメールアドレスを取り出す(スクリプトはperl) CSV データ:no,name,date,mail,pwd スクリプト:(undef,undef,undef,$mail) = split(/,/,$_); XML データ:<data no="no" name="name" date="date" mail="mail" pwd="pwd"> スクリプト:$_ =~ /mail="(..+?)"/; $mail = $1;
上の例での特徴
CSV
split関数の方が処理が早い。
データ構造が簡単なので扱いやすい。
XML
欲しい要素に直接アクセスできる。
(データの要素が増えてもスクリプトに手を加える必要がない)
っていうかむしろ
>>56 みたいな議論をするのがこのスレの本来の目的なのではないかと思ってみたり。
>>1 も予想外の展開なのかっ?
227 :
nobodyさん :02/12/03 22:18 ID:8ebcifH1
>2.XSL経由でデータを送ると全てユニコードになってしまう そんなことないでしょ。 <xsl:output encoding="Shift_JIS"/> > XML > データ:<data no="no" name="name" date="date" mail="mail" pwd="pwd"> > スクリプト:$_ =~ /mail="(..+?)"/; $mail = $1; こんなことやるつもりなの?
こういう規格は5年後、10年後を見て作っていかなきゃ駄目なんだよ。 しょちゅうバージョンアップがある規格は見通しがもてていない証拠
>>227 <xsl:output encoding="Shift_JIS"/>
はなぜか無視されるようです。
>こんなことやるつもりなの?
一例ですから?
>>230 自分のあげた"一例"の悪いところがわかっていってるのか
鯖側での保存はCSVでもCMTでも好きにすればいいじゃん、
ユーザーに送信する時に、読み取ってマークアップすれば、
>>1 の
>この規定を定めることにより掲示板間のデータファイルの共有や
>乗り換えが容易にできるようになります。
は可能だろ?
乗り換えるときにもデータを共有するときにも、一度CGI通してマークアップしなきゃだけど…
234 :
nobodyさん :02/12/03 22:40 ID:8ebcifH1
データを送るってフォームのPOSTの話か。
>>228 正規表現じゃいけないですか。
これくらいしか思い浮かばなかったんですが
もっといい方法があれば教えて欲しいです。切実に。
>>231 ?
>231 いいたいことあるならはっきりかけよう。スレ汚してるだけじゃん。
>>235 PerlならXMLパーサーがあるじゃん……。
PHPのことは知らないけどさ。
238 :
nobodyさん :02/12/04 01:04 ID:4LjPmisD
>>235 <data>
<mail>
mail
</mail>
</data>
perlの正規表現でどう処理してるの?
239 :
49 :02/12/04 01:11 ID:???
何気にすごいことに。
まあエンコード戦略がしっかりしてさえいれば、
スタックの必要な文脈自由文法に基づくパースよりも
正規表現でさくっとできるパースは優れている、かもね。
>>213 わかってると思うけど
>>195 は
>>194 =174に対する皮肉ね。
なんか発散しているようなので問題をまとめると、
「掲示板データ構造」が
S=(V,E)(Vは各書き込みのノード、EはV間の二項関係)
で表現*し得る*ものであり続けるならば、
わざわざXMLを導入するメリットはない(それこそCSVで十分だ。)
さて、この「掲示板データ構造」の本質的な変化は今後起こり得るだろうか?
起こり得るとしたら、どんなものが想定されるかな?
(一部の理解の悪い人たちへの注釈:
書き込みのbody部がいくらリッチになろうが、
それは「掲示板データ構造」の本質に影響を与えることはない。
アンカーでもsvgでも動画でもなんでもbody部としてエンコードしてしまえば
「改行区切りの文字列 (
>>198 )」となって終了)
もう、これでいいや <item><n>名前</n><e>メアド</e><d>日付</d><m>本文</m><t>タイトル</t></item> <item><n>名前</n><e>メアド</e><d>日付</d><m>本文</m><r>親番号</r></item> <item><n>名前</n><e>メアド</e><d>日付</d><m>本文</m><r>親番号</r></item> ・ ・ ・ ($n,$e,$d,$m,$r) = (split(/<.+?><.+?>/,$str))[1..5];
CSV でも CMT みたいなのでも XML でも、表現しようと思えばなんとでもなる。 だったら、パース処理を書くのが楽な CSV なり CMT のほうがいいじゃない、っ てことになる。 でもパース処理なんて毎度書くのもどうだろう。単純な split やパターンマッ チによる key, value の抜き出しで処理するのが面倒な構造が必要になった場 合はいやになる。もちろん、split で済むようなものなら、それですませてす まえばいい。 あと、CSV とか key value な表現形式だけど、複雑な構造を encoding する 場合、具体的にどうやるかってことになると一般的でかつ、明確な合意っての はないような気もする。なにか作るたびに、通信当事者間で、そのあたりの約 束事を作りこんでいかなくてはならない。で、そういうところで変なバグを 誘発する原因は高くなる。
XML に関していえば、とりあえず well-formed という約束事があるので、最 低限、DOM tree 程度のデータ構造は得られるであろう、という期待は持てる。 さらに XML-RPC なり SOAP なりを使う、ってレベルにまで通信当事者間で合 意がもっていければ、メソッド名と、引数の並びさえ決めればいいよね、って あたりにまで持っていけるかもしれない。理想的には、どういうデータがネッ ト上を流れるかは気にすることすら必要ない (SunRPC とか IIOP とかあるじゃ ねぇか、なんて言われればそれまでだろうけど)。 XML だから特別に優れているというわけじゃないし、昔からいろいろあった。 まぁ、効率は悪いが、そこそこ使えなくはないから、長いものにまかれちゃえ ばいいや、という割り切りで XML を使うかな、ってところじゃないですかね。
243 :
nobodyさん :02/12/04 08:03 ID:C+9zfYjx
>アンカーでもsvgでも動画でもなんでもbody部としてエンコードしてしまえば CMTはそういう仕様じゃないでしょ。 というかアンカーなりSVGなりのエンコード方法を独自に新しく規定するの?ばかばかしい。 それならXML使ったほうがいいでしょ。
244 :
nobodyさん :02/12/04 08:09 ID:C+9zfYjx
あれだ、49は自分が考えてる具体的な仕様を示してみればいい。
MIMEでいいじゃん
>>219 掲示板なんだから、投稿内容に入れ子ができるわけないと思うのだが。
>>246 1.5chや1chみたいなとこだと入れ子になるかも
CSVや<>で十分って人は拡張性についてはどうなの?
要素が増えたら後ろにつければいいってだけ?
列順をかえられないのでだんだんみにくい並び順に
なると思うけど。
規定フォーマットなんだから互換性が重要なんだし
XMLで定義してインポート時に自分の板にあった形式に
変換かければいいんじゃないの?
248 :
nobodyさん :02/12/04 16:57 ID:5qCfRWF7
49はSVGがバイナリだと勘違いしてるんじゃないのか? >アンカーでもsvgでも動画でもなんでもbody部としてエンコードしてしまえば TEXT要素(まだ決定した名前ではないが)の内容に動画バイナリを直に (orエンコードして)書き込むなんて、まさに馬鹿がやることだろ? 181 :nobodyさん :02/12/01 20:07 ID:vHw2oSY+ 要素の内容に任意のバイナリストリームを持ってくるなんて馬鹿な発言をしたのは誰ですか?
249 :
nobodyさん :02/12/04 17:19 ID:LH+eBnJj
>>246 アンカーつきのハイパーリンクを表現したかったら
<p>まじやばい情報は<a href="hoge.com">ここ</a>をクリック!</p>
みたいになるでしょ。
SVGの内容はバイナリです、49がそう言ってるので当然です!
251 :
235 :02/12/04 18:09 ID:???
別にXML派というわけではないのですが、XMLを使うと
データ=>XML
HTML文章の構造=>XSL
デザイン=>CSSなど
処理=>CGI
のように分担できるところがよさげです。
上のように作業を分担すれば、掲示板をより手軽にかつ安全にカスタマイズできるのではないかと思います。
>>233 情報サンクス
>>237 XMLパーサーが入っていないレンタルサーバが多いのでなんともです。
>>238 1行につきデータ1単位という、CSV形式の方針をそのまま使えばいいのでは。
データ
<data><mail>mail</mail></data>
<data><mail>mail</mail></data>
処理(perlの場合)
while(<IN>){
$_ =~ /<mail>(.+?)<\/mail>/;
&subrutine($1);
}
これだとスタックがいらないのでよいのではないかと。主旨がずれていたらすまそ。
例によってほんとにその処理で通すのか?
>>251 それじゃCSVと対して変わらない、
<data><mail>
mail
</mail></data>
<data><mail(属性)>mail</mail></data>
・
・
・
には引っかからない、素直にパーサー使うべきだよ。
CSVと対して変わらないのは利点だろ。 CSVや<>で十分派も納得させられるじゃないか。
255 :
251 :02/12/04 20:59 ID:???
>>252 というか
>>231-233 ?
perlでモジュールを使わずにXMLを扱う方法はこれしか思い浮かばなかったのですが
実際のところどうなんでしょうか。
どこがやヴぁいのかよくわからないですが、
1.根本的に何かが違う。
2.処理速度が遅い。
3.その他
4.漏れの存在自体が危険
特に1だとどうしようもありませんが・・・
具体的にどこを改善すればよいのか教えてもらえると助かります。
1.Yes 2.むしろ拡張性を犠牲にすればこっちのほうが早い 3.子要素は? <mail><mail></mail></mail>だとどうなる? その他もろもろ 4.まぁ、XMLの勧告書を読んでから出直せ
257 :
49 :02/12/04 22:03 ID:???
なんかなあ・・・
書き込み間の関係と書き込み本体は互いに直交させておくべきと考えてるヤシはいないのね。
構造自体をグラフとして議論できる奴もいない、と。そんな連中が集まって勧告とはね・・・。
まあ頑張ってください。寿命の長い規格になるとよいですね(微笑
>>243 MIME
>>248 「アンカーでも」って書いてますが何か?
それと、あと5年もすれば動画も掲示板のありふれたコンテンツの一つになると思いますが、
そういう掲示板はサポート対象外ってことですね。なるほど。
そうか、49はバイナリもマークアップしたいんですね。わかりました。 >例えば画面サイズに由来する制約とか、一度に転送できる容量の >制約だとかは根本的にXSLTでは対応できないんじゃないか? 画像サイズまで対応できないって電波飛ばしてた意味がやっとわかった。
>>257 >それと、あと5年もすれば動画も掲示板のありふれたコンテンツの一つになると思いますが、
MIMEが任意のバイナリストリームを取れるのは何故か理解できる?
260 :
49 :02/12/04 22:26 ID:???
自分の理解できない文はスキップ。これ。 しかしこれをやると次から厨房扱いとなる、諸刃以下略。 ていうか読み返すとずっと前からそうだった気もする。鬱だ。
>「アンカーでも」って書いてますが何か?
"アンカーでも"エンコードするんですか?さすがですね。
49さんが"規格"を作るとずいぶん寿命の長い"規格"になるんでしょうね、
でも、このスレは"掲示板スクリプトデータフォーマット'規定'を作ろう "なので、
残 念 な が ら ス レ 違 い
まぁ、これからも
>>93 みたいな煽りをいれて"規定"の標準化を邪魔して下さい。
>
>>243 >MIME
おまえMIMEってなんなのかわかってるのか?
おまえにとって、MIMEっていうのは
「答えられない質問があったらMIMEって一行レス」
の存在ですか?魔法の呪文は便利ですね。
181 :nobodyさん :02/12/01 20:07 ID:vHw2oSY+
要素の内容に任意のバイナリストリームを持ってくるなんて馬鹿な発言をしたのは誰ですか?
262 :
49 :02/12/04 22:33 ID:???
先生!"規格"と"規定"の違いを教えてください!
263 :
nobodyさん :02/12/04 22:46 ID:hWcCtuEz
まぁまぁ、49をいじめるのもそのへんでやめようよ、 ところで、 181 :nobodyさん :02/12/01 20:07 ID:vHw2oSY+ 要素の内容に任意のバイナリストリームを持ってくるなんて馬鹿な発言をしたのは誰ですか?
264 :
49 :02/12/04 22:53 ID:???
随分根に持ってるんだなあ・・・。 それはともかく、先生!"規格"と"規定"の違いについてヨロシク!
265 :
nobodyさん :02/12/04 22:55 ID:hWcCtuEz
49の家にはでぃくしょなり、もとい辞書は無いのか?
266 :
49 :02/12/04 23:05 ID:???
辞書キタ------(゚∀゚)--------------! ガーンと貼り付けちゃってくださいよ。ガーンと!
つーか、煽りはスレ汚ししてるだけで見ててつまんないからやめれ。
49の電波に犯されて規定ができなくなったら、 それこそ49はじめCMT厨の思う"壺"だという罠
269 :
49 :02/12/04 23:21 ID:???
∧ ∧ / ヽ / ヽ モウマテナイヨ / ヽ___/ ヽ / ノ( \ | ⌒ ヽ-=・=-′ ヽ-=・=- | / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ へ | \___/ | < "規格"と"規定"の違いまだー? / \\ \ \/ / \____________ / /\\ .> ヽ チンチンチン// \\/ i i _ | チンチンチン i | ‖| / ̄ ヽ / _ チンチンチン Σ [ ̄ ̄ ̄ ̄ ̄ヽ / ̄ ̄ /| \ ̄ ̄ ̄ ̄ ̄ ̄ ̄/  ̄ ̄ヽ____/ / | \回回回回回/ / | \___/
荒らしは基本的に構って君なので、完全無視&放置して下さい。 罵倒レス等も喜ばせるだけ。無視出来ないあなたも厨房です。
きてい 0 【規定】(名)スル (1)物事のありさまややり方をある形に定めること。また、その定め。 「―に従う」「概念を―する」 (2)法令の条文として定めること。また、その条文。 →規程(1) (3)〔化〕 溶液濃度の単位。溶液1リットルの中に溶質1グラム当量を含む濃度。記号 N ノルマル。 (4)「規定種目」の略。 きかく 0 【規格】 (1)工業製品などの品質・大きさ・形状などについて定められた標準。 (2)判断の基準となる社会的な標準。 「―外れの人物」 俺って厨房だな(w
275 :
49 :02/12/04 23:45 ID:???
おおなんてこった。煽りを煽り返してたら荒らしにされてしまった。 つうかさ、XMLの仕様書もいいんだけどさ、卑しくも標準フォーマットを「策定」するつもりなら、 それ以前にアルゴリズムとデータ構造くらい勉強しておこうよ。。。
荒らしは基本的に構って君なので、完全無視&放置して下さい。 罵倒レス等も喜ばせるだけ。無視出来ないあなたも厨房です。
>>274 いまそいつを読んでるところです。日本語でも眠くなるのは気のせいですか?
いや、原文読むってのは多分ネタです。ごめんなさい。
>>275 漏れへのレスですか、そうなんですか?
>アルゴリズムとデータ構造くらい勉強
そのうちやる予定です。(まだやってないです。そういや8王妃問題なんてのもあったなくらいに)
ていうかよ、別にこのスレにレスつけるつもりは全然なくて、
フォーマットの検討をニヤニヤしながら生暖かく見守るのが当初の目標だったわけで(以下略)
ってことで後はまかせますた。
>>255 > 1.根本的に何かが違う。
特に間違いはありません
1行につきデータ1単位なら処理しやすいのでは?という
あなたの意見は、CGI作成者にとって歓迎すべきものです。
しかしこのやり方はXMLの見た目を損ない
XML厨のアーティストな感性を傷つけることになるでしょう。
> 2.処理速度が遅い。
XMLパーサーに比べ軽くて速いです。
CGI運営者にとって軽さと速さは重要です。
正規表現で切り抜けばXMLパーサーより速いのではないか?という
あなたのアイデアは大変素晴らしいものです。
しかしこのやり方は、暗に階層の入り組んだXMLを嫌う雰囲気を含んでおり
フリーダムなXML厨からは総スカンをくらうでしょう。
XML厨にとって重要なのは美しい構造のXMLを創造することであって、
そのXMLがスクリプトレベルで扱いやすいかどうかなど無意味です。
> 4.漏れの存在自体が危険
XML厨は、あなたのいる現実世界よりもはるかに高次元の世界に存在しています。
XML厨にとってあなたは低レベルな存在なので危険ではありません。
279 :
xyz :02/12/05 02:20 ID:???
>>275 アルゴリズムとデータ構造だの、グラフだの、そういうのは基本で別段、
持ち出すことはなかろう。知っててあたりまえ(であってほしい)ことだし。
技術的には CMT とか RFC2822 + MIME くらいで十分だとは思うけど、
現実に出てくるであろう実装がグタグタになるんじゃないかというのが
不安。実際、特に MIME の実装を見ていると、現状は混乱しているように
みえるが、どうか。
280 :
279 :02/12/05 02:24 ID:???
MIME についていえば、文字の扱いにおいて US-ASCII の縛りを回避するのに 導入された =?charset?encoding?...?= の表現方法とか、multipart の デリミタの定義とか、そのあたりがもうちょっとなんとかなってれば まだ良かったかもしれない、とは思うけど。
データが XML だとプログラム書くの楽じゃん。 あと 2ch ロカールとか CMT よりも内容を理解してくれる人が多くなる。
バイナリをMIMEで持つのはいいとしても、 いちいち変換するのは面倒じゃない? 単純に別ファイルとして保存してあるバイナリにリンク張るってのはダメなの?
283 :
nobodyさん :02/12/05 09:35 ID:GXA+t9Qx
>それと、あと5年もすれば動画も掲示板のありふれたコンテンツの一つになると思いますが、 掲示板の形式に今後進歩ってあるの?とか書いてたのはどこの誰よ? 49は動画とか現時点でどこの掲示板も実装してないようなものじゃなくて 例えばアンカーつきハイパーリンクとかをどう自分の想定してる規格(CMTの拡張?)で表現するのか示してみてよ。 そしてそれがXMLを使うのに比べてどう有利なのか。
正直XMLの仕様書読む気すらしないCSV厨でつ。 XMLって便利らしいけど、掲示板データフォーマット自体をXMLに統一する必要ないんじゃない? ログは規定しないで、ある種のリクエストがあったときだけ、XMLなり何なり規定されたフォーマットで出力するようにすればどうよ? そもそもログ自体は見られたくないって方が多いだろ? むりくりフォーマットを統一しなくてもいいと思うんだが。 というかすでにこの辺が混じって議論されてる感じ。 プロトコルの話なのかスレタイにあるとおりデータフォーマットの話なのかもうわからん。
285 :
49 :02/12/05 10:46 ID:???
>>279 >アルゴリズムとデータ構造だの、グラフだの、そういうのは基本で別段、
>持ち出すことはなかろう。知っててあたりまえ(であってほしい)ことだし。
と、漏れも当初は思っていたのだが、それにしては抽象化のできない奴が多過ぎると思ったので。
既存の掲示板の構造を最汎化した場合、ナイーブに考えれば
書き込み単位を要素とする集合とその集合上の二項関係を以って表現できると思われるが、
今後そのスキームでカバーできないような構造の掲示板が出現するかどうか、
という問題は自明ではなく、少なくとも標準を策定する上では無視できないdecisionであると
思うのだが、見たところそういった議論はなされていないように見受けられる。
標準仕様の策定はまずもってその仕様がカバーすべきドメイン(その仕様の責任範囲)を
決定し、ついでそのドメインにおけるデータ構造のモデル化が行われ(必要なら問題単位を
しかるべき小問題に分割し)、最終的にその実装手段(マーシャリングメソッドの選択、
XMLなりMIMEなり)の規定が行われるべきと考えるが、このスレの議論では前段の2段階を
すっとばして「どんなデータ構造を落とし込むのか」という点が不明なまま
実装手段を選ぼうとしているあたりが徒労感の強い原因だと思ったり。
少なくとも漏れは、標準仕様がカバーできる問題空間の軸を増やす意味で、
「書き込み本体」と「書き込み間の関係」の仕様は分離しておくべきと考えているのだが
ここの連中はそう思っていないのか、そもそも抽象化思考のレベルが低くて分離の意味が
理解できないのか、どっちですか?喪前ら教えてください。
>>285 簡潔に要点だけを述べてください。
具体例もつけると尚良いです。
あなたの文章には字面の割に内容がありません。
287 :
49 :02/12/05 10:59 ID:???
それと、煽りも楽しいんですが、段々飽きてきたので、 当方、今後厨房は相手にしませんので悪しからずご容赦ください。
288 :
nobodyさん :02/12/05 11:33 ID:PKDnXDXR
>>49 厨房は自分だろ。
言語は他者にメッセージを伝えるためにあるんだぞ。
オナニーのためじゃあない。
289 :
nobodyさん :02/12/05 11:46 ID:GXA+t9Qx
「書き込み本体」と「書き込み間の関係」の分離という言葉から思いつくものが
49の考えてるものと同じかどうか分からないと反論のしようも賛成のしようもないので
具体例をしめしてくれないかね。
あと
>>283 の答えもよろしく。
>>285 とりあえず、ここは2chであることと
レベルが厨房から神?までいることを認識してください。
その小難しい文章を正確に理解して正確に議論できる
奴ばっかりではないこと理解してもらってこの後も
よろしくお願いします。
大学に入ったばかりの自意識の強いオタクに時々いる。 それっぽい言説で悦に浸るが、論旨がはっきりしないので、当然点数は低い。 うっかりそのまま社会に出てしまうと、コミュニケーション不全のため、 まともな仕事ができないので気をつけること。
49の描く掲示板の理想像 1.掲示板の投稿内容はエンコードされて当然、アンカーだろうがSVGだろうが気にせずエンコード 2.それと、あと5年もすれば動画も掲示板のありふれたコンテンツの一つになると思いますが、掲示板の形式に今後進歩ってあるの? 3.一度に転送できる容量の制約だとかは根本的にXSLTでは対応できないんじゃないか? 4.CMTなら記事を時刻順に並べ替えて表示とか、そういう操作がしやすいね。 5.先生!"規格"と"規定"の違いを教えてください! 6.当方、今後厨房は相手にしませんので悪しからずご容赦ください。 7.例えばHTTPのようなkey=value形式のフォーマットと比較した場合、互換性に関するXMLのメリットって何? ちなみに私のことは厨房とみなしてもらって結構ですので相手にしなくていいですよ。
>>285 とりあえず、ここは2chであることと
レベルが厨房から神?までいることを認識してください。
そのデムパ文章をデムパと理解できずにマジレスしてしまう
厨房も含まれているってことを理解してもらってこの後も
よろしくお願いします。
ま、予想に反してこのスレは良スレであるし、 予想以上に49は魅力的な人材だ。 これからもその調子で頼むよ諸君。
___ ___ うんざりなんだよっ…! `> `'´ <´ XMLだ MIMEだ… 49だ 電波だ…… ∠´ `ヽ、 そんな話はもうっ…! / ヽ / ヽ そんなことを話せば話すほど… ,.イ /|ハ/! ,ハ ト、lヽト、 `、 オレたちは浅ましく 醜く 這い回っている…… ´/ ハ/\\|/ `,// \ | この社会の底を……! / r| ==\! |/=== ヽ. r‐、 | わかんねえのか…!その姿… 7 | | `-v゚/ `--u゚‐'′| |こ!| | そして そんな姿を見て本当にXMLを理解している香具師は喜ぶ…… ,/ | | u / u U | |こ!| `、 / `| /_ - ヽ u' | !_ン ヽ オレたちが…… .イ ヽ lニニニニ二ヽu /| \ XMLについて語り合えば語り合うほど、 / ヽ`ー──―'/ / ハ~"''‐- ヽ_ 反応を すればするほど 7' ヽ ~~~ / / ,/ ヽ~"''‐- 結果的に その野郎の思う壺… /__,.,.ィィ \_/ u' / / `、`、 意のまま……! -‐''"~ /~7 /| /ノ ', `、ヽ / / / |‐-、 ,r-―"| ', `、ヽ 悔しくねえかっ…! /____///__| | |______`、 悔しくねえのかよっ…!!
>>260-270 の49の厨房っぷりを棚の奥にしまい込んで
「今後厨房は相手にしませんので」などという
49の厚かましさに乾杯!
/::://:::! /-=、 ,// u / _,,.-ゝ. 「ヽ l ! , l 落ち着け…… /::_;イ-‐=レ'==ミ" '∠-==ヽl=ヽlヽ レ'レV /::::::::..、 o ,≡:::::::〈、 o , :|│ リ ' 冷静に考えれば…… ::::::::::::::::: ` ー--‐ '´三 :::::::::ヽ`::ー-‐:'.´ |│ l 49の言っている事が電波だとわかる…… ::::::::::::::: ニニ ::::::::::::::ヽ::::::::: U |│ ! :::::::::::::::U  ̄ ̄ U::::::::::::::::ヽ::: u |│ .l ここはひとまず…… :::::::::::::::: U r‐:::::::::::::::::::::ヽ. Lノ | 見っ……!
298 :
nobodyさん :02/12/05 17:32 ID:1bGA4YAM
ところで、 181 :nobodyさん :02/12/01 20:07 ID:vHw2oSY+ 要素の内容に任意のバイナリストリームを持ってくるなんて馬鹿な発言をしたのは誰ですか?
>>285 つーか、きちんとした標準化作業なんて面倒じゃん。
WG 作って TR 書けって言われてやる?
301 :
nobodyさん :02/12/05 20:04 ID:1bGA4YAM
>>299 やるだろ
HPアドレス
居住地
アイコン
文字色
添付File
基本要素としていらない
基本要素として必須なのは、 コンテナとしての 「記事」 「スレッド」 「グループ/ボード」 「システム」 だけであって、 中身は規定できないと思うがなあ。
303 :
nobodyさん :02/12/05 20:18 ID:1bGA4YAM
掲示板を構成する要素、には投稿内容(中身)は必須、だと思うが?
>>302 このスレの存在意義を全否定してどうする
306 :
nobodyさん :02/12/05 20:42 ID:1bGA4YAM
基本要素として必須なのは、 コンテナとしての 「投稿内容」 だけであって、 そのほかは規定できないと思うがなあ。(w
307 :
49 :02/12/05 20:48 ID:???
掲示板にもいろいろあって、各記事が親記事を持つようなツリーのものもあれば
2chみたいに書き込みがずっと連続していくやつもあるわけよ。
で、中には変態的な掲示板もあるかもしれないと考えるわけだ:
(例えば親記事を複数指定できるとか、あるいは子記事なんだけど話題が飛んで
「サブジェクト変えました」なんつって新しくルートを作るんだけど、でも元の話題と
関連してるってことをデータとして持っとくとか。
もちろん変態的なのに全部対応しろっつってんじゃねえぞ。勘違いすんなよ。)
でだ。そういうことをつらつら考えると、こういった「掲示板の形式」と
「掲示板の書き込み(=
>>300 にあるような名前とか本文とか、1つの書き込みを構成する要素)」
の仕様は分離できたらしたほうがいいんじゃねえかと思うわけよ。で、書き込みの中身なんて
それこそ人によって好き好きなんだろうからよ、まずは「掲示板の形式」の規定を考える方が
先なんじゃねえか、とまあこう思うわけよ。
/::://:::! /-=、 ,// u / _,,.-ゝ. 「ヽ l ! , l 落ち着け…… /::_;イ-‐=レ'==ミ" '∠-==ヽl=ヽlヽ レ'レV /::::::::..、 o ,≡:::::::〈、 o , :|│ リ ' 冷静に考えれば…… ::::::::::::::::: ` ー--‐ '´三 :::::::::ヽ`::ー-‐:'.´ |│ l 49が自分への質問を投げている事がわかる…… ::::::::::::::: ニニ ::::::::::::::ヽ::::::::: U |│ ! :::::::::::::::U  ̄ ̄ U::::::::::::::::ヽ::: u |│ .l ここはひとまず…… :::::::::::::::: U r‐:::::::::::::::::::::ヽ. Lノ | 見っ……!
NetNewsあたりを調べて、 記事が時系列 記事が親を持つ 記事が複数の親を持つ 記事がサブジェクトを持つ 記事が元サブジェクトを持つ : 等の実例を列挙したあと、 「BBSの基本となる13の形式」みたいなのを提示すれば?
>>307 お前が言ってることはお前が言う前から全員の頭の中にありますが何か?
個々のメッセージの内容としてはXHTMLを引っ張ってくれば十分、
多分内容について議論する必要無し、そこがXMLのいいとこ。
メッセージの内容も含めた情報については
<投稿日時>W3C-DTF
<投稿者情報>
http://www.nmda.or.jp/enc/w3c/cr-p3p-20001215j.html +α
<投稿内容>"個々のメッセージの内容"+α
<管理情報>α
で、それをさらにマークアップするために、
<掲示板>
└<メッセージs>
└<メッセージ>
├"メッセージの内容も含めた情報"
└<レス>
やばいよ…
>>310 はダメすぎる…
調子にのって49を叩いているけど
典型的なXML厨
やばいよ…
>>311 はダメすぎる…
調子にのって310を叩いているけど
典型的なCMT厨
___ ___ うんざりなんだよっ…! `> `'´ <´ XMLだ MIMEだ… 49だ 電波だ…… ∠´ `ヽ、 そんな話はもうっ…! / ヽ / ヽ そんなことを話せば話すほど… ,.イ /|ハ/! ,ハ ト、lヽト、 `、 オレたちは浅ましく 醜く 這い回っている…… ´/ ハ/\\|/ `,// \ | この社会の底を……! / r| ==\! |/=== ヽ. r‐、 | わかんねえのか…!その姿… 7 | | `-v゚/ `--u゚‐'′| |こ!| | そして そんな姿を見てXMLの良さを理解している香具師は喜ぶ…… ,/ | | u / u U | |こ!| `、 / `| /_ - ヽ u' | !_ン ヽ オレたちが…… .イ ヽ lニニニニ二ヽu /| \ XMLについて語り合えば語り合うほど、 / ヽ`ー──―'/ / ハ~"''‐- ヽ_ 反応を すればするほど 7' ヽ ~~~ / / ,/ ヽ~"''‐- 結果的に その野郎の思う壺… /__,.,.ィィ \_/ u' / / `、`、 意のまま……! -‐''"~ /~7 /| /ノ ', `、ヽ / / / |‐-、 ,r-―"| ', `、ヽ 悔しくねえかっ…! /____///__| | |______`、 悔しくねえのかよっ…!!
49のいうことが分からなくもないんだが、 理解できる香具師がいないんだろうね
>>314 =49
おげんきですか?がんばってください。
>>314 いや、仮に思考の内容がすばらしいものだとしても他人とのコミニュケーションがとれないヤシは使い物にならないだろ、実際。
すばらしいっていうのはあくまで仮にだがな。
>仮に思考の内容がすばらしいものだとしても 正しくないから仮定の意味が無い
>49のいうことが分からなくもないんだが、 >理解できる香具師がいないんだろうね そうそう、49の脳内にしかいないんだよね。
319 :
nobodyさん :02/12/05 23:52 ID:nsdc30ym
49は当初XMLに対してCMTで十分という立場だったのに 任意のデータをMIMEにとか書き込み内容の分離とかいいだして もはやCMTでもその拡張でもないような立場になって 挙句の果てに掲示板形式の規定を考える方が先、て。 具体的に語彙の話が出かけてたところをあんたが引っ掻き回したんじゃないの。 何度もいうようだけど具体的なものを示してよ。 完全じゃなくてもいいからこんな感じのことを考えているっていうのを。 議論に何の建設的貢献もできないなら黙っておくれ。
XMLでもCMTでもCVSでも
>>49 でもいいが、
コピペバカは消えろ。まじで。うぜぇから。
322 :
49 :02/12/06 00:38 ID:???
>>319 >>151 を見れ。「掲示板の形式」が、もし*既存の掲示板の枠内に留まる*のであれば
CMTで十分と書いている。で、今回策定する標準ってのは既存の掲示板の枠内に
とどまるのかどうか、ってことを
>>195 ,
>>239 ,
>>285 で聞いている(がこの点に関する返答は
スレ内では未だにゼロだ。)なぜなら「掲示板の形式」として既存のフォーマットが既に
サポートしているもののみを対象として新しくフォーマットを策定する作業は、
単なる車輪の再発明に過ぎないからだ(わかりやすく言えばムダな作業ってことだ。)
仕様策定においてまずもって必要なものは抽象化された「データ構造」であって、
それを実装する手段の選択は二の次だ。
(現時点ではXMLでもMIMEでもserializeでもRDBにぶちこんでダンプでもData::Dumperでも
手書きでもなんでもいい。大事なのは表現する対象となるデータ構造だ。)
その構造の具体的な提案が
>>239 ,
>>285 のグラフであり集合論上の二項関係だ。
用語がわからなけりゃグラフ理論入門でも集合論入門でも読め。
この程度の知識も素養もない連中が「規定」なんてできると思うなバカ共。
323 :
nobodyさん :02/12/06 00:48 ID:UztSNGiC
まず第一に既存の掲示板の枠内に留まるものであってもCMTでは不十分だ(CMTの仕様書を読んでるかね?)。
第二に既存のフォーマットが既にサポートしているものでもそれを標準化することに意義がある(
>>1 を読んでるかね?)
324 :
nobodyさん :02/12/06 00:51 ID:UztSNGiC
あと具体的という言葉の意味がわかっておられないようなのですが、 要するに何も示せないという答えということですよね?
”(掲示板)フォーマット規定”と聞くとすぐにしゃしゃりでるXML厨。
326 :
49 :02/12/06 00:56 ID:u7T55qaR
>>323 (1)CMT方式(要素の拡張含む)でサポートできない具体例をあげてくれ。
(2)先行するフォーマットは機能の不十分がない限り通常デファクトとして扱うべき
だが、それをわざわざ「別のフォーマットで」標準化する具体的な意義とやらをあげてくれ。
327 :
49 :02/12/06 00:57 ID:u7T55qaR
>>324 データ構造として
グラフS=(V,E)は十分具体的です。わからないのはあなたの知識不足です。
>先行するフォーマットは機能の不十分がない限り通常デファクトとして扱うべき ハァ? >グラフS=(V,E)は十分具体的です。わからないのはあなたの知識不足です。 自分だけ理解しているつもりになるのは、あなたの知識不足です。 つーか、もう49は無視の方向で。
329 :
49 :02/12/06 01:01 ID:???
やれやれ。やっぱり厨だったか。君には「無知の知」という言葉を贈ろう。
330 :
49 :02/12/06 01:08 ID:???
ちなみにGではなくSなのは、はじめ集合のつもりで考えてたからでした。詳しい人の突っ込みありがとう!(前もって御礼
>やれやれ。やっぱり厨だったか。君には「無知の知」という言葉を贈ろう。 そっくりそのままお前に付き返してやるよ(藁
またしても微妙に異なる2つの意見がごっちゃになってる気がする。
・掲示板スクリプトデータフォーマット規定を作ろう
→
>>240 みたいなやつ(?)
・掲示板書き込み内容のメタデータの規定を作ろう
→CMTで十分では。
メタデータっていう言葉の意味は知らんけど
2ch datくらいが単純でいいや。 CMTですらオタクっぽくて全然使われてない。
>>333 ごっちゃになってるよな。
>>334 俺も既存の <> 区切りが処理が楽ちん(融通が利かないのは我慢)で好きだ。
CMTは元々出力を目的にしてるから、ログデータとしては考慮されてない模様。
XML厨な方に質問。
記事番号1、親記事、タイトル「あああ」、本文「いいい」
記事番号2、記事1への返信、タイトル「Re:あああ」、本文「ううう」
記事番号3、親記事、タイトル「AAA」、本文「BBB」
こんな感じの記事ログをXMLで保存するとしたら、おおよそどんな風になるの?
あくまで一例ってことでよろしく。
まず俺がXML勉強しるって感じですまんが。
336 :
お約束 :02/12/06 09:26 ID:???
まずお前がXML勉強しる
なるほど、CMTって出力向けフォーマットか。2chのrawモードみたいの。
338 :
nobodyさん :02/12/06 09:52 ID:71EnxhWl
>>335 過去ログ嫁よ。
親子関係の表現には2通り可能ということで議論がある。
339 :
nobodyさん :02/12/06 09:54 ID:71EnxhWl
ところで「無知の知」っていう言葉は意味わかって使ってるのかな。 相手に向ける言葉としては批判でもなんでもないし皮肉として解釈するのも無理だな。
しかしまあ、現実的には2chがXMLを採用する可能性は ここ数年は絶対ないな。負荷にうるさいもん。 XMLは、日本最大の掲示板が実用上採用しないだろうフォーマットである という事実は、やはり意識しておいたほうがよさそう。
341 :
nobodyさん :02/12/06 10:25 ID:71EnxhWl
俺は1じゃないけど、あくまで、このスレの目的は 「データファイルの共有や乗り換えが容易にできるように」 規定を決めることなので、各スクリプトがが普段持つ データフォーマットとしてのものを決めるのでは無いことを 再認識していただいてこの後の議論を続けてください。 ようはフォーマット決めればその形式にエクスポートされたデータは 他のスクリプト使用時にインポートすればOKということだろ? それようのバッチは作る必要があるけど。
あげっ!!
>>335 <>形式で、行の最初をスキーマ定義にしとくってのはどうよ。
id<>parentid<>subject<>name<>email<>body<>(ユーザ要素)<>...
1<>0<>掲示板スクリプトデータフォーマット規定を作ろう<>nobodyさん<>age<>決めようぜ<>...
2<>1<>-<>nobodyさん<>sage<>2Get!!<>...
...
読み込むときは
@schema = split /<>/o,<LOG>;
@rows = ();
while (<LOG>) {
$i = 0;
my %item = map { ($schema[$i++] => $_) } split /<>/o;
push @rows,\%item;
}
こんな感じで。
>>342 そういう中間データなら、議論するまでもなく、
XMLでいいんでない。
書き込むときは、@schema,@rowsに上と同じ構造が入ってると仮定して print join("<>",@schema)."\n"; foreach $line (@rows) { $i = 0; print join("<>",map { $line->{$_} } @schema })."\n"; } こんな感じかな? あとはidとかemailとかbodyとか、それぞれ必須とか推奨とか レベルが違うと思うけど、そんな感じの標準スキーマを決めればいいのかな?
346の$i = 0;はいらなかった。スマソ。
エンコードは foreach $line (@rows) { foreach $k (keys %$line) { $line->{$k} =~ s/</</gos; $line->{$k} =~ s/>/>/gos; $line->{$k} =~ s/\n/<br>/gos; } } で、デコードはこの逆をすれば、 スキーマ要素によらず書き出すもの全部エンコード/デコードできるよね。
やられた。。348の置換の右側は < とか > とかに読み替えてくれ。。。 ウツダ。
350 :
342 :02/12/06 15:13 ID:???
>>345 と、ずっと思ってたのだが、違うのか?
スクリプトでどういうデータ形式にするかは
作者次第だろ。すべてバイナリでもったりしたい奴も
いるかもしれないし。板の特性に合わせて作者が
考えるべきで、規定なんて決めてそれに従うような
風潮ができたら発想が狭くなるだけだと思うんだが…。
351 :
56 :02/12/06 17:08 ID:???
鯖での保存はCSV(,なり<>なり)、CMT(CMTって鯖側保存の事も考えられてるのかしらん)、XML等、 各設置人のスキルとか、鯖の負荷とか考えてやればいい。 書き込み処理 [ 書き込みデータ受け取り ↓ CSVなりCMTなりのログデータ読み込み ↓ 書き込み内容を末尾に追加、 ↓ CSV(orCMT等)ファイルに記録、同時にXMLに書き直したものを別ファイルに保存 ] ってやればいいんでないの? 読み込み [ XMLファイルリード (and 鯖側で変換) ] 読み込み処理はこれだけで済む。 と、XMLファイルに記録するんじゃなくて、動的に生成するような事だと思っていたんだが、 鯖側の読み書きログまでXML形式にしようっていうと… まぁ、そんなに激しい負荷のかかることじゃないからいいと思うけどね。 と、思いますた。
対応掲示板サーバーと対応掲示板クライアントとの間で転送される データの形式を決めるんだろ? サーバー、クライアントがローカルに保存するデータの形式は各々が勝 手に決めればいいことだし、データ交換のための中間形式ならデータを 落としさえしなければ何だっていいってことになる。 現実には、転送用形式と別に交換用形式を用意する必要はないだろ。
353 :
nobodyさん :02/12/06 17:36 ID:zJ8lEv59
>十分枯れていない(進化の過程にある)とするなら、そもそも可搬性を議論するフェーズではない(どんどん進化させてくれ。)
>ってことを
>>195 ,
>>239 ,
>>285 で聞いている(がこの点に関する返答は
スレ内では未だにゼロだ。)
155
に
>そもそも、進化が終わった時点で規定された勧告ってW3Cでいくとどれくらいだろう…
W3Cにこだわる理由もたいしてわからんが、
進化の過程にあるものを定義するな(可搬性を議論するな)というなら、
世の中にHTML(XHTML)の可搬性を考えているやつはいないよな?
もっとわかり易く言うと、あれだ、テレビに付いてるビデオ端子、あれの可搬性(端子と流れる情報について)を考えたやつもいない筈だ。
テレビとビデオを繋ぐ方法は将来的に必ず進化するって事はわかりきってたし、今現実に進化してるからな。
ついでにXMLどころかSGMLも生まれなかっただろうな。
354 :
49 :02/12/06 21:08 ID:???
>>353 >進化の過程にあるものを定義するな(可搬性を議論するな)というなら、
>世の中にHTML(XHTML)の可搬性を考えているやつはいないよな?
HTMLはmachine-readableでないため(XML知ってるんだったら意味わかるよな?
ブラウザで読めるだろとかアホなこと言わないでくれよ)、
HTML(XHTML)の可搬性を考えるにあたって必ず考慮しなければならないことは、
「それが汎用の通信路で搬送され得るかどうか」
ということだけだ。その後の解釈はブラウザ任せだ。
画面が崩れてたって最終的なクライアント(人間)は読んでくれる。
>もっとわかり易く言うと、あれだ、テレビに付いてるビデオ端子、あれの可搬性(端子と流れる情報について)を考えたやつもいない筈だ。
>テレビとビデオを繋ぐ方法は将来的に必ず進化するって事はわかりきってたし、今現実に進化してるからな。
テレビ信号が守らなければならない最低限の規範
「特定の周波数帯に属する電気信号であること」
という合意があったからこそ、ビデオ端子の規格を決めることができた。
(つうかテレビ信号って全然進化してないと思うんだが・・・。)
今回の話は、machine-readableなデータ構造を決めようとしているにもかかわらず
「仕様の責任範囲はどこまでなのか」という議論がほとんどなされていない。
ツリーのみを前提としたフォーマットで一般のグラフ構造を記述することはできない。
データ構造における最低限の合意がない限り、そもそも可搬性を議論できようもないと思うのだが。
>ついでにXMLどころかSGMLも生まれなかっただろうな。
唐突すぎて論理の流れがわからないのでこういう結論に至った論理展開を激しく希望。
フィーリングとかじゃないよね?
355 :
nobodyさん :02/12/06 21:32 ID:oYivAj3/
49にレスしてると話が進まないため全くいないものとして扱うほうがいいと思うのです。
356 :
nobodyさん :02/12/06 21:45 ID:zJ8lEv59
>HTMLはmachine-readableでないため >(XML知ってるんだったら意味わかるよな?ブラウザで読めるだろとかアホなこと言わないでくれよ) machine-readableだからディスプレイに表示できるんじゃないのか? ブラウザで読めることの何処がアホですか? >「仕様の責任範囲はどこまでなのか」という議論がほとんどなされていない。 タイトル読めよ
>画面が崩れてたって最終的なクライアント(人間)は読んでくれる。 XMLで再定義された意味が無いな。
358 :
49 :02/12/06 21:50 ID:???
359 :
49 :02/12/06 21:51 ID:???
machine-readableでなくてmachine-understandableとあるな。 用語を間違えますた。素直に訂正してお詫び致します。
360 :
nobodyさん :02/12/06 21:54 ID:zJ8lEv59
厨房は相手にしないことにしたのだが特例としてレスしてやろう。 おまえはせっかくHTMLでマークアップされたのに、 ・何処から何処までが1段落なのか? とかの、意味を処理装置が読み取ってそれに適した表示をすることを否定するのか?
361 :
49 :02/12/06 22:04 ID:???
>>360 (
>>354 のmachine-readableをmachine-understandableに読み替えてくれ(陳謝致します。))
それは否定しないが、別に段落表示がされなかったとしても
HTMLの最終的なクライアントは「人間」であるため、「文章の意味の送付」という
目的は達成される。従って最低限「文書の搬送が可能」でさえあればOKで、
それ以上の条件は「オプション」だとしても構わないわけだ。
だが、今回の話のようなデータ交換(EDI)となると話は違う。
機械が解釈できるためにはフォーマット以前の問題として
交換する情報の「データ構造」の合意がない限り不可能(人間が目で読むのとはわけが違う)だ、ということだ。
362 :
nobodyさん :02/12/06 22:07 ID:zJ8lEv59
<style> P{ color:green;} </style> これを適用するためには意味解釈をしなくてはならないのではないか?
363 :
nobodyさん :02/12/06 22:11 ID:zJ8lEv59
あと、 「否定しない」 という言葉づかいはやめてくれ。 お前の肯定、否定でなにが変わるわけでもない。 >だが、今回の話のようなデータ交換(EDI)となると話は違う。 つまり、XHTMLを読むことはデータを交換(この場合受け取る) ことでは無いとおっしゃるのか? >交換する情報の「データ構造」の合意がない限り不可能 >(人間が目で読むのとはわけが違う)だ、ということだ。 schemaってものがありますが?
364 :
49 :02/12/06 22:12 ID:???
>>362 例えばそのcssを含むHTML文書が仮に白黒画面の端末上で表示されたとしても
「人間が理解できる文章がHTML文書の中に含まれている限り」
その文書の意味を人間に理解させるという目的は達成されているね?
つまり、その意味解釈機能は「文書の意味を人間に理解させる」という目的を
達成する上では必須ではない、ということだ。
365 :
49 :02/12/06 22:13 ID:???
おまえら新しいおもちゃを見つけたからってあまり浮かれない方がいいと思いますよ。 そろそろ放置したほうが彼のためになります。
367 :
nobodyさん :02/12/06 23:06 ID:zJ8lEv59
>
>>363 >
>>360 で「否定するのか?」と聞かれたから
>「否定しない」と言ったまでだが。
すまんな、「否定しない"が"」が気に入らなかったんだ、
>HTMLの最終的なクライアントは「人間」であるため、
漏れは、HTMLは機械からみればただの文字列配列に過ぎないデータに
"その文字それぞれが、文章中でどのような意味を持つのか?"
をわからせるためのマークアップ言語だと思っているが、
最終的なクライアントに"プレーンテキストとしての意味"がわかれば最低限それで由?
>その文書の意味を人間に理解させるという目的は達成されているね?
それが"目的"なら(最低限、)プレーンテキストで十分だとおもうが?
>その意味解釈機能は「文書の意味を人間に理解させる」という目的を
>達成する上では必須ではない、ということだ。
達成する上"では"、な。
「文書の意味を人間に理解させる」だけがHTML(含むXHTML、特にXHTMLか?)
の目的じゃないだろ?
368 :
49 :02/12/06 23:19 ID:???
>>367 >「文書の意味を人間に理解させる」だけがHTML(含むXHTML、特にXHTMLか?)
>の目的じゃないだろ?
他にどんな目的があるかね?
ブラウザに表示するのも印刷するのも結局人間に理解させるためではないのかね?
369 :
nobodyさん :02/12/06 23:21 ID:zJ8lEv59
>他にどんな目的があるかね? "意味"を"処理装置が読み取って"それに適した表示をする。
370 :
nobodyさん :02/12/06 23:22 ID:zJ8lEv59
追記、 最終的なクライアントが全てでは無いだろ?
371 :
49 :02/12/06 23:30 ID:???
例えば商社のシステムを考えてみよう。 顧客からの発注に対し、メーカーのシステムに在庫情報を問い合わせて 受注の可否を判断・通知するものとしよう。 このとき、商社のシステムは、「受注の可否を判断する」という*目的*で メーカーのシステムと「在庫情報」の交換を行っている。 これがEDIだ。「在庫情報」は機械が解釈するため、その仕様に曖昧さは許されない(定義されていさえすれば多様性は許される。) だがHTML(XHTML含む)の目的はこのようなクリティカルなデータ交換ではない。 今回の掲示板データフォーマット、ってのは機械が解釈できるようにするんだろ?
372 :
49 :02/12/06 23:32 ID:???
>>370 >最終的なクライアントが全てでは無いだろ?
全てだろう。というかこういう書き方をされると手間なので
最初に何が書きたいのかはっきりしてくれないか?
49は放置しろ。 これは警告だ。
374 :
nobodyさん :02/12/07 00:02 ID:IF9f0MTH
最終的なクライアントが人間で無い例をあげてみてくれるか? >>最終的なクライアントが全てでは無いだろ? >全てだろう。 最終的なクライアントとの間にもさまざまなクライアントが存在していて、 そういったクライアントが意味解釈をするためにも (最終目的と途中の手段を取り違えている訳ではない) HTMLでマークアップすることは意味あることだと考えるが? >これがEDIだ。「在庫情報」は機械が解釈するため、その仕様に曖昧さは許されない >(定義されていさえすれば多様性は許される。) >だがHTML(XHTML含む)の目的はこのようなクリティカルなデータ交換ではない。 HTML(XHTML)でも"曖昧さのない情報交換"も"定義によって拡張された情報の交換" も可能だろ?
375 :
279 :02/12/07 00:08 ID:???
>>285 >と、漏れも当初は思っていたのだが、それにしては抽象化のできない奴が多過
>ぎると思ったので。
そこはあえて無視しているというか、過程を飛ばしている、という考えかた
も好意的に見れば可能でしょう。まー、2ch において、そのようなことをする
必要は必ずしもないが。
で、実際にこのスレがどうあれ、また、希望としてはどうあれ、世界をみわ
たせば、人それぞれの差というのは大きい。
そこから話がそれるかもしれないが、そういう差というのは抽象化の作業だ
けじゃなく、なんらかの規格を実装をする、という作業においても同じだ。
そういった点において、相対的にスキルの低い人間が実装した場合に限りな
く悲惨なものができあがってしまい、カオスを生み出した MIME は失敗だった
のではないだろうか、とか思ってる。
>>354 >「仕様の責任範囲はどこまでなのか」という議論がほとんどなされていない。
これはだいたい同意というか、おそらく漠然としたイメージを既に皆が
持っているからか、明示的というか、具体的に示されてはいなようだね。
>ツリーのみを前提としたフォーマットで一般のグラフ構造を記述することはできない。
「ツリーのみを前提としたフォーマット」って何?
たとえば、RDF ならば directed graph は表現できるように思えるけど。
graph theory はちゃんと勉強したことはないので変なこと言ってたらスマソ。
376 :
49 :02/12/07 00:32 ID:???
>>374 >最終的なクライアントが人間で無い例をあげてみてくれるか?
>>371 にある商社のシステムは、最終的に商社のシステム=機械が受注の可否を決定しているね。
>HTMLでマークアップすることは意味あることだと考えるが?
HTMLでマークアップすることに意味がないと言っているのではない。検索エンジンなども
HTMLのマークアップ情報を利用しているし、その意味では検索エンジン=機械が解釈している、
ともいえる。
が、HTMLのマークアップはあくまで「あったらいいね(なくてもまあ、なんとかなる=読める)」
という位置付けであることは理解していただけるだろうか。
それに対し、掲示板データフォーマットを決める際には、そのプレゼンテーション方法
(XMLにするかCSVにするかCMTにするかMIMEにするか)を決める前に、まず前提として
掲示板というものの「データ構造」を定義する必要がある、と(ずーっと上の方から)
主張しているのだが、わかっていただけるかな?
>HTML(XHTML)でも"曖昧さのない情報交換"も"定義によって拡張された情報の交換"
>も可能だろ?
交換するプレイヤーが全員合意できる約束事をHTML(XHTML)の上に載せれば十分可能だ。
ただ、それをHTMLの上に載せることにどれだけ意味があるのか不明だが。
377 :
49 :02/12/07 00:44 ID:???
>>375 >「ツリーのみを前提としたフォーマット」って何?
えっと、これはXMLのことではなくて、掲示板データ構造のことね。
例えば掲示板データフォーマットとして書き込み間の関係を記述するにあたって、
各記事がその親記事のIDを1つだけ持つ、という決めにした場合、
ルート記事があるという前提でそのフォーマットはツリー構造以外の
掲示板構造をサポートできないよね?(2chみたいなのは特殊なツリーとして
捉えることができるけど、例えば関連記事を複数指定できるようなのはムリ
ってことね)
で、そういう「どこまで変態的な掲示板まで認めることにするか」っていう合意が
ないと、結局フォーマットの規定なんてできないんじゃないか、と。
378 :
279 :02/12/07 00:52 ID:???
>>377 >えっと、これはXMLのことではなくて、掲示板データ構造のことね。
了解。
で、「どこまで変態的な」だけど、とりあえずは過去から現在まで
見られた掲示板的なものをある程度サーベイするなどは必要だろうね。
パソ通にしてもホストシステムによりいろいろあったし、NetNews は
あるし、昨今の Web 掲示板、さらには日記システムや blog 系の
システムなんかも、一種の掲示板的使われかたがある。
さらには Wiki とか。
なんにしてもグラフで表現はできるね。では、そのグラフに対して
どのような制約を設定するか、だな。
379 :
279 :02/12/07 01:13 ID:???
ちょっと昔の記事にレス。
>>282 > バイナリをMIMEで持つのはいいとしても、
> いちいち変換するのは面倒じゃない?
> 単純に別ファイルとして保存してあるバイナリにリンク張るってのはダメなの?
1. message/external-body で
access-type に HTTP のようなものを指定し、
name に URL とかを書くようにする
2. text/html とか text/xml+xhtml (だったかな) ならば
img タグで URL を指定
3. HTTP で使われているみたいに、単にバイナリをたれながしてしまう。
Content-Length でデータの終端を見極める
1. や 2. は RFC 2046 の 5.2.3.6. に述べられているような、また、最近言
われる「Web バグ」のような問題を引き起こす可能性もあるので、安易な規定
や実装は危険。3. は Content-Length: はエラー処理が面倒。
application/xml+xhtmlじゃなかったか?
381 :
nobodyさん :02/12/07 11:28 ID:xRJXJ2LG
>>282 みたいなこと考えた場合でもXMLならXLinkとかよく考えられたものがあるのに。
コテの乗り換えか、さすがだよ
application/xhtml+xml
人間の脳も一種の解釈装置 定義されていない情報でも、独自に意味自体を解釈して そのデータを解釈する能力がコンピューター等と比べて飛躍的に優れているだけ。
正直、49は話術はうまいかもしれんが、知識は平均以下。
うまいわけないだろ。読みにくくてしょうがない。というかもう読んでないけど。
>>386 実際"話術は"うまいよ。日本語がうまいかは別として、
不自然さを残さずに話題をうまくすりかえている事がよくある。
「飛矢不動論」みたいだね。 思わず納得してしまうような。
389 :
56 :02/12/07 21:04 ID:KahB7D1v
可搬性について考えながらXHTMLでマークアップしてる漏れは言って由?
…相変わらず理想を語るだけのスレだな。 お前たちがあまりにも悲惨すぎるので 俺が有名所の掲示板サイトを巡って 書き込み間の関係 を 調べてきてやったよ。 他にあれば適当に追加してくれ。 記事の位置を表す 8タイプ この記事は記事aへの返信です この記事は記事a,記事b,記事c...への返信です この記事は記事aへの1行レスです この記事は記事aを評価します(+1点) この記事は記事aの続きです この記事はxスレに所属します この記事はxカテゴリに所属します この記事はx,y,z...カテゴリに所属します
391 :
nobodyさん :02/12/07 23:15 ID:bSS0h4J9
>この記事は記事aへの1行レスです >この記事はxスレに所属します この2つは >この記事は記事aへの返信です に還元できるんじゃない? カテゴリって具体的にどういうの?
>>390 netnews や mail のように記事に uniq-id つけて参照してやれば。
393 :
49 :02/12/08 00:39 ID:???
>>378 >なんにしてもグラフで表現はできるね。では、そのグラフに対して
>どのような制約を設定するか、だな。
うん。記事間の関係も、たとえば2chみたいな">>\d+"をレスに含めるような
スタイルもあれば、いわゆるスタンダードなツリー(書き込みに返信していくタイプ)もある。
1chのような1行レスもあるがこの1行レスは独立した「書き込み本体」なのか
それとも主たる書き込みに付随する要素なのか、という問題もあるな。
最初にいろいろ切り分けておかないと破綻するだろうな。
>>391 カテゴリは2chの板だと思ってほしい。
例えば「この記事はxカテゴリに所属します」を具体的に言うと
>>1 はWEBプログラミング板への新規投稿です
…となる。
しかし板と記事とを同列に扱うと、後で無理が生じる恐れもあるため
記事とは言わずにカテゴリと書いた。
396 :
nobodyさん :02/12/08 02:41 ID:rGDePQLz
それは個々の記事が持っているべき情報なの? あと複数のカテゴリに所属するって言うのは具体的にどのサイトでやってるの。
>>396 390 の人じゃないけど、カテゴリを newsgroup とするなら、
NetNews のクロスポストとか。
パソ通のホストでも、そういうのをサポートしているところがある
(そこは Web からも見れるが、Web から見る限りはわからない)
>>396 kari.to もスレが複数の板に属することができる。
399 :
nobodyさん :02/12/08 02:55 ID:dWu9ddDI
>>390 1つ追加
この記事はxスレに子スレを新規作成します
>>396 1だけ持ってればいいんじゃない?
400 :
◆kelobi3ito :02/12/08 02:57 ID:ubKy2Te3
400
>それは個々の記事が持っているべき情報なの? これがまさにこれから決めなきゃならない重要な問題だよね。 NetNewsは持ってるけど、2chは持ってないよね。
402 :
nobodyさん :02/12/08 09:29 ID:ZeoNMGBo
さて、正直XLinkとXPointerでカバーできないものがあるか?
さて、正直テキストファイルでカバーできないものがあるか?
405 :
nobodyさん :02/12/08 14:26 ID:gXokz3Fs
XMLもテキストファイルだからって言うオチですか。
プログラム言語の比較で、それってチューリング等価じゃん、 で話が終わってしまうようなもんか。
\t
408 :
nobodyさん :02/12/08 17:57 ID:tCL4JfFl
XMLでデータを持つとして、CGIなりPHPなりASPなりで データ読み出し書き出しのモジュールを配布すれば もっと広まると思う。
>>408 掲示板のスキーマによるから XML の読み書きライブラリと変わらないんじゃない?
netnews も wiki も同じく扱える巨大汎用規格ならいいけどさ。
Web サービスの WSDL のように、
スキーマをプログラムにマッピングできる規格が必要かと。
今夜はマターリですね
このスレにはろくな奴いないんだから、 素直に他の団体から勧告されるの待てよ。
413 :
49 :02/12/08 23:44 ID:???
>>394 >それが
>>390 じゃないの?
そうっすね。ただ、1行書き込みは「書き込みクラス」のメンバにした方が
パフォーマンス面でいい気もする、とか、そのあたりの議論が必要かと思いますた。
何にせよ話題がXMLから構造そのものに移行するということはよいことです。
どんな規格を策定するにせよ、最初にXMLありき、という態度は到底健全とは言えないので。
ありえそうな全パターンを列挙して規定とし、 個々の掲示板にはそのサブセットを使うと。 だるいね。
規格を作りたい49と掲示板を作りたいその他の構図
掲示板以外の規格とあわせたいXML陣と 掲示板におけるベストなフォーマットにしたい49+(以下略
規格を作りたい49と規定を作りたいその他の構図
おまいらの意見を総合すると 要するに49だけが浮いているということですね。
49とその自作自演が浮いてます
420 :
nobodyさん :02/12/09 22:29 ID:UMmT4V+m
「<、>、"」等を変換してしまうのは良くない。 書き込み時に変換しておくことで読み込み時の負荷を減らすことができるけど、 書き込まれたデータはなるべくそのままの状態で保存しておくべきだと思う。 HTMLで表示することを前提にしちゃってるしね。 レスがつけられる掲示板で親記事の内容もtextarea内に表示する場合、 もう一度「<、>、"」を変換しなおさなくてはいけないし。
>>420 変換には汚染対策の意味があるんだよとマジレスしてみる。
>>421 デミリタと同じ文字列や改行は一時的になんらかの文字列に変換しといて
読み込み時に変換しなおせばいいとマジレスしとく。
>>1 の目的は
>>390 みたいなことじゃなかったのか?
またずれ始めてるぞ。
あと、
もうわかったからあふぉな
>>49 叩きはやめろ。見ててマジでウゼェから。
425 :
nobodyさん :02/12/10 06:01 ID:FaxsMvKu
汚染対策は保存形式自体とは関係ないな
1を引っ張ってきて"掲示板スクリプトのデータフォーマット"が何なのか聞かなきゃいかん。
427 :
49 :02/12/10 07:56 ID:???
>>414 >ありえそうな全パターンを列挙して規定とし、
>個々の掲示板にはそのサブセットを使うと。
>だるいね。
誰もそんなこと主張してないぜ。普通に優秀な奴らなら、想定される全パターンを盛り込む
規格を作るなんて楽勝(残念ながらこのスレの連中にはそれすら望むべくもないが。)
難しいのはそうして集まったパターンを経済的合理性に基づいて切り捨てていく作業だ。
W3Cの連中は基本的にこれができていないので
XML Schemaなんていうバカげたfatな規格ができてしまうんだな。
428 :
49 :02/12/10 08:04 ID:???
おっと訂正訂正。 誤 残念ながらこのスレの連中には・・・ 正 残念ながらこのスレに粘着してるXML厨の連中には・・・
429 :
49 :02/12/10 08:06 ID:???
>>424 っておい。まじでリア厨だったのかよ・・・。
だめだ。熱出てきた。
430 :
nobodyさん :02/12/10 08:10 ID:FaxsMvKu
例えばXHTMLのモジュール化とかの例を知っていればばかげたfatな規格なんていう言葉は出てきそうにないな。
よく「サーバにモジュールがインスコされていないので使えません」とか言う香具師 がいるけどさ、perlのモジュールなんて多くは単なるテキストなんだから、ホームに コピーしてuse libすれよゴルァ、と思うんですがどうでっしゃろ。
>>427 「想定される」パターンは確かに誰でも盛り込めるけど、
その想定ができないパターンについてどうやって
拡張性をもたせるかも重要なんじゃないの?
434 :
nobodyさん :02/12/10 13:39 ID:kTH/2hjo
だからXMLには名前空間っていうものがあって、
そういう話をこのスレの前のほうでもしてたんだけどね。
>>119 -
「切り捨てる」とかいって出来たものは誰も使わないだろう。
436 :
nobodyさん :02/12/10 20:30 ID:RdWzoDHt
違うでしょ。49はCMTもにわか勉強しながら書いてる感があるし。 4と5でCMTとXMLについて最初に言及したのは両方とも俺だけど 使ってらんねーよというわけではなくて(INCM使ってるし) CMTよりベターなものを作ろうとしたらXMLだろうと思うだけです。
厨な質問かもしれんが、誰か教えて。 「掲示板スクリプトデータフォーマット」って具体的に何の事? 俺が読んだ限りでは、掲示板が保存するログデータのフォーマット(<>区切りとかCSVとか)の規定かと思ってるんだが、 そうではなくてCMTなんかのように、外部ソフトから呼び出された時に出力する(ことを主な目的とした)フォーマットの事なのか?
> 掲示板が保存するログデータのフォーマット DBの場合、どうするのだろうか。
XML自体はいいんだが、これじゃあ、返ってログの容量を増やしてないかなぁ。 <>だと拡張するときに大変だって言うけど、 id<>name<>mail<>host<>comment<>upfile<> 1<>nobody<><>192.168.0.1<>I'm depression.<br>I'd like to die.<>hicky.gif:mona.gif<> こういう感じに、1行目に形式(フィールド名)を定義して、後からデーターっていう感じじゃだめ?
>>439 漏れはそれでいいと思う。
もしくはスクリプトのログデータ読み取り部分を完全モジュール化して、
形式にあわせて各ベンダがモジュールを作成するとか。
>>439 csvベースならそれ以外には考えられないな。
1行目はもう少し複雑になって
最終的には正規表現に毛の生えたような表記方法になるだろうな。
442 :
nobodyさん :02/12/11 00:40 ID:Gdu4L0PC
なんかいまさらな議論な感じ。
いずれにしろ、
>>437 の質問に答えが出ないことには話の進めようがないのだが。
>>438 CSVの各カラムをそのままDBのカラムにして
1行1レコードで突っ込んでけばいいんじゃないの
データベース使えないサーバーが多い以上あまりいい方法ではないな。
それに外部から使うのに困る。
CSVなら
>>439 のようにハッシュを使うものではなく、普通のやつでいいんじゃないかな。
map使うと単なるsplitより(項目数によるが)10倍以上時間がかかる。
普通数十〜百程度の記事を表示するだけだから、あまり速度を気にする必要もないが。
カラムの意味定義は仕様書に任せるとして、結局別口でデータ再利用スクリプトを用意した方がいいんじゃないかな。
データのフォーマット換え程度なら誰でも作れるし。
「掲示板間のデータファイルの共有」に限った話ね。
ちーげよお前ら阿呆だな。
データ自体の持ち方はそれぞれがcsvだろうがCMTだろうがXMLだろうが
好きなように持てばいいんだよ。
ただし、それとは別に決められた汎用的なフォーマットも残せ(吐き出せ)
ということだろ。(それにはXMLが最も適している)
ちなみに
>>1 が言いたいのはcsvフォーマットで残す場合の企画を統一
しないかということだとエスパーしてみる。
ちーげよ
このスレが何を示すものなのか、みんなちぐはぐになってるんだよ。 掲示板スクリプトデータフォーマットの規格を統一する前にこのスレの規格を統一してくれ。
このスレの主題は csvフォーマットでデータを記録する場合の企画の統一 です。
454 :
437 :02/12/11 17:56 ID:???
全部読んだつもりが見落としてたか。しかも最近のレス。 わざわざスマン。 で、今後は「掲示板がエクスポートするデータフォーマットを規定する」が統一見解ってことでOK? 俺はOKよ。
csvでやるなら、レコード中のフィールドの順番を決めて &Quot;とかやっとけばオッケーそう。
456 :
nobodyさん :02/12/11 21:52 ID:GtOPPdmi
>>454 本当は、掲示板が保存するデータのフォーマットを統一するのが
1の望むことだろうしみんなの理想なのだろうが、実際問題として難しい。
(Perl、PHP、Java、ASPなどでもっと手軽にxmlを扱うことができるように
なればいいのだけど・・・)
ならば、せめて統一フォーマットだけでも決めておいて、保存データとして
使うか、エクスポートのみの採用かはそれぞれの掲示板製作者にまかせると
するしかないのではないだろうか。
以上はXML形式にするという前提で話をしてるが、
時代の流れから行くとこれが一番良いでしょう。
457 :
456 :02/12/11 22:00 ID:GtOPPdmi
確かに出力フォーマットのみに限定するとこのスレも色あせて見えるが、ポストCMTってことで今後の発展に期待。
実際は、データの規定よりCGI制作者側からするとハードルが低くなって取り入れられる割合は増えるだろうな。
モジュール作って入れるだけでよさそうだし。
いや、データの規定でも、読み込み書き込みルーチン作れば済むって意見もありそうだから、やっぱ作者によるか。
とりあえずXMLで規定するのは了解です。
よくわかってないが、汎用性があるらしいから。
欲を言うと、掲示板巡回ソフトの類がもっと増えて欲しいな。開発競争ってのが無い気がする。
>>455 CSVは掲示板によって項目数がかなり増減するから、規定作る場合は面倒そう。
>>439 みたいに見出しレコード使う手もあるけど、各データで項目の意味合いが完結してる方が簡潔だ。
まずガンガッテXML仕様書読むとするか・・・。でも英語はイヤんな感じ。
掲示板の論理構造を決めるスキーマのスキーマを作ると言うことで。 UML でいうところのメタクラスの階層。
XMLなんかでログ保存⇔読み出しなんかしてたらたまらんだろうが。
461 :
nobodyさん :02/12/12 06:58 ID:njI4CLTT
XMLフォーマット、csvフォーマットそれぞれ作るというのは駄目ですか? ・XMLフォーマットは将来を見据えた理想、現時点で採用は難しい。 ・csvフォーマットは現在最も普及している、採用が容易。 ということで、どちらを選ぶかは掲示板製作者の自由にしておく。 どちらもフォーマットを決めて置くことで相互のデータの互換性も あると思うのですが。
462 :
455 :02/12/12 07:46 ID:???
>>457 だね。すぐにcsvとして使えなくちゃ意味ないもんなぁ。軽率でした。
>>461 >342
スクリプト側でのデータの持ち方はいまさら決めても
仕方ないだろ。
すでにあるスクリプトでで対応するのは考えられないし。
じゃあ、
>>145 が作ったxmlを元にする感じなのかな?
つうかさ、
>>439 が出力用の汎用フォーマットってことでいいじゃん。
なんでXMLが必要なのか正直わからん。
466 :
nobodyさん :02/12/12 14:19 ID:FvLiMeis
XMLでは表現できるけど
>>439 では表現できない例キボンヌ
>>466 あとから、前の項目を削ったりできない。
469 :
nobodyさん :02/12/12 15:04 ID:LfYYQWKp
なぜxmlかはさんざん書いたので過去ログ読んでよ
例えば name<>link<>msg というデータ形式をいったん決めたとする。 そのあとにlinkをwebとmailに分離して定義したいと思った時、 linkの項目を削除して定義し直すと、 それ以前に作ったデータとの互換性が失われる。 データ項目はあとからどんどん付け足すことしかできない。 XMLなら柔軟にデータ項目の追加削除が可能。
XMLで削除が可能ってのはナゼですか?
形式定義の柔軟性ってこった
>XMLでは表現できるけど
>>439 では表現できない例キボンヌ
例えばXMLだと送信者の情報をいれとこうと思うと、
すでに個人情報のマークアップの仕方を定めてる勧告があって、
それを使用することで、個人情報の中身には一切関わらなくても、
「この要素の内容の"個人情報"は"送信者の個人情報"ですよ」
って事がわかってれば、内容についてはノータッチでいける。
将来的にあたらしい種類の個人情報が登場してもノータッチ。
CSVで行の最初に・・って方法で、個人情報を入れたいと思うと(あくまで投稿者の任意だが)
id<>name<>mail<>host<>comment<>upfile<>住所<>電話番号<>郵便番号<>氏<>名<>・・・
みたいにきりが無い。
(CSV扱うプログラムにに他のschemaを読みに行く能力をつければ可能だが、
自分の知る範囲でそんなものはない。)
>>475 何がノータッチなのかわかんない。
プログラムで個人情報触るんならノータッチのはずないじゃん。
なんでお前らはデミリタに<>を使おうとしてるの? そんなのKENTが考えたやり方だろ。 それこそ汎用性に欠けるんだけど。 CSV=Comma Separated Value、な?
デミリタあげ。 汎用性って何ですか?
ちょっと誤解されてるみたいなんで補足すると、 id<>name<>mail<>host<>comment<>upfile<> うえのように1行目で、形式を定義するんだけど、僕が言いたいのは その1行目のフィールド名を元に $out{id} $out{name} $out{host} $out{comment} $out{upfile} みたいな感じの入れ子を作って出力するってことなんだ。 こうすれば、他の形式のログを読みとるとき id<>name<>mail<>url<><>pass<>host<>comment<>icon<> となっていても、問題なく今までの掲示板でよめる。 大切なのはログの形式が、1行目のファイル形式のルールに従うこと。 こうすれば、ログを拡張しても、最低限読むときの下位互換は得られる。 問題は、形式の異なるログを更新したりするときに、一工夫いるところだけどね。 (古いバージョンの掲示板側で出力しないデータは空欄でいいのかとか、 使っている掲示板のデータだけ記録すればいいのか、など)
480 :
nobodyさん :02/12/12 17:35 ID:qH8N5K0u
>>476 掲示板フォーマットが、だろうと言ってみるTEST
>>480 なるほど。で、なんでノータッチにする必要があんの?
> なんでお前らはデミリタに<>を使おうとしてるの? , がデータに入る可能性がある、<>は<>に変換するからデータに入る可能性が無い。 だからだろ。 それが良いか悪いかは別にして、それくらい自分で思いつくぐらいには脳みそ使ってやらないと しまいにゃ脳みそも腐ってしまいますよ。 > そんなのKENTが考えたやり方だろ。 KENT以前からありますよ。
>それが良いか悪いかは別にして、それくらい自分で思いつくぐらいには脳みそ使ってやらないと >しまいにゃ脳みそも腐ってしまいますよ。 煽り不要。ギロンしようぜ。
>>484 <>を使ってる理由を考えられない人と議論しても激しく無駄。
>>483 あとそれだと別に"<"一文字でもいいんだよな。なんてことは
>>17 でガイシュツ
>>486 改行を<br>に変えてたりしたらダメなことぐらい気付いとけ。
>プログラムで個人情報触るんならノータッチのはずないじゃん。 プログラムで個人情報触る必要があるなら(そのような規格なら)、 個人情報を勧告した団体からでるだろ? (データとして扱って普通に表示する分ならDOMに対応してれば十分だが、) で、それを組み込めばSVGみたく、 乗せるのがXHTMLだろうが掲示板フォーマットだろうが、処理できるって事。
<>が良いとは言わんけどさぁ、そーいうことぐらい自分で考えようよ。 思考が停止してる人が議論に入ってきても自分だけが正しいって思い込んで 全然中身のある議論になんねーんだよ。
>>488 そういう団体が個人情報の最終利用形態まで全て包括的にライブラリとして
提供してくれるわけじゃないよな?
ってことはいずれにせよプログラムがその規格の中身を理解してないとだめじゃん。
掲示板データに 名前、記事番号、返信元記事番号、投稿回数、タイトル、本文 の要素があるとする。 XMLだと <news><name>なまえ</name><number>11</number><reference>10</reference> <posttimes>3</posttimes><subject>たいとる</subject><text>ほんぶん</text></news> みたいな感じにできるのかな?? CSVでは一行目を見出しとして name,number,reference,posttime,subject,text なまえ,11,10,3,たいとる,ほんぶん か。 ここで投稿回数がいらなくなったら、XMLなら要素を削ればいいだけだけど CSVだと単に削っただけではダメ。全体を書き換える必要がある(もしくはゴミを残して無視)。 その後も掲示板の仕様が変わるたびに要素が増えたり減ったりして面倒。 XMLが推されるのはこんな理由かな。 でもエクスポートに関しては、面倒さではあんまり変わらないのかも。 汎用性については、XMLはすでに規格化されていて、パーサー使っていかようにも構文解釈できるってことかな。 この辺が俺の中でもかなり謎。 XMLの知識無いから見当はずれな事書いてるかも。 俺は(掲示板のエクスポートに関しては)CMTボンバイエだけど、 XMLだからといって毛嫌いしているわけにはいかんだろ。 それが有効ならば取り込んでいかないとね。 もちろん他に有用なものがあればそっちがいい。 俺はCMTで十分だと思ってる。今の掲示板を扱う外部アプリがあんまり無い現状ではね。
>ここで投稿回数がいらなくなったら、XMLなら要素を削ればいいだけだけど >CSVだと単に削っただけではダメ。全体を書き換える必要がある(もしくはゴミを残して無視)。 XMLでもCSVでもファイル全部書き直しだろ。
デリミタ<>はHTMLで表示する前提で考えだされたものだけど、
それに加えて区切りの見やすさからこれになったんじゃないかと推測。
>>477 変形CSVだけど、いちいち厳密なCSVでないなどと断る必要ないだろ。みんなわかってんだから。
別に , 区切りで , としても タブで 	 としても良いし、<>なのは単なるデファクトなだけでどうとでもなる。
HTMLで表示するのが前提だから、当然 < などの一文字ではタグの扱いができない(面倒になる)という問題は自明。
<br>に変換するのは、掲示板ログとしてならOKだと思う。その方が処理が少なくすむと言うメリットがちゃんとあるんだから。
>>493-494 掲示板ログの話になるけど、XMLなら無視すればいいだけなんじゃないかと思うわけだよ。
XMLは各記事毎に項目の意味づけがされてるわけだけど、CSVは一行目の見出しに意味づけがあるだけで、一行目と全体とが連動してるでしょ。
XMLなら同じログファイルに<posttimes>がある記事と無い記事が混在してても問題ないと思う。
CSVだと一行目のカラムを削ったら、全体も削らねばならない。もしくは見出しにゴミを残したままになる。
という考えです。
そもそもXMLの認識が間違ってるのだろうか。無責任でスマン。
>>479 に関しては、ハッシュを使おうとCSV型の欠点は補えないでしょ。
仕様が変わるたびに見出しが長くなってしまう危険性がある。
ちなみに俺はCGI書くときデータはCSVだよ。
使うなというのではなく、より便利なものがあればそっちにしたいという考えです。
>>496 なるほどそういう意味か。理解が浅くてスマソ。
しかし思うにファイル(Read)→プログラム上のデータ構造→ファイル(Write)
という過程を考えるとどのみち整形されてしまうんではなかろうか。
>>497 結局そうですね。
正直俺も掲示板の処理が煩雑になって、結局メンテナンス性が悪くなるんじゃないかと危惧してる。
これでパターンマッチ使うようなら速度もずっと遅くなるし。(ここでは速度はあまり重視しない方が良さそう)
このスレではメンテナンス性の良いものを考えるべきだな。
というか、掲示板のデータ構造は各作者に任せて、エクスポートするデータフォーマットを考えることに絞った方がいい。
>>498 この際速度も重要だといってみる黄昏時。
パターンマッチ(正規表現)はXMLのparseより本質的に速いよ。
速さだと結局インデックス無しのCSVじゃないか?
split /,/; で済む。たぶん他のどれより速い。
でも
>>344 みたいにハッシュにした方が断然使いやすいけどな。
なんだか目的もなくたゆたってる気分ナリ。
デミリタに<>を使う奴は劣等種。
あくまで、その内容がXMLパーサーでは扱いきれない情報を含んでいた場合のみだが、 >ってことはいずれにせよプログラムがその規格の中身を理解してないとだめじゃん。 言い方がわかりにくかったか… こっちでプログラムを管理しなくて済むってことの有効性は他にもあって、 例えば、 XHTMLにうめこまれた個人情報を解釈するプログラムと、 掲示板用のXMLにうめこまれた個人情報を解釈するプログラムがそれぞれ別々だとすると、 たった2つだけならいいけれど、 他にも個人情報を埋め込みたい文章はいっぱいあるわけだから、 それぞれが、個人情報を処理するコードを内部にもつとなると物凄い量になって、 バージョンがあがるごとに、それぞれのプログラムがアップデートしてそれに対応しなきゃならない。 その点、外でもってくれると、アップデートは気にしなくていい。 >そういう団体が個人情報の最終利用形態まで全て包括的にライブラリとして >提供してくれるわけじゃないよな? 勧告が規定するものが"外部的なプログラムを使用して解析されなければ意味のないデータ"の場合、ほとんど出てるよ。 でも、例の"個人情報"という内容だけならば、XMLパーサーで十分。
結論: csvで充分。
>>504 うむ。言いたいことは十分わかる。漏れも昔はそういう理想的な世界を考えていた。
しかし良く考えてみてくれ。
個人情報をHTML形式で清書するみたいなプログラムは確かにライブラリでOKかもしれん。
しかし例えばプログラム内で掲示板の書き込みを「年齢順」にソートする場合、
どうしたってプログラムで「年齢」という要素にタッチせざるを得ない。
つうことはそのプログラムが個人情報の規格に否応でも依存してしまうわけだ。
逆に言えば、そういう個々のプログラム内でタッチしないような「個人情報」なら、
年齢や住所などをベタにテキストで持っておいても(人間さえ解釈できればいいわけだから)
構わないとさえ考えられる(XMLで持つ利点といえば清書できるぐらいか?)
エクスポートするデータフォーマットに限定して話さない? それともこの混沌の中から掲示板データフォーマットを搾り出すのか?
もし現時点で実用的な(=実際に流通するような)フォーマットを規定するのであれば、
>>479 あたりが落し処なんじゃないかと思う。
世の中のサーバ環境はまだXMLに寛容ではないし、掲示板プログラマに至っては尚更だ。
例えばスクリプト言語なりがネイティブにXMLを読み書きできるようになれば
また話は変わってくると思うのだが。
CSVだと要素を増やすことができないのでやめといたほうが… 増やすときにこのスレみたいなのでいちいち議論というのもなぁ…
空気を吸って吐くことのように! HBの鉛筆をベキッ!とへし折る事と同じようにッ できて当然と思うことですじゃ! 大切なのは「認識」することですじゃ! CSVを操るという事は できて当然と 思う精神力なんですぞッ!
だから、物理的な保存形式と、論理的な構造を分けて考えようよ。
>>507 >しかし例えばプログラム内で掲示板の書き込みを「年齢順」にソートする場合、
>どうしたってプログラムで「年齢」という要素にタッチせざるを得ない。
>つうことはそのプログラムが個人情報の規格に否応でも依存してしまうわけだ。
XSLって言うXMLの応用規格を使えば簡単にその事ができる。
"年齢"という要素名をパーサーが読み込んでXSLスタイルシートを適用するだけ、
>>145 にある上の奴に
http://homepage3.nifty.com/sepura/bbsformat/test.xsl が適用されると下のほうのサンプル(普通に見えるやつ)に見える。
(実は下のサンプルは7行ぐらいのテキストで成り立ってる。
で、XSL使うと例えば日付関係無しに日時だけで並び替えとかも簡単。)
で、他にもXSLスタイルシート使うと、例えばツリーがそのまま反映されたXMLを読み込んで、
親番号指定の"<>"区切りdatに変換する事も簡単。な筈。
それについては
>>83-84
×>で、XSL使うと例えば日付関係無しに日時だけで並び替えとかも簡単。) ○>で、XSL使うと例えば日付関係無しに時刻だけで並び替えとかも簡単。) スマソ
いやだからさ、その場合掲示板プログラムに添付されるXSLスタイルシートが規格に思いっきり依存してんじゃん。
依存していいんじゃないの?ダメ?
いや、むしろXMLもCSVも規格に依存してるが…
>>516 XMLのメリットっていうのはあくまで表示でなくて
あくまでデータ扱いの汎用性を維持することだろ?
それを行う事が表示にもつながるわけだ。
で、べつにデータの互換がしっくりできてれば表示はプログラムでレンダリングするなり、
XSLを適用できるプログラム使ってレンダリングするなり好きにして下さいってこった。
>つうことはそのプログラムが個人情報の規格に否応でも依存してしまうわけだ。 >その場合掲示板プログラムに添付されるXSLスタイルシートが規格に思いっきり依存してんじゃん 言ってる事がかわってるじゃん。
49...
ま た 4 9 か
49はどうでもいいよ。 XMLはよう知らんからCSVについてのみ。 ・1行目はインデックス(2行目以降がデータ本体) あるいは1行目を掲示板ユニークな情報に使って2行目をインデックスにする ・前提はHTML表記。よって必要な特殊文字はそのまま ?XX; の形で含まれる ・改行コードは LF ・改行文字は <br> ・データの文字コードを明示 ・区切り文字は「,」 ・日付に関するデータのフォーマット 年月日時分秒をそれぞれ分けるか、それとも yy/mm/dd HH:MM:SS にフォーマットした状態か 1039761862 みたいな秒だけってのはちょっと・・・ ここらへん統一するだけでも使いやすくなるんじゃない? インデックス使うだけで処理は重くなるけど。 CSVかXMLかその他か、選ぶのは人それぞれで。 とりあえず汎用性のありそうな規格を考えて、使われない方が廃れる、ってことでいいんじゃないか?
? xx; → &#xx; テキトーなんだが、CSVのカラム。 MessageId = 記事番号なり記事ID ReplyTo = 返信元のMessageId Name = 投稿者名 Text = 本文 Subject = 題名 DateYear, DateMonth, DateDay, DateHour, DateMinute, DateSecond = 年月日時分秒 最小限必要なのはこんなもんか。 インデックスが長くなってしまうが、意味を明解にするためには我慢。 日付を年月日時分秒で分けると増長だけどどうか。
実際のデータ。
一行目に文字コードと改行の情報を入れてみる。エクスポートにしか使わないけど。
01: scode=sjis,break=<br>
02: MessageId,ReplyTo,Name,Text,Subject,DateYear,DateMonth,DateDay,DateHour,DateMinute,DateSecond
03: 1,,名無し,オッス、オラ悟空<br>よろしこ,無題,2002,12,13,16,40,0
04: 2,1,nobodyさん,やあ悟空さん、頃しますよ。ふふふ。,Re: 無題,2002,12,13,16,50,0
05: 3,,nobodyさん,
>>2 ゲット<br>≡≡≡つ`⌒⊃゚Д゚(⊃,無題,2002,12,14,3,10,30
sub readdata { open LOG, shift or die $!; my $info = <LOG>; my @schema = split /,/o, <LOG>; my @rows = (); while (<LOG>) { chomp; my $i = 0; my %item = map { ($schema[$i++] => $_) } split /,/o; push @rows, \%item; } close LOG; return \@rows; } sub main { my $data = &readdata("format.dat"); for (my $i=0; $i<=$#{$data}; $i++) { print $data->[$i]->{Text}, "\n"; #(*゚Д゚)チョッチウザイ… } }
XMLでエクスポートするならCSVの形式統一する必要ないじゃん
530 :
nobodyさん :02/12/13 20:44 ID:aVW9jPSr
>>516 >>521 >掲示板プログラムに添付されるXSLスタイルシートが規格に思いっきり依存してんじゃん
何言ってるかわからない。
たぶん君のすごい誤解だと思うから具体的に書いてみて。
てへじゃねぇ。
XSLって言葉を正しく理解してない人間が過去にも約1名おりましたな、 誰とは言わんけど。
XML使いたい奴とCSV使いたい奴がいるんだから XMLのフォーマットとCSVのフォーマット両方作ってみようよ。 話はそれからだろうが。
>>526 のやり方いいね。
ただデミリタに「,」派と「<>」派がいるから一行目で
delimiter=<>みたいにできたら更に汎用性が上がるかな。
>535 汎用性があがるとは思えない。 デリミタとか固定した方がいい。 インポートする方の作業が増えるだけ。
537 :
nobodyさん :02/12/13 22:48 ID:an3wnW9j
>>526 方式だとどんな掲示板のログでもCSVデータであれば
1行目にヘッダー情報、2行目にインデックスをつけるだけで
統一できると思うのだがどうよ?
538 :
536 :02/12/13 22:55 ID:an3wnW9j
>>536 今までの掲示板のデータはほとんどがCSVだと思うのだが
それぞれの掲示板のデータの主な違いは、「デミリタ」と
「データの並び順」だと思うんだよね。
どんなデータの持ち方をしようと1行目のヘッダーと2行目の
インデックスを付けるだけでインポートできてしまうのは
楽なんじゃないか?
539 :
537 :02/12/13 22:57 ID:an3wnW9j
>538 本文のエンコード方法とか、結局データを読み出して 出力し直す必要があると思うから、ほとんど意味ないと思うけどな・・・。
541 :
nobodyさん :02/12/13 23:03 ID:xzIbks/p
そうやって汎用性と拡張性を考えてやっていくと結局最初からXMLでやっておけばよかったということになるのではないかと思うが。まあ。
>>541 そうなったら心の中で勝ち誇るとよいと思います。
543 :
537 :02/12/13 23:15 ID:an3wnW9j
>>541 汎用性の面では、既存の掲示板のデータにヘッダーとインデックスを付けて
もらうだけでOKなので問題ないのでは?
拡張性の面も問題ないと思うし。
XMLで問題となってた書き込み/読み込みの速度の問題もないし。
さて、ではCSVで個人情報をいろいろ持ちたい場合にはどうなりますか?
>>530 >>475 がよ、
>例えばXMLだと送信者の情報をいれとこうと思うと、
>すでに個人情報のマークアップの仕方を定めてる勧告があって、
>それを使用することで、個人情報の中身には一切関わらなくても、
>「この要素の内容の"個人情報"は"送信者の個人情報"ですよ」
>って事がわかってれば、内容についてはノータッチでいける。
>将来的にあたらしい種類の個人情報が登場してもノータッチ。
なんつうアホなこと書いてたからよ、
>>507 >>516 で
個々の掲示板プログラムまたはそれに付随するXSLスタイルシートが
年齢要素にタッチしない限りソートできるわけねえだろ、っつっただけのことよ。
それとよ、XML攻撃する奴は誰でも49なのか?(ワラ
546 :
56 :02/12/13 23:36 ID:???
漏れならXMLで、カテゴリやサイトをまたいだクロスポストができるように作りたいなぁ(w 記事にURNふってみたいと思ったり(w 少なくとも漏れが過去に提示したサンプルじゃ(以下略
>>544 掲示板には住所も電話番号もいらねえ。マーケットのニーズを考えろアホ。
>個々の掲示板プログラムまたはそれに付随するXSLスタイルシートが >年齢要素にタッチしない限りソートできるわけねえだろ、 個々の掲示板のフォーマットは統一されてるんだから、 XSLスタイルシートは一つですみそうなもんだが? もっとも、自分で拡張した場合はこのかぎりでは無いがな。 あと、"年齢要素にタッチ"の具体的な内容がわからんが…
どうしても書きたい奴は本文に住所でも性癖でも書くだろうさ。
>>547 どうして"いらねぇ"なんだ?
連絡先がわかれば便利でしょ?
連絡先を教えたいか教えたくないか(記入するかしないか)
を選択できるのがニーズだと考えるべきだと思うが…
>逆に言えば、そういう個々のプログラム内でタッチしないような「個人情報」なら、 W3Cが勧告した意味すら無いじゃん。
>>553 そりゃXHTMLをプレーンテキストで書きなさいって言ってるようなもんだぞ。
>>554 だから?住所データを機械が認識しなきゃいけない理由は何?
556 :
nobodyさん :02/12/13 23:52 ID:F168Lhf6
XMLの話題はとんでもない馬鹿をひきつける作用があるのかな。 なにから手をつけて反論するかも面土居。
558 :
nobodyさん :02/12/13 23:55 ID:gMX5rVmQ
>連絡先を教えたいか教えたくないか(記入するかしないか) >を選択できるのがニーズだと考えるべきだと思うが… 否。マーケットのニーズと書いたのは、現状インターネットの掲示板で 住所を書くような掲示板がほとんど存在してないことを考えろ、ってこった。
25歳。
去年まで金無し君だったけど、オンラインカジノとパチンコで
二年で350万貯めた。一度やってみなよ。
初回のみだけど、1ドル以上のチップを買えば30ドル(4000円くらい)貰える。
もらうだけもらってプレイせずに換金することもできるし、ルーレットで赤か黒に
思い切って賭けてしまえば50パーセントで二倍になる。
金なきゃオフラインでゲームすればいいだけ。暇つぶしになる。
ビデオポーカーとかスロとか色々あるのでマジでお勧め。
http://www.imperialcasino.com/~1kl5/japanese/
XML好きなひとって、いつも掲示板で住所と電話番号公開してるんですかぁ?
561 :
nobodyさん :02/12/14 03:10 ID:LX3yzwPN
この板で議論は無理だなーと思った。一抜け。
煽りはイヤン。 住所とかの個人情報は一つの例だろ。 いろんな掲示板で採用され得る規定を作るなら、副項目的な拡張性が欠かせない。 突拍子もない項目であっても簡単に追加できるのが望ましい。 CSVならインデックスに、例えば UniqueTerm1 〜 UniqueTerm9 とかいう具合に掲示板独自の自由な項目を作って、 後はエクスポート・インポート側の対応に委ねてはどうか。 いまいち趣旨からずれてるけど。
全員の主張の最小公倍数的な規格ってのは絶対流行んないよ。
規格決める側が
>UniqueTerm1 〜 UniqueTerm9 とかいう具合に掲示板独自の自由な項目を作って、
こんな風に決め打ちしなくてもいいじゃん。
>>479 みたいな書式+IDとかTITLEみたいな必須項目だけ決めとけば、
あとは勝手に掲示板プログラマが項目追加してくでしょ。んで追加された項目が
本当に便利だったら残るし、意味なかったら消えてくし、って感じで淘汰されてくと思った。
>>524 >年月日時分秒をそれぞれ分けるか、それとも yy/mm/dd HH:MM:SS にフォーマットした状態か
>1039761862 みたいな秒だけってのはちょっと・・・
2つ項目持てばいい。DateTimeStrのフォーマットは任意。
統一した表記にしたければUnixTimeをプログラム内で使えということで。
(矛盾した場合はあくまでUnixTimeが優先で、DateTimeStrはログ読む人間用
もしくは高速に清書したい場合用)
DateTimeStr, UnixTime
2002-12-14 06:14:00,1039814040
>>525 >DateYear, DateMonth, DateDay, DateHour, DateMinute, DateSecond = 年月日時分秒
これはムダ。こうするんならJSTとかGMTとかのタイムゾーンも考えなきゃならなくて面倒。UnixTimeマンセー
>>561 まあW3Cを盲目的に崇拝してるような連中にはハナから議論なんてムリだろうな。
自分の頭で考えずに権威に頼るのは技術を理解できない厨房orじじいのやることだぜ。
TCP/IPもUNIXも「民主的な標準化プロセス」からは決して生まれてこなかっただろうよ。
>>525 のように時間を「年月日時分秒」に分ける人もいるし、
>>564 のようにUnixtimeで持つのもありだと思う。
柔軟性のある規格がいいね。
>そりゃXHTMLをプレーンテキストで書きなさいって言ってるようなもんだぞ。 に >だから? と答えている奴に何を言っても無駄。
568 :
nobodyさん :02/12/14 10:21 ID:ohZS+1FK
>XML好きなひとって、いつも掲示板で住所と電話番号公開してるんですかぁ? 公開したい人の事を考えているだけ。
>>567 ムダなら書き込まなきゃいいじゃん。アホでつか?
そもそもエクスポート用の標準形式を決めることにどれほどの意味 があるのか疑わしいなぁ。 A氏作の掲示板CGIはa形式で、B氏作の掲示板CGIはb形式で ログを保存するとする。A氏のCGIを使って掲示板を運営していた C氏がB氏のCGIに乗り換える際、a 形式で蓄積した過去ログをB 氏のCGIでも読めるようb形式に変換したい。A氏が提供するエクス ポート手続きでa形式のログを標準形式に変換し、B氏が提供す るインポート手続きでこれをb形式に変換する。この方法でC氏が 望む形にログの変換が成されるかというと、元々a形式とb形式が ほとんど同じ形でない限り、まず無理だろう。 a形式をb形式に変換するうえで難しいのは、a形式にあってb形式 にない要素をどこに押し込むか、a形式になくてb形式に必須の(もし くはあった方がよい)要素をどう補うかってことで、その決定にはかなり の恣意性がある。a、b両形式についての知識も必要だ。標準形式 を間に置いたってこの問題に対しては何の助けにもならないよね。 日付等の基本的な要素について個々に形式を統一するのはいい ことだけど、実際に統一しやすいのは日付、記事番号、記事間の リンクみたいなユーザーが直接入力しない部分が主じゃないかな。 メール欄なんかメアドが入ってるとは限らんわけだし。
>>567 彼にとってはmachinereadableじゃないのでプレーンテキストで十分なのですby某氏
そもそものスレに反するのだが、フォーマット規定にあまり魅力を感じないんだよな。 規定を作ればこんなに便利になる、ってのが実感できない。 はっきりしたメリットがないと、実際に掲示板に取り込んでみようって人がなかなか現れないかと思う。 規格が統一されたときにメリットを感じるのは、掲示板の設置しかできない人くらいなのかなと。 このスレの住人の大半は自前でリフォームスクリプト作るだろうしね。 いまいち必要性がないって感じ。 CSVいじってる間は実用的な進歩があるのか疑問なもんで、XML厨に期待。
そうだねぇ、このフォーマット規定を作っていいことって言うと、 将来的に検索エンジン(例えばgoogle)がXMLファイルもサーチしてくれるってなったときに、 「ひろゆき氏による書き込みを検索」 「書き込み内容に"あぼーん"が含まれているものを検索」 って事が、「BBSの勧告によるDTDまたはスキーマーによって宣言された "名前"(or"BODY")要素の内容が"ひろゆき"(or"あぼーん")な物を検索」 って事だけでできると思われる。
>標準形式を間に置いたってこの問題に対しては何の助けにもならないよね。 標準形式を間にはさむと、 「標準形式をうちの形式に変換」するスプリクトなりXSLなりを用意するだけでできる。 とりこむ相手がaだろうがσだろうが、相手から送られてくるのは"標準形式"なので、 少なくとも、標準形式に意味が無いというのは間違い。
例えば多言語間の自然言語翻訳とかの世界では、ほとんどの場合 英語をハブにして各言語間の翻訳をしてるんだけど、この場合英語で表現できない 意味内容は欠落しちゃうんだよね。それと同じことが今回のケースでもあてはまる気がする。
>>575 >少なくとも、標準形式に意味が無いというのは間違い。
そうかなあ?そもそも掲示板の乗り換えをする場合、情報が少しでも欠落したら
ニーズは激減しそうだし、掲示板の乗り換え以外の利用法がないんだったら
標準形式なんてそもそもいらないんじゃないの?
欠落させないためにはインポートする側が全ての要素をサポートすればいいんでしょ? フォーマットに文句言うもんじゃないと思うが…
>>579 "フォーマットとして可能である"、が
"うちのCGIではそういった情報の書き込みはできませんorやらせません"
っていうのは可能だよ。
個人情報はせっかく他のレイヤーとして確立できそうなんだから、
このばでどうこう言わなくてもいいと思うが、
>>574 とかは世間で言われているところのセマンティクスwebなわけなんだけど、
セマンティクスwebがうまくいかないであろう最大の理由は、
文書の記述者がその標準フォーマットに従うインセンティブがほとんどなくて、
そのフォーマットの従わない文書が多数派である限り
結局全文をベタに検索したものを人間が解釈した方が良質の結果が得られるからなんだよね。
582 :
nobodyさん :02/12/14 13:40 ID:aj0kcrC5
>>577 それは標準形式の問題じゃなくてたんにポート元とポート先で
もたせてる情報が異なるというだけの問題だろ。
>>581 でも、掲示板の場合初期のデータがある程度意味付け(名前,書き込みetc)
したCSVかなんかでそろってるんだから、
そこから規定文章フォーマットに書き直すことは比較的簡単にできると思われ。
584 :
nobodyさん :02/12/14 13:42 ID:aj0kcrC5
セマンティックウェブだろ。
>>580 意味わかんない。
>>577 は、フォーマットで標準決めてもそれよりリッチな要素をもつ掲示板間の
乗り換えはできないでしょ?ってことなんだけど。
>>585 >それよりリッチな要素をもつ掲示板間
なんで、"リッチな要素の標準"を作るという発想がでてこない?
>>586 単純にキリがないから。世界の1箇所だけでしか使われてない要素を標準化してもメリットないでしょ。
>フォーマットで標準決めてもそれよりリッチな要素をもつ掲示板間の乗り換えはできないでしょ? その為にもXMLには名前空間という概念があります。
589 :
nobodyさん :02/12/14 13:49 ID:aj0kcrC5
世界の1箇所だけでしか使われてない要素はそもそもポート自体無理じゃないか。
>>587 >リッチな要素をもつ掲示板間の乗り換えはできないでしょ
だから、最低2個所以上で使われているはずなんだが?
じゃあさ、世界のどっかの2箇所で使われてる要素についてはどうするの? 標準化にすべて取り込むの?
だからさぁ、その2ヶ所の間で標準化を行えばいいじゃん。 外部に公開する必要も無い。
いや、外部に公開する必要が無い事も無いか、 第3者がそれにあわせてみたくなるかもしれんし。
標準形式+独自拡張ってのはだめ? いわゆるCコンパイラとかががやってるアレ 全てを規格に盛り込むよりずっといいと思うけど
だから、 X M L に は 名 前 空 間 っ て い う 概 念 が あ る って何回言ったらわかるんだよ。
>>595 ネームスペースでどう解決するのかね。
ご高説を拝聴しようか。
597 :
nobodyさん :02/12/14 14:06 ID:aj0kcrC5
独自要素を独自な名前空間で定義するだけじゃないのか。 「標準化にすべて取り込む」なんてことを考える必要は無い。
598 :
nobodyさん :02/12/14 14:07 ID:aj0kcrC5
>>596 自分で考えなさい。
少なくとも"名前空間"という言葉を理解している人間の発言には思えん。
>>597 独自な名前空間で定義された独自要素をどうやって相互運用するんだね?
独自に定義された要素が"意味的に"コンフリクトした場合、誰が調整するんだね?
601 :
nobodyさん :02/12/14 14:12 ID:1SjORodv
XSLを使いなさい
>独自な名前空間で定義された独自要素をどうやって相互運用するんだね? 2者またはそれ以上の間で取り決めを行って"独自の名前空間の定義"を行えば 相互運用にはまったく問題ない気がするが?
>>602 それはプライベートな標準を作るということでよいのかな?
つまらん議論だね。。。
605 :
nobodyさん :02/12/14 14:21 ID:1SjORodv
概念を共有せずにちぐはぐな議論をするスレはここですか?
>>605 問題は、その方式で独自の要素の定義を独自の名前空間の下で許したときに、
・同じ意味を持つ要素なのに、それを異なる団体がそれぞれ独自の要素として定義してしまう場合に発生する。
その意味の"名寄せ"は誰がやるんだね?
既出の要素を標準化したDQNを叩く。
609 :
nobodyさん :02/12/14 14:31 ID:1SjORodv
>その意味の"名寄せ"は誰がやるんだね? 被った当事者達だろうね
そうやって標準化が分裂して、VHS対βみたいなことになっていくわけやね。
ほほう、βはVHSを拡張する規格でしたか、初めて知りました。
612 :
nobodyさん :02/12/14 14:34 ID:aj0kcrC5
>・同じ意味を持つ要素なのに、それを異なる団体がそれぞれ独自の要素として定義してしまう場合に発生する。 これはそれなりにいい質問で、そういった場合に 「この名前空間のこの要素とこの名前空間のこの要素は同じ意味」を 結びつける方法も現実的にSemanticWebの目標として考えられている。 どこかにいい解説があった気がするがちょっと見つからない。
将来schemaに取り入れられそうなもんですな。
>>611 は文脈を理解してないので放置するとして、
>>612 問題はそれを双方の名前空間のownerが合意する形で定義できるかどうか、ってことだな。
英語と日本語の単語が1対1に対応してないのを無理矢理対応させるようなもんだからな。
ほとんど同じなんだけど微妙に意味が違う要素とか、そういう要素間の対応はどうするんだろう。
615 :
nobodyさん :02/12/14 14:50 ID:1SjORodv
>ほとんど同じなんだけど微妙に意味が違う要素とか、 意味が同じとみなされて問題ないならどっちかに統一、 問題あるなら統一はできないと思う。
例えばの例なんだが、ある掲示板では ・年齢:〜15才 16〜25才 26〜35才 ・・・ のいずれかを書き込み者が選択 とかなってて、もう一つの掲示板では ・年齢:〜12才 13〜18才 19〜30才 ・・・ のいずれかを書き込み者が選択 とかみたいになってた場合、どうやって標準化すんの?
617 :
nobodyさん :02/12/14 15:23 ID:1SjORodv
標準化は(何かを妥協しないかぎり)不可能 てか、標準化すべきでないと思われ。
現実のケースでは各掲示板プログラマは
>>616 に輪をかけててんでばらばらに
要素を決めてたりすると思うんだが、そんな状況下でそもそも標準形式の意味があるんだろうか?
619 :
nobodyさん :02/12/14 16:21 ID:aj0kcrC5
だから何もかもグローバルな標準に取り込む必要はないんだってば。 ループしそうになってるよ。
そうだよ、標準化より有名どころ同士のログコンバータでもつくっとけ
621 :
nobodyさん :02/12/14 16:29 ID:aj0kcrC5
なんか通じてない。やっぱここで議論は無理だわ。
>>aj0kcrC5 >標準化すべきでないと思われ そんな事みんな知ってると思うよ。このスレでは禁句でしょ。 さ、さ、みんな気にすんなー。
623 :
nobodyさん :02/12/14 17:01 ID:R1uTGzYK
XMLパーサを標準で装備してるスクリプト言語ってある? Javaならありそうだけど。
624 :
nobodyさん :02/12/14 17:21 ID:GYPNLieZ
>>616 じゃぁ、
child young old
で、標準化では?
迷わず作ろう!作れば分かるさ!!
626 :
65 :02/12/14 17:56 ID:???
今まで名前欄に56と書いていた事に今気づいた。鬱だ…
正直、どうでもいい
630 :
628 :02/12/14 19:33 ID:???
>>616 MetaScheme で age は Integer, Range, String, and Array of aboves として、
Scheme で age は [1..15, 16..25, 26..35] (Array of Range) とすれば?
MetaScheme だけ規定して Scheme は好きに書いてもらう。
>>623 Perl、 Python
632 :
631 :02/12/14 20:19 ID:???
もう少し言うと Relax や WSDL みたいにすると、 それを扱うプログラムの雛型が自動生成できる。
またまた実用性の話で申し訳ないんだけど、
>>574 みたいな話で、例えば2ちゃんの過去ログをここで定めるフォーマットに
変換することで、みみずん等より質の高い全文検索サービスを構築できる
見込みはある?
>>581 で否定されてるけど。。
>633 検索の用途もあるかもしれないけど、 他にも掲示板の巡回ソフトとか、 統計とか他のデータベースへの変換するための 中間フォーマットとしてとかいろいろあるじゃん。 csvでもxmlでもいいから、この手のものの標準があって それに対応した掲示板が豊富にあれば まだまだ用途は増えるかもしれない。
>>633 >>581 では
>そのフォーマットの従わない文書が多数派である限り
という仮定の元だから、2chという空間全てがフォーマットに従えば
>>574 は可能。
でも、2chのHTMLなんてたかが知れてる、
(名前が<B>で囲まれてるとか)
なので、XMLにしなきゃぁ
>>574 でいう検索ができないか?
っていうとちょと疑問。
637 :
nobodyさん :02/12/15 02:28 ID:N0KMGiTF
前にも出てたけど、データ形式を統一するんじゃなくて 読む側がリベラルに対応できるつくりになってればいいんでない?
>>631 PerlってXMLパーサ標準じゃないだろ?
つかHTMLになったら、XMLもCSVも関係ないだろ。
HTMLはこのスレと関係ないよ。
<記事> Content-Type: text/html テスト Content-Type: base64 Content-Transfer-Encoding: base64 AAUWBwAC..... </記事> ってのは外出?
<記事> <![CDATA[ Content-Type: text/html テスト Content-Type: base64 Content-Transfer-Encoding: base64 AAUWBwAC..... ]]> </記事> だな・・・。
そういえば、MIMEを使うって人が過去に一名…
644 :
nobodyさん :02/12/15 11:44 ID:Z4aOzgP/
>>642 だとデータの型は分かるけどデータの種類が分からないから,
<記事>
<内容 Content-Type="text/html">
<![CDATA[
テスト
]]>
</内容>
<内容 Content-Type="image/jpg" Content-Transfer-Encoding="base64">
<![CDATA[
AAUWBwAC.....
]]>
</内容>
<内容 Content-Type="application/x-shockwave-flash" Content-Transfer-Encoding="base64">
・
・
</記事>
としておいて,2ちゃんなら1番の内容のみエクスポート。
画像掲示板なら1・2番の内容をエクスポートって感じの方がいいかも試練。
645 :
nobodyさん :02/12/15 12:25 ID:rbcHXy5s
ハイパーリンクしろよ。
どうして
>>145 が<![CDATA[]]>使わなかったかわかるか?
★★★ここはXML理解度自慢のスレになりますた★★★
★★★ここはMIME理解度自慢のスレになりますた★★★
641-642,644 = 馬鹿
>としておいて,2ちゃんなら1番の内容のみエクスポート。 >画像掲示板なら1・2番の内容をエクスポートって感じの方がいいかも試練。 はぁ?お前何考えてるの?
やっぱ馬鹿はついてこれないようだな(ワラ
mimeも使ってユーザーまでxml文章を送信して、 その中にmimeを使ったデータが入ってると。
>>645 リンクにする意味は?画像掲示板ならimgタグだからどっちにしろ画像の転送はされるよ。
画像以外ならリンクにするだろうけど。
掲示板の標準エクスポート形式ができたら, 1つのブラウザで色んな掲示板を同じインターフェイスで利用できるようになるよね。
656 :
nobodyさん :02/12/15 23:34 ID:HSCL5DS4
mimeで埋め込む意味のほうがよほど理由を必要とするだろうが。 同じアイコンがたくさんあっても全部埋め込みで持つのか?
655はIEユーザ
MIME?阿呆?
>654 :nobodyさん :02/12/15 23:26 ID:???
>
>>646 >何故?
投稿内容についても意味付けが必要だと踏んだからだろ?
<内容>
<html:p>段落</html:p>等。
</内容>
てーか
> <内容 Content-Type="text/html">
><![CDATA[
>テスト
>]]>
> </内容>
内容が"text/html"じゃないのになにやってんのかね?
>>660 <内容 Content-Type="text/html">
<![CDATA[
<p>テスト</p>
]]>
</内容>
でいいんでないの?
<![CDATA[]]>がいる訳を答えよ
>>653 画像表示切ってても帯域を立派に占領する訳ですね、わかりました。
>画像掲示板ならimgタグだからどっちにしろ画像の転送はされるよ。
"imgタグだから転送される"?意味不明
>>661 どうして素直に
<内容>
<p>テスト</p>
</内容>
って発想ができないの?
君達はバイナリまでエンコードしてマークアップする気ですか?
>>663 > どうして素直に
> <内容>
> <p>テスト</p>
> </内容>
> って発想ができないの?
それだと整形式にならなくない?
内容がどんな形なのかは掲示板によって違うんだから内容に直接書くのは変じゃない?
>>664 >それだと整形式にならなくない?
>内容がどんな形なのかは掲示板によって違うんだから内容に直接書くのは変じゃない?
じゃぁ、最初にhtml名前空間宣言しといて
<内容>
<html:p>段落</html:p>等。
</内容>
、ならいいんでしょ。
内容がどんな形なのかわからなからそこまで標準化せずに、
ほかのschemaとってきて拡張する。
投稿者が独自になんかを書きたい場合でも、
投稿者が名前空間いれれば全て解決。
"整形式でないものも通すために"
CDATA使ってるならその思考を改めたほうがいい。
>>665 ふーん。そうなのか。
色々勉強になりました。ありがd。
そもそも"CDATA"の中身って解析されないだろ?
>>667 解析しないでしょ?そもそも内容は掲示板によって違うんだから。
それを解析するようになっちゃったら「標準化によって個性が無くなる」ってことになっちゃうんじゃない?
669 :
nobodyさん :02/12/16 21:08 ID:IWW05LT5
>それを解析するようになっちゃったら「標準化によって個性が無くなる」って >ことになっちゃうんじゃない? なんでよ?
>>669 え・・・。
ある掲示板では記事の表現が<p>逝ってよし</p>かもしれないし
別の掲示板では<ul><li>北海道</li><li>OL</li><li>仲良くしてね〜</li></ul>かもしれないし。
(例えばの話です)
671 :
nobodyさん :02/12/16 21:16 ID:1d5bIvHK
箱庭諸島2+みたいに、データーをJavaScriptで出力し、 表示もJavaScript使うとか。 少なくともサーバーには負荷がかからないぞ。
>>668 =670
君は"解析"の意味を激しく勘違いしてる。
>>673 どゆこと?教えてちょんまげ。
<内容>の中身をCDATAにしておいけば
汎用ブラウザでペタッと貼り付けるだけで
各掲示板の記事の形式に沿うことができると思ったんだけど
激しく勘違い厨?
XML文書は実体という記憶単位から成り,実体は構文解析されるデータ又は構文解析 されないデータから成る。構文解析されるデータは,文字から成り,その一部は文 字データを構成し,一部はマーク付けを構成する。マーク付けは,文書の記憶レイ アウト及び論理構造を記述する符号とする。XMLは,記憶レイアウト及び論理構造に ついての制約条件を記述する機構を提供する。
XMLはデータ量が増えるな。
content-type派の人はhtml以外の形式での 内容も認めようとしているって事だよね。 それだと、表示する方がその形式に対応していないと、 全く読めないと言う事態に陥らないか? >>CDATAにケチ付けているヤツ べつに、<や>や&などのxmlでエスケープする必要がある文字が現れないなら、 <![CDATA[ ]]>で囲もうが囲まないだろうが、意味は同じになる。 ってことぐらいわかっているよね・・・ まあ、]]>が含められネーじゃネーかというなら、 ]]>]]<<![CDATA[ってエスケープすればいい。
>だ、、、ウツダシノウ
682 :
nobodyさん :02/12/17 19:56 ID:LseevTEE
><![CDATA[ ]]>で囲もうが囲まないだろうが、意味は同じになる。 >ってことぐらいわかっているよね・・・ 絶対わからん。
ぼくはこうゆう内容を掲示板にかきたいです: <a>あああ<b>いいい</a>ううう</b>えええ
684 :
nobodyさん :02/12/17 20:18 ID:LseevTEE
>>683 名前空間の宣言すればどんなマークアップしようが自由。
XML厨がうぜーな
687 :
nobodyさん :02/12/17 20:38 ID:LseevTEE
><a>あああ<b>いいい</a>ううう</b>えええ を ><a>あああ<b>いいい</b>ううう</a>えええ だと思ってた。逝ってくる
683の思い通りだ…
>>681 あう、違うの?
<p><![CDATA[あああ]]></p>
と
<p>あああ</p>
では、pの最終的な内容が異なるのですか?
690 :
nobodyさん :02/12/18 00:16 ID:jNpRA+Kj
君はもうちょっとスレを前のほうから読みたまえ
>>690 俺も分からないんだけど曖昧に答えるんじゃなくてずばっと言ってくれない?
レスへのポインタでいいからさ。
692 :
nobodyさん :02/12/18 09:17 ID:LPZfQAtv
693 :
nobodyさん :02/12/18 12:33 ID:QY3OkQpg
それを参照してどうしろと
何となくわかった気がするんだけど、 んで、<>&を<>&ってエスケープするのとどう違うの? どっちにしても、]]>という文字データはエスケープしなきゃならないでしょ。
DTD は <!ELEMENT board (#PCDATA)> ですべて終了だな。
>俺も分からないんだけど曖昧に答えるんじゃなくてずばっと言ってくれない?
>レスへのポインタでいいからさ。
>>675
CMT厨でもXML厨でも49でもいいから(49はイクナイという意見もあるが) 無知なリア厨は逝って下さい。
無理な話だったつーこった
もう冬やすみだったつーこった。 ということでのんびり700getおめ ↓
700 :
49 :02/12/19 00:11 ID:???
700Get!!
(・∀・)ヤッテクレル!
ごちゃごちゃ言ってねーで形にしろやボケどもが。
XMLの設計目標を次に示す。 XMLは,インターネット上でそのまま使用できる。 XMLは,広範囲のアプリケーションを支援する。 XMLは,SGMLと互換性をもつ。 XML文書を処理するプログラムは容易に書ける。 XMLでは,オプションの機能はできるだけ少なくし,理想的には一つも存在しない。 XML文書は,人間にとって読みやすく,十分に理解しやすい。 XMLの設計は,すみやかに行う。 XMLの設計は,厳密で,しかも簡潔なものとする。 XML文書は,容易に作成できる。 XMLでは,マーク付けの数を減らすことは重要ではない。
データ量削減の方向でよろしく
gzip使用の方向でよろしく
XMLではサポートできない掲示板を作る方向でよろしく
それは他のどんなフォーマットでもサポートできない掲示板だってことを知った上でよろしく。
"<"と">"というアルファベットのみからなり、文脈依存文法Sから生成される言語Lを 受理するような万能チューリングマシンの自身による記述のみをコンテンツとするような 掲示板はどうか。
なんだかネタも冴えないね。 とりあえずマジレスだけど、 まずCMTをそのまんまXMLに焼き直すようなDTDを書いてみたらいいんじゃないの? でもって、そのXML版CMTで表現できない掲示板のログがあれば、 XML厨のお題目であるところの「拡張」とやらを行えばいいんでしょ? まぁ、「拡張」とやらは上手くいかないと思うけど。
┌──→──┐ │ │ ↑無限ループ.↓ │ │ └──←──┘
>>709 それなら、CMTをそのまま使えばいいと思うが。
あれなら拡張も簡単だしそのままでも可読性あるしな。
CMTCMT言ってる奴は釣りなのか? それとも素で馬鹿なのか?
CMT最高!!!
713=714アフォの釣りか。
716 :
709 :02/12/20 15:14 ID:???
CMTって言ったのは深い意図はないよ。 ただXML推進派の人たちはXMLを推す理由として拡張性が容易である点を 挙げているわけだから、その拡張の元となる小さなコアをさっさと作っちゃえよ、 ってゆう意味だよ。
717 :
709 :02/12/20 15:23 ID:???
訂正 ×拡張性が容易である ○拡張が容易である 補足 本当にシームレスに拡張が可能なんだったら、 コアの部分はちょっと小さ過ぎるくらいでもいいはずでしょ?
>>717 規格は大きくても、細かくモジュール化すればいいんでしょ?
とにかく、DTDキボンヌ
コア仕様:テキストファイル。 後は勝手にどうぞ。 今思ったけど、ログだったら コンピュータで「これが名前」とか「これがメール」とか「これが本文」とか 細かく把握してなくてもいいんじゃねーの? 乗り換えるときはHTML BODYなログのファイルをそのまま渡して 新しい掲示板プログラムはログの末尾にそのまま追加。 ログなんて人間が読めればいいじゃん。なんか不都合ある?
>>721 得意気に例を語るのは見ていて微笑ましいんだけど、
そもそも本文だけを検索したい!とかいうニーズってあるのか?
全文検索で完全に事足りると思うんだがどうか。
それと、検索の場合しかXML化する意味ってないの?検索のためだけにXML化するの?
もしそうだったらまさにXML厨。
ロゼッタネットは掛け声だけだしebXMLは全然ダメだしWebServicesもhype-onlyで 中身ないしXSLTで携帯・PCに関係なくコンテンツ作れますってのも嘘っぱちだったし インフォテリアはあぼーん近いしappressoに至っては聞いたことない奴が大多数だろうし >XMLがなんのために制定されたかされたかわからない厨は逝って由 結局2000年前後のアイテーバブルを煽るための道具の一つだったって理解でOKですか?
>結局2000年前後のアイテーバブルを煽るための道具の一つだったって理解でOKですか? 貴方がそれで十分なら十分でしょう
「XMLにすると何がいいの?」 みたいな厨な質問でスレの消費とは…
>それと、検索の場合しかXML化する意味ってないの?検索のためだけにXML化するの?
>>574 には"処理装置(この場合はgoogleエンジン)が構文解析をできるようになったら"って前提が含まれていて、
それが、「検索どーのこーの」っていう"一例"よりも数倍大事な事だよ。
そこの所の意味を読み取れましたか?
>>726 全然読み取れませんでしたし今でも読み取れませんので改めて聞きますが、
>"処理装置(この場合はgoogleエンジン)が構文解析をできるようになったら"
処理装置が掲示板のログを構文解析できるようになったら何が嬉しいんですか?
>>722 加工や分析のプログラム作るのも楽になる。
掲示板に新しい要素を追加したときにプログラムの変更が少なくて済む。
どんな言語でどんな技術を使っていようが頑張れば同じことができるから
ユーザから見れば変わらないわけだが。
>処理装置が掲示板のログを構文解析できるようになったら何が嬉しいんですか?
構文解析を行う事によって理論構造を取得できますよね?
(別にこれはXMLに限った事じゃないが)
で、例にあった
>>574 みたいな事をする訳ですよ。
>>728 加工や分析のプログラムって具体的には何?掲示板データでOLAPでもやるの?
あと、
>掲示板に新しい要素を追加したときにプログラムの変更が少なくて済む。
これは嘘だよね。フォーマットの決まっていないログが一番変更に強いはず。
>>730 >>掲示板に新しい要素を追加したときにプログラムの変更が少なくて済む。
>これは嘘だよね。フォーマットの決まっていないログが一番変更に強いはず。
どう変更に強いのかワカランが、"変更が少なくて済む"のは嘘じゃないだろ。
>>729 いや、
>>574 みたいな事をするなと言っている訳ではないんですが、
世の中にそのニーズがどれほど存在するのか、ってことを考えたことあります?
人間が読む掲示板なんだから、せいぜい全文検索ぐらいで十分で、
理論構造を取得してもあんまりメリットないんじゃないかなあ。
>>731 少なくて済むというからには比較対象があると思うんだが、
>>722 あるいはその元
>>720 で言ってるものが対象だとすれば、ログの形式がそもそも決まってない方が
変更コスト低いだろ?
>>732 今までの時代がそうだったからかもしれませんが、
理論構造を取得できるって事の意味は意外に大いんだなこれが、
例えば名前欄で"ひろゆき"が入るものを検索したいって時には、
圧倒的に文章量の多い本文の検索を減らせるわけだから、負荷の軽減も大きい。
ついでにこのカキコにも5行目に"ひろゆき"の文字列があるけれど、引っかからない。
好意的に見て、例えばこのスレだけで全文検索した場合はそれでもいいかもしれないけど、
「インターネット上の全ての掲示板で"ひろゆき"氏の書き込みをリストアップ」
みたいな事になった場合手におえないね。
>>733 >ログの形式がそもそも決まってない方が
その"決まっていないログ形式"だと、後方互換とか、将来性の面で不安が残るね。
他の掲示板との互換性を保つ事も無理と言い切っていい。
XMLの場合、基礎となる形式はXMLなんだから、パーサー使ってれば比較的簡単に変更が可能だし、
それ以前のログを新形式にコンバートするような作業も不要。
まぁ、"決まっていないログ形式"がどんなものかによるが…
>>734 >圧倒的に文章量の多い本文の検索を減らせるわけだから、負荷の軽減も大きい。
テキストごとき、負荷はもはや問題ではないよね。
>好意的に見て、例えばこのスレだけで全文検索した場合はそれでもいいかもしれないけど、
>「インターネット上の全ての掲示板で"ひろゆき"氏の書き込みをリストアップ」
>みたいな事になった場合手におえないね。
検索ミスには2種類あって、1つは「余計なものまで拾ってくるミス」
もう1つは「当然拾えてしかるべきものを拾えないミス」
ある規格を決めたとして、情報の発信者側にその規格に従うメリットがない限り
インターネットのような世界で情報の発信者に規格を守らせるのは難しい。
オントロジーとか、理想は格好いいんだけど
実際には後者の検索ミスが圧倒的に多くて使い物にならん、というのが現実。
738 :
nobodyさん :02/12/20 22:57 ID:+dd7CU3q
720は本気でいってんの?
つーかさ、XMLファイルを検索エンジンに拾わせて その時の利便を考えるってのは何? 見られてはいけないデータ(削除コードとか)が含まれているかもしれない XMLファイルを検索エンジンに拾わせるわけ? もしかして特定データのみ隠せる方法ってのがあるのか?
またそれてきたな。 342 名前:nobodyさん 投稿日:02/12/06 12:09 ??? 俺は1じゃないけど、あくまで、このスレの目的は 「データファイルの共有や乗り換えが容易にできるように」 規定を決めることなので、各スクリプトがが普段持つ データフォーマットとしてのものを決めるのでは無いことを 再認識していただいてこの後の議論を続けてください。 ようはフォーマット決めればその形式にエクスポートされたデータは 他のスクリプト使用時にインポートすればOKということだろ? それようのバッチは作る必要があるけど。
なんだ中間フォーマットってことか。 エスペラント語を思い出させるな。
>>740 掲示板毎にインポート用とエクスポート用の
プログラム書かないといけなくなるのか。
XML厨の所為で話が逸れてたのか。
>>742 書かなくて済む方法なんてあるの?
規定フォーマットに従ってない掲示板ならインポート・エクスポートのプログラムを
書く必要があるのは当たり前な気がするが。
>>744 ごめん。何か変だった。
×規定フォーマットに従ってない掲示板なら
○色んな掲示板があるんだから
>検索ミスには2種類あって、1つは「余計なものまで拾ってくるミス」 >もう1つは「当然拾えてしかるべきものを拾えないミス」 >ある規格を決めたとして、情報の発信者側にその規格に従うメリットがない限り >インターネットのような世界で情報の発信者に規格を守らせるのは難しい。 XMLを検索した場合、前者の問題は発生しなくて、 全文検索した場合、後者の問題は発生しないとこっちで脳内補完させてもらう。 で、XMLで検索した場合googleのエンジンが"当然拾えてしかるべきもの"は、 「規定によってマークアップされたものの中で条件を満たすもの」 な訳だ。しかし、こっちが考えてる"当然拾えてしかるべきもの"は 「掲示板の中で条件を満たすもの」 な訳ですよね。 このギャップをどうやって埋めていくかが、問題なんだが、 "優先度指定のor検索"で何とかなるんじゃないかといってみる。 検索結果の最初のほうにXMLでの検索結果を持ってきて、 全文検索の検索結果は後ろのほうに持ってくるような事をすれば、 検索結果の最初のほうでは目標とするものだけ(それが全てかは別として)を見れるわけだから、 「余計なものまで拾ってくるミス」はとりあえず目障りじゃなくなるね。 で、後半まで読めば「当然拾えてしかるべきものを拾えないミス」は無し。 (目障りな情報は多いかもしれない) >ある規格を決めたとして、情報の発信者側にその規格に従うメリットがない限り >インターネットのような世界で情報の発信者に規格を守らせるのは難しい。 最初は1%の人間が守るだけでもいいからそこから広まっていくと思うよ。 "規格に従うメリット"(XMLという規格でなくてこの掲示板に関する規定に従うメリット) が沢山生まれてくるのはむしろ規定がしっかりできてからだと思う。
>XMLを検索した場合、前者の問題は発生しなくて、
>全文検索した場合、後者の問題は発生しないとこっちで脳内補完させてもらう。
そうっすね。
(中略)
>最初は1%の人間が守るだけでもいいからそこから広まっていくと思うよ。
ここがダウト。
>"規格に従うメリット"(XMLという規格でなくてこの掲示板に関する規定に従うメリット)
>が沢山生まれてくるのはむしろ規定がしっかりできてからだと思う。
規格の普及というトピックについて一般的に考えてみよう。
HTMLは情報の発信(表現)という点で他に代替手段がなかったため、爆発的に普及した。
しかし今回のXML形式ログ(セマンティックウェブ全般と言い換えてもいいかも)
の場合、そもそも掲示板というアプリケーションの主目的が
「人間同士が意思疎通をする=掲示板のコンテンツは人間が読む」
である以上、検索できるとかのメリットはあくまで副次的なものでしかなく
その形式に従わなくても主目的(人間同士の意思疎通)が達成されてしまう以上
よっぽどヒマな人間以外わざわざ新しく制定された規格に従うことはしないだろう。
(つまり、その規格に従うインセンティブがないから、ね。)
要するに掲示板のログなんて人間が読むためにあるんだから
わざわざコンピュータで全部把握する必要なんてないっしょ、ってこと(
>>720 )
掲示板を乗り換える場合?2chの過去ログみたいにHTMLに落として別ページにしておけばいいじゃん。
>HTMLは情報の発信(表現)という点で他に代替手段がなかったため、爆発的に普及した。 これもダウトでしょう。情報の発信(表現)じゃなくて理論構造のマークアップのためでしょ? "人間同士が意思疎通をする"="HTMLのコンテンツは人間が読む" である以上、段落や見出しをHTMLでマークアップすることは よっぽど暇な人間以外しなかった筈だけど、実際違いますね。
>情報の発信(表現)じゃなくて理論構造のマークアップのためでしょ? HTMLをはじめに設計した奴がどう考えていたかはともかく、現実には お手軽レイアウト言語のメリットが評価されて普及したわけでしょ? >"人間同士が意思疎通をする"="HTMLのコンテンツは人間が読む" >である以上、段落や見出しをHTMLでマークアップすることは >よっぽど暇な人間以外しなかった筈だけど、実際違いますね。 ちょっと曲解気味だけど、フォントや色やレイアウトは明らかに人間が読むという 効率を上昇させてくれるのに対し、意味付けはそうではない、というところが違うね。
検索エンジンとか騒いでいる人達はなにがしたいんだろう。
751 :
nobodyさん :02/12/21 13:54 ID:KpH3w/4i
人間がコンピューターを使っている以上、 全てのコンテンツは最終的に人間が読むんだがな。
753 :
nobodyさん :02/12/21 14:06 ID:KpH3w/4i
>「人間同士が意思疎通をする=掲示板のコンテンツは人間が読む」 >である以上、 この図式が全てのフォーマットに当てはまるって事さ
>よっぽどヒマな人間以外わざわざ新しく制定された規格に従うことはしないだろう。
>(つまり、その規格に従うインセンティブがないから、ね。)
だから、即"ダウト"ってもんでもないだろ。
世の中に暇な人間ってのは結構いるもんだ、
規格に利益がないというのも現時点ではごもっともかもしれんが、
将来的にはその規格を守る事によって新しい利益が生まれてくると
>>746
756 :
nobodyさん :02/12/21 14:12 ID:KpH3w/4i
>当てはまるからどうしたの? どうもしないでしょう。 ただ最終的な読者が人間なのに世の中に色々なフォーマットがある意味を理解できますか? と言いたいだけ。
>>755 問題は将来生まれるかもしれないその新しい利益が
掲示板アプリケーションにおいて本質的な価値があるものではない、ってことなんだな。
>>756 世の中にある色々なフォーマットって具体的にはどんなのを思い浮かべてるの?
>ただ最終的な読者が人間なのに世の中に色々なフォーマットがある意味を理解できますか? あと貴兄が考える「世の中に色々なフォーマットがある意味」を是非教えてください。
>掲示板アプリケーションにおいて本質的な価値があるものではない、 "本質的な価値"って何? 今の掲示板の利用法だけが"本質的な価値"なの?
掲示板の本質的な価値ってのは価値人間同士の意思疎通ってことな。 将来的に掲示板アプリケーションが進化するっていいたいなら、 それは今の掲示板とは違う別のアプリケーションってことだ。
訂正。価値人間同士→人間同士。失礼。
だから"人間同士の意思疎通"の「方法」を進化させたり拡張したりしようとしてるわけでしょ。
あれか、ニュータイプとかか(ワラ 文字を読んで理解する、という「方法」をどうやって進化させるんだい?
人間同士の意思疎通は全て文字を読んで理解する事ですか?
掲示板においてはそうですね。
例えば"画像掲示板"は、"掲示板"で無いという解釈の元にこの会話があるのですか?
画像のみで意思疎通をしている掲示板を寡聞にして知りません。
テキストのみで意思疎通をしている掲示板ばかりではありません。
と、
>>764 の「文字を読んで理解する」を
「人間がコンピュータの出力を受け取って理解する」にしとこうかな。
>>763 の
>"人間同士の意思疎通"の「方法」を進化させたり拡張したりしようとしてるわけでしょ
の"意思疎通の方法"は当然使う処理装置がデータを交換,解釈する手法等等も含まれますよ。
データの発信側が作成した情報をコンピュータがそのまま出力してくれれば意思疎通ができるので、 処理装置による解釈なんて本質的に必要ないと思いますが。
"そのまま出力"するためには送られてくるデータを解釈する必要があると思いますが。
774 :
nobodyさん :02/12/21 14:52 ID:8ig1pt8t
注・772で言ってる処理装置の解釈、ってのは、XML等によるデータの意味付けの、処理装置側での利用、ってことな。
"XML等によるデータの意味付け"の「XML等」が具体的に何処から何処までなのかが疑問。 XML等で意味付けしなくても他のレイヤーで散々意味付けされてるし。 (httpヘッダー等)
>>775 例えば通信先特定だったりっていう意味付けはデータ通信に必要不可欠なわけで、
(その掲示板を用いた)人間同士の意思疎通には結果的に必要不可欠なわけさ。
だがしかし掲示板内のデータのうち、名前とか本文とかが処理装置側で特定できなくったって、
人間同士の意思疎通っていう目的には差し支えない、ってことよ。
何処から何処までが"差し支えない"かはわからんが、XMLで例をとって 「名前とタイトルのみを一覧で表示」という処理をXSLスタイルシートなどで指示すれば、 処理装置はマークアップによって「何処が名前で何処がタイトルかが判っている」 訳だから、これを行えるね。 これができなくても"意思疎通という目的には差し支えない"と言えばそうかもしれない。 が、場合によっては、「達成は可能だが、差し支えないとは言い難い」ような状況もあるとは思わないか? そんな所で、規定を定めておくと、"利便性が上がる[かも]しれない"ことがあるわけだよ。 利便性が上がっても下がっても"目的[には]差し支えない"事にかわりは無いが… この規定を規定する意味は 「掲示板による意思疎通等を差し支えなく行うため」か 「掲示板による意思疎通等を利用しやすくするため」 かの見解が統一できていない事がこのスレの問題とオモワレ
うむ。言わんとすることはわかる。777ヲメ。 >が、場合によっては、「達成は可能だが、差し支えないとは言い難い」ような状況もあるとは思わないか? >そんな所で、規定を定めておくと、"利便性が上がる[かも]しれない"ことがあるわけだよ。 もし規定を作ったとして、それを普及させるためには、この「利便性」を 誰の目にも明らかなように主張していかなくてはいけないと思うんだな。 だが、今の所その利便性は(少なくとも漏れには)見えなくて、 だったら今のままで(意思疎通できるんだから)いいじゃん、と思ってしまう、と。 つまり、逆に言えば、これこれこういう達成したい「利便性」が先にあって、 それを達成するためにXMLなりを導入する、と、こういう流れなら非常に説得力があるんだが、、 現時点では掲示板データフォーマット共有のメリットって何なのかわからんし、 そもそも共有する必要があるのか疑問。
結局ループするのか(w
パスというのは"XPointer"と"XPath"と言うべきかな。
>>747 >要するに掲示板のログなんて人間が読むためにあるんだから
>わざわざコンピュータで全部把握する必要なんてないっしょ
「人間が読むため」ってのはいいんだけど,あまりに膨大だと読むの大変でしょ。
見たい記事がすぐ出てくると楽だと思うんだけど。
何か保守派が多いな…。 それが悪いこととは一概には言えないけど、 新しい形態を模索するのは無駄ではないと思う。 別に仕事でやってるわけじゃないんだし、失敗したらそれはそれでいいじゃん。
>>780 うーん
それって例えば、人間が工夫すると、HTMLをブラウザで表示させてるときに
Ctrl+Fで " 1 :" を検索すれば(まあ他のにもぶつかるかもしれないけど)
とりあえずなんとかなっちゃうじゃない。
で、既存のIT投資の罠は、人間がちょっと工夫すればなんとかなっちゃう
ようなことでも、無理矢理コンピュータ化してしまう、というところにあって、
そういう意味でいうと
>>780 は費用対効果(コストパフォーマンス)の面でどうかと。
ということで、
http://pc.2ch.net/test/read.cgi/php/995359658/ と微妙にオーバーラップしますが、XML等で意味付けするに足る「利便性」の候補をどうぞ↓
>>784 >Ctrl+Fで " 1 :" を検索すれば(まあ他のにもぶつかるかもしれないけど)
他のにぶつかるでしょ?
自分がためしにこのスレを"49"で検索してみた。 このスレは何故か49分の書き込みが多い気がした。 これは49の陰謀か?
ごめん。切れた。
>とりあえずなんとかなっちゃうじゃない。
もっと良くしようとは思わないの?
便利なものを追いかけなくなったらそこで成長は止まっちゃうじゃない。
>>783 の言うように保守派過ぎるんじゃないかなあ。
もう冬休みってことだ
てか、「データフォーマット規定」ってのは ログの形式だけじゃなくて設定とかいろいろあると思うのだが… なんでログの話だけなんだ?
"フォーマット"規定だから設定はスレ違いだろう
もう冬休みってことだ
XML厨
796 :
728 :02/12/21 20:12 ID:???
797 :
728 :02/12/21 20:24 ID:???
name,mail,date,body = split($_, ","); if (name eq "49"){ # 何か処理 } if (body =~ "XML"){ # 何か処理 } などと書いても同じわけだけど、 XPointer、XPath 対応のブラウザ(んなのまだないが、2ch ブラウザで作ろうと思えば作れる) なら表示用の XSLT を用意しておけば 796 に書いたようなリンクで表示できる。
それはクライアント側だけで全部処理できるの?
800 :
798 :02/12/21 20:34 ID:???
ごめん今のなし 取得して専用ブラウザがあれば出来るんだね サーバー側で処理するのかと思ってた
★ ★ ★ 盛 り 上 が っ て ま い り ま し た ★ ★ ★
もう冬休みってことよ
XML厨が騒ぎすぎだな
806 :
791 :02/12/21 23:21 ID:???
>>792 設定ファイルのフォーマットもあると思うんだが…
したらばスクリプトで使ってる板をそのまま
めがびスクリプトで使うとかできるようにするのを
考えるのも必要じゃないのか?
板設定ファイルのフォーマットが同じならそのままコピれば
動くということも考えられる。
スクリプトの乗り換えをするときに便利だと思う。
掲示板スクリプト"データフォーマット"規定だからねぇ そりゃ設定もデータですが…
808 :
nobodyさん :02/12/22 10:10 ID:24cN95CE
いつのまにかこのスレも800か
XML化したらまず>>784-
>>809 をDOMであぼーんさせたい。
XML厨は2chブラウザ使えよ。
冬休みage
>>811 コワイage方するなよ((;゚Д゚)ガクガクブルブル
>>787 ざっと調べたが15件だったかな。812件を60分で割ると13〜14件だから、誤差の範囲だ。…言わなくてわかると思うけど、手作業で数えたわけじゃないぞ(ワラ
>>813 どうせ"49(スペース)ID"を検索とかその程度だろ。
十分手作業じゃん。
掲示板アプリケーションを(PHPでもPerlでもCでも)複数サーバーに 分散させた場合、書き込みデータの同期はどうやっているんですか? PHPでは同期させるライブラリなどが充実しているのでしょうか? JavaですとOpenJMSなどがあるんですが。
議論で盛り上がるときには盛り上がるんだが、 そのとき意外はdat落ちしそうなスレだね
データ量→少なく CPU負荷→低く これらは絶対条件だろう。 2chは前者で一回死にかけ、今は後者で苦労してるみたいだからな。
データ量ってのは転送量のことでつか?
そういや、名前とか投稿日とか消したりテレホタイムはリンクしないようにしたりして 生成されるhtmlを小さくしてたね。 でもそれは819の言う通り転送量の方だね。
>>818 814が言ってるのは検索の内容で、君が言ってるのはその検索を行う方法だね。
しかたねぇ、俺がネタを振るよ 先生、やっぱり日付は属性がイイと思います。
<投稿時刻> <時刻> <タイムゾーン>JST</タイムゾーン> <グレゴリオ暦> <紀元>AD</紀元> <年>2002</年> <月>12</月> <日>27</日> <時>12</時> <分>23</分> <秒>54</秒> <ミリ秒>334</ミリ秒> </グレゴリオ暦> <夏時間>OFF</夏時間> </時刻> </投稿時刻>
784ですが。 結局XML化したところでしょぼい利便性しかないのね〜 とXML厨を煽ってみるテスト。
>>824 まぁ、名前付きで値を保存するってのは賛成。それに業界標準のXMLを使うのもまぁ間違ってはいないだろう。
でも、パースに時間がかかる。
>>824 で、君の感じた利便性ってどんなもんだい?
反論してやるから列挙してみ。
>>826 ていうか立場が逆だと思うんですが。
XML化する利便性を先に沢山提示してくださいよ。
>>827 おいおい。あれだけ啖呵切っておいて結局XMLなんてわかりましぇーん。だから否定しまーす。かよ・・・。
あ、利便性っつっても、 「拡張性に富む」とか「柔軟性がある」とか "Seamless"とか"Flexible"とか"Reliable(これはちと違うか)"とか"Effective"とか"Scalable"とか バブってる「意味なしターム」はやめてね〜 できるかぎり具体的にヨロシク。
>>828 意味わかんねえ。
XML化する意味がなさそうに見えるんで具体的なメリットを提示してくれよ小僧、つってるんだが。
おーい。
>>828 。お前の投げたルアーになんかでっかいのがかかってるぞ。ウザイからさっさと引き上げてくれ。
>>784 お前、途中で議論のレベルをさんざん下げた挙句にそんなこと言ってるとはまさに神だよ。
>XML化する利便性を先に沢山提示してくださいよ。
XMLはインターネット上でそのまま使用できる。
XMLは広範囲のアプリケーションを支援する。
XMLはSGMLと互換性をもつ。
XML文章を処理するプログラムが容易に書ける。
XML文章は人間にとって読みやすく,十分に理解しやすい。
XML文章は厳密で,しかも簡潔。
XML文書は,容易に作成できる。
…
>>832 >XMLはインターネット上でそのまま使用できる。
なんのこっちゃ?じゃあテキストファイルなら何でも良いことになるぞ。
>XMLは広範囲のアプリケーションを支援する。
単に読み込める可能性があると言うだけ。と言うか意味不明。
>XMLはSGMLと互換性をもつ。
違う。サブセットだからSGMLは上位互換しか持たない。
>XML文章を処理するプログラムが容易に書ける。
そうか?パーサがない環境とか地獄だが。
>XML文章は人間にとって読みやすく,十分に理解しやすい。
お前はBASE64でエンコードされたバイナリとかも読めるのか?そうか。すごいな。
>XML文章は厳密で,しかも簡潔。
落とし穴は無数にある。
>XML文書は,容易に作成できる。
ネームスペースとか厳密に書こうと思えば思うほどしんどいぞ。
>>832 インターネット上ではあらゆるバイナリがそのまま利用できると思いますが。間違ってますか?
>>824 悪かったな。こんな低レベルの相手してたのか。今から俺はお前の味方だ。
>なんのこっちゃ?じゃあテキストファイルなら何でも良いことになるぞ。 君がそう思っているならひろゆきに2chの出力をHTMLからテキストに変更するように要請してみるといい。 >>XMLは広範囲のアプリケーションを支援する。 >単に読み込める可能性があると言うだけ。と言うか意味不明。 "XML"が"アプリケーション"を支援するのであって、アプリケーションが主体では無い。 >>XMLはSGMLと互換性をもつ。 >違う。サブセットだからSGMLは上位互換しか持たない。 つまりは互換性を持っているわけだ。 >>XML文章を処理するプログラムが容易に書ける。 >そうか?パーサがない環境とか地獄だが。 つまりは「XML文章を処理するパーサーが容易に書ける。」と言う意味だ。 無くてもそれを書くことは簡単だと言っているんだよ。 >>XML文章は人間にとって読みやすく,十分に理解しやすい。 >お前はBASE64でエンコードされたバイナリとかも読めるのか?そうか。すごいな。 "XML文章"は読みやすいね。 49みたいに内容をエンコードしてもそれはあくまで内容であって、 内容がエンコード済みバイナリだろうとFrenchだろうと 俺は読むのに苦労するが不可能ではないね。 >>XML文章は厳密で,しかも簡潔。 >落とし穴は無数にある。 君が思う落とし穴を具体的に上げてくれるか? >>XML文書は,容易に作成できる。 >ネームスペースとか厳密に書こうと思えば思うほどしんどいぞ。 容易に作成できる、しんどいのは多分君の知能のせいだ。
で、
>>824 のそれが掲示板のデータフォーマットに採用して何の得があるか?って言う
君の発言読んでるだけでは確かに全然伝わってこない。
俺もXML信者だがそれをそこまでつまらなく(軽い電波も交えながら)語れる君がすごいと思った。
ろくに理解もできてない人間が勝手に「XML信者」ですか? おめでてぇな。
839 :
nobodyさん :02/12/27 15:14 ID:EOuYsFYV
冬休みってことだ
>>832 >XMLはインターネット上でそのまま使用できる
ほとんどの掲示板のデータには削除コードなど
他人には見られていけないデータが含まれている
それまで再利用する気ですか?
crypt
ま、今ある掲示板はそのまま記録しているのが多いけどな。
845 :
nobodyさん :02/12/27 15:20 ID:EOuYsFYV
>>840 心配するな、お前のデータなんて再利用したいと思わんから。
今ある掲示板ってどんな掲示板?
>>845 データなんて誰に利用されるか分からんのに偉そうだな(w
検索エンジンはなんでも取得するけどね
って言うか
>>840 の論理だとパスワードは共通フォーマットには含めないってことか。
まぁ、オプショナル機能ではあるわな。削除とか編集とかって。
>>852 で、頭のいい君はSSLから地道に実装するんだね。
燃料が入ったなw
どぷどぷ入ったな。
アンチXML厨、必死だな(藁
アンチCMT厨、必死だな(微笑
859 :
nobodyさん :02/12/27 15:33 ID:EOuYsFYV
853が鯖側変換の意味が飲み込めてないに一票
一気に冬の時代へ
統一しなくていいじゃん。もう。
65の次期案待ち
864 :
nobodyさん :02/12/27 15:37 ID:EOuYsFYV
まぁ、冬休みだな。
>>850 パスワードの暗号化も共通化すればいい。
>>862 黎明期ならともかく、今からじゃ無理だな。
なにか革命的な事が起きない限り。
868 :
nobodyさん :02/12/27 15:50 ID:EOuYsFYV
870 :
nobodyさん :02/12/27 15:52 ID:EOuYsFYV
自分のカキコまで指定しちまってるよ…そろそろ逝くか
>>868 自分が自作自演していると他人もやっていると思っちゃう例
可哀想に
冬休み期間中は凍結ですね
そういや日付はXHTML? 2.0 2nd Draftでedit,datetimeが出てきたからそれでいい予感。
なんでこのスレの奴らは放置ができないんだ?
XMLにする必要は全くなし
XMLにしない理由もないんだけどな。
行動力のあるXML厨、もしいるならがんがってくれ。 今の状況では一歩進んで五歩下がって右向け右してるみたいで進歩ないぞ。 煽りや厨発言は無視して、とにかく話を進めることをキボン。
いかなる技術もその良し悪しは需要にどれだけ応えられるかによって評価される。 「掲示板間のデータファイルの共有や乗り換えのための中間フォーマット」には 今のところ全然需要がなさそうだから、どんなのがいいか議論しようにも尺度がない。 これ以上このスレを続けるのなら目標から決め直した方がいいと思うが。。
>>881 そもそも、最小公倍数を取ると各アプリケーションが拡張仕様を持たざるを得なくなる。
網羅的な物を作ると無駄な情報が増えるし各アプリケーションで使われる/捨てられる
情報が異なってくる。
なんか一つの掲示板モデルを作ってさ。
>>883 じゃあそこが案上げてくるまでこのスレはいらないわけだ。終了。
>>884 短絡的にしか考えられないんだな…
2つのスレで相互に連携をとって議論できればどれだけいいか。
たぶん2ちゃんねらにはまだ無理だろうけど
そして終了か。
休止ってとこか。
XMLレベルで考えようとするからダメなんだよ 俺ならSGMLで全て解決 問題なし
>>879 データ量の増加、サーバー側のCPU負荷の増加
無駄過ぎ
それが問題になる掲示板はほんの一握りなんだが。
>>891 まぁ、XMLの一般的なデメリットだな。
で、XMLのメリットの否定はしないのか?
XMLはでお前の挙げたデメリットもあるがそれ以上のメリットがあるから急速に普及しつつあるんだよ。
XML普及はいいが、掲示板のデータにXMLを使うメリットってなんだ?
>>344 みたいにすればXMLじゃなくても拡張性なんぞ問題ないしな。
>>894 なぁ、
>>344 ってシーケンシャルにしかデータ置けないじゃん?
あれでスレッド構造とかツリー構造とか導入したら操作時のポインタの張り替えとか大変じゃない?
って言うか表示する自体大変な気もする。
だからってXMLがいいって訳じゃないよ。純粋に疑問に思っただけ。
>>894 勝手に拡張されるだろうから規定には無理だろ
>>896 その前提だと共通フォーマットなんぞ夢のまた夢なんだけどな。
>>895 XMLだってランダムアクセス出来ないんだからシーケンシャルでなにも問題はない。
ツリーなんかはデータフォーマットの領域ではない。
>>899 DOMとかX-Path使えばいくらでもランダムアクセスできるわけだが。
>XMLだってランダムアクセス出来ないんだからシーケンシャルでなにも問題はない。 キタ━━━━(゚∀゚)━━━━!!!!!!
XML厨は偽装してまで貶したいか。
アンチXMLが糞だと言う事がハッキリしたわけだが。
>>897 XMLなら追加されたタグの部分は無視すればいいだろ
…344でも無視すれば同じか…
XMLなら入れ子構造とかできるのが何かに使えそうだ。
このスレのどこかに書いていたような…
XML推している香具師はぐだぐだ言ってないで 雛型を幾つか作って優位性をアピールしろよ
>>908 記憶すべきデータをすべて列挙してくれればやるよ。
対象とする掲示板のモデルすら決まってないんだからどうとでも因縁は付けられるからね。
実際、現状で挙げられるデータフォーマットは
>>344 みたいな原始的なものくらいな訳で。
やることやらずに煽り合いだけしてても仕方ないだろう。
まぁ、実際に見て触ってみない事にはどれだけ便利なものか分からんしな。
XMLだと1chみたいなレスつけるのに便利かも。
>実際、現状で挙げられるデータフォーマットは
>>344 みたいな原始的なものくらいな訳で。
ていうかさ、掲示板なんて所詮その程度で十分で、XMLなんて必要ない、って正直に言おうよ。
「いやそうじゃない、掲示板はこんな風に進化するんだ!そのためにはXMLでないとダメだ!」
って主張したいんだったらまずその進化形を提示しなさい。
それ無しで、
「拡張性に富む」「柔軟性がある」レベルの具体性に乏しいhypeなXMLの宣伝を繰り返しても
誰もついてこないぜ?
>>912 速攻でレガシーになり数年後には使い物にならない。
そんなのつまんないじゃん。
>>912 規定を決める時に拡張できるものがあるのに
拡張しにくいもので決めるのに抵抗があるだけだ。
えらく食いつきがいいな… まあ、形のない夢や希望を語るのはそいつの勝手だが、結局は >「いやそうじゃない、掲示板はこんな風に進化するんだ!そのためにはXMLでないとダメだ!」 >って主張したいんだったらまずその進化形を提示しなさい。 ってこった。がんがれXML厨(ワラ
しょせんXMLに縛られた連中はザコにすぎなかった。 これからはSGMLの時代だよ。
もう、HTMLでいいだろう?お前ら。・
なぁ、データフォーマットよりインターフェースが同一なサーバの規格考えた方がよくねぇ? ちょうど世間の流れもWebサービスとかに向いてきてるんだからさぁ。
920 :
nobodyさん :02/12/30 19:55 ID:Yi1D6eqJ
SOAPとかか。
つーかtext/plainでいいじゃん。
>>921 何が楽しうてテキストばっかのデータをバイナリにするか。と。
>>920 そうそう。モデルは好きなように作ればいい。インターフェースさえちゃんと規約守れば。
そうすればしょうもないXMLだタブ区切りテキストだもめなくて済む。
そうだ、バイナリにしよう。
ああそうしよう
決定
927 :
nobodyさん :03/01/02 16:33 ID:wSMDiPZP
>>924 で、具体的な方法は?
テキストデーター←→バイナリデーター
>>927 って言うかASCIIコードのみで構成されたファイルをテキストファイルと定義するならば、日本で扱われてるファイルのほとんどがバイナリファイルとなるわけだが。
そもそも、テキストファイルの定義って何?
929 :
nobodyさん :03/01/02 18:23 ID:L6yfXpSS
人間が読めるか読めないか
>>929 82 A8 82 DC 82 A6 94 6E 8E AD 81 48
はちにー えーはち はちにー でぃーしー…
また話がそれてきたな…別の話するならスレ立てしれ
933 :
nobodyさん :03/01/04 05:41 ID:/7Nw9Upa
82 B1 82 EA 82 F0 93 C7 82 DE 89 C9 82 A0 82 C1 82 BD 82 E7 89 BD 82 A9 8D 6C 82 A6 82 EB 81 42 83 7B 83 50 82 AA 81 45 81 45 81 45 8E 81 82 CB
8E 81 82 CB
8F 49 97 B9
92 4E 82 A9 81 41 83 66 83 52 81 5B 83 5F 8D EC 82 C1 82 C4
foreach (@ARGV) { s/(..)/chr(hex($1))/e; print; }
>>937 2バイトコードが入ったら変換できなくない?
3E 3E 39 33 37 82 A2 82 E2 81 41 82 B1 82 EA 82 DC 82 C5 82 AA 82 DC 82 B3 82 C9 32 83 6F 83 43 83 67 95 B6 8E 9A 82 BE 82 C1 82 BD 82 ED 82 AF 82 C5 81 42 82 C2 81 5B 82 A9 81 41 82 A2 82 A2 82 A9 82 B0 82 F1 82 A4 82 B4 82 A2 81 48
3E 3E 39 33 38 82 BE 82 C1 82 BD 81 42 90 C0 82 C1 82 C4 82 AB 82 DC 82 B7 81 63
個人的には各記事がメールに近いフォーマットになると使いやすいなぁ。 メーラーで読めるし。 でもまぁ、スレも終りだから期待はしない。
930:nobodyさん:sage:03/01/02 (木) 18:29 ID:???
>>929 おまえ好き?
933:nobodyさん :03/01/04 (土) 05:41 ID:/7Nw9Upa
これを読む暇あったら何か考えろ。ボケが・なんてね
934:nobodyさん:sage:03/01/04 (土) 10:23 ID:???
逝`
935:nobodyさん:sage:03/01/04 (土) 12:53 ID:???
逝キル
936:nobodyさん:sage:03/01/04 (土) 21:03 ID:???
誰か、デコーダ作って
939:nobodyさん sage:03/01/05 (日) 18:32 ID:???
>>937 いや、これまでがまさに2バイト文字だったわけで。つーか、いいかげんうざい?
940:999 sage:03/01/05 (日) 18:35 ID:???
>>938 だった。逝ってきます…
3e 3e 39 33 30 2d 39 34 30 b3 bb de b0 2d 81 42 82 c5 82 e0 94 53 92 85 82 cc 89 b4 83 82 83 69 81 69 98 6d
From: nobodyさん To: 941 Subject: Date: Mon, 06 Jan 2003 00:51:34 +0900 。。。
945 :
nobodyさん :03/01/07 08:41 ID:8awAqF3b
こういう話になると、ログのテキスト形式は、やっぱりUnicodeがいいわけだが、 UnicodeでかかれたPerlはちゃんと走んないんだよね。
>>945 そうなのか?各種規格あって日本語の扱いはグデングデンだけれど。
素直にS-JISかEUC使っといた方が無難だな。
>>947 どこかに日本語のエンコード方式書いとくとかな。
それ見て好きなコードに変換すれば良し。
RIFF…
>>948 <?xml version="1.0" encoding="Shift_JIS"?>
書いてみた。
952 :
nobodyさん :03/01/08 11:56 ID:qE6vynNE
まだまとまってなかったのか・・・ Part2に期待しよう。
共通フォーマットより共通インターフェースの方が得る物が多い予感。
>>953 んで共通インターフェースのものって
どういうものがあるの?
UTF-8
959 :
nobodyさん :03/01/12 11:37 ID:xce8gJUO
「拡張性や柔軟性に富むって」言って「具体的なものを示せ」って言ってるやつらは 煽って何が楽しいの? それとも想像力のまったく無い馬鹿なの?
Majide Vakana People
>>961 複数形なところがバカさ加減を増長しているな。
peopleって名詞だろ? 複数扱いかもしれないけど複数形には程遠いと思うぞ。
Person の複数形だと思ったらしい。
これだから(以下略
>>958 一文字に何バイト使いやがるんだって感じ。
じゃぁUnicode
半角カナでいいじゃん。
つぅか手書き。
970 :
山崎渉 :03/01/15 13:33 ID:???
(^^)
次スレはもちろん無しか?
>>972 船頭多くして船山に上る。って奴だな。
かと言って掲示板仕様スレの
>>1 の独裁というのも心底むかつく。
船頭多くし、漁船を宇宙へ打ち上げませんか?
>>974 みんなでボールを囲んでみたいにAAつければなお良いね。
49のデムパが無きゃとっくにまとまってただろうに。
もともとこんなものはまとまらないだろ。ひろゆきとか管理者が参加すれば どうにかなるかもしれんが。 議論することが目的みたいなスレなので次スレに続いてもいいと思うけどな。 できれば1は責任もってある程度まとめて次スレをたててほしい。
・掲示板スプリクトデータ内容を議論しよう。 ・掲示板スプリクトデータフォーマット規定をXMLで作ろう ・掲示板スプリクトデータフォーマット規定をCSVで作ろう ・掲示板スプリクトデータフォーマット規定のCMTを拡張しよう の4つのスレを立てればマターリ進みます。
互いにもみ合って全滅の予感。
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。