辞書機能を備えたソフトを作ろうとしたら、辞書のライブラリでフリーのもの無いんですね…
英辞郎にしたって、結局どこがフリーじゃって感じしますし。
そんなわけで完全著作権フリーで誰もが自由に使える辞書作りませんか?
もちろん辞書データベースソフトはフリーで公開する予定です。
そこで聞きたいんですが、
どんな機能があったらプロジェクト立ち上げ時のしょぼい段階の辞書に協力する気になりますか?
あと、何か著作権云々でこれは気をつけとけ!ということありますか?
2 :
名無しさん@英語勉強中:04/12/15 01:32:35
ににににいいいににいににんんんいんにににににんい
>>1 すばらしい考えだな。俺も協力するよ。
細かい機能はいらないから、どんなにマイナーな単語でも例文は最低1つはのっけてほしい。
ちゃんと一文になってるやつを。
4 :
名無しさん@英語勉強中:04/12/15 01:48:32
>>1 ちゃんとした辞書からとった発音記号を載せて欲しい
英辞郎も結局アレだからな・・・
6 :
名無しさん@英語勉強中:04/12/15 04:25:35
関連ツールも必ずフリーつーことで
7 :
名無しさん@英語勉強中:04/12/15 04:36:08
電子辞書買った方が早いよ
8 :
名無しさん@英語勉強中:04/12/15 04:51:11
英一郎はたて逃げか?
様々な言語にWordNetがあるけど、英語のWordNet
はフリー。それ以外のWordNetはライセンス料がかかる。日本のEDRも、もうすぐフリー?
10 :
英一郎:04/12/15 12:49:14
これからこのスレを保守していきますが、基本的に出没はPM11:00です。
着手は諸事情にて1月中旬から、
このスレの目的は
「著作権フリーの英語辞書(ライブラリ)」
を作成することが目的です。
ですが、さすがにライブラリだけを作ろうとしても人が寄らなそうなので、
辞書ソフト壱号機は私が作ります、もちフリーです。
あと、なるべく皆さんの協力をリアルタイムで反映させるためにサーバーも立てるつもりです。ウィキペディアみたくできたらいいんですが技術上どこまで可能かは分かりません。(この辺は未体験ゾーン…)
恐らく、このライブラリが充実してくれば辞書ソフトは多くの支援者によっていろんなバージョンが作成されると期待しています。
また、このライブラリを搭載した翻訳ソフトなんかもでるかもしれません。
現状では、辞書ライブラリを搭載したソフトを作成する際、ソフト作者は辞書ライブラリの著作権に縛られ個人レベルでは思うように辞書を進化させることができません。そこで自由に使用でき、編集できる辞書がこの世に存在したらと思いこのスレを立てました。
とりあえず製作に入る前にやりたいこと
1.フリーのライブラリがあるならそれが欲しい
0から作るよりずっと楽になるため
★「英語のWordNet」これそのまま取り込んじゃっていいんですかね?
後で調べてみますが知ってる方ヨロです。
2.基本フォーマットの作成
どんなデータがあると辞書として役に立つか
★発音記号
★例文
3.著作権上の注意点
後になって公開差し押さえは勘弁してもらいたい
英一郎君、頑張ってくれ。
語源を充実させて下さい。すべての単語に語源説明をするくらいの勢いで
お願いします。
面白そうなアイデアだと思うけど、
1が想定しているものがどういうものなのか、いまいち分からない。
ライブラリって何ですか。
「辞書ライブラリ」って、プログラムのことを言ってるのね。
勘違いしてました。
>>14 はデータ作成のスレなので、無視してください。
>>15 辞書を調べてみよう! 多義語だから、どの意味かはあいまいだが。
>>16 その一方で英辞郎を出しているから良く分からない
英辞郎は辞書データだよな.「辞書データベースソフト」なんて言い方もしてて,
結局何を作りたいんだか...
「著作権フリーの英語辞書(ライブラリ)」って何なのさ.
私の解釈では
「1は辞書プログラムを作る。英語板住人は辞書データを作る。」
ってことだと思ったんですけど。
1の書き方はあいまいでよく分かりません。
20 :
英一郎:04/12/16 00:59:12
もうこんな時間か…
辞書の話で「ライブラリ」は確かに混乱を招きました、スンマセン。
ライブラリ…データの集合体(EIJIRO81.DIC)
辞書ソフト…データの集合体を扱うアプリケーション(PDICW32.EXE)
と考えてください。
オンライン作者の立場から見ると「辞書ソフト」は一人で作れる代物ですが、その中身のデータファイルというのは当然ながら一人ではとても作れません。
ですが、世の中にある英和辞書データはおそらく全て著作権によって保護されており、一個人の作ったソフト上で自由に扱うことができません。
たとえば学習する辞書ソフトを作ったとしましょう。
このソフトは「英辞郎」や「GENIUS」のデータを取り込めたとします。
その際、ある人が一生懸命使ってそのデータベースを二倍に拡張したとします。
それでも、元に「英辞郎」や「GENIUS」の著作権が存在するために、その人の拡張されたデータを第3者へ配布することができないのです。
あくまで、個人利用にとどまってしまうわけです。
つまりどこまでも辞書データを成長させていくために必要な基本データを作成しようと言うわけです。
コンセプトは英辞郎とまったく同じでそれを完全フリーでやり抜こうということです。
でも、せっかくやるからには辞書データとして魅力的な情報を持たせてやりたいと考えています。
せっかちな話かもしれませんが、このデータベースに『乗せるべきデータ様式』をマッタリ話し合いませんか?
------------------------------
例:patientという単語を調べた結果
発音記号:peisens
語源:耐え忍ぶ者
名詞:医学:患者
形容詞:一般:忍耐強い、辛抱強い
例:ンマフフ
------------------------------
てな感じ
21 :
英一郎:04/12/16 01:10:35
ちなみに英辞郎だと
1英単語:patient
2発音記号:pe@iSnt
3日本語訳:
【@】ペイシャント、ペイシェント、【変化】《複》patients、【大学入試】
【形】我慢強い、根気よく働く、辛抱強い、忍耐強い、隠忍自重する、我慢する、堪忍する、気長な、気が長い、寛容な
【名】我慢しなければならない人、患者、病人
4用例:【用例・形】 Be patient. : 我慢してください
5単語レベル
6暗記必須単語
の6項目で構成されています。
私的には、日本語訳や用例をもっと細かく区分したほうがいいかなと思ってます。
例えば、
単語の使われる状況:
[名詞] [医学] 患者
など、名詞の場合は使われる環境を大まかに示したりするとどうかな?とか考えてます。
>>20 なるほど。僕も参加させてください。
僕の希望を言わせてもらうと、どの単語と結びつくか(コロケーション)が欲しい。
それも、既存の辞書にあるような数個だけっていうんじゃなくて、
どんどんデータベースを拡張できるようにしてほしい。
具体的にいえば、コマンドに、
「この単語の用例をデータベースに追加する」
「この単語の用例を見る」
があればいいなと。
patientなら、英英辞書を引くと、
elderly patient, ill patient, AIDS patient, cancer patient,
help the patient, treat the patientなどが載ってるけど、
これを自分で追加していけるような。
23 :
英一郎:04/12/16 01:13:43
他の参考リンクはまた後ほど見させていただきます…
24 :
うんこ:04/12/16 01:19:47
みんな頑張ろうな!!
>>うんこ君
がんばるのはいいんだが、君はそのコテハンもうちょっと何とかならんのか?
26 :
うんこ:04/12/16 01:24:16
>>25 うんこって何か楽しい感じしない?気楽に頑張れる気がして・・・
うんちならOK?
きたない。あと例文を作れる人間はまず皆無だろうからかなり難しい作業だと思う。
出典のチェックネイティブチェック校正チェックときりがない。
一応学生時代辞書編纂の手伝いした経験あり。
別にネイティブチェックなんていらないんじゃないの。
売るわけでもないし。
自分で改変できるってのがいいんであって、
信頼度を求めるなら普通の辞書引けばいいじゃん。
29 :
名無しさん@英語勉強中:04/12/16 14:41:32
電子辞書持ってるからイラネ
30 :
名無しさん@英語勉強中:04/12/16 15:19:35
どうせ1がソースを持ち逃げしてシェアウェアにでもするんだろ?
30が核心ついたところで
-終了-
32 :
名無しさん@英語勉強中:04/12/16 16:30:05
ってのは嘘ぴょーん
33 :
名無しさん@英語勉強中:04/12/16 16:49:06
ってのは嘘ぴょーん
-終了-
WordNetがある
-終了-
36 :
英一郎:04/12/17 01:14:52
名無しさん@英語勉強中の発言は発言内容のレベルがぶっ飛んでるのでいざスレッド立ててみると理解に苦しみますね…
今一番の収穫は「WordNet」です、まさにこれをやろうと考えていたのであるならいいです。
-終了-
37 :
英一郎:04/12/17 01:15:20
ってのは嘘ぴょーん
38 :
英一郎:04/12/17 01:16:51
ってのも嘘ぴょーん
39 :
英一郎:04/12/17 01:39:25
…疲れてるな俺。
とりあえず基本データはWordNetを丸々コピーしてシステム作ってみます。
実際に着手できるようになるまでまだ時間がありますので、少しでも協力者を煽るためにもフリー辞書データのメリットを上げていきますね。
>>29 「電子辞書で充分」
普通に考えると浅はかな気がしますが、あまり煽ると公開時に叩かれるので穏やかに説明します。
中学受験や英語学習目的の辞書の使用であれば市販の英語辞書で充分、というよりかそれを選択するべきです。
でも、データを有効に活用したシステムを作成する場合、市販のデータは個人利用に限り改変できますが、皆で共有することは現実的に難しくなります。(お金がかかる)
特に特定の辞書のデータだけで充分な場合などは中学受験位ではないでしょうか?
今考えている中で有効活用を上げてみると、文章翻訳時に最適単語を選出する機能なんか付けられるかもしれません。
たとえば文章を丸々読み込ませて、その中にどんな単語が含まれているかを解析させます、するとどういった内容の文章か大まかにジャンル別に区分けすることができます。
そのジャンルにあった訳語を優先的に表示するといった機能はあったら便利かもしれません。
また、未来の話ですが、たとえばある人が人工知能の作成を個人レベルで始めたとします。
もちろん言語学習が必要になるわけですが、その際フリー辞書を使えば著作権にとらわれず自由に公開できたりします。
多言語翻訳、英->日 英->韓 の辞書がある程度できたとします、するとこれを元に日<->英 英<->韓 日<->韓 なんてものが作れます。
つまり皆が二つの言語を充実させると全ヶ国語辞書が作れちゃうわけです。まぁこれらはバビロンとかの辞書会社は普通にやってると思いますが、がんばりゃ俺らでもできるんではないでしょうか?
まぁ結局、辞書を引くだけの人にははじめは全くメリットがないかもしれませんが、完成したらほんとにスゲープロジェクトだと思います。
またにー
市販の辞書ってどの位著作権持ってるの?
例えばこのスレで作成する辞書にhungryの用例を入れる場合、
I'm hungry(低級レベルで申し訳ない・・・)
って自分で考えたとしてこの文を入れるとするじゃん?
市販の辞書のhangryの用例が同じI'm hungryだとしたら
著作権違反でアウトってことになるの?
41 :
名無しさん@英語勉強中:04/12/17 10:52:00
>>40 というか市販の辞書でも例文はよく他所のをぱくってるよ。
版権が切れた書籍からの転載でしかも部分的に改変しているなら、特に断らなくても
いいという慣例はある。逆にシェークスピアとか有名なものは断っておく方が高級に
見えたりもする。著作権は今厳しくてインターネット上でも訴えられる場合もあるし
原告勝訴の判決も出ているから、もう甘くはなくなってきているよ。
アメリカ人になればいいよ。マジでw
44 :
英一郎:04/12/18 23:50:21
WordNetの仕様を見ていると日本語版WordNetができればそのまま英語、日本語、英和、和英辞書ができちゃいますね。
上位語、下位語、等位語の概念すら知らなかったから勉強になりました。
日本語版WordNetの作成を検討しているところってあるんですかねぇ?
ググッた感じじゃ見当たらないんですが。
著作権について
>>40-41 余り詳しくないんだけど、答えてくれる人がいないみたいなんで可能な限り答えます。
一般的には、「一般的に広く知られている事実」は著作権には触れません。
だから
「お腹がすいた:I'm hungry」
なんかがたとえ他の辞書に載っていてもそれを使用することは問題ありません。
だからといって日本語と英語に長けた人が俺はこの辞書内の全ての単語と意味を知っているからといってデータを丸々コピーすることはできません。
ばれなきゃ良いだろうと考える方がいますが、確実にばれます。
というのも普通の辞書(データベース)は「罠」を仕掛けてあるからです。
以前も某地図データベース会社が他の地図データベースをコピーしてばれましたよね。
よくあるタイプの罠は既知の入力ミスです。
入力ミスをあえていくつか取っておくと、データが丸々コピーされた際にそのミスもコピーされます。
もちろんこのミスは「一般的に広く知られている事実」ではないのでこれが複数発覚すると著作権侵害ということになります。
つまり本人がよく耳にしたり、経験的に知っていることを「確認として」他の辞書で調べて新たな辞書に登録することは問題ないと思います。
っていうか既存の辞書に何か不満でも?
別に新しいものがなくても、英和や英英なら洋書で1000円前後でいくらでも手に入りますが何か?
つーかそんな辞書の造り方も知らない奴が作る辞書をだれが使うんだよw
俺は特殊な英語辞書作ったことあるけど、もっと研究してから作ったぞ。マジで。
そんな浅はかに「自分でも…」とかって思うなら、カエレ
47 :
名無しさん@英語勉強中:04/12/20 00:06:43
このスレは終わりましたか?
返信求む
48 :
英一郎:04/12/20 01:03:41
いますよ…
>>10 にも書きましたが1月中旬までは他の事が忙しいので、実際にプログラムを作ったりはできません。
その間に、いろいろ構想だけでも練っていきたいと思っています。
今日はちょっと時間を使って、単語を登録するだけのWEBサーバー用のデータベースを作ってみました。
仕様などを先に公開して論議したいのですが、読もうという気のある方います?
まぁ不発にせよ何にせよとりあえず一発は公開するつもりです。
>>45 人それぞれ考え方はあるみたいですが、煽りをするにももう少しスレッド読んでからしてもらいたいです。
でないと返事する気すら失せます。
フリー辞書はあるみたい。
フリー英英辞書もあるみたい。。
つまり、ありふれた小辞書はいらない。。
ネットでフリーでなにかやってみたい、と言う気持ちはわかるけど
現実にフリーで”凄い”ものを作るとしても、結局誰かが引っ張らなければ
むりぽ。人気のフリ−ソフト作っている人の中には現実の生活を壊しかねない
状態でがんばっている人もいるくらいだし、雑談でなにか出来るとは正直
>>1も考えてないだろ。
52 :
英一郎:04/12/20 15:21:54
英英は
hyyp://wordweb.info/free/
hyyp://www.free-soft.ro/index-en.html (多言語)
hyyp://www.freelang.net/dictionary/index.html (多言語)
英和はベクターなどにあったと思う。
と言う俺はBookshelf使ってるのだけれども。
辞書を作るには多分長い年月が掛かると思うのですが、
データベースを少しずつ追加できる形式だといいのではないでしょうか
54 :
英一郎:04/12/20 17:51:02
ウホッ逃避中…
>>50 ネットでフリーウェア公開して人生踏み外し傾向にある人間です…
自慢できるほどのソフトはありませんけど…
もちろん、
常時更新、登録、アクセス可能なサーバー立てて
Windows下でネット接続無しで動くクライアントを作る予定です。
>>53 ありです。後で見てみます。
できれば全データを丸々ダウンロードできるものがいいです。
データ形式は独自であってもフォーマット仕様が分かれば抜き出せます。
もちろん、使用許可付きでないと使えませんがね。
55 :
英一郎:04/12/20 17:53:04
今読んでる本:言語の科学3「単語と辞書」(岩波)
単語自体の構成や仕様はこれ読んでから考えます。
細かい点で問題になる例えとして、
●「自動制御」を単語として認めるかとか。
(自動、制御)とばらばらにしても意味が通じかつ意味が変化しないもの
これらはほぼ無限通りの組み合わせが作れるが、時際に使われる言葉は有限数しか存在せず、外国語によってはそれ自体に一単語が割り振られているケースがあるため。
英語で「おにぎり」に相当する単語は無いが2語「rice ball」でなら表現可能な場合、
英語側の単語として「rice ball」は認めるべきであるといった点など。
●データベース仕様
データベースは3グループで構成
1:ネットワーク型単語データベース
単語と単語をつなぐデータベース
例えば
動物->哺乳類->ネコ
のような繋がり関係を保存します。
関係式は
上位語:「ネコ」の上位語は「哺乳類」、「肉食動物」、「動物」...
下位語:「鉛筆の」下位語は「色鉛筆」、「赤青鉛筆」...
等意語:「間違い」の等意語は「ミス」
多言語間でネットワーク上に繋げていこうと考えてますが、上位語、下位語…の定義はまだ決めてません。
2:意味データベース
単語とその意味を連結したもの
時計:時刻を表示したり測定したりする機械
3:等意文データベース
同じ意味を持つ文章
How are you?-ご機嫌いかが?
56 :
英一郎:04/12/20 17:54:51
このデータベース仕様をもっと煮詰めて行きたいと思います。
例えば
名詞以外の扱い方
文法のデータベース化
ネットワーク型単語データベースの問題点
下位語の範囲はどこまでか?
単語->単、語
単語->たんご->た、ん、ご
ここまで分けると日本語初挑戦の外人さんにもやさしいかな?
もちろん
単語、単、語、た、ん、ご
は意味データベースと直結させます。
57 :
名無しさん@英語勉強中:04/12/20 19:00:00
>>56 最近はアニメの影響か日本語習得しようという人も海外で
増えてきてるみたいですし、ローマ字で引けるようにすれば
いいかもしれないですね。
フリーの百科辞典Wikipediaみたいに誰でも投稿、編集できるよう
なスタイルにすれば独自性も出せるんじゃないかと思います。
ほうほう。
>>46に池沼呼ばわりされたから、経験者がアドバイスしてあげよう。
実際辞書を作るにはコーパスを作る必要がある。ってそれ以前に目的を決めないとコーパスも作りにくい。
例えば「treponema」って単語は、細菌関係の辞書作るなら必要かもしれないけど、それ以外では必要ないだろう。
どっからコーパスのソース集めるかにもよるけど、新聞や雑誌、その他諸々から上位約15000〜30000語も掲載すれば実用には耐える(と思う)。
あと基本語の意味をちゃんとしとくと。他にも重要ポイントはあるけど、あげたらきりないな…
どう?辞書作者がなんで著作権主張したがるか少しはわかったか?
そんな簡単にできるようなもんではないんだよ。
>>1よ。
生半可な気持ちで作った辞書には利用価値も見出せない。だって英和辞書くらいネットでタダで引けるしね。
ちなみにマジで作る気があるならいくつかアドバイスしてあげよう。
とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
意味付けなんていうものは無機質な作業だけど、それ以前にやるべきことがたくさんあるということを知っておいてくれ。
そんじゃ*本気なら*ガンガレ
まあ
>>46はもっといいアドバイスをくれるんだろうが。
>>58 46じゃないが、アフォなのはお前のほうだよ?w
まず
>>1 の制作意図がなんであるか全くわかっていないようだ。
それからフリーで物を作る威力というのがどのくらいかもわかっていないようだ。
さらに、
> とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
こんなもんはプログラムの入門書のはじめのほうに書いてある10数行の
練習問題だぞ。w
まあ作ってから言ってもらいたいもんだな。
妄想だけなら誰でもできるんだよ。
フリーのものを作る威力?ああ。フリーであることは素晴らしいかもしれない。
しかし、辞書をフリーにしたところで何の意味があるのか?
実際有名辞書からの出典ほど信頼できるデータはないはずだよな。
辞書とかの著作権は信頼という付加価値があることには気付かないようだな。
だってお前ら、「○○××English Dictionaryによると〜」と「コウビルドによると〜」のどっちを信頼するのか。
実際に利用価値がある=内容価値があるものをフリーでどう実現するか、教えてもらおうじゃない?
フリーの辞書なんぞ作らなくてもWiki1個設置すれば済む話。
自演乙。
参考: WikiPedia
------------------------------------
-------------- 終 了 --------------
------------------------------------
>>60 お前もしかして英辞郎 thread 荒らしてるバカじゃね?
じゃあ相手しない。w
>>61 俺も Wiki type のやり方が妥当かなと思ってるが、辞書なんだから
format の制定やら tool の作成などほかにもやることは色々あるだろう。
>>1 がどこまでやる気かはわからんが。
>>62 英辞郎はモノになってるだろ。一緒にするなバカ。
フリーなんて意味を改変可能&創作可能だから信頼性がないんだよ。
そもそも辞書をフリーにする利点は?書いてみ↓
> > とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
>
> こんなもんはプログラムの入門書のはじめのほうに書いてある10数行の
> 練習問題だぞ。w
うん、それさえやってないこの辞書は糞だね。
the コーパスなしのパクリ辞書!
このスレではまっとうな意見も煽りとみなすんだよな。
まるで北朝鮮ニダ。
・辞書を作る大変さ
・著作権に込められた信頼性
を言いたかったんだけど、「フリーで〜」とか言ってるの。
いやいやフリーは素晴らしいよ。ただ危険性もはらんでるだろ。
辞書みたいに規範になるようなもの、それにフリーはどうかと。
作るのは自由だ。大変だがな。ただ「価値を見出す」という壁は越えられないぞ。
あとアドバイス。経験者の意見に耳を傾けてみてはいかがかと。
まあ作る本人の自己満足に口つっこむ必要はないが、最低限の知識の欠落が目立つんだよな。
確かに理論上簡単でもやっていないんなら反論しても笑われるだけ。
受け容れてこそ、完成度がまして、さらに高度なアドバイスが受けられるのでは?
66 :
名無しさん@英語勉強中:04/12/23 02:27:07
バ カ さ ら し 上 げ !
>>65 > あとアドバイス。経験者の意見に耳を傾けてみてはいかがかと。
俺の言うことも聞いてくれ〜って事か?www
いらんから。
このスレではまっとうな意見も煽りとみなすんだよな。
まるで北朝鮮ニダ。
うんうん、じゃあコーパス作らないでね。絶対に。
で、無知の結晶を辞書にぶち込んでくれ。
世界一信頼性の低い辞書を作って、世界中の笑いものになるがいい。
>>68 ハイハイ。バイバイね。
誰もお前の指図なんか聞いてないよ。w
お前には関係ないんだからもうこのスレくんなよ。
> 実際辞書を作るにはコーパスを作る必要がある。ってそれ以前に目的を決めないとコーパスも作りにくい。
> とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
もうこれを否定する時点で辞書作成の糞さが露呈。
だって辞書作成の常套手段を否定してるんだもんw
あっ一般論否定できるほどの理由があれば反論どうぞ。
> いやいやフリーは素晴らしいよ。ただ危険性もはらんでるだろ。
> 辞書みたいに規範になるようなもの、それにフリーはどうかと。
これに答えられないからってバカ扱い。それこそ知能の低さを世間に知らしめてますねw
> まあ作る本人の自己満足に口つっこむ必要はないが、最低限の知識の欠落が目立つんだよな。
無知を知れ。ぶっちゃけ恥。
> 確かに理論上簡単でもやっていないんなら反論しても笑われるだけ。
> 受け容れてこそ、完成度がまして、さらに高度なアドバイスが受けられるのでは?
これも一般論。一般論否定してどうする。
はい。あなたの知能の低さ、これらに答えられなければ決定ですが、さて…
だって経験者より知ってたら、そりゃすごいわ。表彰モン。ヨッ!この博学者!!
>そこで聞きたいんですが、
>どんな機能があったらプロジェクト立ち上げ時のしょぼい段階の辞書に協力する気になりますか?
>あと、何か著作権云々でこれは気をつけとけ!ということありますか?
と書いておいて他人の意見聞けないようなやつに建設的なものは何も作れない。
自己満乙。
------------------------------------
-------------- 終 了 --------------
------------------------------------
>>70 なんか少しは内容のあること書けバ〜カ。
そんだけ長文書いといて、何一つ意味のあること書かれてないじゃないか。w
lexicographer が辞書編纂時にcorpus 使うこと知ってるくらいで経験者?
はぁ?w
バカも大概にしとけよ。
>>72 いややってないのに、調べ調べ言ってるようなお前はホント馬鹿だな。
フリーのよさも説明できない、知識の欠落を認めない、それならさっさと作ってみろやハゲ。
何一つ意味ないって、お前もなwまず反論できてねーじゃん。日本語も読めないのね。
> バカも大概にしとけよ。
自分へのメッセージですかw
まあ「英語辞書」でもつくってなw
俺も昔英英を作ったもんだが、そんな奴相手に辞書の作り方も知らないのに無知をさらけ出して煽ってる姿は、まるで喜劇をみているようだ。
一般論さえ否定して、状況が悪くなれば馬鹿ですか。そんなunprospectiveな戯言に誰がついてくるんだろうね。
まあ文句言う前にモノを作ってみろや。コーパスなんてことば、俺が来るまで登場してなかったのは、それこそ異常。
あっ馬鹿すぎて相手にされてなかったのね。ごめんごめんw
請われていないのにやってきて「アドバイス」を押し付ける香具師って
心にどこか欠陥があるよね。
実社会で誰からも認められていない腹いせを2chでやりたいのかな。
実際、迷惑だよ。
>>75 >そこで聞きたいんですが、
>どんな機能があったらプロジェクト立ち上げ時のしょぼい段階の辞書に協力する気になりますか?
>あと、何か著作権云々でこれは気をつけとけ!ということありますか?
フリーの英和辞書は存在するから要らない
終了
>>76 ?
>>45,58 のどこにその質問への回答が書いてあるのかな〜?w
おばかさんw
請われてもいないのにしゃしゃり出てきて
聞かれてもいない質問に答え、
ちっぽけな経験を威張りちらし、
意味のない自己弁護だけを繰り返す。
正直言って、あんた出てくる必要あったの?w
>>45,58
何も生産しないでただ
>>1の精神が分裂してるスレはここですか?
Welcome FREE !!!!!!!!!!!!!!!!!!
TLOVE FREE STUFF !!!!!!!!!!!!!!!!
真の学者根性でパクらず一つ一つ作っていって欲しい。
82 :
名無しさん@英語勉強中:04/12/23 23:09:02
みんな頑張ってつくってな。俺はできたやつを頂くだけでいいや。
83 :
名無しさん@英語勉強中:04/12/23 23:20:44
84 :
名無しさん@英語勉強中:04/12/23 23:25:16
まず、電子辞書のReaders、Readers Plus、大ジーニアスをテキスト化する。
次に、例文や発音記号などを削除して、見出語とその語義(多義語の場合には、
コンマで区切る)を抜き出して、保存する。
保存したデータと、英痔瘻の見出し語と語義とをperlなどの言語で比較させる。
見出し語と語義が共通するものは、「著作権」が発生しないので、perl
でテキストファイルに書き出す。
これで、20万語程度の英和辞書は自動的に作成でき、著作権もないので
自由に配布できる。
85 :
名無しさん@英語勉強中:04/12/23 23:51:51
まず、電子辞書のReaders、Readers Plus、大ジーニアスをテキスト化する。
次に、例文や発音記号などを削除して、見出語とその語義(多義語の場合には、
コンマで区切る)に「にょ」を付けて、保存する。
86 :
英一郎:04/12/24 00:41:01
なんか知らない間にスレが伸びてますね…
そういえばクリスマスですねー、引きオタの私にゃ暮らしづらい時期になりました。
一人で映画館行ったら職務質問でもされるんじゃないかと心配ッス。
>>58 スレタイが「辞書」ですがこれから作ろうというものは今まで僕らが使っている辞書とはちょっと違うものです。
そもそもこれまでの「辞書」は人間が直接使用することを前提に製作されたものであり、紙に記録されていました。
そのため、容量や直感的な検索の容易さ(あいうえお順)が重要でしたが、今回作ろうとしている「辞書」はコンピューターを介して使うことが前提となっています。
だからコパース云々ではなく単語の収集対照は存在するもの全てを対象とします。
単語管理、分類は当然あいうえお順等ではなくWordNetに似た概念を用いたいと思うのですが、中々いい案がないのが現状です。
あと、フリー辞書のデメリットを挙げているようですが、メリットもあるということををよく理解してください、
それがあなたにとって魅力的でないものであっても、それを魅力的に感じる人がいるということを理解してください。
>とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
どういう意味で言ってるか判断し辛いのですが、数百メガの単位のソートを言ってるのであればプログラミング入門程度ですし、数ギガオーダーのインデックスに対して行うのであれば上級者向けですよね…。
87 :
英一郎:04/12/24 00:42:25
>>60 頼むからスレッド読んでくれ、あなたが言っている例では市販辞書が最適選択肢です。
フリーの辞書のメリットは、
●誰でも組み込み再配布が行える:
例:しりとりゲームや言葉遊び的なゲームの内部辞書
人工会話システムの内部辞書
オンライン作者の作る自動翻訳機の辞書
●不特定多数の人間によって随時拡張可能
同人語、ごく一部の人間しか使わない語、等も登録閲覧可能
通常辞書にない崩れた言葉も調べることが可能
88 :
英一郎:04/12/24 00:47:15
あと、
●フィードバックが受けれる
オンラインで公開した際、どんな単語が検索されてるか等が分かる
>>61-62 ウェブ公開のタイプはWikiっぽいのが妥当ですよね。
ツール製作も基本的には問題ありません。
一番のネックがデータフォーマットです。これを何とかこのスレッドで解決したいと思ってます。
89 :
英一郎:04/12/24 00:57:49
やっと本題。
単語をどうやって管理するか?
基本的に単語は何でも登録可能にします。
そして、単語と単語を<>=で繋げて行きます。
これは
>>55の
1:ネットワーク型単語データベース
の事です。
あれから少し拡張して、この関係の糸に強度のパラメーターを追加することにしました。
例えば
肉食動物 > ネコ
肉食動物 > ウサギ
と登録されたとします。
今回は明らかに間違っているものを例にしましたが単語の中には微妙なものが多数あります。
これを見た人はその関係が正しいと思ったら+,間違い(一般的でない)と感じたら-を加えることができるようにしようと考えています。この場合は修正が最適ですけどね^^;
で今悩んでる問題点
こういったネットワーク上の関係式は、明らかな事実には有効なんですが感情的な単語にはとても不向きなんです。「美しい」「早い」等、特に形容詞の管理には向いていません。
これをどういう風に管理したらよいかいい知恵ありましたらお願いします。
90 :
英一郎:04/12/24 02:02:10
やっぱ欲張りすぎかなぁ
先ず普通に英和辞書を作ってみるべきかな?
未知の領域に踏み込んでいってください
EDRは、9年以上の歳月と180億円を投じたが、
大きな問題点があった。
成功することを祈っている。
93 :
名無しさん@英語勉強中:04/12/25 00:46:03
英和作る→属性つける→プログラム側で対応→┐(´ー`)┌'
フリーは製品にたたかれるなぁ
がんがれ
叩かれる理由は他にもry
96 :
英一郎:04/12/25 22:40:46
口だけじゃ何なので簡単なサーバー作ってみました。
http://dictionary.hiroishi.org/ 家の普通のPCに繋げてるんで絶対いたずらしないでください。
ログはスマンが取らせていただきます。
HTML文法が無茶苦茶なのでIE6限定です。
私が私用に使うときはサーバー切ります。
本格始動は1月下旬ですけどね。
97 :
名無しさん@英語勉強中:04/12/25 22:46:43
オントロジーの設計は、初めにきちんとやらないと、
大問題になる。
98 :
英一郎:04/12/25 22:58:02
データフォーマットはまた後で公開します。
これはとりあえず本気だということを示すのと、
初めてのサーバー構築のテストです。
( ´∀`)はじめの一歩
作りたい辞書のイメージがよくわからないんだけど
英和辞書にこだわるのってなんなんだろう。
とりあえず、BasicEnglishとVOAの基本単語をまとめたPDICは例文付きで
作ったものがあるけどね。
でもちょっと目的が違うのかなぁ。
英語が使えるようになる為ってわけではないんだよねぇ。
最近は写真とか絵とかをリンクさせる方法を考えてるんだけどね。
素材は集まって来てるから。
北大の単語リストとかレベルわけに便利だと思うけど、基本1万語ぐらいだったかなぁ。
ちょっと長くなりました。すみませんです。
『月刊言語』2003年5月号
「辞書を作ろう――編者とユーザーの急接近」
読んだ?
>>55 >1:ネットワーク型単語データベース
> 上位語:「ネコ」の上位語は「哺乳類」、「肉食動物」、「動物」...
> 下位語:「鉛筆の」下位語は「色鉛筆」、「赤青鉛筆」...
> 等意語:「間違い」の等意語は「ミス」
何やら生成文法的な発想と似てる気が・・・
>>89のような方法を取るにしても、
こういう分野にまで手を出してしまうと収拾が付かなくなりそうな予感。
参考までに、意味の繋がり(類義語)を表す面白い試みとして、こんなのを見つけました↓
http://www.visualthesaurus.com/ >2:意味データベース
>単語とその意味を連結したもの
>時計:時刻を表示したり測定したりする機械
特に英英を使いこなせないレベルの人には、
こういう説明的な英和があったら役に立ちそう。
103 :
英一郎:04/12/26 18:28:26
終わらぬストレスと追い討ちをかける不眠症で気ー狂いそ。
これで学位もらっても職なしだもんなぁ…
よのなかだいきらい。
この悶々としただーくなぱわーでこのプロジェクトは動いてたりします。
>>101 辞書を作ろうの特集ページは全て読みました。
スゲー勉強になりました。
ぼんやりと思い描いていた輪郭に実線が引かれた感じッス。
著作権についても結構都合よいことが書かれていてほっとしました。
>>102 単語のネットワーク機構についてはまず間違いなく収集がつかなくなるでしょう。
でもそれは人間から見たらの話でプログラム的には問題ないと考えています。
もちろん如何にルールと管理を組むかが問題なんですけどね。
無作為にリンクの張られたwwwも検索サーチエンジンがあれば目的のものにたどり着けるのと同じ理屈です。
Yahoo!的な管理じゃ無理だと思いますが、googleみたいな管理ができたらと思ってます。
抽象的でスミマセン。
またフォーマット仕様を後日変更します。
いつもの時間は眠れないので今日はもう寝るよ。
>>98 > これはとりあえず本気だということを示すのと、
ある程度ちゃんとしたものを作ってからにしたら?
現時点での本気度を示されてもねぇ。
単語帳iアプリとか作ってたときに辞書を作るのが面倒だったから、
何にでも使えるフリーの辞書があればいいとは思うけど、これじゃ叩きようがない。
俺みたいな無精者でも2000語程度の辞書は作ったし、
わからない単語・熟語は定期的にエクセルにまとめてる。
1も「辞書を作る」なんてぶち上げているんだから、自前の単語帳データぐらい持ってるだろ?
まず、それで「辞書」と呼べるものを作ってからにしなよ。
106 :
名無しさん@英語勉強中:04/12/27 20:26:28
英一郎氏は 趣味 でやっているのです
すばらしい趣味をお持ちですね。
108 :
名無しさん@英語勉強中:04/12/27 22:22:59
オントロジーの部分は、話題のセマンティックWebのOWL
と関連している。セマンティックWebでは、いきなり<辞書>
を作るのではなく正しい<辞書>を作るための枠組みに何年も
かけている。特例の領域での辞書は、セマンティックWebの
グループが公開していくから、彼らが公開する資料を利用する
のが賢い選択かも。
<辞書>を自作するのであれば、RDF, OWLに従うべき。
>>108 そんなことをしなくてもCSVでいい。
アプリからも使いやすいし。
110 :
名無しさん@英語勉強中:04/12/27 23:37:38
>>92 >EDRは、9年以上の歳月と180億円を投じたが、
大きな問題点があった。
時間と金はあったが 技術が無かったと。
データベースソフトでは他分野ですごいの知っているが、
それと比べたら辞書データベースは 相当シンプルなんだけど。
やったな!課題が見つかったね!!
>>1の英語辞書はシソーラスのことだったのか。
英語辞書といえば英英・英和・和英・熟語・シソーラスなどなど…
>>106 独りでシコシコやってる分にはいちゃもん付ける気は無いけど
人を巻き込んだプロジェクトを進めたいのなら、もうちょっとしっかりしてくれということ。
>>112 いや、趣味を同じくする人がやっていこうというのでかまわん
と思うんだが。
高校入試程度の単語でもいいので、
とりあえず「辞書」と呼べるものを一度作ってみてください。
そうしたらどこをどうしたらいいのか、また、どうしたいのか、
具体的に浮かび上がってくると思います。
それと、
>●参照カウンタ
>何回その単語が参照されたか数えます。
>これは非常にマイナーな単語や使わない単語とよく使われる単語を区別するためです。
「よく使われる単語」の意味が良く分かりません。
「よく参照される」の意味ですか?
実際には使用頻度の高い冠詞や人称代名詞なども、辞書で参照される回数はかなり低いと思いますが、
これらも「マイナーな単語」として数えられることになるのですか?
>>114 1は、プログラムで使うことに重点を置いてるんだろうから、
出現頻度が参照頻度になるって考えてるんだろうな。
どうして、市販の紙の辞書から離れられないのかな。
まあ、そこにしか関心がないってことか。
結局のとこ、どういう場面での使用を想定した辞書なんですか?
他のプログラムに組み込んで使うのか、
英二郎みたいに紙の辞書と同じような感覚で使うものなのか、
それともその両方を目指してるのか?
117 :
名無しさん@英語勉強中:04/12/29 01:22:11
118 :
名無しさん@英語勉強中:04/12/29 01:46:20
>>115=
>>1 自分で洋書で使われる単語の出現回数調べろ。
もっとも実用レヴェルの辞書データが存在するからいらない気もするんだが...
それに達する前に既に方向性見失って頓挫しているこのプロジェクトの存在自体無意味。
考えもまとまらないうちにわざわざここに持ってくるな。
>>118 出現回数数えろ?w
馬鹿かこいつ。少しは時代についてこいよ。
ウザイから消えろ。
まー私は何にしたって、説明不足で意味不明といわれるんだが、
それでも理解できる人がいるのは確か。
なんと言われようが突き進みます。
理解できないんだか理解しようとしないのかは人それぞれだけど
プロジェクトの進行が理解できない人 105 112
今回作ろうとする辞書が理解できない人 108 116 118
辞書のフォーマットが理解できない人
がいる中で
それらを理解してさらに先へと導いてくれる人
101 102 111 115
理解しようと努力してくれている人
114
もいます。
分からんなら書き込むなとは言わないけど、もうちょっとがんばって考えてみてくれYO-
どんなことにも少なからずメリットはあるはずなんだから。
>>114 「よく使われる単語」の意味が良く分かりません。
パソコンでの使用を考えると、検索に使われた回数、例文に用いられた回数を数えることは簡単にできます。
またある単語を調べた際、意味が色々羅列されるわけですが、その中で自分の目的とする訳語というのは通常一つです。その訳語というのは全平均を取れば大体頻出訳語となります。
そういった、使いやすさを反映させるためのパラメータだと思ってください。
だからメジャーな単語で誰もが意味を知ってて検索にめったにかけられないような単語は逆にマイナー扱いを受ける可能性もありますが、それはそれで構わないと考えています。
ここで言うよく使われるとは”よく調べられる”ということなのですから。
もちろん、頭良すぎててめーの下らん辞書プロジェクトなんか腐っちまえという奴もいるんだろーけど。
できたらそういう人は、下らんで片付けないで、どういうところが下らないかを教えてくれたり、
こうしたらもっと面白くなるんじゃねーの?と助言を付加してくれると助かります。
122 :
名無しさん@英語勉強中:04/12/29 13:19:00
1950'sの著作権切れの辞書をそのまま使おうとするプロジェクトは、
どっかにあったと思ったが...
123 :
英一郎:04/12/29 14:12:57
>>108 今回作ろうとする辞書が理解できない人
>>108 ↑私が馬鹿でした…
ちゃんと確認しないで書いてしまった。ごめんなさい。
124 :
英一郎:04/12/29 14:47:02
125 :
名無しさん@英語勉強中:04/12/29 15:02:37
英語はいい 格段に世界が広がる
海外サイトへGO
プログラム云々の部分は知識がないから付いていけないけど、
これまで紙の辞書ではどんな試みがなされてきたかの文献ならあります。
当たり前ですけど英語辞書の部分が一番詳しいです。
特に「和英辞典」の項がいいかも。
参考になれば幸いですが・・・
竹林・千野・東(編)『世界の辞書』研究社 1992
前途多難ですが、いい辞書を作ってください。よい年を。
132 :
英一郎:04/12/30 12:56:08
>>126 図書館閉鎖ー 年明けにでも勉強させていただきます。
>>128-131 情報アリス
スポポポポポポーン!!!
。 。
。 。 。 。 ゚
。 。゚。゜。 ゚。 。
/ // / /
( Д ) Д)Д)) <EDR高すぎー
やっぱり色々考えると日本語をどのようにデータベース化しているかとか
EDRの不便な点や矛盾なんかがあったら参考にしたいと考えていたんですが、
とてもさわれそうなものじゃ無いっすね。うちの図書館にも置いてないみたいだし。
そんな一般人の触れられないところに置いておくようなものなのか?
アフォー!
EDRをデータ抽出に使おうとは思ってません、てかできたらいいけど権利的に無理でしょ。
単語収集はまだまだ先ッス。
>>127 おおおっサンクス
JIS X 4081を早速っと…1,890円かいな…
まぁ買えない金額じゃないけど不便じゃのぅ PDFなんかもろ公開されてんのになー
freePWINGがオープンソースなのは助かりました。読めるかどうか分かりませんが…
PDICの作者もこれ参考にしたのかな?
このフォーマットに下位互換が取れたらと思ってるので、一応知っておきたかったのです。
133 :
名無しさん@英語勉強中:04/12/30 22:26:02
>>132 >EDRの不便な点や矛盾なんかがあったら参考にしたいと考えていたんですが、
>とてもさわれそうなものじゃ無いっすね。うちの図書館にも置いてないみたいだし。
多くの大学では、サイト・ライセンスを購入しているから、
無料で使える。情報関係の教員に相談しなさい。
( ´∀`)やっとるね
>>1、これも入れろよ。
Methionylglutaminylarginyltyrosylglutamylserylleucylphenylalany-
lalanylglutaminylleucyllysylglutamylarginyllysylglutamylglycyla-
lanylphenylalanylvalylprolylphenylalanylvalylthreonylleucylglyc-
ylaspartylprolylglycylisoleucylglutamylglutaminylserylleucyllys-
ylisoleucylaspartylthreonylleucylisoleucylglutamylalanylglycyla-
lanylaspartylalanylleucylglutamylleucylglycylisoleucylprolylphe-
nylalanylserylaspartylprolylleucelalanylaspartylglycylprolylthr-
eonylisoleucylglutamiylasparaginylalanylthreonylleucylarginylal-
anylphenylalanylalanylalanylglycylvalylthreonylprolylalanylglut-
aminylcysteinylphenylalanylglutamylmethionylleucyalanylleucylis-
oleucylarginylglutaminyllysylhistidylprolylthreonylisoleucylpro-
lylisoleucylglycylleucylleucylmethionyltyrosylalanylasparaginyl-
leucylvalylphenylalanylasparaginyllysylglycylisoleucylaspartylg-
lutamylphenylalanyltyrosylalanylglutaminylcysteinylglutamyllysy-
lvalylglycylvalylaspartylserylvalylleucylvalylalanylaspartylval-
ylprolylvalylglutaminylglutamylserylalanylprolylphenylalanylarg-
inylglutaminylalanylalanylleucylarginylhistidylasparaginylvalyl-
alanylprolylisoleucylphenylalanylisoleucylcysteinylprolylprolyl-
aspartylalanylaspartylaspartylaspartylleucylleucylarginylglutam-
inylisoleucylalanylseryltyrosylglycylarginylglycyltyrosylthreon-
yltyrosylleucylleucylserylarginylalanylglycylvalylthreonylglycy-
laranylglutamylasparaginylarginylanylalanylleucylprolylleucylas-
paaginylhistidylleucylvalylalanyllysylleucyllysylglutamyltyrosy-
lasparaginylalanylalanylprolylprolylleucylglutaminylglycylpheny-
lalanylglycylisoleucylserylalanylprolylaspartylglutaminylvalyll-
ysylalanylalanylisoleucylaspartylalanylglycylalanylalanylglycyl-
alanylisoleucylserylglycylserylalanylisoleucylbalyllysylisoleuc-
ylisoleucylglutamylglutaminylhistidylasparaginylisoleucylglutam-
ylprolylglutamyllysylmethionylleucylalanylalanylleucyllysylvaly-
lphenylalanylvalylglutaminylprolylmethionyllysylalanylalanylthr-
eonylarginylserine
what??
HE
HE WANNA MAKE AN ENGLISH DICTIONARY, DOESNT HE?
140 :
名無しさん@英語勉強中:05/01/01 12:40:31
>>131 >JUMANが使ってるのはEDRの日本語辞書の方だよ。
いずれにしても、EDRを利用してフリーソフト(=juman)が公開
できるという先例があるので、サイトライセンスを取得している
大学でとりあえずEDRを利用して、<フリーソフト>を公開して
みては?
とりあえずまともじゃないことは確かだなw
自演乙。
w←これってムカつくな
143 :
英一郎:05/01/03 01:07:15
あけおめ(あけおめ)俗
あけましておめでとうございます。
意味:新年の挨拶、1月1日から4日までの間、人と会った際に一度目にのみ交わす挨拶。
ただし、昨年親族が亡くなった相手にはこの挨拶は行なってはいけない。
っていうかさぁ…正月2日になっても年賀状一通も来ないんですけど…
10通も出したのになぁー。郵便配達員に捨てられたことにしておこう。
>>135 それ、最長の英単語とかいうやつですね。
単語の登録は半角で256文字までにします。
理由は扱いやすいからです。全角にして128文字以上の単語なんて通常考えられないですし。
256文字以上にすると検索とかパソコンのパフォーマンスが悪くなるんです。
例外的なのは例外として扱うようにしますけど、まだまだそれ以前の状況ですからね…
>>140 EDRについても正月明けないと何もできないっす。
1月中旬に向けていよいよ忙しくなってきたので、しばらくは何も進展できません。
今年はまったりよろしくお願いします。
>>1へ。
プログラム板に言った方がいい。
このスレのログ読んでみたけど自己顕示欲の固まりの見当違いの痛いレスが大杉。
辞書とか言うからこういう変なのがふんぞり返って出てくるんじゃないの?
単語データベースって言えば?オブジェクト指向の単語データベースを設計したいんでしょ?
まあ、粗野なレスを物ともせずにぬっぽり突き進んで行くあなたのような人には好感が持てます。
専門外ですから特に何も出来ませんが陰ながら応援してますよ。
がんばってね。
たしかに ストレッサーが多いよな 笑
英和のテキストデータなら2種類持ってますが何か?
それがフリーで公開されているかということが一番このスレでは重要なのでは?
あるいは、辞書を作るという知的好奇心であるとか。
知的好奇心ならいいや。
でもそのうち1つはフリーなんだな。4万語しか入ってないけど。
149 :
英一郎:05/01/08 00:42:19
ちわー。
>>146 すばらしい辞書をお持ちで。
もし、協力していただけるのであれば、形あるものが出来上がった時にでも、データを公開していただけると助かります。
>>144 もともとプログラム・マ版には常駐してます・・・
プログラムの技術的なことはどちらかといいますと得意な方なので、
私にとっては辞書の仕様(作り方)の方が無知なわけです。
私の方は18日から本格的に動けそうです。
それまではとっても手も付けられない状況です。
TIME、Newsweek、washingtonpost、Reader's Digest、National Geographicを読め
よっぽど科学的な単語が必要ならry
1が逃亡してなくて一安心。
>>1さんへ
辞書を作成しようと考えていたらこのスレッドを発見しました。
とても参考になります。同時期に同じ事を考えていた人が居たと
いう事も、少し嬉しく思います。
私も辞書を作るといった点で知識が乏しく、苦労しています。
残念ながら、私は全てフリーでやっていく予定では無いのですが
成果物の一部はフリーにしようかと考えています。
もし成果があがれば、その成果物のフリーの部分は
こちらでデータを公開させていただくかもしれません。
このスレッドを作ってくれた1さんへ、お礼が言いたく書き込みしました。
ありがとう。そして、お互い頑張りましょう。
156 :
英一郎:05/01/12 23:21:47
ちわ。
誰かWordNetの辞書データの内容を日本語で解説できる人いますか?
ぱっと見たところプレーンテキストで
ID-単語-リンク-意味
の順で並んでるのですが、リンクのところの特殊文字が何を意味するのか知りたいっす。
だれもいなけりゃ自分で調べますが、誰か知ってたら教えて欲しいな…とおもっただけです。
>>154 本格始動まもうちょい先ですが、お互いがんばりましょ。
英語辞書=シソーラス?馬鹿か。
自分主導でやるプロジェクトにここを使うな。まずサイトでも立ち上げてから話しろ。
あいかわらず、無知な英語厨がわいてでますな。
159 :
名無しさん@英語勉強中:05/01/14 21:31:09
>>156 >誰かWordNetの辞書データの内容
XML版をダウンロードすれば、意味が分かるよ。
ちみたち英語辞書作る前にまず大学の英語関連の学科に逝きなさい。
161 :
英一郎:05/01/19 00:05:07
どかーん!
(⌒⌒⌒)
||
/ ̄ ̄ ̄ ̄ ̄\
| ・ U |
| |ι |つ
U||  ̄ ̄ ||
はじめるゾウ!
ちょっとまってねー
162 :
名無しさん@英語勉強中:05/01/19 17:13:03
164 :
英一郎:05/01/27 00:35:14
定期age
データベース仕様は大体完成
サーバーの構築に手間取ってます。
Windowsベースで構築してたんですが、いろいろ凝ったこと無料でしようとすると結構難しくて…
再配布まで考えるとライセンスフリーも重要なので
Apache + php + MySQLでいろいろ試行錯誤してます。
ぜーんぶ初挑戦だから入門書あさってますよ。
本代だけでも結構お金かかってるな…
あぼーん
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●合格●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
これを見た人は【合格】します。これをコピペでどこかに3回貼れば確実です。
これは本当です。やらないと一年無駄になります.
私も最初は嘘だと思ったんですが、東大、東工大院落ちたんで一応コピペしてみました。
そしたらJAISTに合格出来ました。
けどコピペしなかった友達は、A8割とっていたのに、おちたんです
( ヽ ―――― ○ ――――
, ⌒ヽ ( ) // | \
( ' ( ヽ⌒ヽ 、 / / | \
ゝ `ヽ( ) | (⌒ 、
( ⌒ ヽ ( ヽ がんばりーや
∧__,,∧ がんばってね ((( )))
____________________( ´・ω・) ______________________________ ( ´∀`) ____________________________
( つ(\ ( つ(\
(\_ノ(___)⌒ ⌒ヽ_ (\_ノ(___)⌒ ⌒ヽ_
) ____ ・_つ ) ____ ・_つ
(/ (/ (/ (/
。 ゚ 。 ゚
。 ゚ 。 ゚
〜〜〜〜 〜〜〜〜
〜〜 〜〜 〜〜 〜〜 〜〜 〜〜 〜〜 〜〜 〜 〜〜 〜
〜〜 〜〜 〜 〜〜 〜〜 〜 〜〜 〜〜 〜 〜〜
〜〜 〜〜 〜〜〜 〜〜 〜〜〜 〜〜 〜〜 〜 〜〜 〜〜
169 :
英一郎:05/02/07 03:29:36
∧∧
(=゚ω゚)ノ ぃょぅ
〜( x)
U U
もーちっとでプレリリースできそうです。
2、3月は暇なはずなのに、なぜか日曜まで狩り出されてます…
にしてもPHPって良いですな。MySQLもサイコー。
CSSもスゲーぇぇぇ。
ネットの進歩は凄まじいですな。
2週間みれば初披露まで漕ぎつけそうです。
>166
情報ありです。
この本は立ち読みしたような…でも買わなかったッス。
もういっぺん本屋いってきます。
>168
予想以上に遅い進行ですが、飽きないで (w
171 :
EX:05/02/13 16:35:28
なんかおもしろうそうな事やってますな〜
英語辞書を探してたら行きついたんでw
172 :
EX:05/02/13 16:37:17
JSPで作るの?
173 :
EX:05/02/13 16:38:57
ごめPHPって書いてあった(汗
174 :
名無しさん@英語勉強中:05/02/13 20:50:27
システムの開発は、それなりに面白いが、データ入力は、はっきり言って
肉体労働。ネットでボランティアを集めて、無料奉仕させるには、
何か工夫が必要だろう。
エイジロウは、1文字数銭で、単語入力者に金を支払っている。
大学研究機関は、科研費などで大学生に金を払っている。
名も無い個人が、ボランティアに無料奉仕させるのには、どう
すればよいか?! ここが最大のボトルネック。
175 :
EX:05/02/14 03:10:52
クライアントに広告を乗せて、
そのマージンで稼いだ金とかを充当するってのは。。。
それじゃぁ、後払いだし、幾ら入るかも分からないから駄目かなw
176 :
名無しさん@英語勉強中:05/02/14 13:54:38
170です。
>>174 まずはサイトを早く立ち上げる事です。
96で1さんが出してるURLを、テキストのみでも良いので
作ります。そこでオープンソースに興味のある方々へ
呼びかける事が第一歩だと思います。
>>1さんへ
96のURLへmailaddressの一つでも載せてください。
力不足ではありますが協力させていただきます。
(英語力が皆無なのでお力になれないかもしれません。。汗)
177 :
名無しさん@英語勉強中:05/02/14 23:35:07
青空文庫に辞書ってないね。
178 :
英一郎:05/02/15 02:59:42
ぐそぉぉ
この3連休が肝だったのに風引きました…
で4連休になったのですが、さすがに動けなくて休んだので、パソコンもできませんでした。
雪祭りでウイルスが持ち込まれたのかな…札幌は決まってこの時期、風邪がはやってる気がします。
何とか今週末には弄れるものを用意しますのでスミマセンです。
てか一人身は本当に病気になると辛い!!
>>174 まーたしかに、ボランタリーな人がどれだけいて、サイトに来てくれる人がどれだけいるか、
荒らしがどれだけの比率で現れるかも興味があります。これらは全て公開していく予定です。
179 :
英一郎:05/02/15 03:05:10
まだ、実装できてませんが、
入力作業は、
匿名とID有の両方で書き込み可能にするつもりです。
ID保有者は書き込み時にポイントが加算され、
ポイントの高い人間のした書き込みに対してポイントの低い人間は編集を行なえないようにします。
少しでも多くの書き込みをした人に対する優遇措置をすることで、書き込む楽しさを持ってもらえればと思ってます。
てか昨日はバレンタインデーだったのか。
ま、いっか。
180 :
名無しさん@英語勉強中:05/02/15 07:34:41
今週末に始動はちょっと難しいかな?
182 :
英一郎:05/02/22 23:19:35
http://wwwords.net でドメイン取得しました。
で、一応「名詞」の単語登録、検索が可能な状況ですが、
なにぶんPHP初挑戦だったため、ソースの書き方造自体に納得がいかず、もう一度作り直す予定です。
Wikiとか最初からみておくべきだったかも…
非常に素っ気無いつくりですが、見てもらいたい点は、
「日本人」で検索すると「にほんじん」「にっぽんじん」と複数の読みをサポートできる。
「森」…「場所の森」と「姓の森」で英語訳が異なるような単語のサブグループ化ができる。
属性はリンク形式なので、後から幾らでも追加ができる。「牛」で検索してみてください。
たとえば、英語の名詞には複数形の不規則変化型があるがこのような要素を後から追加できる。
日本語だと、数えるときの不規則数詞とか(魚->匹)とか。
等です。
適当に中学生レベルの英語名詞を入れてもヒットするかもしれません。
wikiみたいに誤謬ありまくりの低レベル辞書にならないことを祈りますが・・
正確性も大事だけど、レベルの高い辞書なら市販のものがいくらでもあるわけで。
とりあえず誰でも自由に利用できる辞書データが出来ることに意義があるので前向きにいきましょう。
といっても入力してくれる人が集まらないことにはどうにもならなそうだけど。
俺が思う事。
1、現代辞書は発音が音声で確認できなければあまり価値はない。
2.複数人で取り組むなら、エキスパートでなければいけない。主催者がエキスパートであることは言うまでもない。
3.上が満たされていなければ、フリー辞書なんて他にいくらでもあるのでやる意義が無いかと思う。
批判ではなくて、他のフリー辞書を見て感じたことです。
188 :
名無しさん@英語勉強中:05/03/14 16:54:45
>>187 フリーの辞書ってそんなにある?
いくつか紹介してくれないかな?
名詞はともかく、動詞とか形容詞とかは日本語と英語は感覚が違うから
適切な表現を与えるためには例文をいくつか載せる必要もあるね。
例文が無ければ語学学習には役に立たない。。というか訳すのは無理だからね。
>>184 仏語辞典とか西語辞典とか、まだまだ電子版が高いものならいざ知らず、
英語の場合、英和・和英付で2千円切ってたり、オンラインなら優れた辞書がすでに複数ある。
正確でないなら誰も使わんだろう。
>>190 プログラマじゃないとこの辺イメージできないのかもしれないけど、
「再利用・再配布可能なデータかそうでないか」
ってのがこのスレでは一番重要なんだよ。
英辞郎二号を作ろうと言う話とはちっと違うと思うよ。
192 :
名無しさん@英語勉強中:05/03/17 17:36:22
>186
意味がない、というが、こういう場で辞書を作ろうと試みる事自体
には意味があると思う。著作権フリーである、という目的を掲げて
いる事も意味がある。
肝心の英一郎氏が最近書き込んでいないけどどんな感じなんだろ
194 :
名無しさん@英語勉強中:05/03/18 20:40:01
データがあれば、アプリケーションの作り方次第で、オンラインにもオフラインにも
出来ます。
196 :
名無しさん@英語勉強中:2005/03/29(火) 19:11:25
___
_/ \ \_
((/___))___\))
| |!!! !!!| | |!!! !!! !!!| |
| |;;;; ;;;;| | |;;;; ;;;; ;;;;| |
| |;;;; ;;;;| | |;;;; ;;;; ;;;;| |
Λロ二二ロ二Λ二Λ二Λ二Λ二二二二Λ二Λ二Λ二Λ二l
(^×^∩ ∩(´∀` ) (・∀・ ) ∩(ΦλΦ )(ー人ー )
┌〔〔 〔〔V) ヽ〔〔 〔〔 つ〔〔 〔〔 つ ヽ〔〔Э〔〔 つ〔〔 〔〔 つ GO!
(_ノ〈 ||_| (_ノ〈 ||_|(_ノ〈 ||_| (_ノ〈 ||_|(_ノ〈 ||_|
(__) (__) (__) (__) (__)
著作権フリーって、GPLの方向?
それとも修正BSDぐらいかパブリックドメインてこと?
皆で必死こいて作った辞書を持ってかれて
ほんのちょっと機能を追加して製品にされたらたまらんよね。
かといって・・・うーん。
>197
フリーで公開してれば買う人いないんじゃね?お金を出すだけの付加価値(機能)だったら売れるかもしれんけど。
又は作った辞書データを便利に使えるツールを1500円〜2000円位でダウンロード販売だったら売れるかもだし。
それはそれで盛り上がっていいんじゃないかなー。
>198
付加価値が高い場合が往々にしてある。
こちらの辞書が50の分野(or特徴)で傑出していて、
他さまざまなソフトが100ずつの分野(or特徴)で傑出していたとする。
他ソフトはこちらの内容も含めて150の価値を出せる。
対して、こちらは50を100にしようと、200にしようと
いつまでたっても辞書としての優位性は得られ無い。
辞書としてさして優位性が無い(フリーである、という点だけ)のに
加えてこれでは、辞書編纂に加わる人のモチベーションは保てるか?
「この辞書を盛り上げていこう」という機運を高めるためには
これじゃあ駄目だよね。
>199
そう?他の辞書の一部としてでも役に立って世の中に貢献するんだったら、フリーの辞書としての意味(の一部でも)を全うしてると思うけどなぁ。
そもそもが金儲けとかが目的なわけじゃないし。
やはりデータ作成は厳しいだろうな。。一生の仕事になるんでは?
データベース部の作成だよね、ここの辞書作成というのは。
データくれ
*データベースのソフト
なんかタイムスリップしているようだ・・
204 :
sage:2005/04/12(火) 15:10:25
断念!
205 :
名無しさん@英語勉強中:2005/04/24(日) 11:25:26
残念!
206 :
名無しさん@英語勉強中:2005/04/25(月) 21:57:45
再開!
207 :
名無しさん@英語勉強中:2005/04/26(火) 02:12:24
ソフトウェアのほうで、発音記号、カタカナ読み、定義、定義の訳、訳例、例文、例文の訳
などの表示の有無や文字色や大きさを使用者がカスタム出来るようにして欲しいです
あとデータベースの仕様を決定したあとですが例文などに書かれている英単語をリンクさせる事は可能でしょうか?
将来AIの言語学習ソフトになるかもしれないというのは夢のある話ですね
応援しています
健康には十分気を付けてほどほどに頑張って下さい
ルールが多いと入力が面倒になるだけだよ
英辞郎とかPDIC形式ぐらいでいいとおもうぞ
それか単語列と意味列だけのCSV形式。
210 :
名無しさん@英語勉強中:2005/06/14(火) 08:13:13
アップまだー?
211 :
名無しさん@英語勉強中:2005/06/14(火) 09:01:41
言うは易し行うは難し
212 :
名無しさん@英語勉強中:2005/06/14(火) 15:29:52
ライセンスはちゃんとGPLかCreativeCommonなんだよな?
214 :
名無しさん@英語勉強中:2005/06/21(火) 12:22:24
進行状況を教えてくれ。
煽るだけで協力もしない人はいらないよ
216 :
名無しさん@英語勉強中:2005/07/20(水) 12:56:45
217 :
名無しさん@英語勉強中:2005/07/20(水) 13:53:53
初めて見たけど、面白い試みだね。
ただ、1の考えていることがデータベースの構築か辞書データか
もひとつはっきりしないな。
俺はPSSの問題集作るために、LDOCEをアクセスのデータベースに
変換して使っているので、その手の辞書データの有用性はよくわかる。
また、単語同士のリンクや頻度データなんかをDBでいぢくりまわすのも
これまた面白いだろう。辞書データを作成といっても栄二郎の2番煎じ
なんで、まずは単語DBとして面白いものをフリーのPDIC辞書とか
利用して作成したらどうかな。
218 :
名無しさん@英語勉強中:2005/07/20(水) 19:30:42
>>217 >まずは単語DBとして面白いものをフリーのPDIC辞書とか
>利用して作成したらどうかな
誰が作成するの?
219 :
217:2005/07/20(水) 22:59:42
もちろん1が。
なんかつくりかけてたやん?
220 :
217:2005/07/20(水) 23:04:53
なんか単語を入力したら、
語義だけでなくコロケーションとか関連情報とかが
面白く抽出されて出てくるようなDBだったら、
これまでにない魅力があるし、
辞書データ編纂に協力する人も出てくるんじゃない?
しかし、テキストを食わせて、そういう単語の関連性を抽出する
ソフトの方が先かもな。
5ヶ月も英一郎の書き込みねーじゃねえか
のたれ死んだか、遁走したかのどっちかだろう
222 :
名無しさん@英語勉強中:2005/08/17(水) 03:37:25
ノ
223 :
◆wMzNGLjdrw :2005/08/23(火) 16:25:14
PSS の話題が出ていたので来てみました.
なにやら面白そうなプロジェクトですね.1 さんが最近活動されていないのが
実に残念です.
語学学習ソフトの作者として,本プロジェクトの有意性には同意できます.
辞書についてはずぶの素人ですができることがあれば協力したいのですが.
224 :
名無しさん@英語勉強中:2005/08/28(日) 18:49:20
>>211 >言うは易し行うは難し
言うは易し行うは難し
225 :
名無しさん@英語勉強中:2005/09/01(木) 21:21:59
>>224 >>言うは易し行うは難し
>言うは易し行うは難し
言うは易し行うは難し
日本語ムズすw
227 :
名無しさん@英語勉強中:2005/09/09(金) 11:02:26
ウィクショナリー
#GFDLに注意
終了
228 :
名無しさん@英語勉強中:2005/09/10(土) 01:15:32
>>3 がいいこと言った。
っつーか、どんなにマイナーな単語でもちゃんとした例文が載ってる辞書
マジでほしい…。つーか、既存の辞書に例文つけてくれただけで俺は買う
229 :
名無しさん@英語勉強中:2005/09/10(土) 01:35:38
>>228 辞書である必要はなく、みんな検索エンジンはあるんだから、結局は、
膨大なコーパスがあればいいんだよな。ぐぐって出てくるのがかなら
ずしも、正しい英語とはかぎらん状況だと、マトモっていうコーパスが
どっさりあれば、あとは、検索で、必要な文章がでてくれば、前後の
文脈から、例文としては使いやすいものになるのではないか、と思う
がいかがかな。
230 :
名無しさん@英語勉強中:2005/09/10(土) 01:50:28
そう、コーパスがいい。
日本人はコロケーションに弱い(論理的にはありえても絶対に使わない英文を作り上げる)から。
ただしそうなると、著作権の問題山積。
231 :
名無しさん@英語勉強中:2005/09/10(土) 02:19:44
>>230 そうなんだよなー。それをクリアしようとすると、古い英文ばっか。
もっとも、WEBで、というなら、リンク集みたいな感じで、比較的
内容が固定していて、良い英文でかかれているサイトのリンク集をつくり、
ついでに、そのリンク集の中に検索ができるようなエンジンがあれば
単語一発で、優良な文章がざくざく出てくるようなシステムがつくれ
るのではないだろうか?
232 :
名無しさん@英語勉強中:2005/09/10(土) 12:16:30
文単位で、英文と日本語訳が対になった英日対訳コーパス
(2億語)があると便利。意味がわからない英文があれば、
コーパスを英語から検索して、対訳を確認することができる。
英語を書く時に、英和辞書で見つからない表現を、コーパスを
日本語から検索、して、英語を確認できる。
辞書そのものを作るよりもweb上から正しい英語を探し出してくるシステム考える方がうまくいくかもね。
webで手に入って古くなくて著作権に問題ない正しい英文。
なんか思い付く?
234 :
名無しさん@そうだ選挙に行こう:2005/09/10(土) 22:04:49
WordNet
>>234 嘘言わないの・・・
信じる馬鹿がいたらどうするんだろう・・・
コーパス、コーパスってお題目みたいに叫んでるけど、
みんなコーパスって何のことを言ってるの?
ここで語られているコーパスの定義をお聞かせ願いたい。
NHKのコーパス君の活躍?でコーパスとはありもしない魔法のリソースかなんかだという
勘違いが広まっているのではないのかと、コーパス言語学をかじったことのある俺は憂う。
>>236 NHKのもコーパスといっていいのでは?
何をこだわってるか知らんが
荒らすのやめないか?
>>237 どうでもいいが、236のどこが荒らしなんだ?
>>238 痛いところを突かれたり、自分に答えられない質問されると嵐だといってごまかす厨房の典型だよ。
240 :
名無しさん@英語勉強中:2005/09/19(月) 08:42:56
>236
俺は、単純に出る順と思ってるけど?
より正しい定義があるなら、教えて
出る順がダメな理由がわからない
他に有効なものはあるだろうけど
何もしないよりはコーパス使ってのほうがいいとおもうんだけど・・・
>>241 微妙に違わないか?
単に、データの集まりを、単語ごとにどれだけ使われているか?
とか、どういう文脈で使われているか?とか、どの意味で使われているか?
な研究に使う奴。
いや、之も微妙にちがうなぁ。
コーパス
出典: フリー百科事典『ウィキペディア(Wikipedia)』
コーパス(corpus; 「身体」を意味するラテン語に由来)とは、電子化された自然言語の文章から成る巨大なテキストデータである。 言語学や自然言語処理などの研究に使うため、言語的な情報(品詞、統語構造など)が付与されていることが多い。
な意味らしいが、
243 :
名無しさん@英語勉強中:2005/09/23(金) 20:57:23
和英だったら、フリーな辞書作る意味も大いにあると思うんだが。
英辞郎の和英はあんまり使えないし、実質まともなフリー辞書は存在しない状況だと言っていいと思う。
英和だと、よっぽどいいものか、従来の辞書の概念を変えるような方向性の違いを打ち出さない限り、英辞郎に負けるんじゃない?
再配布をフリーにすることが主な目的なら別だが。
>>243 君の発言もただ英辞郎の和英をおとしめたいだけにしか見えないぞ
ただ使えないというんじゃなくて理由を書いた方がいいですよ
246 :
名無しさん@英語勉強中:2005/10/15(土) 00:37:57
質問: 「祝 英辞郎」のスレは、どこへ
消えた?
248 :
名無しさん@英語勉強中:2005/12/04(日) 12:18:41
さがせませんでした。教えてください。
消えた理由も。
249 :
246:2005/12/11(日) 17:15:42
248は私ではありません
250 :
名無しさん@英語勉強中:2006/01/24(火) 01:06:38
早く教えてください
251 :
名無しさん@英語勉強中:2006/01/24(火) 16:39:48
英一郎は今なにやってるの
252 :
名無しさん@英語勉強中:2006/02/12(日) 09:48:05
http://www.alc.co.jp/から 検索文字列 : 有言不実行
該当件数 : 4
有言不実行
credibility gap
有言不実行である
be all gong and no dinner // be all mouth and trousers〈英話〉 // be all talk and no action
有言不実行の人は何も生み出さない。
A person of words and not of deeds is like a garden full of weeds.
254 :
名無しさん@英語勉強中:2006/03/12(日) 22:25:02
255 :
名無しさん@英語勉強中:2006/03/12(日) 22:26:07
関係ないけれど、日本語の話をすると、
院は卒業とはいわん。修了という。院生が学位取らずに院から去るのは、
「退学」だ。必要単位そろえて「退学」した場合は、その後の努力で、
修了することもできる。この場合は「単位取得退学」という。
これは日本語の話な。
オレも、MBAじゃないけれど、工学博士をとったときは、3年院生やって
単位取得退学して、その後、学位取得で「修了」となった。
まあ、Aちゃんでもどこでもそうだろうが、
256 :
名無しさん@英語勉強中:2006/03/12(日) 22:26:34
カーネギーメロン大学だかにあったような・・・<フリーな辞書
257 :
名無しさん@英語勉強中:2006/04/22(土) 15:02:28
ハゲ
258 :
名無しさん@英語勉強中:2006/05/06(土) 17:41:41
もげ
259 :
名無しさん@英語勉強中:2006/05/14(日) 19:41:31
ブッ
260 :
名無しさん@英語勉強中:2006/05/19(金) 23:36:35
まだ?
261 :
名無しさん@英語勉強中:2006/06/20(火) 19:44:53
262 :
名無しさん@英語勉強中:2006/07/31(月) 23:04:30
age
263 :
名無しさん@英語勉強中:2006/09/09(土) 00:11:11
h ayaku
264 :
名無しさん@英語勉強中:2006/09/09(土) 10:52:08
やる気あるの?
265 :
名無しさん@英語勉強中:2006/09/24(日) 21:16:56
諦めたのかな?
266 :
名無しさん@英語勉強中:2006/10/25(水) 23:38:54
嘘つき?!
267 :
名無しさん@英語勉強中:2006/10/27(金) 03:19:12
Do we still look forward to his acheevements?
268 :
名無しさん@英語勉強中:2006/10/27(金) 19:54:41
責任者を出せ!
269 :
名無しさん@英語勉強中:2006/11/19(日) 13:29:52
いいかげんにしろ!
レンタルのwikiでよければ容量無制限のところがあるから借りてくれば?
271 :
名無しさん@英語勉強中:2006/11/26(日) 12:24:44
有言不実行は誰にでもあること。許してやれば?
272 :
名無しさん@英語勉強中:2007/01/08(月) 20:58:35
まだ続けてますか? URLは?
273 :
名無しさん@英語勉強中:2007/01/08(月) 21:43:13
面白そうなプロジェクトだと思って、
>>1から順に携帯でスレ読んじまった。
年、変わってんじゃねぇかっ!
274 :
名無しさん@英語勉強中:2007/01/30(火) 09:23:27
まだ、やってるか?
_ 、 -──¬‐-、
/ \
/ ヽ
/ ,----、 __ ヽ
! / `'''''''´ `ヽ i
| / } |
_⊥< ,,,,,,,,__ | !
/r\f‐┴─-<_ ≦二ヽ__レ'!
!ノ!. ヽ 厂二二┐ ̄r─‐-、 /⌒!
l ヽ !ヽ__//^ヽ!  ̄` ノ/iヽ / / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
\__! `ー--/! \ヽ--'/├'/ < スカっとせんヴォケ厨がオナっとるの〜。
| / L _ __)ヽ ̄ /‐' \_______________
,┤ i〈 、_____, 〉 /
/ ! ヽ\+┼┼+/ /
__/ ヽ `ー‐‐'´ /
, -‐''" i \ 人
-''~ | \`ー----‐'´! iヽ、
ヽ \ / i `ヽ、
\ 丶_/ | \
ヽ /O \ | \
276 :
名無しさん@英語勉強中:2007/01/31(水) 14:32:04
いまどういう状況か、説明する義務は
あるはず。自分でスレをたてたのだから。
277 :
名無しさん@英語勉強中:2007/04/07(土) 08:10:54
いつまで待たせるの?
278 :
虚構世界内存在 ◆vWilh8Qklc :2007/04/10(火) 12:18:26
279 :
名無しさん@英語勉強中:2007/04/25(水) 21:43:42
hogehoge
280 :
名無しさん@英語勉強中:2007/05/26(土) 12:10:20
Hi, how you doing?
281 :
名無しさん@英語勉強中:2007/05/30(水) 20:19:52
このスレ、機能停止?
英一郎さん、今ではwikiボランティアかな?
282 :
名無しさん@英語勉強中:2007/06/15(金) 11:06:58
むしろ俺らは、完全著作権フリーな日本語辞書を作るために、
著作権フリーなネイティヴ日本語文を大量に提供するのが
世界のためになるような気がしてきた。
そうでもないよ
世の中みてれば著作権=悪ではないよ
284 :
名無しさん@英語勉強中:2007/07/05(木) 22:56:49
どっこい。
285 :
名無しさん@英語勉強中:2007/07/14(土) 08:15:57
有言実行?
286 :
名無しさん@英語勉強中:2007/07/27(金) 20:59:54
いつまで待たせるの?
英一郎は逃げました?
288 :
名無しさん@英語勉強中:2007/08/22(水) 08:21:36
>>287 sageを500回書き込んでもsageることは不可能。
どうすれば、短期間にスレッドを削除できるのか?
このサーバーはアルクが管理しているのか?
289 :
名無しさん@英語勉強中:2007/09/16(日) 23:19:35
早くしろ!
英辞郎v107が届いたので要りません。
291 :
名無しさん@英語勉強中:2007/09/25(火) 23:15:54
俺のHDDにも、winnyでアップロードされていた。
ちょっと危ないけど、止められないな。
292 :
名無しさん@英語勉強中:2007/10/08(月) 19:53:23
嘘つきは泥棒の始まり。
293 :
名無しさん@英語勉強中:2007/10/26(金) 00:17:19
逃げたのか?
スレ開く前は「これは良スレ」
スレ開いた後「建て逃げかよ」
295 :
名無しさん@英語勉強中:2007/10/30(火) 07:31:42
協力したくても、サーバーまで止められたら
どうしようもない。
藁にもすがる思いでこのスレを開いた
下までスクロールした、絶望した!
297 :
名無しさん@英語勉強中:2007/11/16(金) 06:57:51
今、どこにいるのだ、こいつは?
298 :
名無しさん@英語勉強中:2007/11/17(土) 14:48:42
>どんな機能があったらプロジェクト立ち上げ時のしょぼい段階の辞書に協力する気になりますか?
とりあえず一人でやれるところまでやる!
というくらいの気合いが入ってる人にこそ、人は付いてくる。
299 :
名無しさん@英語勉強中:2007/11/17(土) 22:55:03
飽きっぽい人だな。
300 :
名無しさん@英語勉強中:2007/12/05(水) 20:45:18
いつまで待たせる?
英語学習を効率的にできるようなソフトを作ろうとしてるんだけど、
いざ、辞書のデータを利用しようと思って探したら
「再配布不可です」といったデータしか見つからなかった。
こんなとき、たしかに完全フリーのデータがあった方が助かるし
日本の英語教育についても、微弱ながらマシになるんじゃないかと思った。
(例えば、誰かがすごく効率的に英単語を覚えることができるゲームなんかを
開発できる可能性が高くなるのではないか、とか)
そんな思いでこのスレを開いたんだけど、
どうやら
>>1氏はいなくなったみたいですね。
提案開始から、もう4年以上も経ってるし・・・
もともとこのスレの意図と合っているかどうか分からないんだけど、
とりあえず、
【英単語】【意味1】【意味2】【意味3】【意味4】【意味5】
といった感じで登録をしていくだけの機能を持ったものを作ろうかなとか
考えてるんだけど、作ったら強力してくれる人はどのぐらいいますか?
最初から高機能を想定すると、また企画倒れになる可能性が高いと思うので。
【意味】が複数あるのは、デリミッタを統一したいためね。10個ぐらい用意した方がいいかな。
他にも追加した方が良いカラムがあれば、追加するぐらいならすぐできるかなと。
あとから拡張するのは難しいと思うので、そこは最初に練った方がいいか…
あと、今パッと思いつく課題点は↓このへんかな。
・荒らし対策をどうするか
(登録処理がログイン必要だのなんだのあまり面倒だと、登録してくれる人自体が少なそう)
・重複登録は、チェックして不可にしようかな
・辞書を作ってる会社から訴えられたりしないかな
あと、俺もポシャったらゴメンなさい。
302 :
名無しさん@英語勉強中:2008/01/12(土) 22:22:56
>>301 それ作ってどうすんの?何の役に立つの?
303 :
名無しさん@英語勉強中:2008/01/28(月) 08:13:34
この分だと、あまり反応は無さそうだな。。。
ここじゃなくてソフト作るほうの板が盛り上がるんじゃね
306 :
名無しさん@英語勉強中:2008/03/01(土) 23:48:35
はげ
あれ、はげてる人がいるってことは
まだ見てる人がいるのか。
結局、ソフト板で提起しようにも
ソフト的にも技術的にも話題にできるものでも無いし、
仮にシステムを作っても、投稿してもらった内容が他からの転載で無い
という事を判断する仕組みを作るのって、現実として不可能だよなあ〜
なんて、ここんところ考えてたとこでした。 今はそんなステータス。
308 :
名無しさん@英語勉強中:2008/03/15(土) 08:00:34
ぼけ
309 :
名無しさん@英語勉強中:2008/03/18(火) 15:34:50
2006/7/6に、由緒あるMerriam-Webster英語辞典が改版され、
2006年秋版「Merriam-Webste's Collegiate Dictionary, Eleventh Edition」に次のような新語が掲載された。
avian influenza(鳥類インフルエンザ:名詞):変異性が高く症状にも大きな幅のある鳥のインフルエンザで、
インフルエンザAウイルスによって引き起こされ、突然変異を起こしてほかの脊椎動物に伝染し、「bird flu(鳥インフルエンザ)」とも呼ばれる。
biodiesel(バイオディーゼル:名詞):ディーゼル燃料に近く、(大豆油などの)植物油から抽出される。
manga(マンガ:名詞):日本のコミックブックあるいは劇画。
mouse potato(マウスポテト:名詞)俗語:多くの時間をコンピュータに費やす人。
ringtone(着メロ:名詞):着信を知らせるために携帯電話が流す音楽。
spyware(スパイウェア:名詞):ユーザーの知らない間にコンピュータにインストールされたソフトウェアで、
そのユーザーがコンピュータで行った操作の情報をインターネット経由で送信する。
text messaging(テキストメッセージング:名詞):主に携帯電話を使って短いテキストメッセージを電子的に送ること。
wave pool(波のプール:名詞):波を発生させる装置の付いた大型のプール。
google(ググる:他動詞):Googleの検索エンジンを使って(人が)World Wide Webから情報を入手すること。
Lhasaが「圧縮」や「圧政」の意味で登録される日も近い。
310 :
名無しさん@英語勉強中:2008/03/31(月) 07:55:38
9 名前: 名無しさん@八周年 Mail: sage 投稿日: 2008/03/28(金) 02:20:46 ID: Ec60gJ6Z0
225 :名無し物書き@推敲中? :2008/02/27(水) 23:25:18
部落民になりたい若者が急増
奈良市環境清美部収集課の男性職員(42)(懲戒免職)が病気を
理由に5年間で8日しか出勤していなかった問題が明るみに出たことで
部落解放同盟には「部落解放同盟に入って部落民になりたい」
という若者からの問い合わせが殺到しているようだ。
これについて部落解放同盟の幹部は「部落民というのは希望してなれる
ものではなく、先祖から受け継いだものだ。」と回答しているが、
若者からは「先祖が部落民でないからといって部落民になれないのはおかしい。
部落解放同盟は希望者が全員部落民になれるような社会制度を目指すべき。
不当な差別は即刻やめるべき。」として、希望を受け入れない幹部に反発している模様である。
311 :
名無しさん@英語勉強中:2008/04/12(土) 12:40:08
pppp
ejdic でいいんでない?
313 :
名無しさん@英語勉強中:2008/04/28(月) 13:41:52
本当に「自由な(フリーは無料という意味で取られすぎ)」の
辞書を作るなら、プロジェクト参加者の個々と契約ないしは
ライセンスで、他者に対して自由にデータを利用して良い
ことを明示しておかないと、安心して2次利用できないだろうなあ。
また編集権などのこともあるので、語句を入れ換えたりしても
編集権の主張も他者に自由にさせることを明示しておくのがいい
だろう。まずは、どっかで法律相談して足もとかためるのが良いんじゃね?
って、著作権法に詳しい法曹界の人が身近いるかどうかは知らないけど
野望に踏み出す前に
ベストプラクティスをまとめるだけでもいいんじゃないでしょうか。
2chでやるべきかどうかは解らんけど。
GPLにすりゃいいさ
315 :
313:2008/04/28(月) 14:32:46
中身を理解して、得失点を考えて GPL にするならそれは
それでいいんじゃないでしょうか。GDPL ってのもあるが。
どういうライセンシング政策をするかは、辞書が栄えるか
どうかの将来を決めるしね。
# そのまえに、まずはプロジェクトの勢いってのもあるが
Creative commons や、dual license なども考えにいれも
良いんじゃないでしょうか。
316 :
名無しさん@英語勉強中:2008/04/28(月) 17:41:21
辞書や単語帳の例文の著作権ってどうなってるんだろうね?
極端な例としてappleの項で「How many apples do you want?」という例文があって
「How many apples does Mary want?」と変えて載せたらどうなるんだろ?
または市販の単語帳の例文をかたっぱしから部分改変で例文盗んで新たに個人で単語帳を完成させて売り出したらどうなるんだろ?
誰か著作権について詳しい人いる?
とりあえずDB使えるサーバだけは1月に用意して
そのまんま放置なんだけど、著作権はメンドそうですね。
サーバもったいないから何か始めろよw
319 :
名無しさん@英語勉強中:2008/05/24(土) 11:31:51
面白そうなのに誰もいないorz
まあそれほど需要が無いってことか・・・(´・ω・`)ションボリ
で、英語だけ?
英語板ですから
はい終了
そろそろ再会いたしますか
325 :
名無しさん@英語勉強中:2008/05/28(水) 00:12:48
326 :
名無しさん@英語勉強中:2008/06/06(金) 17:20:23
あげ。
wiktionaryライクな英語辞書をやろうとしてるってことでいいのかな?
327 :
名無しさん@英語勉強中:2008/06/07(土) 17:30:44
9 名前: 名無しさん@八周年 Mail: sage 投稿日: 2008/03/28(金) 02:20:46 ID: Ec60gJ6Z0
225 :名無し物書き@推敲中? :2008/02/27(水) 23:25:18
部落民になりたい若者が急増
奈良市環境清美部収集課の男性職員(42)(懲戒免職)が病気を
理由に5年間で8日しか出勤していなかった問題が明るみに出たことで
部落解放同盟には「部落解放同盟に入って部落民になりたい」
という若者からの問い合わせが殺到しているようだ。
これについて部落解放同盟の幹部は「部落民というのは希望してなれる
ものではなく、先祖から受け継いだものだ。」と回答しているが、
若者からは「先祖が部落民でないからといって部落民になれないのはおかしい。
部落解放同盟は希望者が全員部落民になれるような社会制度を目指すべき。
不当な差別は即刻やめるべき。」として、希望を受け入れない幹部に反発している模様である。
途中だけど次スレ立てる?
330 :
名無しさん@英語勉強中:2008/07/21(月) 10:09:09
いつまで待たせる?!
くーれー、くーれー、たこらー♪
332 :
名無しさん@英語勉強中:2008/08/21(木) 19:00:00
なぜか1にスルーされてた気がするけど、
>>84の手法って駄目なの?
これをコアにして、wikipedia辺りから例文とか引っ張ってくればいいような気がするけど。
すっかり温度感が下がってしまったが・・・
んーと、要は2種類の辞書データの
見出し語・意味を比較して
2書で同じだったら著作権無しと見なして、自由に利用できる。
っていう認識でエエのかな?(間違ってたら指摘して)
そのデータ比較処理自体はできそうだけど
(たぶんperlじゃなくてJavaでやるけど)
データを入手してくるのが・・・
どっかに「再配布不可だけど無料」辞書データがあった気がするな。
探してみるか。。。
334 :
名無しさん@英語勉強中:2008/08/22(金) 21:31:30
本人じゃないからわからないけど、私もそう解釈した。
ただ、隠れた著者が共通だったり何らかの協定があってクロスライセンス的に
同じユニーク表現を使用してる可能性もなくはないかも。
まあ、検索だって全部が全部グーグル検索って事はなくて独自エンジンの所もある訳だし、
同一ソース使ってれば傾向ですぐバレるだろうから、そんなに問題にはならないような気もする。
無料で手に入る英和は数万語レベルのが数種類あるね。皆結構違う。
って違ったら抽出できないけど(w
著作権切れの古い辞書スキャンしてってのはありそうなのに何故か無いんだよな。
なんでだろ?
335 :
名無しさん@英語勉強中:2008/08/24(日) 06:44:49
古いからでは?
336 :
名無しさん@英語勉強中:2008/08/24(日) 06:53:23
古い文章訳すんならそれでよくね?
337 :
名無しさん@英語勉強中:2008/08/24(日) 07:03:15
英辞郎って完全網羅してるのかと思ったら、例文中にしかないような単語もあるのな
>>337 >例文中にしかないような単語もあるのな
詳しく教えていただけますか?
339 :
名無しさん@英語勉強中:2008/08/31(日) 16:46:43
ウィキショナリー日本版のダンプからタイトルと訳語抜き出せばちょっとした和英になりそう。
っていうかそもそもWikiWikiシステムと辞書形式データを相互変換するツールってないのかな?
340 :
としお:2008/09/07(日) 22:48:36
教えてください。英辞郎のデータを単に利用して、アルクのような検索サイトを作るのは問題ないって事ですよね?
スレ主はもういなくなったのね?
343 :
名無しさん@英語勉強中:2008/10/17(金) 21:52:26
嘘つきは,何処へ逃げた?
いい案だと思ったのになぁ・・・
残念
>>346 手助け程度でいいなら喜んで手伝うけど、自分がメインでやっていくには自信がなさすぎる。
まあ、そんなに気張る事もないんじゃないか?
とりあえず、PDSの辞書はあるけど出自が不明で使いにくいとか、もっと大辞典が欲しいとか、
そんな話なんだっけ?
良いアイデアだと思ったのに… 応援sage
350 :
名無しさん@英語勉強中:2008/11/14(金) 20:25:59
嘘つきは切腹!
<<1プログラミングを載せてください
352 :
名無しさん@英語勉強中:2008/12/13(土) 08:42:22
1あてにしないでゲリラ的になんかやらないか?
どんなのが欲しいのん?
354 :
名無しさん@英語勉強中:2008/12/13(土) 21:44:11
355 :
金玉儿:2008/12/13(土) 21:52:06
>>1 辞書は自分の頭の中に作りなさい。単語のひとつも覚えなさい。
ソフトっていうよりは、辞書のデータを作ろうぜ
っていう話の流れだったのよね、当初は。CSVでもなんでも良いから。
もちろん、もう形態に拘る必要は無いけど。
2ch寄りよりは、一般(ネラーじゃなくカタギの人)向けの
プレーンなデータにしようと。
でも、2ch辞書というのも、確かに面白いかも知れない。
俺的には結局、著作権等の観点から
実現は難しいかなということで頓挫状態になってると考えてる。
どこまでが著作権法に触れるのか
(たとえば既存辞書の単語文と何文字まで同じなら
引っかかるとか、そういう基準?)
そもそも辞書データって作っても良いのか?
ぜんぜん気にせずに作っても良いものか?
弁理士の方、ここを見かけたらレスお願えします。
古い辞書でパブリックドメインになったものをもとにするのもいいかもな
358 :
名無しさん@英語勉強中:2008/12/14(日) 18:08:58
翻訳関係で著作権詳しい人とか居そうなものだけどねえ。
とりあえず門外漢の聞きかじりでちょっと言ってみる、間違ってたら言ってね。
著作権っていうのは表現されたものについての権利で、データの権利じゃない。
プログラムにも著作権はあるけど、あれはプログラミング言語上の記述の機械語翻訳物だから。
同じ事を言うのにも表現はいくらでもあるわけで、それは自分の言葉なので問題ない。
また、誰が作っても同じになるなら独自の表現とはいえないのでこれも問題ない。
辞書の場合は見出し語の選択で使いやすさが決まる訳で、その選択は独自の表現といえるかも?
単語やことわざ自体は、仮に昔の人が作ったものだったとしても、とっくに権利が切れてる。
新語や造語商標類に関してはどうなんだろ?まあ出典を解説する訳だから特に問題ないか。
訳に関しても単語は一緒、意訳には辞書特有の表現がありそう。
例文、元々の文を書いた人のもの。
どうしても外せないものについては引用として明示する手もあるだろうか?
その方が辞書としても信頼おけるかもしれないし。
たぶん、例文引用は引用の限度を越えているよ。
360 :
名無しさん@英語勉強中:2008/12/14(日) 18:42:41
例文ってなんかの文章の一節とかじゃないの?
それともあえて書き起こすの?
I don't think Keinan sense write English skits used in the program.
Some English native speaker write skits and Julia and Greg read out sentences,
so what does Keinan sense do? Is he only a preacher?
There'd be something that only proficient English teacher could do...
362 :
金玉儿:2008/12/16(火) 06:07:58
辞書はすでにいいものが五万とあるだろw
いまさら何をつくろうというのだw
いいことを教えてあげると、現代語から古語を引ける辞書はまだないから、頑張ってつくれば売れるぞw
363 :
名無しさん@英語勉強中:2008/12/16(火) 06:19:50
>>794 匿名なのに律儀に間違いを認めてる。
プチ感動してしまった。
364 :
名無しさん@英語勉強中:2008/12/17(水) 16:54:23
おまえこれ権利者に許可貰ってうpしてんの?違うやろ?タイーホされて周りから白い目で見られる前にやめるべきだよ
仕事してるのであれば尚更。前科有りってどうよ?
ここまでGFDLという単語が一回しか出てきてないのに驚くヨ
なぜプログラム業界(主に米)のオープンソース運動のすったもんだを
参考にしないのかと小一時間(ry
366 :
名無しさん@英語勉強中:2009/01/23(金) 22:17:19
いや、小一時間述べてくれた方がいいんじゃないか?
っていうか1は逃亡してるっぽいからどうぞ引っ張ってきて存分に問い詰めてちょ。
とりあえずGFDLなwikiデータを加工処理して使える辞書に仕立てるのは興味あるな。
369 :
名無しさん@英語勉強中:2009/02/02(月) 01:52:13
>>365 何でGFDL?
クリエイティブコモンズで良いじゃん。
371 :
名無しさん@英語勉強中:2009/04/25(土) 19:15:48
wikipedia系が流用できるからでしょ?
370がクリエイティブコモンズで作るなら応援するよ。
372 :
名無しさん@英語勉強中:2009/04/25(土) 19:21:43
その中で一人プロの人がいた。
すぐオラに合図送ってきたよ。
>>371 それならwiktionaryで良いじゃん…
374 :
名無しさん@英語勉強中:2009/04/25(土) 19:44:13
金髪ねーちゃん心配してたんじゃない?
オラどうみてもアジアンだし(笑)
>>376 一応、wikipediaを電子ブック形式に変換するスクリプトはあるみたいだけど、
まあ
>>339みたいに適当に抜き出しても結構テキスト辞書っぽいのはできるよ。
ウィキショナリーちょっと単語少ないけどね、最近増えてなければ単語帳レベルかなあ?
むしろ、用例とかを自由に引っ張ってこれるコーパスとしての量が魅力だと思う。
あれ?確認したら結構あるなあ?
英語以外の単語絞れてないからよくわからないけど。
379 :
名無しさん@英語勉強中:2009/11/22(日) 02:34:33
380 :
名無しさん@英語勉強中:2010/03/06(土) 21:42:42
おい、逃げたのか?!
381 :
名無しさん@英語勉強中:2010/03/25(木) 22:25:42
382 :
名無しさん@英語勉強中:2010/03/26(金) 11:24:23
bondさんがこれに関わっていたのか...