WXG存亡の危機

このエントリーをはてなブックマークに追加
952名無しさん@お腹いっぱい。:02/05/15 11:19 ID:???
>>187
DOSの頃から顔辞書がついてるのはWXだけっての、理由があるんで
すよ。

 フリー(その当時はPDS(パブリック・ドメイン・ソフトって言ってた)で
WXP出していて、開発の方がパソコン通信でユーザーと交流してたわ
けだけど、ユーザーが変な使い方してるぞってのを、拾ってもらったから
だと思うんですよ。

 顔文字登録もそうで、開発の方は、文法解析の精度とかそっちが気
になるでしょうけど、ユーザーはそうじゃないよね。
 日本語って、「見ための絵の要素」ってのも特徴だから、単純なデータ
ベースみたいにも使いたいってば面、あると思うんですよ。顔文字の
蓄積がそうだしね。古来からの意味とは違う意味をもたせたデータをた
めていくって使い方もアリ。
 一方データベースなら、メモや入力アシストにも使いたいよね。Excelの
入力アシスタントとか、IEのオートコンプリートって、
ユーザーが「商品コード」の入力などにそういった(他のテーブルを参照
するような)窓を出すマクロを組んでいるのを見て、メーカーが取り入れたと
聞きました。こまごました掛線機能などと一緒で、日本のユーザーはそ
ういう使い方をしている、と、そういうことらしいです。
 FEP(IME)も、そっちの方向性があっていいと思うわけですよ。
 で、そういうことが「むちゃな使い方」「目的外使用」ということで却下
されずに、拾われていったんで、けっきょくツールが充実したし、
拡張表現も可能になったのではないかな?

 で、外部のデータベースで辞書を管理したいと書くのは、
全部のデータを一元管理したいからです。
 顔文字もおもしろいから変換させようというのはいいけど、
辞書管理では、とくべつな意味のものは分離できなきゃいけないんで。
使う人はどの辞書から出ていようと関係ないけど。そこで、あくまで
変換辞書は、顔もじなら顔文字として別にしておきたいので、複数の
辞書にアクセスするようなスタイルになっているわけです。ユーザーが
管理するためです。

 複数の辞書内容の重複を整理して単語を違う辞書に移動するとか
したいという時、必要なアイデアなんです。辞書エクスプローラーでは
出来るのかな(最近やりだしたので未確認)?
 ユーザーは辞書内容をいじりたいものだということをずいぶん前に
知ったので、このようになっているのであって、提供されたものが批判
されるだけのものなら、こうではなかっただろうと思います。


953名無しさん@お腹いっぱい。:02/05/15 12:03 ID:???
>>952のどこを縦に読めばいいのかな?
>>902, >>945, >>952
全面的に的外れ。もっと構想を練り直しましょう。

20〜10年前のコンピュータの事情を
(「PDS」ってタームが出てるから、そのへんですよね)
NECのパソコンまわりだけで語るのは不適切。

NECAI 全盛時(?)におけるコンピュータの状況について、とくに
「オートコンプリート」「商品コード」「日本のユーザー」にかんする
文脈で、(Windows 版が出てからの)Excel などを引き合いに出しても、
ほとんど意味なし。(無論、「IE」に至っては…!)

それをいうならエポカルクとか、 クラリスワークスとか、
アシストカルクあたりを出すのがよさそう。

初期の Windows で使われた表計算ソフトとしては、Lotus 1-2-3 や
Microsoft Works などを挙げるのがよいのでは? もっとも、
「FEP(IME)も、そっちの方向性があっていいと思うわけですよ。」と
いう件には、大賛成です。

「全部のデータを一元管理したい」という目的で「外部のデータベース」を
使いたいという方向性は、もうすこし考え直したほうがよいでしょう。
そもそも WXG において品詞として顔文字を分類できないことが
顔文字を別のデータストアに格納したいニーズの原因ですよね。

そうであれば、WXG の運用面に工夫を加えることも必要かも知れないし、
外部で「一元管理」することにもさまざまな仕組み
(編集・管理のワークフローを自動化したプログラム)が必須です。

ちなみに、「RDBMS」の「R」の意味が理解できなければ
(そして使いこなせなければ)「データベース」なんてものを
言っても、使っても、たんに金と時間を浪費するだけです。

すでに 944 さんが言っているとおり、あなたがなさろうとしている
限りのことについては、データを プレイン・テキストの型式で
扱うことが現実的でしょう。

そもそも、字句・構文解析のエンジンなども作り直さず
方言の「辞書」だけで方言対応ができるのだと
本気で思っていますか?

すでに辞書作りを試しておられるのであれば、
音便の処理などの難点が山積していることに
お気づきだと思いますが。
955名無しさん@お腹いっぱい。:02/05/15 14:18 ID:???
>>954のどこを縦に読めばいいのかな?
956名無しさん@お腹いっぱい。:02/05/15 15:35 ID:???
>956
分かってないのは君だけだよ
よく探してごらん
957名無しさん@お腹いっぱい。:02/05/15 15:51 ID:???
おい、正規表現が出来なくてgoogle知らなかった>>902、まだ見てるか?
またまた論破されてハズカシイんで荒らすのか?
それとも逃げたか?(ワラ
958名無しさん@お腹いっぱい。:02/05/15 17:34 ID:???
902の人、アンタの文章読みにくいよ。
方言の前に標準語勉強してよ。
959名無しさん@お腹いっぱい。:02/05/15 18:30 ID:???
バカを煽るのはヤメレ
960名無しさん@お腹いっぱい。:02/05/15 18:51 ID:???
961名無しさん@お腹いっぱい。:02/05/15 19:58 ID:???
WXGなんか使うやつは馬鹿です
962名無しさん@お腹いっぱい。:02/05/15 19:59 ID:???
>>954
 私、大卒じゃないからきちんと整合性の取れた論文? はムリです。日本語
そのものがへたくそなのはそのとおりかも。

 前置き終わり。

 >「FEP(IME)も、そっちの方向性があっていいと思うわけですよ。」と
いう件には、大賛成です。
 このことが大事。
 アイデアを正確に表現するという難しいことは頭のいい皆さんにおまか
せします。唸るような一文をモノにしてほしいなぁ。

 で、
 1 Relationalにデータを一元管理したい。
 2 辞書は、複数「小分け」したまま使いたい。
 ということがしたいけど、次善の策として、どんなものがあるかなって
ところが問題なんですよ。

 あと、方言なりなんなり、文法の変わっているものまで「手作り辞書」
で対応しよういうのは、ムリな相談ではないです。
 音便といったことは、正当な手段で文法的な処理を望むよりは、
「使いこなし」で対処できますよ。
 体系的に網羅された助詞の登録などは、ちょっとのことで副作用が
たいへん大きいのでやるべきではないです。あたりまえの使い方ができなくなる。
 副作用を出さず、変換エンジンはそのままでこうした問題に対処しようと
しているのがWXGで、拡張表現というもの。少し前のレスに、古文の変換へ
ユーザーがチャレンジしている例が出ていましたでしょ。

 必要は発名の母。 なせばなる、ならぬならなそうぜ、どこまでも。

なので、「使いこなし」。具体的な方法は「手作り辞書」のスレッドを
この板に立てました。そこに書き込んであります。「関西くん」の
「むりやり変換」も、私の「素うどん辞書」の「猫だまし」も似たようなもの。
ムリを承知で遊んでしまうほうが楽しいですよ。
 おっしゃるように山ほどある問題へ、具体的に取り組んでいます。
なんとかなるんですよ、ほんと。

963名無しさん@お腹いっぱい。:02/05/15 20:11 ID:???
>>962
どこを縦に読めばいいのかな?
964名無しさん@お腹いっぱい。:02/05/15 20:13 ID:???
何書いてるのかサパーリワカラン。
ウザイからもう来ないでね。
965名無しさん@お腹いっぱい。:02/05/15 20:16 ID:???
>>962
そんなことはメーカーに思う存分語ってください。
966名無しさん@お腹いっぱい。:02/05/15 20:17 ID:???
もすかすて、その立てたスレと言うのはこれですか?

【WXG】  手作り辞書  【辞書】
http://pc.2ch.net/test/read.cgi/software/1021250174/l50

その電波っぷりが素晴らしく反映されて居りますよねぇ。
967名無しさん@お腹いっぱい。:02/05/15 20:19 ID:???
ソ板一の真性厨房が現れるスレはここですか?
968名無しさん@お腹いっぱい。:02/05/15 20:20 ID:???
>>964 が良い事言った!
969名無しさん@お腹いっぱい。:02/05/15 20:21 ID:???
>>963
>>964
>>965
>>966
>>967
>>968
どうも同一人物のような
970名無しさん@お腹いっぱい。:02/05/15 20:26 ID:???
今度は被害妄想か・・・
971名無しさん@お腹いっぱい。:02/05/15 20:27 ID:???
自作自演するならせめて5分くらいは時間を開けないとな。
972名無しさん@お腹いっぱい。:02/05/15 20:46 ID:???
つーかおまえら次すれ立てるなりなんなり早くしろ
973名無しさん@お腹いっぱい。:02/05/15 20:54 ID:???
じゃぁつまんねークソ辞書の話題は禁止っつーことで良いか?
974HyperTEIKA ◆WXG5o/E6 :02/05/15 20:56 ID:???
今ひとつ962さんのおっしゃることが理解できませんね…
プランではなく、何か見本を露してみては?
WXGならできている
そゆことをATOKやMS-IMEの辞書作成で陵いでみせる
そのサンプルを示していただければ協力はしますが

それと失礼ですが、ある程度本格的に辞書を作成したことはありますか?
またWXGやATOKなどのシステム登録単語など分析したことはありますか?
WXGについても、形容詞やら形容動詞やらかなり枝分かれさせてることは知っていますか?
複合語(単語+単語)なども一語として登録してあることは知っていますか?
最後に、「貴社の記者が汽車で帰社した」と云った変換の場合
文脈で同一読みの異義語を第一候補として導き出す仕掛けなど
単純に単語登録だけの問題ではすみません
そしてこれをユーザーが一つ一つ脳内変換するというのであれば
昔のワープロ専用機や現在の携帯メールのように単漢字変換させることと何ら換わりません

IMEの辞書登録は単語登録のみに非ず
これが理解できなければ、辞書作成プロジェクト?など○上の楼閣に過ぎないのです
975名無しさん@お腹いっぱい。:02/05/15 20:56 ID:???
次スレいらねぇからこのまま放置。
976名無しさん@お腹いっぱい。:02/05/15 21:06 ID:???
>>902
あなたには多分必要なスレです。

ttp://love.2ch.net/test/read.cgi/kageki/1015332357/
977名無しさん@お腹いっぱい。:02/05/15 21:08 ID:???
係り受けまで設定できるIMEがあったら
おもしろそうだけどな。
978名無しさん@お腹いっぱい。:02/05/15 21:20 ID:???
http://pc.2ch.net/test/read.cgi/software/1021464892/

新スレ立てますた。
移行おながいします。
979名無しさん@お腹いっぱい。:02/05/15 21:27 ID:???
>>954

>そうであれば、WXG の運用面に工夫を加えることも必要かも知れないし、
外部で「一元管理」することにもさまざまな仕組み
(編集・管理のワークフローを自動化したプログラム)が必須です。



 一元化だけど、プログラムは書けない(言語障害中でDQNなのは人にいわ
れなくても自分で感じてるので)から、バッチファイルとSQLです。
 辞書ファイルとデータベースのリレーションを確立するための作業は、他
の作業とは完全に別に考えてやる事にしてました。
 辞書ベースでもテキストファイルでも、「差を取る」ツールがあれば、追
加単語、品詞の変更されたもの、削除されたものをそれぞれとり出せるの
で、マスターファイルへそれを反映出来ます。自動処理の中で、date()や
time()を取り込むフィールドを用意して置いて、事故に備えます。

 単語の削除は、データベースの削除フラグだけでなく、分類フィールド
で削除扱いにするという場面もありです。(1万語辞書用、4万語辞書用
などマークを付けて置き、目的ごとにset filter to などでとり出して
編成するとか。

 どっちにしても大変だけど、それだけの面白さはあると思ってるところ
です。

 余談:昔あれ程あったデータベースソフトですが、Accsess以外見当たら
ないからびっくり。
 バッチ処理って、Windowsではどうやるんだろ? ってのは、これから勉強
します。




980名無しさん@お腹いっぱい。:02/05/15 21:28 ID:???
今の議論を新スレまで引きずらないでくださいね。
981名無しさん@お腹いっぱい。:02/05/15 21:45 ID:???
>>902
へー、知らんかったよ、データベースってAccsessしか無いんだ、( ´,_ゝ`)プッ
982名無しさん@お腹いっぱい。:02/05/15 22:21 ID:???
何でもいいけど、もっと文を簡潔にまとめてくれ。次のスレは期待してるよ。
983名無しさん@お腹いっぱい。:02/05/15 22:45 ID:???
冗談じゃねぇ!
次スレ絶対に来るな!
984名無しさん@お腹いっぱい。:02/05/15 23:56 ID:???
956ちょっとワラタ
985Mifes mini 大好き:02/05/16 07:35 ID:nq9CFuq8
>>974
>それと失礼ですが、ある程度本格的に辞書を作成したことはありますか?

 辞書内容をすべてテキストへ書き出し→そのテキストで辞書内容を一括削除→
中身0の辞書。

 これを出発点に5万語程の辞書を作りましたが、何か?
986名無しさん@お腹いっぱい。:02/05/16 08:48 ID:???
3行以上は目眩がするので長文はやめてほしい
987HyperTEIKA ◆WXG5o/E6 :02/05/16 08:58 ID:???
辞書作りの話題は次スレに持ち越さないようにしましょうね。

>985
>  これを出発点に5万語程の辞書を作りましたが、何か?
をを、すばらしい!
で、この元データは何を使いましたか?

おそらく出発点も到達点も全く違うようなので、議論も噛み合わないと惟いますが
私は趣味道楽で、愛読書(古典を含む)のレジュメを作ったり、
小説などを物して筆慰みをしたり、
この過程でIME(FEPも)の出来合いの辞書(言葉)では間に合わず、已むなく自作へ向かいました
この時、登録したいものは名詞だけでなく、動詞、形容詞、形容動詞、
そして古文では助詞・助動詞だったわけです
要は、活用させた形で、生きた言葉の遣い方に堪えうるIMEの辞書でなければなりません
その意味で、読みを入力してそれに対応する単語を呼び出すだけではなく
WXGの連想変換、用例変換、フォーマット変換は、デフォルトの数倍の容量になるほど
自作を追加して膨らませてもいます

とゆことで、現在の私の日本語デジタル入力習慣では、WXGに替わるIMEは見当たりません
また登録単語も、連想変換、用例変換、かな英単語なども欠かせないのです

まぁ、この辺りで終結して、他人を巻き込まず、自らの径を歩むことにしましょうよ
988HyperTEIKA ◆WXG5o/E6 :02/05/16 08:59 ID:???
>986
スマソ
もう逝きますので…
989名無しさん@お腹いっぱい。:02/05/16 10:58 ID:???
>>987
>をを、すばらしい!
 ありがとうございます!!

 こんにちは。そちらはサイトかなにか、立ち上げていらっしゃいます? こ
 ちらはある程度まとまったらサイト作ってうぷします。

>で、この元データは何を使いましたか?
 0から作ったので、「単漢字辞書」。一文字づつ拾って熟語作製、その都度
 辞書登録する。

 そういう作業で辞書を作ったので、「私が使っている、生きた言葉」を、辞
書に写したと、そういうことになります。
 思考内容そのもののような辞書。
 別なジャンルの文章の時は、辞書を取り変えたりする。
 なので、「事故った」のような言葉が自然に出る。
 連語や係り受けの取り込みなど、こまかいことは経験ずみだし、目的別の辞
書作製方法はひととおり(自分なりの方法が)あります。


 ここの掲示板に参加しようと思ったのは、正しいかどうかを見討・議論する
のが目的なんじゃなくて、スクリプトやプロシージャを書いてくれるような協
力的な人と出会ったり、おなじ楽しみを広げて一緒にやりたいという仲間探し
のような気持ちです。


>まぁ、この辺りで終結して、他人を巻き込まず、自らの径を歩むことにしま
しょうよ
 それはチトもったいない。
 そのうち自前で簡単なサイトをでっちあげて掲示板借りますんで、遊びに来
 てください。

 以前というのはそうとう昔の話。PC-VANというところのGV(グローバル・ビ
 レッジ)ってところにはうぷしてあったんだけどな。雑誌の付録にも付いた
 ことがあった気もする。ヴィレッジセンターの書籍にも入ってたかな(その
 当時のことなので、フロッピーディスクつきの本だったのだと思う)
 それらは天変地異(ちょっと字がわからない)によってPC、HDDといわず、
 家ごと無くなってしまいました。
(((( ;゜Д゜)))ガクガクブルブル


 その当時のノウハウだけをたよりに、今ふたたびやってると言う次第。現在
 の辞書単語数を見ると、998語でした(それで今打ってる)。


990名無しさん@お腹いっぱい。:02/05/16 10:59 ID:???
  |         |  |
  |         |  |_____
  |         |  | ̄ ̄ ̄ /|
  |         |  |   / /|
  |        /\ |  /|/|/|
  |      /  / |// / /|
  |   /  / |_|/|/|/|/|
  |  /  /  |文|/ // /     ∧∧
  |/  /.  _.| ̄|/|/|/      /⌒ヽ)
/|\/  / /  |/ /       [ 祭 _]    ∧∧
/|    / /  /ヽ         三____|∪   /⌒ヽ)
  |   | ̄|  | |ヽ/l         (/~ ∪    [ 祭 _]
  |   |  |/| |__|/       三三      三___|∪
  |   |/|  |/         三三       (/~∪
  |   |  |/         三三      三三
  |   |/                    三三
  |  /                    三三
  |/                    三三


9911000:02/05/16 12:53 ID:???
992名無しさん@お腹いっぱい。:02/05/16 13:16 ID:???
クソ辞書厨房野郎!
頼むからもう来ないでくれ!
ここのスレ住人全員の切なる願いだ。
早いとこ自前のつまんないサイト立ち上げて、そこでオナニーしててくれ!
993名無しさん@お腹いっぱい。:02/05/17 00:45 ID:???
>>989
要点をまとめて、これぐらい短く書けないか?
─────────────────────
>>987
サンクス。そっちはサイトを立ち上げてないの?
こっちはある程度まとまったらサイト作ってウプ予定。
そのときは、また来てくれ。

昔はPC-VANのGVに辞書関連のファイルがウプしてあったり、
雑誌の付録のフロッピーにデータが入ってたんだがなあ(w
もっとも、天変地異で家ごと無くなったから
何も残ってないけど((((;゚Д゚)))ガクガクブルブル

因みにこの辞書は0から作ったので、元データはなし。
現在の辞書単語数は998語だけど十分打てるぞ(w
当時のノウハウを頼りにまたやり始めた次第。

ところで、このスレでスクリプトやプロシージャを
書いてくれる人がもしいたら協力キボンヌ。
─────────────────────

それぞれの掲示板の雰囲気に合わせた書き込み
をしないと、ウザがられるぞ。
994名無しさん@お腹いっぱい。:02/05/17 11:05 ID:???
1
995名無しさん@お腹いっぱい。:02/05/17 11:06 ID:???
112321
996名無しさん@お腹いっぱい。:02/05/17 11:06 ID:???
2321
997名無しさん@お腹いっぱい。:02/05/17 11:07 ID:???
231
らしせ
998名無しさん@お腹いっぱい。:02/05/17 11:07 ID:???
1000
999名無しさん@お腹いっぱい。:02/05/17 11:09 ID:???
999
10001000:02/05/17 11:09 ID:???
1000
10011001
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。