慶応大学、ユーザー参加型の日本語入力システム「Social IME 」を公開
1 :
ハレンチψ ★ :
2009/02/20(金) 14:02:37 ID:??? 慶応大学が、ユーザー参加型で辞書を鍛えてネット経由で利用する新しい日本語入力システム「Social IME」を開発した。
ユーザー参加型の新しい日本語入力システム「Social IME 」 みんなで育てる日本語入力」では
インターネットを用いたユーザー参加型のメリットを活かして変換を行うことができる。
具体的には次のような特長がある。
●多くのユーザーが単語を共有辞書に登録することで、普通では変換できない単語も変換可能
●ユーザー間の共有だけでなくWeb全体の集合知を利用した予測変換により、入力効率が21%向上
たとえば、「支出官」というお役所用語は、辞書登録しない限り普通の日本語変換システムでは変換できないが、
「Social IME 」によれば官公庁の入力記録を元に、「支出官」「支出官払い」「支出官代理」などのお役所用語が予測変換できるであろう。
また、「デジラジ」「アラフォー」などの比較的新しい用語も、即座に変換できることになる。
多くの人が共用で使う日本語変換エンジンは、集合知のスクリーニングを行うべく、
Wikipedia的な編集方針の確立が大きな課題と言えるだろう。
http://japan.techinsight.jp/2009/02/sanada200902201234.html 公式サイト
http://www.social-ime.com/
2 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/20(金) 14:09:07 ID:uWyFz42j
らきすたにもネタがあったけど変換候補が2ちゃん用語ばかりだったりしたら嫌だよなあ
らきすたって入力して変換すると、らき☆すた って変換されるのか?
VIPerの遊び場にされる
アサヒる・・・ アサヒる登録だな アサヒる登録確定www 俺もアサヒるぽちってきた。 あと〜票で登録確定! こんな会話が繰り広げられる予定
これで、円盤皇女ワるきゅーレが正しく変換できるようになるわけですね?
ごとうむらこと入力しなくてもよくなるのか
常時接続が必要だし、平文でネットワークに文章垂れ流しだし、だめだこりゃw MS IMEの辞書ファイルを共有して、みんなで単語登録してったほうがはやいんじゃね? ATOKでいいか。
9 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/20(金) 15:50:43 ID:8CMZi3o9
これ、情報流出の元にならないか心配だ 予測変換、文章の垂れ流しだぞw
10 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/20(金) 16:01:01 ID:J9prK6tz
というか、何故Windows2000を外したんだ。 Ver5.0とVer5.1の違いでしかないのに2KとXPは。 もう、Windows2000は過去の物か・・・軽くていいOS(1万も出せば中古PCで動くのに)だったのにな。
>>3 ATOK2009で、しゅごきゃらを変換すると、「しゅごキャラ!」と、“!”もついてくるのはファンの間では常識
まいにちしんぶん→1.変態新聞 2.侮日新聞 とかなってクレームきそうだなw
>>10 XPもMS公式からは外されはじめてるよ。7が出たら対応してます程度になるんだろうな。。。
14 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/20(金) 18:16:22 ID:qUwIXJN/
これだいぶ前から公開されてたよね 大学が公式に認めた的な意味?
>>10 そんなに、軽いのがいいならGentooでも使えばいいじゃん
このネタ3年くらい前に仕事中に思いついた(英訳ソフト的に)ことあったけど あん時特許とか出してたら今頃空気読めねええええって叩かれてたんだろうなあorz
スーフリ用語はデフォルトで学習済みですね。 分かります
20 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/21(土) 00:41:26 ID:iiFUQG5a
現時点では使い物にならないね。 自分がどのような文章を打っているのかすらデータベースには残るわけで。 常に娯楽にしか使わない人であればともかく、 少しでも業務や連絡に使うというのであれば怖くて使えないよ。 現状では制度にも問題が山積みだしね。 最初のうちはVIPPERに人身御供になってもらって、 あるていどこなれてきてから使うのがいいかと。
情報流出というか、ナンパのネタ探し用のツール。 スーフリのお膝元じゃねーか。
これ半年ぐらい前から愛用してるけどオタクには凄まじく便利 東方関係みたいなゲーム用語が一発で変換できる上に辞書は共有で手元に残らないから友達に身の潔癖を主張できる まあ問題は多いけどな 「メルアド」で自分のメルアド登録してるアホとかいるし
スーパーバイザーは日下部陽一さんとか?
24 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/22(日) 00:26:47 ID:JzG2Z6vt
>>11 しゅごキャラ!
おー(・∀・;)
ATOK2009凄いなw
Anthy しゅごきゃら→主語キャラ らきすた→等キス他 ぷりきゅあ→付利キュア すずみやはるひのゆううつ→涼宮ハルヒの憂鬱 !!!
どらどら、よっこらせックス。 セクロス ワロタ ワロスw てか入力しずらいなあ 変換が遅すぎるし、 きちんと予測変換が使えない。
27 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/22(日) 06:41:12 ID:MU27kCMD
物珍しいだけで、実用レベルではない感じだな。
28 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/22(日) 08:33:51 ID:JJMWKYV9
29 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/22(日) 15:58:41 ID:NsyuOm69
ウンコマーンコあほ
30 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/22(日) 16:13:11 ID:NsyuOm69
ウンコマーンあほ
31 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/22(日) 16:34:40 ID:NsyuOm69
ここでウンコマン、登場!
32 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/22(日) 18:36:09 ID:4q1++Pej
毎回通信して変換するよりも 一定期間ごとに辞書をダウンロードするようにしたほうがいいんじゃね
ネトゲのマクロっぽいのがたまにまざるな 「れ」「れいす」「ないと」 等で変換
34 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/22(日) 21:38:52 ID:IAeYICsQ
>32 効率を考えると絶対に定期的に更新がいい。 ただ、現時点で制作者は利用者第一ではなく成果第一なので、 常時接続のほうが「アクセス時間帯に対しての接続数、利用形態」が把握できるから、 そちらの方法を採っているの過ぎない。 正確なデータを多く残すのは卒論や企業への売買に関しては評価の桁が変わってくるからね。
その昔のWXだな
>>11 すげええええええええええええええええええええええええ
ATOK買うわwwww
37 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/23(月) 08:34:17 ID:AFl4NxGV
もうだめだねIME、慶応?中華大学じゃん・・・ 単語書くのに候補がどうしても出てこないから 手書き入力で単語書いたよ・・・日本語ツール?これ
38 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/23(月) 08:39:41 ID:D5KaVhu9
よくわからんな。 何変換してもウンコって出るように工作したらそれが反映されるんだろうか
利用者が増えれば増えるほどゴミデータが増えるだろうなぁ かといってどれが有用な変換かの判定なんてそれだけで一つの発明になってしまうわ
40 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/23(月) 17:51:50 ID:0+j0laye
>38 うん。結局、利用者の善意に任せるもの。 「絶対数が増えれば悪戯の変換数は誤差に収まる」との見方もあってのことだけどね。 利用者が1000万人になれば1万人が悪ふざけの登録をしたところで、 残りの999万人が普通に使っていれば、変換そのもののデータは正しいものになるっていう。
>>11 守護キャラ
ATOK2008だと普通だな
固有名詞の登録数の違いか
差別用語満載、部落地域名満載、朝鮮人がなりすます通名満載
「うんこ」で変換したら「カレー」が出てきてわろた。
44 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/02/28(土) 20:05:18 ID:Ou35oXJo
これ使うと、変換の時に訳の分からない文字がたくさんでてくることない?
裏でキーロガーが動いてますw
ユーフォープリンセスと入力して変換されたらATOKを買ってもいい。
>>45 裏じゃなくてまんまキーロガーと同じ動作なんだが
Social IMEという名前がダメ。 (opensource含め)製品開発のド素人がやっている、あるいは、 研究データ取得目的だけでやっているのが名前だけからでも伺えるので、 まともな人は近づいてこない。
もうATOKで出てるじゃん 慶応バカか?
51 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/03/07(土) 21:40:16 ID:CjeiB4oL
ほしゅ
52 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/03/15(日) 01:36:21 ID:PPAcpXJN
光回線の人向け?
回線以前の問題。 とろすぎて使い物にならん。 ブラインドタッチの練習にもってこいだ。 だだだっっーっと入力して10秒後に結果表示。 これ最高。
54 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/03/15(日) 20:03:32 ID:PPAcpXJN
Firefox 3.1 Beta 3だと入力中にFirefoxが死ぬ 他のIMEではまだ発生しないのでSocial IMEの通信との問題かな
55 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/03/17(火) 01:16:15 ID:Z9pfKN+v
Windows専用文字(記号)はサポートしないの?
56 :
文明の守護者ごるごるもあ ◆753Z/RLFiY :2009/03/18(水) 21:29:31 ID:fckimGCu BE:201180858-2BP(210)
■■■■■■小沢氏の第七艦隊発言でCIAが動いている模様■■■■■■ 民主党の主張するように、政治献金の単なる形式違反に過ぎないものであり、政治的混乱を招いた検察側には事件の説明責任がある。 なぜならば、今回の逮捕は同時に、検察内部の意図的な政治撹乱の疑いがあり、我が国にとってより重大な問題が提起されたからである。 すなわち、国民の利益を考えれば、先ず民主党の主張を優先し、検察内部の背任・収賄容疑を疑って検察側はその説明責任を果たすべきなのである。 そして我々は、事実上の米国情報工作機関CIAにおける莫大な対日政治工作費の存在を忘れてはならない。 我々敗戦国は常に傲慢な国の被害者を強いられてきたのである。
64bitで使えないし…クズだな
ブラインドタッチの人にはオススメできない。 人差し指一本で、キーを探しながら打つ俺はむちゃくちゃ入力速くなった。 オススメ。
でもって入力内容は筒抜けと
60 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/03/26(木) 22:09:38 ID:A1KNCDJ0
オープンソースじゃないんだ
所詮国の援助で作ったお遊びだろ
63 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/08(水) 21:15:25 ID:AWKvskwH
″ら″の変換候補に ″ラオスSVの会″ ″ラストワイトにします おつノシ″ がある
64 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/08(水) 21:20:50 ID:AWKvskwH
″べ″の変換候補に ″別キャラで叫び見てCC後、耳しました″ がある
65 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/09(木) 06:15:37 ID:8PF97fXi
″ばか″の変換候補 ″野比のび太″
結局、話題はこういうオモシロイ変換がありますよ。ってことだけだな。 実用的かどうかという点では0点。
″べ″がよくバグる べt??y耀う ベ?通過REGISTRY¥MACHINE
「そうか」で 創価の献金術士
69 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/14(火) 01:22:53 ID:8IUMHYuz
フルマネーロンダリング
70 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/19(日) 16:47:11 ID:Nm01yZ6c
″ください″を変換するとなぜか″スク水万歳″になる
71 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/20(月) 02:03:08 ID:WA6jH4C7
″こん″を変換すると″コンドームをちゃんと使用するのよ″
ユーザー参加型なんてまともに機能するわけがない。
73 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/22(水) 10:34:10 ID:j0JouoKS
昔2ch用語辞書を導入したら滅多に使わない2ch語が出まくって恐ろしく入力しづらくなったの思い出した
74 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/24(金) 11:38:16 ID:Ju7sbX13
休み時間ヒマだったので、Social IMEに 「うんゆ」→「運輪」 「こくどこうつうしょう」→「国土文通省」 「せんじつは」→「先曰は」 「けっさん」→「抉算」 「ねんどまつ」→「年度未」 「しゃちょう」→「杜長」 「おくえん」→「憶円」 「つるまる」→「鶴九」 などを辞書登録しておいた。 どうやらまだバレていないようだ。
75 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/24(金) 18:52:33 ID:XPALTeVr
2ch用語が第一候補というか優先順位が高い 2ch専用だな
76 :
ただいま名無し変更議論中@詳しくは自治スレへ :2009/04/24(金) 22:19:13 ID:pv3bCXnj
手始めに、古事記・日本書紀などの古典、および漢籍の全単語を入れておいて欲しい。
77 :
ただいま名無し変更議論中@詳しくは自治スレへ :
2009/04/25(土) 05:12:00 ID:H7cnccWG 予測変換機能オンにするの怖い