ATOKに宣戦布告か!?慶応大学、ユーザー参加型の日本語入力システム「Social IME 」を開発

このエントリーをはてなブックマークに追加
1 ◆V3/DONjiko @変態仮面V3φφ ★
慶応大学が、ユーザー参加型で辞書を鍛えてネット経由で利用する
新しい日本語入力システム「Social IME」を開発した。果たしてどのように便利になるのだろうか。

現在、メールやブログ更新ならばOS標準の日本語入力システム(WindowsならMS-IME、Macなら「ことえり」など)で間に合うが、
ヘビーな日本語入力や、専門用語の一発変換、予測変換や
変換履歴使用などの高度な作業環境ならばジャストシステムのATOKが標準となっている。
ちなみにほとんどの商用UNIXにもATOKが採用されている。

一方で、慶應義塾大学理工学研究科の開発した、ユーザー参加型の新しい
日本語入力システム「Social IME 」 ?みんなで育てる日本語入力?」では
インターネットを用いたユーザー参加型のメリットを活かして変換を行うことができる。
具体的には次のような特長がある。

●多くのユーザーが単語を共有辞書に登録することで、普通では変換できない単語も変換可能

●ユーザー間の共有だけでなくWeb全体の集合知を利用した予測変換により、入力効率が21%向上

たとえば、「支出官」というお役所用語は、辞書登録しない限り普通の日本語変換システムでは変換できないが、
「Social IME 」によれば官公庁の入力記録を元に、「支出官」「支出官払い」「支出官代理」などのお役所用語が予測変換できるであろう。
また、「デジラジ」「アラフォー」などの比較的新しい用語も、即座に変換できることになる。

これにより、日本語入力システムを持たないか、持っていても貧相で使えないというOS
(例:QNX、HaikuOS、PC-BSDなど)にとって、日本での実用可能性が大きく進歩することになる。

一方で、このシステムの実用化には多くの課題があるだろう。
まず、日本語変換システムはかなりのCPUパワーを消費するものであり、
インターネット経由でのクライアント・サーバ型利用では、相当な処理性能を持つサーバを置かなければ対処できない。
そして、もちろんネット環境が無いところでは使えない。(ローカルにキャッシュするという方法も考えられるが)

さらに、ワープロ黎明期に、会社の共用ワープロに各自が自分だけが使う新語登録をして混乱を招いたことの再現も危惧される。
「お」と打ったら「お世話になっています」と変換されるようになっていて、別のユーザーが
「おはようございます」と打ったら「お世話になっていますようございます。」というマヌケな事態が起きていたことがある。

多くの人が共用で使う日本語変換エンジンは、集合知のスクリーニングを行うべく、
Wikipedia的な編集方針の確立が大きな課題と言えるだろう。
また、ATOKが実装しているように、流行語を取り入れる一方で、「ら抜き言葉」の警告や、
「特長」と「特徴」の違いを説明するなどの機能まで実現するかどうかは、さらなる研究が必要になると思われる。

http://japan.techinsight.jp/2009/02/sanada200902201234.html
2オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:07:31 0
エイトック重い
3オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:09:53 0
3ならキーボードの上にウンコする!
4オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:10:25 0
連想変換の候補で画面が埋まりそうだな。
5オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:10:28 P
ATOKの拡張機能でSocial IMEを補完に使って終了
6オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:10:46 0
「お世話になっていますようございます。」

中村玉緒みたいだw
7オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:10:48 0
>慶應義塾大学
ああ脱亜入朝化した大学か。
法則発動中〜
慶應義塾大学卒業の経営会社・勤務会社も
今現在法則発動中。
8オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:12:47 0
ゴミ増やすなよ。
9オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:13:06 0
>>1
文字化けてんぞ


全角チルダと波ダッシュの問題をなんとかしないとなぁ
10オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:17:43 0
対抗してTNOKを
11オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:18:21 0
にってい、こくにち、はんにち、こうにち
どう変換されるようになるのかな?
12オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:18:28 0
>>10
力抜けよ
13オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:18:35 0
あれ、でもATOKにも似たような機能なかったけ?
14オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:19:59 0
前に使ってみたことがあったけど、
向こうのサーバーが落ちるとこっちまで被害が及ぶので、
結局使い物にならなくてやめた。
15オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:21:18 0
         ヽ、        /  思 い
  シ 俺 お   !        !   .い い
  ョ の. 前.   !       |   つ こ
  ン. ケ     |      !,  い と
  ベ. ツ     ノ      l′ た
  ン の     ゛!  ___ 丶
  し. 中    ,,ノ' ´    ` ''ヾ、、_   _,.
  ろ で   /            ヽ`'Y´
        }f^'^^了t^'^'`'ー1  l
       ノ|L_ ! ___ { ,..、|
'- 、.....、r‐''´  }f'tr'i  ''^'tォー` }j/i',|
     ヽ    l.| ´ |    ̄  vijソ.!
         丶 └、     Fイ l′
     /    ',  ‐--‐  ,イ ケ|
   , ,/.       ヽ `''"´,/ !  ^|ー、
  / /      _,,」、'....ィ'       '|. \、__
. /./  ,. ‐'''"´    ! /   ,  _」__ヾ',
.,'.,'  /´   └ 、_ ノi   ノ  (、_  ``ヾ!
,'/ /     ヽ、 ` ''ー 、ィ-─'' r`'^    `
l|  !            リ    `ぅ ー=、_
| |          サ     〉
  ト             ′    ./''ー- 、,.._
  |  ヽl            (B     /    ヽ、
  |     !,、      !     /     ∠_
  ,イ     ヾ'     ィ 、   . /   ,,ィ'´
16オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:21:19 0
> 「支出官」というお役所用語は、辞書登録しない限り普通の日本語変換システムでは変換できないが

そもそも日常で使わない単語なんだし、いらんだろ。
17オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:27:31 0
どんな不具合が出るか素人でも予測できそうな実に後進的なプロジェクトだな。
慶応もゆとりの弊害出て来てるんだな・・・・
18オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:28:47 0
単語登録機能で足りてるよ.
19オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:33:13 0
超漢字のが気が利いてる。
20オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:42:16 0
昔に一太郎のver3使ってる時は、
変換1回=会 2回=回 3回=階
みたいな感じで記憶してブラインドタッチしまくれたのに、
最近のATOKとかIMEだとうまくいかなので不便だな。
21オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:44:07 0
パスワード・暗証番号が共有されるw
22オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:49:41 0
>>16
支出官と支出負担行為担当官の違いもわからぬ餓鬼は黙ってろ
23オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:53:40 0
KO大学とかいうから、ATオッケーに見えてしまった。
24オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:54:39 0
まあ、この風車はまわらないと思うよ。
25オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 13:59:04 0
ATOKも辞書を肥大化させることで変換能力を上げようとしたこともあったが、
結局は誤変換が増える一方なので、贅肉を取り払った辞書にした。
ATOK7〜10ぐらいが肥大化の時代。
その後は特定人物の用例をもとに絞り込んだ辞書+分野別拡張辞書にして
今に至ってる。
過去の轍を踏み、泥沼にはまるだけなのに。
26オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:00:56 0
文章を書いている最中でも他の共有ユーザーの影響でついさっき変換した単語の第一候補がくるくる変わるってことかな
27オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:01:32 0
そもそも慶応ボーイは何が目的なのかね?

↓こういうので充分だろw
(例) http://www.vector.co.jp/vpack/filearea/data/writing/dic/
28オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:08:27 0
焼肉って入力すると、
焼肉関連のサイトが大量に出てアフィリエイトが慶応に入るって仕組み。
29オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:27:44 0
KOにもしょーもない研究室あるのね
30オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:31:36 0
「ばぐた」と打つと「しね」と候補に出たりするんですね
31オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:32:33 0
鯖屋と何か癒着してて、リベート目当てでもっともらしいような理由付けて研究費をry
ん?誰か来たようだ
32オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:36:23 0
情弱が錠弱になるのなんとかしてくれ
33オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:38:56 0
IMEは辞書連動しないのかよ!
34オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:44:58 0
こんなもの怖くて使えるかよ。
下手すりゃ個人情報垂れ流しだぞ?
35オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:51:46 0
ATOKが何年前に通った道なんだろうなこれ?
36オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 14:53:12 0
これただ?
37オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 15:03:17 0
大麻がらみの隠語が育ってそうだ
38オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 15:08:15 P
新たな誤変換祭りの悪寒w
39オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 15:09:32 0
>3
40オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 15:10:38 0
気付いたら出会い系サイトになってたりしてなw
41オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 15:30:58 0
卑猥な単語を無差別に登録するやつが出てくるだろうな
42オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 15:34:08 0
役所のIPからガンダム用語の書き込みが・・・とか、ダメな方の予測しか出来ないなw
43オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 15:36:47 0
>>25
日本語ではなく英語の話だが、ワードソフトなどのスペルチェックに使う辞書をでかくすると、
どう考えてもtypoとしか思えないような単語すら通ってしまうとか。

まあ、うまくいかんねぇ。
44オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 16:41:16 0
とりあえず予測してみた。
しね>>>氏ね
しろ>>>汁
ばい>>>ノシ
そうか>>>カルト
いけだせんせい>>>犬作
かんこく>>>姦国
けいおう>>>変態
あさひ>>>捏造
よみうり>>>国売
みんしゅ>>>ミンス
かんこくじん>>>チョン
ねつぞう>>>アサヒる
おおさか>>>大阪民国or東朝鮮
(その他放送禁止用語)>>>あぼ〜ん
45オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 16:44:52 0
ネットにつながないと使えないの?
うちISDNだから無理
46オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 17:17:19 0
変換候補の上から20個がAV女優の名前になるわけか。検索には便利だが・・・。
47オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 18:15:32 O
言葉の共有化による無個性文書の
大量発生の予感…
48オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 18:26:53 O
←何故か変換できない
が無くなってしまうのか
49オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 19:24:47 O
Anthy for Haiku
50オレオレ!オレだよ、名無しだよ!!:2009/02/20(金) 22:59:52 0
不必要な単語が登録されるのが嫌で最新辞書入れてない&デフォでも要らない単語は抑制してるぐらいやのに、こんなん御免蒙るわ
必要な単語だけ登録していき、適宜自前のシステム辞書更新してけばいいだけじゃん
そのほうが自分の環境に限っては入力効率が上がる
51オレオレ!オレだよ、名無しだよ!!:2009/02/21(土) 02:21:01 0
.
52オレオレ!オレだよ、名無しだよ!!:2009/02/21(土) 23:39:13 0
TNOK
53オレオレ!オレだよ、名無しだよ!!:2009/02/22(日) 00:42:12 0
そういえばwnnなんてのもあったよな?
54オレオレ!オレだよ、名無しだよ!!:2009/02/23(月) 01:08:25 0
.
55オレオレ!オレだよ、名無しだよ!!:2009/02/23(月) 02:18:27 O
それよりカンナとウンヌをベースに進化させたIM作ってくれよ
56オレオレ!オレだよ、名無しだよ!!
>>22

支出負担行為担当分任官のほうが重要だな