【ソフトウェア】ユーザーが皆で育てる日本語入力システム「Social IME」の使い勝手[09/03/24]
日本語入力システムといえば、「MS-IME」や「ATOK」が一般的。しかし、固有名詞や専門用語などが一発で
変換できずに不便を感じるときもある。頻繁に使用する語であれば、個別に辞書登録していくしかないわけだが、
それもまた面倒だ。
そこでお薦めしたいのが、慶應義塾大学の学生が開発した「Social IME」。その名の通り、ユーザーみんなで
辞書を登録、共有していくという新しいスタイルの日本語入力システムだ。
一番の特徴は、辞書データなど54万語がネット上に存在するという点。ローカルPCにデータをインストールする
必要がなく、変換時ごとにサーバーにアクセスする仕組みとなっている。また、予測変換機能も実装しており、
実験によれば「MS-IME 2007」と比べて入力時間が21%、キー操作が26%削減されたという。
気になる使い勝手だが、クライアントソフトをインストールしたのち、言語バーで「Social IME」を選択するだけで
いい。使用感は、ほぼ「MS-IME」と変わらない。変換にかかる時間が若干遅く感じられるが、慣れてしまえば
それほど気になるものではない。
そしてさすがに、ウリである固有名詞の変換には目を見張るものがある。小難しいアニメキャラや著名人の
名前などは、ほぼ一発で変換可能だ。政治家であれば「麻生太郎」「与謝野馨」「小泉純一郎」「小沢一郎」
などなど、じつに簡単に入力できる。
ただし、変換候補にノイズや絵文字が多いのは気になるところではある。例えば「来た」と変換しようとすると
「キタ━━━━━━(゚∀゚)━━━━━━!!!」といった顔文字が上位に挙がってくる。とはいえ、流行語などへの
即時性は高いと思われるため、ブログエントリの執筆や、コメントなどの作成には強みを発揮しそうだ。
使用の際の注意点は、まず、個人情報の辞書登録は避けること。既存のIMEでメールアドレスや住所などを
辞書登録しているユーザーは多いと思われるが、「Social IME」では他のユーザーと共有されることとなる。
現時点では、通信自体は暗号化されていないので、セキュリティを不安視する声も挙がっている。その点は
頭に留めておいたほうが良い。
まだまだ課題の多いことは否めないものの、「オフラインでの変換」や「高速化のためのキャッシュ機構」なども
今後、実装される見込みだという。「クラウド・コンピューティング」という言葉がもてはやされ、PC上のアプリ
ケーションがどんどんネット上へと移行しつつある昨今、「みんなで育てる」をスローガンにした「Social IME」が、
どう発展していくのか注目だ。
▽ソース:DIAMOND online (2009/03/24)
http://diamond.jp/series/digitre/10042/
ATOKで十分
自分の使いやすいようするためなのに
なぜ共有しなくちゃならんのかね
4 :
名刺は切らしておりまして:2009/03/26(木) 00:36:48 ID:JFZqjFfS
良いんじゃない?
5 :
名刺は切らしておりまして:2009/03/26(木) 00:37:32 ID:s6ythfiC
とりあえず「たけしま」は「独島」になるんだろな。そのうち関係ない言葉まで。
メンテできなくなって終了。
6 :
名刺は切らしておりまして:2009/03/26(木) 00:39:47 ID:ILdEf6De
wikipediaと連動して、見出し語の差分を自動で登録すれば効率よさそう
未踏のやつだっけ?
8 :
名刺は切らしておりまして:2009/03/26(木) 00:40:37 ID:I24Danso
素人はなんでもいいらしい
玄人は一太郎&ATOK
9 :
名刺は切らしておりまして:2009/03/26(木) 00:40:44 ID:bmpPL0xV
住所や電話番号も登録されてたりしてそうだが。
仕事で使ってると、「確定型拠出年金付きうんたらかんたら」とか
「かくてい」で一発変換するような登録すんだけどそんなんも共有
されるんか? てか IME の善し悪しって登録単語の多さじゃないんだけどな。
11 :
名刺は切らしておりまして:2009/03/26(木) 00:42:35 ID:yPFz6oKa
2ちゃん語ばっか充実しそうな気がする
13 :
名刺は切らしておりまして:2009/03/26(木) 00:47:39 ID:mYPKWlIU
14 :
名刺は切らしておりまして:2009/03/26(木) 00:50:46 ID:eXcFV7nA
「ウリである固有名詞の変換」
・・・・これもSocial IMEで打った文章か?
まじダルビッシュ=まじダルイとかってでてくるの?
うざいなw
16 :
名刺は切らしておりまして:2009/03/26(木) 00:54:00 ID:vFfc+ybX
一番安上がりなのはMS-IME
辞書付きのATOKは金のある人にお勧め
Social-IMEは第三の選択で、2ch語には良さそうだが、
あんまり専門用語を充実させると、誤変換が多くなる気が。
辞書を切り替えればいいんだろうけど…
ネット切れたら変換もできんのか?
Social系の話はいかにノイズメーカーとシグナルメーカーを識別するかが肝なんだが
これって単にSocialしてみましたってだけくさいな
で、チャネラーの使用者が増えて、変換する当て字の誤変換ばかりになって使いものにならなくなると。
辞書なんて、取り込みすればいいだけ、当初の変換効率なんかさして問題ではない。
一番の問題は辞書よりも癖の馴れ。
anthyでいいや
21 :
名刺は切らしておりまして:2009/03/26(木) 00:59:15 ID:WxkSNoS8
JAPANIST最強
22 :
名刺は切らしておりまして:2009/03/26(木) 01:02:48 ID:kLhYOfKO
ATOKの辞書だけ流通させればいいだろ?
ある程度辞書をローカルに取り込んでオフラインで使うことはできんのかな?
あるいは閉じたユーザの中だけでの辞書とか。
設計ポリシーに反するのはわかるけど、常にインターネットで外に出ることは出来る
オンライン環境で使えるとは限らないし、何よりセキュリティを考えるとね。
24 :
名刺は切らしておりまして:2009/03/26(木) 01:14:41 ID:kcS0YqN9
ATOKとかいってる奴は馬鹿、 つか、JUSTなんか使ってる奴は死ね
MS-IMEの調子がおかしくて、訓読み変換がまともに出来なくなった上、
ATOKもダウンロードが何度やっても失敗して困ってた。パッケージ購入ついつい忘れるし。
ちょうどいいので使わせてもらおう。
てな訳で入れてみた。
うんまあ、普通に使えるようだからいいやw
27 :
名刺は切らしておりまして:2009/03/26(木) 01:57:54 ID:eVdw61YL
>変換にかかる時間が若干遅く感じられるが、慣れてしまえば
>それほど気になるものではない。
そこに慣れるかどうかが一番重要だろ。
つかATOK使えない。何回もチャレンジしてるんだがなあ。
最近も「紀香」が出なかった。つか2chのくだけ調にはむかんね。
むかんね(ことえり)、無冠ね(ATOK)。向かんわw
「がいしゅつ」が変換できるようになるのか
>>3 文書は他人に見せることが目的なことが多いため
そこに利用される言葉も他人に理解できる、共通認識がある言葉が
より利用される可能性が高い。よって単語が共有されることには変換効率の
向上というメリットがあるものと思われる。
>>29 それって自分の専門分野に特化した学習しないから実用性ないだろ。
31 :
名刺は切らしておりまして:2009/03/26(木) 03:20:15 ID:dC0GKkn7
skk とぼそっといってみる。
確か、人力系で辞書も更新してたような。。。
試しに入れてみたが、なぜか2ちゃんの書き込みだけ使えない仕様になってる
再起動したら使えたわ
F9で英文字の大小切り替えができないのな
今まで(。・ω・)ノ゙ コンチャ♪とか使ったことなかったが、これだけ種類が多いと使ってみたくなる
ネット経由で参照するというからスピードがどうかと思ったが全く問題無い
これはさすがにびっくりだな
さっき「これは」で他の文字と一緒に変換させたが、「これはすごい」と変換された
実用で使うとかなり紛らわしい変換が出てきそうではある
34 :
名刺は切らしておりまして:2009/03/26(木) 03:52:34 ID:EXtDqhDI
MS-IMEで満足してる奴は、語彙が少ないって自覚ないよね。
お笑いだ。あんな中国で制作してて日本語に即していないものを。
ATOKは、ほぼ毎年更新されて機能は日本人が作っているだけあって、
現代日本語に即応。語彙はかなり豊富。
変換システムは、MS-IMEの方式でも使えることを知らない奴は、
使ったことが無いことを露呈するよ。
だから、どちらかと言われたらATOKというのが日本マイクロソフトの
社長も認めている。
35 :
名刺は切らしておりまして:2009/03/26(木) 04:05:13 ID:AHuelO7s
ローマ字入力のキーの割り当てをカスタマイズできるように
してくれないかな?
36 :
名刺は切らしておりまして:2009/03/26(木) 04:06:58 ID:qD5nyg43
F9で英文字が大文字にならないのはマジで勘弁してくれ
あと、本気モードで文字うちすると結構処理落ちが多くなってきて
文字が数秒出てこないんで見てて気持ち悪いんだが
38 :
名刺は切らしておりまして:2009/03/26(木) 04:17:32 ID:ueY4TOl4
>>1 の記者は馬鹿か?
ATOKで学習させ辞書を継続できれば良い
できれ社内の各部署で共有辞書が在れば尚更良い
まあ、使っていてMS-IMEよりはましかな。
顔文字系の候補はまだ優先順位が低くなっているので、意外と気にならない。
共有ではないローカル用の辞書登録ができれば、通常利用で特に問題はないかと。
>>29 それはもっと上位層の概念(メタ文書・メタユーザ)でやるべきであって
単語単位みたいな最下層でやっても意味がないと思う
Windows2000でも使えるようにして下さいな。
「キーロガー」ってちゃんと言ってやれよ。キーロガーの意味もわからん情弱は勝手に使えばよろしい
キーロガー
常駐型のソフトとして別のソフトの使用中に透過的に動作するようになっており、
複数の人間が利用するパソコンにこっそり仕掛けてパスワードやクレジットカード番号などを収集するなど、
悪用されることが多い。実際、インターネットカフェに仕掛けられたキーロガープログラムにより、ネットバンキングのパスワードが盗まれ、
知らないうちに口座から現金が引き出されるといった被害が発生している。
パスワードの入力程度なら大丈夫だと思うが
間違って個人情報を単語登録したら不味いことになるな
パスなら変えればいいが、住所や電話番号・氏名など登録したら相当な不利益を受けることに
45 :
名刺は切らしておりまして:2009/03/26(木) 10:37:32 ID:obT5AS66
これは良いんじゃないか
支那、北鮮、露助、なんかが変換できないMSのIMEはくそだよ。
46 :
名刺は切らしておりまして:2009/03/26(木) 10:53:50 ID:3wDRXa6o
ちょうせんじん
しな
一発変換できるようにしてくれ。
辞書クリアしてIMEの学習機能切ったら変換効率上がった。w
48 :
名刺は切らしておりまして:2009/03/26(木) 11:22:24 ID:QLO9bRfq
ちょっと試しで使ってみたが、(・∀・)イイ!!
いいで(・∀・)イイ!!がでてくるのは(゜д゜)ウマー ん、なんでいいでウマーなんだ。(〃´・д・)φ.....ヮヵラ冫
これは正常進化して欲しい
言葉狩りとか似非被差別とかの圧力に屈して特定の語にフィルタリングかましたりはしないで欲しい
定期的のローカルのユーザー辞書を更新する方式じゃないから重すぎw
しばらく前までは到底使い物にならない文字化けバグがあったんだが、
少し前のバージョンでfixされたみたいだね。
ただその前にATOKに鞍替えしてしまったので当面これを再導入するつもりは無いが…
(和英変換や広辞苑系辞書が便利すぎる)
個人情報やノイズ変換あたりの改善を主課題として頑張って欲しいソフトではある
変換のたびにサーバーにアクセスし暗号化もしてないって
ログ取られてたらどういう文書打ってるかダダ漏れだよなw
53 :
名刺は切らしておりまして:2009/03/26(木) 13:57:43 ID:+9ZwEiMF
>>20 あれは開発者自身が日本語不自由なのがなあ。
IPAのOSSに何か愚痴ってて、それが原因だかようわからんけど一応開発終了ということらしい。
54 :
名刺は切らしておりまして:2009/03/26(木) 14:00:04 ID:3Y/IJs9b
いまだにWXGが手放せない俺には関係ない話
>>1 以前使ったけど、5年前のPCではとても重くて使い物にならなかった。
意味不明の、長大な文字列に変換したり、単語予測機能が逆に使いにくかったよ。
MS-IMEは酷過ぎるだろ。「あそう」って入れても変換できないし、
その他当たり前に使われてるような言葉が変換されなくてイライラする。
辞書共有じゃなくて、基本的にローカルに置いといて、
定期的にサーバーにアクセスして更新かけるようにしてくれれば
それで十分なんだが。
58 :
名刺は切らしておりまして:2009/03/26(木) 14:24:31 ID:bqyfGD8l
使用してるアプリケーションによって最適な辞書を自動で切り替えられれば
それなりに使い物になる予感。
ただ、辞書はローカルに置かせて欲しい。
>個人情報やノイズ変換あたりの改善を主課題として頑張って欲しいソフトではある
それ、すごくユーザ視点から考えて嫌かもしれない…
パスワード・暗証番号とか入力補完で、共有される
田中太郎 ЧXX-XX-XXXX 日本国XX県XX市XX町X番地XXX mail
[email protected] 入力補完で一発入力! 完全実名Social Communication!
>>1 >ウリである固有名詞の変換には目を見張るものがある。
(AA略)
61 :
名刺は切らしておりまして:2009/03/26(木) 14:34:29 ID:jrerXFUV
常時通信の必要性があんまりないな
ローカルにファイルがないと不便で仕方なくないだろうか
62 :
名刺は切らしておりまして:2009/03/26(木) 14:43:09 ID:gJDw8tsM
やっと時代がこのシステムに追いついたのね
かなり昔からあるのに
____
/__.))ノヽ
.|ミ.l _ ._ i.)
(^'ミ/.´・ .〈・ リ 育てると聞いては黙ってはおれん
.しi r、_) |
| `ニニ' /
ノ `ー―i´
64 :
名刺は切らしておりまして:2009/03/26(木) 17:09:42 ID:k2Ry/nR0
イタズラでヘンな変換語を登録されて
あっという間に終了。
こんな学生のお遊びにつきあっとられん
65 :
名刺は切らしておりまして:2009/03/26(木) 17:19:47 ID:EZc7nK5i
くだらないね
>>59 間違って単語登録した分については手作業で削除してもらってる
>>61 そこはクライアントの開発待ち
変換候補の表示順の重み付けデータとかローカルにおいて欲しい。
67 :
名刺は切らしておりまして:2009/03/26(木) 17:27:30 ID:8yXiVITo
1990年頃はこういうシステム使ってた。
69 :
名刺は切らしておりまして:2009/03/26(木) 20:09:34 ID:J7RY2ETG
それよりもプライオリティが
個人>部署>社内で学習して
辞書もインポート・アウトポートしやすい
ATOKを格安で売って欲しいな
70 :
名刺は切らしておりまして:2009/03/26(木) 20:27:04 ID:hlmh2uNx
せきゅう、げいいん、しゅつちょうが変換出来ない
やっぱりアメリカ人が作ったIMEはバカだな
71 :
名刺は切らしておりまして:2009/03/26(木) 20:32:46 ID:SumsNOuA
そういや、日経なんかだと「日経ATOK」なんていう
新聞用にカスタマイズされているATOK使ってるんだっけか。
あーゆーの、売りに出されればねぇ。。
(ま、契約上できなさそうだが)
73 :
名刺は切らしておりまして:2009/03/26(木) 22:07:05 ID:PskfrJ+E
オープンソースじゃないのか
>>73 グーグルのn-gramデータ使ってるからオプソにはできない。
まあAGPLだったら嬉しいわな。
76 :
名刺は切らしておりまして:2009/03/27(金) 01:00:14 ID:ZDC3Wto8
しり
(゚∀( * )
とか出るんだろうな〜
77 :
名刺は切らしておりまして:2009/03/27(金) 01:12:23 ID:yOpqwdgt
これって辞書データは一度ダウンロードして、使うようにすればイイと思うがなあ。
54万語なんて、2バイト文字としても、1メガくらいのデータじゃないのか?
>>3 それ以前のレベルでいろいろ足りてないからだろう。
「誰もがこう変換したいと思うであろう言葉を変換しても、そうならない」って言葉が
まだまだたくさんあるってことなんじゃないの。
79 :
名刺は切らしておりまして:2009/03/27(金) 01:16:58 ID:de4L3TEF
″いいよ″と入力すると
″m9(´・Д・`)いいよ″になる
81 :
名刺は切らしておりまして:2009/03/27(金) 01:30:07 ID:yOpqwdgt
変形囲い込み臭が・・
これバージョンアップする時は現在のをアンインストールしないと駄目?
バージョン事にフォルダが作られるみたいで・・・
VJEベースで、沖縄辞書が入ったのがいいな。
配色は茶色と黄色にしてさ。
辞書データ等はローカルにもって、
更新をバックグラウンドでP2Pでやってくれればいいと思うんだけど、
それだと何か問題あるの?
85 :
名刺は切らしておりまして:2009/04/03(金) 19:59:31 ID:MMi4zcl0
ATOK
一択がでねー
言った区ってなんだよw
86 :
名刺は切らしておりまして:2009/04/03(金) 20:27:29 ID:q7uazrNS
いたずらで上司のパソコンに「年度未」とか辞書登録をしたコピペを思い出した
入れた瞬間は、予測変換に感動
でも普通の変換が激遅で、しぶしぶMS IMEに戻した
88 :
名刺は切らしておりまして:2009/04/03(金) 23:51:11 ID:C3xd5KOv
ニフティは深夜激遅なんで
アプリが死んだかと思うぜ
89 :
名刺は切らしておりまして:2009/04/04(土) 00:04:43 ID:tha3C7dV
90 :
名刺は切らしておりまして:2009/04/07(火) 11:14:14 ID:vgpw5/B3
よくこんな事考えるなあ。
91 :
名刺は切らしておりまして:2009/04/07(火) 13:29:10 ID:0ERzKcEu
たまに変換で長い文字列がでて消すのがちょうめんどくてやめた
92 :
名刺は切らしておりまして:2009/04/07(火) 13:33:22 ID:gtaP5Nzq
これってオープンソースの延長だね。
いい試みじゃない?
日本にもようやく有用なオープンソースソフトウェアが登場した。
これ使ったらどんな文章書いているか情報漏れまくりだな。
社内のサーバーに辞書コピーして使えればいいんだろうけど。
94 :
名刺は切らしておりまして:2009/04/07(火) 13:48:22 ID:gtaP5Nzq
早速使ってみた。キタ━━━(○´艸`)●・艸・)○゜艸゜)●^艸^)○>艸<)━━━!!
96 :
名刺は切らしておりまして:2009/04/07(火) 23:55:16 ID:buPi+2HJ
どこがオープンソースなん?
97 :
名刺は切らしておりまして:2009/04/07(火) 23:57:06 ID:Eii64aDT
誤用もどんどん登録されることがいいことなんだろうか?
98 :
名刺は切らしておりまして:2009/04/08(水) 00:10:13 ID:Lmc9NMrf
メモリ1GBでフォトショとイラレとFLASH同時起動してるような状態で使うのは無理があった…
ATOKだけど使えば使うほどバカになるのはIMEと同じ
100 :
名刺は切らしておりまして:2009/04/08(水) 00:41:18 ID:rKo6vKB6
金正日とか金玉男尺八も一発変換できるのか・・・
これってパスワードとか入力IDとかの秘匿は問題ないの?
102 :
名刺は切らしておりまして:2009/04/08(水) 01:15:31 ID:0JFvJU7w
″ぜん″を変換すると
(○´・д・)ノ--------キリトリ線--------ヽ(・д・`●)
って出る
103 :
名刺は切らしておりまして:2009/04/08(水) 22:02:49 ID:0JFvJU7w
″ひゅ″で変換すると
″ヒューレックス株式会社の金山てす。″って出る
個人情報wwww
105 :
名刺は切らしておりまして:2009/04/09(木) 06:09:13 ID:udkcn1jU
″こん″の変換候補
″コンドームをちゃんと使用するのよ″
106 :
名刺は切らしておりまして:2009/04/09(木) 06:24:40 ID:udkcn1jU
″ない″の変換候補
″/a 敵ナイト発見 <pos> 発言数=頭数″
どーでもいーっちゃどーでもいいんだが、誰かの個人情報をWeb晒しはあんまり良くない事だし、必要なら掲示板なんかの場合IPアドレスとかわかっちゃうわけで。
しかし、個人情報そのもので数万回くらい検索かけまくって、個人情報そのものが検索用語上位で公開されるとか、このスレの場合だと変換候補でさらされるとか、、、、そうゆー場合はどーなのよ?
辞書なんてのは自分で鍛えるものだろ
他人がやったやつなんて、とても使い物にならない
自分のパソコンだけでも5-6台あって、その上会社のパソコンでどれ使うかわからない状況だと
もう昔みたいに辞書を育てようという気がなくなるなあ
辞書ファイルもリプレースファイルにすればいいわけだが・・・・・いつも全コンピュータを起動させ確実にする必要があるしな
111 :
名刺は切らしておりまして:2009/04/09(木) 07:41:01 ID:mkLGgft9
>>70 せきゅう→せきゆ(石油)
げいいん→げんいん(原因)
しゅつちょう→しゅっちょう(出張)
話し言葉でという事?
「MS-IME」は最悪だろ。酷すぎ。
114 :
名刺は切らしておりまして:2009/04/09(木) 15:31:38 ID:MDnX1abg
バカだからそういうケチつけて他で恥と見られるようになる。
115 :
名刺は切らしておりまして:2009/04/11(土) 06:23:04 ID:5kSqlfuY
″けい″の変換候補に
″勁草書房編集部の徳田慎一郎です。″
116 :
名刺は切らしておりまして:2009/04/11(土) 06:24:47 ID:5kSqlfuY
″ぴー″の第一候補が
なぜか″ジャンプしません(゚Д゚#)″
117 :
名刺は切らしておりまして:2009/04/11(土) 06:27:30 ID:5kSqlfuY
″じー″の第一候補が
なぜか″リグル・ナイトバグ″
118 :
名刺は切らしておりまして:2009/04/11(土) 09:08:26 ID:ybEKkRf6
東方辞書がベースだから
>>1には何故か触れられてないけど
119 :
名刺は切らしておりまして:2009/04/12(日) 19:08:48 ID:J24QGuo9
″こんびに″を変換すると
″ε=ε=ε=ε=( *~▽)ノノ ||コンビニ||″
なんだよこれ
どんどんダメになっていく辞書w
121 :
名刺は切らしておりまして:2009/04/12(日) 19:16:25 ID:kRFnGTIp
exiteの全検索ワードを公表してるページがあるけど
アレと同じ様なもんだろ。情報漏洩が怖い
>>27 1回「向かんね」で変換すればちゃんと学習するじゃん
このIME使ったけど学習機能がないね。
>>123 変換ロジックは全部サーバ側にあるんでしょ。
たしか最初の頃はAnthyをエンジンにしてたけど、今は知らん。
125 :
名刺は切らしておりまして:
おもしろい