【IT】富士通が文章校正の新技術 実例学んで自動修正 [12/04/04]
富士通は4日、人による文章校正のデータを活用して、自動的に文章を校正する新技術を開発したと発表した。
データの蓄積に伴って校正の精度が高まり、外国語の文章を日本語に翻訳する際の効率を高められる。
同社はこの技術を使った校正支援システムを開発し、2013年度中に実用化する予定。
この技術は、人が校正した文章と校正前の文章をペアで登録して利用。
たとえば「冬は雪を降る」と「冬には雪が降る」という校正前と校正後の文章を一緒に登録しておけば、
構造が似た「梅雨は雨を降る」といった文章は、データ検索によって自動的に校正される。
従来の校正支援システムは、不適切な表現や置き換えるべき表現を事前に逐一、辞書登録する必要があった。
しかし新技術を使えば、「人力」による校正事例を利用することで、幅広い表現ミスに対応可能となる。
校正データを1万件登録し、中国人が書いた日本語文章を自動校正したところ、表現ミスを約80%修正できたという。
富士通の担当者は「製品開発などを外国企業に委託する例が近年増えており、
新技術を使えば仕様書の和訳がスピードアップできる」と説明。
まず、中国の関係会社でシステムを運用して改良を加え、13年度をめどに、
インターネット経由でソフトを利用するクラウドサービスの一環として提供を始める。
http://www.sankeibiz.jp/business/news/120404/bsj1204041628004-n1.htm
誰かがオワタ
文学的な表現ができねえ
便利は便利だけど結局誰かが最終チェックしなきゃどうにもならんし
変に弄って文意が変わる恐れもあるし・・・
ないよりはマシレベル?
5 :
名刺は切らしておりまして:2012/04/05(木) 00:52:18.97 ID:iClsrTJ9
>表現ミスを約80%修正できた
何であれ、今どき、こんなレベルじゃ取り上げるに値しない。
99%ですら始まりだろ。
6 :
名刺は切らしておりまして:2012/04/05(木) 00:54:07.65 ID:VXFUrVEI
機械学習が進んだAIで校正かければ出版社の編集者を減らせそうだね
IBMのAIのワトソンは文章や音声から内容を理解してクイズに答えてたし
そもそもそれも最終チェックも完全にチェックできてるわけじゃないからな
ゆとりでも仕事が出来るようになる
同時に、ゆとりが必要なくなる。
皆失業
「日本語の壁」が無くなる恐怖ってどうよ、ドカタの皆さん
>中国人が書いた日本語文章を自動校正したところ、
実験の対象がおかしいと思うのは俺だけか?
中国人に仕事回すってことだろ
え・・・95%の精度であっても現実的には使い物にならないんですがw
>>9 外注先が東アジアってのもあるし漢字文化圏(まあ大陸は簡体字だが)
なのもあるだろね
13 :
名刺は切らしておりまして:2012/04/05(木) 03:23:41.66 ID:nVwTs6m4
「なりすまし」がまた増えるね。
<実験>
「母と火を焚きました。」という日本語をエキサイトの自動翻訳にかけたら
「Fire was burned with the mother. 」という英語が出てきました。
今度はこの英文を日本語に再び自動翻訳にかけると、
「火は母親と燃えました。」という日本語がでてきました。
これではちょっとおかしいので、
この富士通の文章校正支援システムが多分するであろう文章に直すと、
「火は母親を燃やしました。」になるか、
「火と母親は萌えました」になると思う。
14 :
名刺は切らしておりまして:2012/04/05(木) 06:25:47.84 ID:7Ut2vmp6
富士通がNECにまた一つ差をつけたな
NECと富士通の両社から20年前から仕事を請け負ってたが、NECはダメになることは昔から感じていた
簡単に言うとNECは技術者を大事にしないってことだ
15 :
名刺は切らしておりまして:2012/04/05(木) 07:50:39.64 ID:W9L1lLEA
ジャストシステムのは駄目なの?
16 :
名刺は切らしておりまして:2012/04/05(木) 07:57:07.88 ID:ikUuTipi
中国人が書いた文章を80%校正できても実務的にはあまり意味がない。
日本人が書いた文章を99.99%ぐらい校正できないと使えない。
17 :
名刺は切らしておりまして:2012/04/05(木) 07:59:07.30 ID:rU/Spq9/
一太郎さんでいいのでは
18 :
名刺は切らしておりまして:2012/04/05(木) 08:59:47.35 ID:N4lEN5x+
翻訳も一語ごとの逐次じゃなくて
データベースから同じ意味をもってる文をもってくるようにすれば
自然になると思う
そのうち2ちゃんねるもスクリプト同士の罵り合いの場になるんだろうな
Wordのやつでいいだろ。