翻訳ソフト作成の質問

このエントリーをはてなブックマークに追加
391:03/05/01 00:01
>>32
>システム作りで一番タチが悪いのは、口ばっかりで設計も実装もできないヤシ

機械翻訳自体に興味があるから、その基本メカニズムや作成の際に参考になる
情報など知ってる人がいましたら、お教え頂けると幸いです、ということです。
機械翻訳が面白そうだから、それが一体どんな物なのか考えてみよう、という
スレなんで、機械翻訳自体に全く関心が無いなら見るだけ時間の無駄でしょう。
ソフトの完成品だけに興味のある人に勝手に期待をかけられて「口ばっかり」
だの「タチが悪い」だのと罵られても困ります。

無論、最終的には翻訳掲示板に使えるものができたら良いな、とは考えていますし、
外部のfreeの翻訳エンジンを利用した翻訳掲示板自体ならば、既に上述URLで
稼働しています(私が作成したものです)。
4033:03/05/01 00:02
>>38
逐語訳を2回続けてしまうと、訳文がぼやけてしまう。
その「ぼやけ」が意訳的に見えることがあるけど、意味が違ってきてしまうという怖さがあるよ。

例えばプリンターかなんかの説明文に、
「This machine provides printing to you.」
という文があったとする。
翻訳者だったら意訳で「本機では印刷ができます」とするところだけど、
逐語訳をすると「この機械はあなたに印刷を提供します」となってしまう。
これが中間言語だったら例えば「machine→(give; printing)→you」みたいになる。(この辺適当)
これをもう一度逐語訳すると、「この機械はあなたに印刷物を手渡します」となり得る。
逐語訳を2度繰り返す「中間言語方式」は、意訳的になる場合があるけど、誤訳の可能性も高まってしまう。

やはり本物の意訳というのは、原文からイメージを介して一気に生成しなければならなくて、間に言語が挟まるとどうしても一語一語の辞書的な意味に捕らわれて逐語訳になる。

素人考えなんだけど、UMLを使って「原文→UML→日本語」というのはダメだろうか?
UMLを見ていると言語を挟まないイメージで逐語訳ができそうな気がするんだけど・・・。
411:03/05/01 00:06
>>33
>逐語訳。おそらく、ほとんどの翻訳機械がこういう仕組みでしょう。

確かに、翻訳のメカニズム自体は単純なもので、後は辞書データを鍛えることに
専念するのが多いようですね。

>意訳の翻訳ソフトができれば、おそらく大発明でしょう。

そうなると、翻訳自体のルールだけのプログラムじゃなくて、人工知能みたいな
ものが必要になってくるのかも知れません。
42名無しさん@3周年:03/05/01 00:09
つうか論理的な思考ができないヤシがそういうこと言うからダメなんだよ。
結局クレクレ君じゃん
つうかさ、一番の問題はアルゴリズムだから、PC板いけよ。
43名無しさん@3周年:03/05/01 00:13
>>40
それは君の中間言語が間違っているだけ。
はなはだしい想像力の欠如。
4433:03/05/01 00:16
>>43
中間言語の正誤はどうでもよくて、要するに2度逐語訳を繰り返すと、意味が違ってしまう可能性があるということです。
451:03/05/01 00:17

>いわゆる「中間言語」で翻訳する機械はこれに似た構造を持っているのかもしれませんね。

マイナーな言語間の機械翻訳では、英語を中間言語にする場合が多いようですね。
どこかにエスペラントを使うものもありました。ただ翻訳の精度は落ちるようなので、
翻訳専門の中間言語が必要なのかも知れません。

Linguaphile: http://linguaphile.sourceforge.net/
4636:03/05/01 00:21
>>40
う〜ん、ちょっと今はわからんな〜。
その中間言語はそもそもソフト内だけにあればいいわけだから
日本語・外国語のように文字の羅列ではなく、なにかしらの形でっ
てイメージなんだけど…。チョット保留。
47名無しさん@3周年:03/05/01 00:30
>>45
そのサイトでフランス語→英語を試してみましたが、辞書がまだまだのようですね。
know, can のような単純な英語も訳せてませんでした。
ユーザが協力して辞書を豊富にしていくのかな?
481:03/05/01 00:51
>>47
辞書データはまだどれも小さいようです。
最大のスペイン語で168kb程度。
韓国語は曜日を含め数十個しかありません。
単語数自体はフリーの辞書データを何かの
商用翻訳ソフトを使って一括翻訳して
ぶち込むこともできるかも知れません。
4932:03/05/01 01:44
>>39
うーん、見事に誤読されてますね。しかも肝心なところはスルーされてるし。

「タチが悪い」云々は一般論であってあなたのことじゃないですよ。
「実際に動くもの」は当然あなたが今作ろうとしている翻訳エンジンのことです。
あなたの言う
> 外部のfreeの翻訳エンジンを利用した翻訳掲示板
は問題外。

一番言いたかったことは、翻訳エンジン作りに関してあなたが今考えていることを
ひとまず形にしてみてはどうかという部分だったのですが、いかがですか?

漏れもプログラマのはしくれですが、システム作りにおいては実際にやってみないと
分からないことの方がずっと多いものです。また、具体的なアイデアというものは
具体的な試行錯誤からしか生まれないと思います。恐らくこの板には翻訳エンジンを
手掛けた人などいないでしょうから期待するだけ無駄だと思いますよ。
5032:03/05/01 03:09
板違いもいいところですが、ついでなので思いついたことを書きます。

・機械翻訳や自然言語処理と題された書籍が和書・洋書ともに多数出版されていると
思います。恐らく素人がすぐに思いつくようなことはすべて書かれているハズなので
何冊か読んでみるとずっと考えが具体的になると思います。

・情報科学の分野で常識となっている多数の技術が必要になると思います。これらを
知っているのとそうでないのとでは設計や実装に大きな違いが出てくると思います。
知識処理の技術:意味ネットワーク、フレーム、述語論理、エキスパートシステムなど
人工知能の技術:探索、推論、バックトラッキングなど
コンパイラ関連の技術:字句解析、構文解析、正規表現、書き換え規則など

・原語と訳語の対応を示すもっとも基本的な辞書の他に、複数の訳語の候補の中から
文脈に合った訳語を選択するための辞書、語と語の共起関係を調べるための辞書などが
必要になると思います。また、原語の文法を翻訳語の文法に書き換えるための基本的な
ルールの他に、自然な翻訳文になるように書き換えるための多数の例外的なルールが
必要だと思います。これらの辞書やルールの作成はプログラムの作成以上に手間暇が
かかると思います。

・それなりの翻訳結果が得られるようになる頃には、恐らくプログラムのサイズは
数万行になっていると思います (どのプログラミング言語を使うかに関係なく)。
それだけの規模のプログラムを途中で破綻しないように設計し実装するのはプロでも
大変な仕事だと思います。どういう規模なのか実感できないようだと実現は難しいかも
知れません。
51名無しさん@3周年:03/05/01 03:43
52gpltrans home:03/05/01 03:47
53名無しさん@3周年:03/05/01 04:05
>>33
意訳とはいっても、原文の言語構造とその文化的背景を完全に把握した上でのことですよね?
54名無しさん@3周年:03/05/01 04:20
>>1

プログラマ板へ行って、翻訳アルゴリズムの本を紹介してもらいなさい。
webでタダで見れるような情報だけでは、ぜんぜん勉強にならないよ。
551:03/05/01 04:23
Universal Networking Languageというのは面白そうですね。
http://www.unl.ias.unu.edu/unlsys/introduction.html
http://slashdot.org/articles/99/10/13/0915241.shtml
A Universal Networking Language for the Internet?
Anonymous Coward writes: "The United Nations University is developing a
Universal Networking Language for the Internet, which is designed to
allow effective communication between people writing in their native
languages, with automatic conversion through an intermediate Meta-language
(perhaps a precursor to Star Trek's Universal Translator.) They will be
holding a symposium on the technology on 18 November in Brussels, Belgium,
where they will publicly announce their achievement. They claim that the
initial stage of UNL will support 16 languages: Arabic, Chinese, English,
French, Russian, Spanish, German, Hindi, Italian, Indonesian, Japanese,
Latvian, Mongol, Portuguese, Swahili and Thai." An interesting idea, but
this is one of those "the devil is in the details" things. It'll be
interesting to see how/if this can work.

単なる既存の文章の「翻訳」ではなく、「コミュニケーション」という事では、
まず元の文章を自分が書く時点でUNLなりに翻訳されやすい形で書いておけば、
異例的な翻訳の難しい表現などの問題も回避されるわけです(無論、意訳を
要する例外的な表現も翻訳できるに超した事はありませんが)。掲示板などでの
機械翻訳の利用も同様でしょう。

英語やエスペラントのような言語を皆が憶え直すより、この方が世界言語
としては実用的な理念かも知れません。
5654:03/05/01 04:28
>>55の書き込みで、
>>1の関心事が必ずしも機械翻訳の作成ではないと思った。
何をしたいのか基本的なことがズレてるような気がする。

ゆえに>>54の私の書き込みは取り消します。
571:03/05/01 04:42
1で私が最初に書いた文章が不味かったのかも知れませんが、このスレは基本的に
機械翻訳というトピック一般に関する話ということで行きたいと思うのですが。
Winnyみたいに私自身が機械翻訳ソフトをこのスレで本格的に開発し完成させる、
というのではなく。無論、それが可能なら全く結構な話ですが、私個人の
用途(翻訳掲示板)としては他にフリーで使える機械翻訳エンジンがあるなら
それで十分だし、他の有能な方が他所でフリーの翻訳ソフトを作成中なら
その辞書を鍛えるなり何でもして開発を助け貢献するだけでも構いません。
上述のlinguaphileに日本語モジュールを追加するというのでも良いでしょう。
また、機械翻訳というもの自体にも興味があるので、自分自身で作成するしない
出来るできないに関わらず、本を読んで勉強するのは吝かではなりません。
5832:03/05/01 05:12
ははは・・・勝手な思い込みで先走ってしまったようですね。失礼しました。
59動画直リン:03/05/01 05:20
601:03/05/01 09:40
http://www.cfilt.iitb.ac.in/icukl2002/
UNLにはウンベルト・エーコ等も名を連ねているんですね。
日本人研究者も何人か活発に参加してるみたいだし。
Tronとかとは絡んでるんですかね。
61名無しさん@3周年:03/05/01 12:28
>>57=1
>1で私が最初に書いた文章が不味かったのかも知れませんが、このスレは基本的に
>機械翻訳というトピック一般に関する話ということで行きたいと思うのですが。


情報の散逸や議論のループを回避し、サーバーの限られたリソースを有効活用するため、
このように重複したスレッドを立てることは2chガイドラインで禁止されています。

既にあるスレッドに書き込んでください。


翻訳ソフトの将来性
http://academy2.2ch.net/test/read.cgi/gogaku/992109492/l50
6254:03/05/01 13:08
>>1
やはり、このスレッドは速やかに削除依頼を出すべきだと思います。

この板にいるひとのほとどんは機械翻訳のアルゴリズムや手法には関心がないでしょう。
このスレがこのまま進んでも>>1に独り言と、それに他人がチャチャを入れるか、罵倒が入るだけでしょうね。

私は、板違いで立てた人間の独り言が嫌いだし、
他のひとの多くも同様の感想を持つはずです。
6354:03/05/01 13:10
訂正:ほとどん→ほとんど
64名無しさん@3周年:03/05/02 03:39
ニューロに変わる学習機能が確立されればそのうちC3POが出来上がるから
安心。
65名無しさん@3周年:03/05/02 03:42
てか結構理論は出来上がってきてるし。
66名無しさん@3周年:03/05/02 03:43
それと、なんか上のほうで色々でてるみたいだけど、
辞書式じゃダメですよ。
67名無しさん@3周年:03/05/08 05:23
もうおしまい?
68名無しさん@3周年:03/05/08 16:34
もうおしまい?
69名無しさん@3周年:03/05/09 09:31
もうおしまい
70山崎渉:03/05/22 03:02
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
71山崎渉:03/05/28 11:03
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
72名無しさん@3周年:03/06/12 19:52


      ☆ チン     マチクタビレタ〜
                        マチクタビレタ〜
       ☆ チン  〃 ∧_∧   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
        ヽ ___\(\・∀・) < >>1 翻訳ソフトまだ〜?
            \_/⊂ ⊂_ )  \_____________
          / ̄ ̄ ̄ ̄ ̄ ̄ /|
       | ̄ ̄ ̄ ̄ ̄ ̄ ̄|  |
       |  愛媛みかん  |/
73山崎 渉:03/07/15 11:44

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
74名無しさん@3周年:03/07/28 15:52
75山崎 渉:03/08/02 01:09
(^^)
76名無しさん@3周年:03/09/27 19:08
もうおしまい?>>1
77名無しさん@3周年:03/10/21 03:10
もうおしまい?
78あぼーん:あぼーん
あぼーん
79名無しさん@3周年:04/05/28 22:30
おしまい。
80名無しさん@3周年:04/08/02 18:09

81名無しさん@3周年:04/08/30 16:59
日本語を入力すると英語に変換されるソフトとかってあるんですかね?
82名無しさん@3周年:04/08/30 17:07
外国語(英語除く)@2ch掲示板
83名無しさん@3周年:05/03/13 02:39:17
sage
84名無しさん@3周年:2005/03/29(火) 02:54:30
sage
85あぼーん:2005/04/18(月) 17:59:48
あぼーん
86名無しさん@3周年:2005/05/01(日) 18:27:46
sage
87名無しさん@3周年:2005/05/15(日) 06:16:27
sage
88名無しさん@3周年