翻訳エンジンと言語学ないし認知科学

このエントリーをはてなブックマークに追加
1meta 1
言語学という学問は
工学における翻訳エンジンの制作にどのように寄与しているのか。
また、どのように寄与すべきなのか。

僕は情報工学の学生なのですが、履修範囲に
認知科学の分野が含まれていてその基礎分野として
言語学を認識していますが、
あるスレッドでは言語学は科学と言うよりも文化だという
発現を目にし、工学分野には応用されないものなのか分からなくなりました。

読むべき書籍、あるいは認識の違いの紹介、指摘をお願いします。
2gets

はあ?
3名無し象は鼻がウナギだ!:03/04/01 01:50
とりあえず月刊「言語」のバックナンバーでも読めや
4名無し象は鼻がウナギだ!:03/04/01 12:29
meta1さんご自身が何か言いたいことがあるって
ことですね? きかせてくださいな。
5meta1:03/04/01 12:56
言いたいことは特に有りませんが、むしろ知りたいのです。
語彙理論という最新(?)の翻訳システムに用いられている理論というのは
ニュース記事を読む限り、(URIが無いのが申し訳ないです)
文法規則ですらボトムアップ的に構築されていくシステムのようなので、
言語学という範囲はこれらをトップダウン的に構築する学問だとおもっていたので

64:03/04/01 13:06
大雑把にいえばかつては両方のアプローチがあった。
電子計算機の処理速度が向上して文法解析よりも
語彙データベース処理のほうが有利になっただけ。
つまらなくなったので、みんな興味を失った。
7meta1:03/04/01 20:23
>4 なるほど。学問としてはセオリーを作らなければならないわけで
文法事項を洗練してカテゴライズすることのほうが、
人間の言語習得過程を模したような翻訳アルゴリズムよりも
より言語学らしいというような感じですか?

前者は言語というものを公理系でとらえられるという前提が有って
後者は言語は現象にすぎず、雑多な情報から収斂していくことでしか
言語をとらえられないというあきらめがあるのかな・・。

もっと議論のある話題だと思ったのですが、単発質問的になったのが残念です。
現在、アルバイトで中学の国文法を生徒に教えており
日本語に不適な分類を押しつけているように感じるのですが、
どうなのでしょうか?

8名無し象は鼻がウナギだ!:03/04/01 20:23
onara
>>7
>日本語に不適な分類
具体的にどんな分類が?
国文法(口語学校文法)は文語文法を考慮した通時的なものだってことも
忘れないでね。

あと、演繹に傾くあまり帰納を軽視しがちなのは生成文法派の悪癖。
10meta1:03/04/02 00:22
>国文法(口語学校文法)は文語文法を考慮した通時的なものだってことも
>忘れないでね。
あ、そういうのもあるか。
日本語のネイティブであることを前提としずぎている判別法が
ただのパズルみたいになっていて、必要性や意義を中学生に教えづらい。

「は」と「が」と「の」の助詞が(も、こそ、だけetc)
やや画一的に主語の生成をになっているという記述が妙に不自然で、
英語の主語とは根本的にちがう概念な気がするのです。

君がいた夏はとても蒸し暑かった。
(僕は)君が死んだ日にはいつも涙がとまらない。
(僕は)君の死んだ日にはいつも涙がとまらない。

このときに「は」「が」「の」はいずれも主述の関係を内包しているが
運用するときには他のものに変えられない場合が多い。

「は」のほうが広範的な話題の提示
「が」のほうが直線的にしめされた前後の関係
「の」がインナーな要素の参照

といったイメージがあります。
素人考えなので、おかしなところも有るでしょうが
他の言語からの日本語へのアクセスとしてはおかしな気がします。
高校古文の前哨戦であれば文部省の意図は多分に理解しますが。

>あと、演繹に傾くあまり帰納を軽視しがちなのは生成文法派の悪癖。
ADSLみたいなものですか?(違う)

>>10 
>英語の主語とは根本的にちがう概念な気がするのです。

それは学校文法以外の日本語文法論では昔から樣々に指摘されてることです。
下記も参照のこと。

日本語に主語はいらない
http://academy2.2ch.net/test/read.cgi/gengo/1021896416/l50
突然失礼いたします。
タダでお金がたまるちょっとお得な情報をお教えいたしますので
メールください内容を書いたメールを返信します。
騙されたと思ってお気軽にメール下さい。タダだし…
得はしますが、絶対損はしません!
何でそんなことただで教えるかって?それはメールの内容見ればわかります。
ホントに得だからとりあえずメール送ってちょ
もちろんフリーメールで送ってきてもOK
13名無し象は鼻がウナギだ!:03/04/02 21:45
学校の国文法の問題点については、次のを(どっちか)読むといいと思います。
まちがいだらけの日本語文法 講談社現代新書
町田 健 (著)
日本語のしくみがわかる本
町田 健 (著)
てゆーか中学生の国文法なんてわりきって教えちゃったほうがいい。
テストで「花だ」「先生だ」「きれいだ」から異質なものを選べれば
いいのであって、名詞+断定の助動詞とか形容動詞とかの用語は便法。
疑問を訴えてくるような生徒には、2ちゃん言語学板でも薦めて桶w
15meta1:03/04/03 21:39
>>13,14ありがとうございます。
さっそくアマゾンします。

僕は国語、英語を教えています。
塾の優秀な子であっても
英語で副詞、形容詞のちがいも言葉としては理解できる子がすくないので
英語学習の補助として国文法を中1の時にさっとやるんですが、
教えていても中学の国文法は断定的で、「こういうものだ」と言っているのが
ナンセンスに感じます。

高校古文の予習なんだと、さらに賢い子には言っておきます。
164:03/04/04 04:51
日本語の「は」と「が」にひっかかるなら次の本がおすすめ。
新日本語文法選書1『「は」と「が」』野田尚史 くろしお出版1996
17名無し象は鼻がウナギだ!:03/04/04 13:13
困った時のくろしお出版
18名無し象は鼻がウナギだ!:03/04/05 00:30
正直、情報処理学会なんかで発表されてる言語学系の研究って、どうよ?
なんだか、安っぽくねえ?てか、んなのだれでもできるっていうか。
19名無し象は鼻がウナギだ!:03/04/05 10:20
>>18
学会の連中も、お前みたいな安っぽい奴には批判されたくないだろうね。
20山崎渉:03/04/17 09:20
(^^)
21山崎渉:03/04/20 04:49
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
22山崎渉:03/05/21 22:44
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
23山崎渉:03/05/21 23:25
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
24山崎渉:03/05/28 15:04
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
25名無し象は鼻がウナギだ!:03/06/26 21:06
言語学が、世間の注目を浴びるとしたらここら辺りじゃないのかな?
言語学ではなく自然言語処理の手柄になると思われ
27名無し象は鼻がウナギだ!:03/06/26 22:59
いいよ、世の中が便利になるなら
28山崎 渉:03/07/12 12:39

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
29山崎 渉:03/07/15 12:31

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
30名無し象は鼻がウナギだ!:03/08/24 09:28

大人の時間ドットNET
http://2ch.otona-no-jikan.net

31あぼーん:あぼーん
あぼーん
32名無し象は鼻がウナギだ!:04/02/09 14:51
ソフトウェア会社での業務で日本語仕様書を英語に訳すことがよくあります。

内容が理解できればいいので、例えば、
「この領域にはユーザデータを入力する。」が
「このareaにはuser dataをinputする。」でも良いと思う。

これを自動的にするツールが(2万円以下くらいで)ありませんか?
Trados、Wordfast、ともう一つ見たが使い勝手が悪い。
Wordfastのように、1。汎用Glossaryと2。カスタマイズできる翻訳用フレーズ対、の二段構えのが望ましい。

自分でMSWordのマクロを書いたら50時間くらい以上かかりそうだ。
ご存知の方、よろしくお願いします。
板違い

というか自分で作れ
作ったら公開して。
>>32
50時間ぐらい時間作れ。一日1時間でも2ヶ月かからん。
36名無し象は鼻がウナギだ!:04/02/10 11:37
>>32
今から SimplyTermsを試してみるつもり。
他にも良いツールあったら教えてください。
http://homepage2.nifty.com/buckeye/software/st.htm
37名無し象は鼻がウナギだ!:04/04/06 15:14
英語と日本語(国語)を中学の生徒に教えている方、
「助動詞」で生徒は矛盾を感じるはず。
38名無し象は鼻がウナギだ!:04/04/28 03:43
http://jbbs.shitaraba.com/bbs/subject.cgi?CATEGORY=study&BBS=4383

スレッド一覧@stzz BBS: 翻訳 英語 書籍 文化 その他 (全部で24のスレッドがあります。)

■掲示板に戻る■

感想(14)
■スレッド立てるまでもない質問スレッド◆(17)
豆知識 Trivia(4)
翻訳のコツ(6)
フランス語 Francais(1)
スペイン語 Espan~ol(2)
Limericks(2)
Beowulf研究者 と 指輪物語(3)
コンピュータ GUI インターネット(1)
ドイツ語 Deutsch(2)
*マーク*ピーターセン*(3)
Shakespeare(3)
法律、税金、不動産など(2)
聖書 The Bible(2)
医学 FDA 化学(1)
外来語、和製英語、カタカナ語(1)
翻訳ツール(2)
Google 検索ツール(1)
特許 Patents 技術翻訳(1)
テスト書き込みはここへどうぞ!(2)
ネイティブスピーカー神話(2)
翻訳:理論と実践(1)
Pushkin 「Onegin」(1)

■掲示板に戻る■
39名無し象は鼻がウナギだ!:04/05/01 20:01

☆☆☆ 翻訳 英語 などに関する4つの掲示版 ☆☆☆

お暇な時にお立ち寄りください。

(otd) stzz BBS: 翻訳 英語 書籍 文化 その他
http://bbs10.otd.co.jp/stzzBBS/bbs_thread

stzz BBS: 翻訳 英語 書籍 文化 その他
http://jbbs.shitaraba.com/bbs/subject.cgi?CATEGORY=study&BBS=4383

亡命.受難した翻訳者のための掲示板
http://jbbs.shitaraba.com/bbs/subject.cgi?CATEGORY=study&BBS=4434

Takayuki Nanto's BBS about Foreign Languages and Translation (C'mon, guys!)
http://bbs10.otd.co.jp/292937/bbs_thread


「樹影譚」 (文春文庫) 丸谷 才一 (著) 価格: ¥347
http://www.amazon.co.jp/exec/obidos/ASIN/4167138093/qid=1084673235/sr=1-4/ref=sr_1_8_4/249-8149013-5257942

この中の短編「鈍感な青年」を読んだ。
大学生くらいの男女カップルが毎日、図書館で並んで本を読む(デート)、
そして、ある日、東京下町のお祭りに行ってみる・・・
こんなにすんなりと主人公(たち)に感情移入できる話は久しぶりに読んだ。

それから、表題作 「樹影譚」 を駆け足で読んだら、
Nabokov "Pale Fire" に近い世界を日本語で実現していた。 つげ義春にも似ている。

3つめの短編 「夢を買ひます」 も良かった。 これは Lolita みたいな感じ。 愉快で笑った。
エキサイト翻訳
http://www.excite.co.jp/world/english/

ちなみにこの翻訳エンジンで↓の文を日→英→日と翻訳したところ、こうなりました。

「ハッキング」から「今晩のおかず」までを手広くカバーする巨大掲示板群
『2ちゃんねる』へようこそ!
          ↓
huge bulletin board group " which covers extensively
"from hacking" to "the dish of this evening" -- my two -- る" -- passing -- Welcome!
          ↓
大きな掲示板グループ"それは「叩き切りから」「今夜の皿」
--私の2枚--まで広範囲にカバーする、通過するというる"は歓迎します!
42outrage factor:04/07/19 05:20
http://ruku.qp.tc/dat2ch/0405/12/1082683634.html 786
質問: Consumers view genetically-engineered foods as "not natural", having "unknown consequences", "harmful", "controlled by others", and "risky" -- all well-known outrage factors.
の outrage factor はどう訳しますか?

異常に性格が悪いヒス女として有名なフェミS女史(自称ベテラン翻訳者)が、outrage factor の意味が解らないと大騒ぎしたのには ワロたが、
アメリカ人の著者に自慢気に質問メールしたのには驚いた。「日本語の定訳は何ですか?」(オマエモナー)
英語しか知らんアメリカ人が何故そんなこと知ってるハズがある?

こんな簡単なことが解らないレベルの人でも分野を限れば(例えば特許)翻訳のプロとして活動は可能かもしれないが、
outrage factor の意味(背景・語感)というものがすぐに解らんようでは時事問題の翻訳は無理だろう。 (略)

意味(背景・語感):
outrage factors と言う表現は少しだけ気が利いている。
objections が最も当たり前か。 common complaints、often-raised objections, protests、counterarguments、ETC.

anger factors, complaint factors, objectionable factors,
objection factors, repulsion factors, aversion factors, など、似た言い方はいくらでもある。
定訳があるはずがない。以上挙げたフレーズのどれにも定訳はない。

outrage factor の適当な翻訳とは以下の作業である。まずその意味と背景・語感(どの程度気が利いているか)を理解し、
出来る限りの日本語の感覚を用いて、前後また全体との関係を考えつつ置き換える。

(本来はそれほど大変な事ではないが、これがちゃんと出来る翻訳者は少ない。)

原文をよく読んだ結果、outrage を軽い気持ちで使っていると判断できる場合には、 -- all well-known outrage factors.
が 以下の当たり前の表現 になっても おかしくない。
「などがよく聞く異論である」
「などがよく耳にする異論である」 「などの異論をよく耳にする」

たまにプロ翻訳者の質問に答えることがあるが、さすがに これほど簡単な質問を受けたことはない。
こんな簡単なことが疑問なような人間には TIME、NYTimesは読めないだろう。
(・ε・) ニフニフ http://ruku.qp.tc/dat2ch/0405/12/1082683634.html
ヲチスレを読むための予備知識。(1of2)

Fhonyaku(通称 Nif、ニフ)は英語翻訳者の掲示板。
以下の4人(自称「テクノラート」集団)が中心に運営しています。
● B、ニックネーム=禿げ、抜海
● S、ニックネーム=ヒス女、フェミ女、(楊貴妃?)
● ネコ、ニックネーム=糞、検索男
● HN=小野仙内、ニックネーム=小○仙○、汚染ちゃん

一見、民主的に開かれているような印象を与えるため、この掲示板には 気軽に迷い込む人がいます。
日英バイリンガルの「ST初心者」も間違って入ってしまいました。

ちなみに、英語・翻訳の知識・能力は:
ST >> Tan >>>>>> S >>> B=平凡な翻訳者 >>>> ネコ、O=素人

自分より英語ができる人間は許さないS,Bは即座に STに嫌がらせを始めます。
S,B(ネコ)は、慇懃無礼な嫌がらせを、徐々に強めるのが巧妙です。

「■翻訳者の無駄話■」スレッド では、イジメられて STがうろたえるさまを、楽しくヲチしていました。
しかし、汚染ちゃんは以下の発言で、STを罠にかけることに成功します。

> ところで、中3の娘の英語の教科書に、
> We can contact each other either by e-mail or the Internet.
> という文があるんですが、これ、わたし絶句してしまいまして(^^;)
> 訳せなかったんですよ。このthe Internetは果たしてなにを指しているのでしょう。

この質問に、うっかりと答えてしまったSTに「テクノラート」集団の4人が嫌がらせの集中砲火を浴びせます。

T=Tanyaも初めはSTに加勢していましたが、かえって事態を悪化させて、卑屈に謝罪をはじめます。
(つづく)
(・ε・) ニフニフ http://ruku.qp.tc/dat2ch/0405/12/1082683634.html
ヲチスレを読むための予備知識。(2of2)

嫌がらせの集中砲火が始まると、ヲチの方にも力が入って、本スレから
分離したヲチスレ 「 (・ε・) ニフニフ 」 が立つ運びとなりました。

ヲチスレでのハイライト:

● 嫌がらせの集中砲火に対する非難(今まで溜まっていた不満が爆発!)
● 汚染ちゃん乱入、荒らし・脅迫・埋め
● 渦中の人、ST登場
● Bが突然、「追放」宣言

B>> 専門を持って生まれてくる人なんていません。みんな、専門を作るんです。
おいおい!  Bさん松下幸之助(OR ソニーの創業者とか)になっちゃてるよ!

「私もST初心者さんふうのレスをしてみましょうか?」とはじまる
S嬢が渾身の力を込めて書いた STを挑発・侮辱する文章
(STを挑発・侮辱する文章としてはS嬢の最高傑作だった)

>> ネコが英語に関して正しい事を言ったのを初めて目撃した。

ネコ:「台北は今日も雨だった、の可能性もあります」

汚染ちゃん:
 2ちゃんはエンガチョなんでカキコミはいっさいしないのに、こういう形で
登場させれると誤解されますねえ。
 で、誰がやったの? 迷惑なんだけど。あたしがリードオンリーなのはマー
ケティングのために2ちゃんを研究しているからです。自分が登場しちゃうとフィールドに影響がでちゃうんで。
 そろそろお遊びじゃすまなくなってきましたね。
45認知MAN:04/08/17 15:01
何じゃ?このスレは?
認知科学全般を語ってると思いきや・・・。
Meta1さんはこの前認知言語学IIスレに来た人ですね!

>>あるスレッドでは言語学は科学と言うよりも文化だという
発現を目にし、工学分野には応用されないものなのか分からなくなりました。

文化も深く関連しているので、構造的に割り切れるものじゃないって事だった
と思うんだけど・・・。
他にも宗教や風土条件なども絡みますよね!
もっとついてほしい?ちゃんと自分でいわなきゃ突いてあげないよ
いつも誤訳してる馬鹿な奴(町山)が、意味不明の訳文を提出してきたから、「また誤訳かな?」 と思ったら、やっぱりそうだった。

http://d.hatena.ne.jp/TomoMachi/20041015
> マット・ストーン  僕らは俳優たちがテレビのニュース番組に出るのを追っかけて観た(ボールドウィンはCNNの政治討論番組『クロスファイア』に出演した)。

「追っかけて観た」って、テレビで見るのに追っかける必要は無いから、
「俳優たちがテレビのニュース番組に出るのを追求してテレビ視聴した」というのが町山の解釈か?

ちなみに原文は: We really went after actors who'd gone on news programs.

この原文の意味わかりますか? (ヒント:町山のは完全な誤訳)

リンク先にある町山の翻訳はシロートらしい悪訳だけど、前後の部分で完全に誤訳してるのは問題の一文だけだから、文脈を見れば正解がわかるはず。
>>47
私たちは、ニュース番組上で行った俳優を実際に追いかけました。

エキサイトテキスト翻訳より
49名無し象は鼻がウナギだ!:04/11/04 11:46:37
>> この場合の"go(went) after someone"っていうのは「誰だれを追い込む」とか「誰々を狙って」という意味ですね。

その通り!

原文>> We really went after actors who'd gone on news programs.

http://d.hatena.ne.jp/TomoMachi/20041015
「カタコト英語の町山」完全な誤訳>> 僕らは俳優たちがテレビのニュース番組に出るのを追っかけて観た

悪い点を列挙してやったから、2日目に少し直していたが、完全な誤訳の部分は4日目に、やっと直した。 正解を誰かに教えてもらったのかな?

「カタコト英語の町山」らしい悪訳>> 僕らが実際「チーム・アメリカ」でいたぶったのは、テレビのニュース番組に出たことのある俳優たちだ

● really went after ・・・ ここでは「実際に」じゃなくて、「徹底的に」の意味

● who'd gone on ・・・ この過去完了は「出たことのある」(経験)じゃないよ!

このシロート君は、「えーと、現在完了の意味は4種類だったかな? 過去完了も同じかな?」 と、高校受験生クンみたいに悩んだようだ。

1.継続〔(いままで)ずっと〜している 〕
2.完了〔(ちょうどいま)〜してしまった〕
3.経験〔(いままでに)〜したことがある〕
4.結果〔〜して(その結果,いまは)〜だ〕
hoshu
ほしゅ
sage
53名無し象は鼻がウナギだ!:2005/05/31(火) 15:18:03
町山、英語が聞き取れないのでどんなジャンルの映画を観てもミステリーになってしまうと告白してたのにはワロタ

57 :無名草子さん :05/02/22 05:06:00
英語わからん馬鹿チョソがGerald Riveraを「ジェラルド・リベラ」と書いてた。

387 :名無しさん@お腹いっぱい。:05/02/26 12:59:44 ID:7CisLQ6l
よく誤訳してる馬鹿な奴がアメリカのテレビ番組がまるで聞き取れないで恥を晒していた。
(リンク先は何度も訂正した後)
http://d.hatena.ne.jp/TomoMachi/20040630
# macska 『どうでもいいですけど、正しくは「チェイニーの口汚い言葉が邪魔でほとんど映画の音声は聞こえなかったよ」です。』

# TomoMachi 『すみません。これはその番組を見てすぐに書いたので聞き取りは正確ではなかったです。とりあえずますチェイニーのところの意味は直しておきました。』

大胆に「超訳」してるのかと思ったら、聞き取れる部分だけ訳して、後は省略してた www
54名無し象は鼻がウナギだ!:2005/08/28(日) 14:06:55
55名無し象は鼻がウナギだ!:2005/09/21(水) 18:19:31
56名無し象は鼻がウナギだ!:2005/09/23(金) 17:59:05
>>36
NOT FOUND
ページが見つかりません
57名無し象は鼻がウナギだ!:2005/09/23(金) 20:33:25
言語学の究極の目的は自動翻訳、だと思う。

「間違いだらけの...」にも間違いというか
  通説に妥協した部分がある。
58名無し象は鼻がウナギだ!:2005/09/23(金) 22:05:59
22世紀になればできているかな。
59名無し象は鼻がウナギだ!:2005/10/10(月) 20:22:43
======
キチガイスレ
======
60名無し象は鼻がウナギだ!
町山智浩: 「『オタク』という造語に関しては俺が元祖ニダ」 とアメリカで(嘘の)宣伝してるのはイタダケないが、
英語がまるで聞き取れないのに、映画評論にガンバッテルのは偉いと思う。
__________________________

よく誤訳してる馬鹿な奴がアメリカのテレビ番組がまるで聞き取れないで恥を晒していた。

原文: Couldn't hear most of the movie over Cheney's foul mouth

(リンク先は何度も訂正した後) http://d.hatena.ne.jp/TomoMachi/20040630
町山による聞き取り> 「チェイニーの汚い言葉遣いは揶揄しないのか?」

# macska 『どうでもいいですけど、正しくは「チェイニーの口汚い言葉が邪魔でほとんど映画の音声は聞こえなかったよ」です。』

# TomoMachi 『すみません。これはその番組を見てすぐに書いたので聞き取りは正確ではなかったです。とりあえずますチェイニーのところの意味は直しておきました。』

大胆に「超訳」してるのかと思ったら、聞き取れる部分だけ訳して、後は省略してた www
__________________________

よく誤訳してる馬鹿な奴が、意味不明の訳文を提出してきたら、また誤訳かな? と疑うのが普通だと思うが。

原文: We really went after actors who'd gone on news programs.

http://d.hatena.ne.jp/TomoMachi/20041015 町山の誤訳> 僕らは俳優たちがテレビのニュース番組に出るのを追っかけて観た

「追っかけて観た」って、テレビで見るのに追っかける必要は無いから、
「俳優たちがテレビのニュース番組に出るのを追求してテレビ視聴した」というのが町山の解釈か?

原文: We really went after actors who'd gone on news programs.

この原文の意味わかりますか? (ヒント:町山のは完全な誤訳)