【話題/IT】4億円かけた最高裁の『音声認識システム』、津軽弁の「うっと」を認識せず [05/19]
標準語も喋ることが出来ない奴は死んだ方が良いな
日本の方言全て対応したら
金額の0が幾つ増えるの?
標準語を強制すればおk
A「とっとっと?」
B「とっとっと!」
A「なんばとっとっと?」
B「○○新聞ばとっとっと!」
この九州弁を、はたして認識できるのだろうか?
正直青森のなまりは東北の人間でも判別不能
111 :
名刺は切らしておりまして:2009/05/20(水) 08:27:33 ID:Zd8vfRyE
人間が速記しようにも、津軽弁は津軽の人間じゃなければ認識できないだろ。
>>108 それより鹿児島弁とか沖縄弁とかほとんど外国語の世界のレベルのがあるし。
とある私鉄にて、音声認識型自動券売機を試験導入するも、まったく使い物にならなかったのは極秘だ。
115 :
名刺は切らしておりまして:2009/05/20(水) 22:07:12 ID:dq5JFm41
ホンズナス・バガワラス
116 :
名刺は切らしておりまして:2009/05/20(水) 22:12:29 ID:SfiDCgi5
Via TalkとかVoiceAtokとかは
ちゃんと音声認識を意識してしゃべらないとダメダメだったけど
このシステムはそんなまともに動くのか?
117 :
名刺は切らしておりまして:2009/05/20(水) 22:36:01 ID:EyenDgKp
4億ってたったの100KLぐらいか
まぁ仕方ないんじゃね
119 :
名刺は切らしておりまして:2009/05/20(水) 22:38:03 ID:V0Y9r9oG
>>1 >最高裁が約四億円をかけて開発した自信作で、全国の約百六十法廷に導入。
関西弁入れた程度で対応できると思っている
司法試験上位合格者で判事が構成される
最高裁って馬鹿なの?死ぬの?
ワープロの日本語変換とか自分でできるの?
言葉は変幻自在だからなぁ
121 :
名刺は切らしておりまして:2009/05/20(水) 22:48:04 ID:V0Y9r9oG
4億かけて要求仕様を満たさないものを検収したらまずいでしょ?
領得罪なんだから
若者言葉なんか誤変換しまくりだろうね
>>121 仕様書を情報公開制度で見てきたらどうよ?
コピー貰ってきたら、黒塗りの枠がいっぱいだろうけど。
124 :
名刺は切らしておりまして:2009/05/20(水) 23:16:28 ID:G8Veee5W
ちゃうちゃうちゃうんとちゃう?
ちゃうちゃう
ちゃうちゃうちゃうで
125 :
名刺は切らしておりまして:2009/05/20(水) 23:35:46 ID:FoF6iDdv
まあ、そんなこと言い出したらきりが無いわ。
帰化人の訛った言葉も聞き取れるようにしとかないと
差別とか言われたりしてな。
126 :
名刺は切らしておりまして:2009/05/20(水) 23:47:29 ID:QrNjuvwZ
うってうって姫
127 :
名刺は切らしておりまして:2009/05/20(水) 23:49:45 ID:B4Hoil/p
津軽弁は日本語よりフランス語に近い。
129 :
名刺は切らしておりまして:2009/05/21(木) 00:38:47 ID:JcraZy+O
津軽弁の単語
「マイネ」(ダメだ)
「チャペ」(仔猫)
「ジャンボ」(髪)
「マディーニ」(丁寧に)
「イェパタダ」(変な)
「ズッパド」(たくさん)
「エンプテ」(煙たい)
「アコモコ」(悪口)
「ジャイゴ」(田舎)
130 :
名刺は切らしておりまして:2009/05/21(木) 00:56:40 ID:wTAb9hOV
筆談で裁判やれ
131 :
名刺は切らしておりまして:2009/05/21(木) 01:00:52 ID:JcraZy+O
>>130 津軽衆は「百円」を「ふぇぐえん」
「背中」を「へなが」と書きます
132 :
名刺は切らしておりまして:2009/05/21(木) 01:04:06 ID:dCWaYLZ8
そもそもだ。
制作者が理解できないコトバを
制作物が理解できるわけが無かろう。
津軽弁は、方言というより別言語に近いなw
134 :
名刺は切らしておりまして:2009/05/21(木) 01:37:02 ID:0ZayVJ/R
なんでこう、自然言語処理系で実用レベルを高く設定するのかねw
ちなみに、活字文字認識、手書き文字認識、顔認証、指紋系認証、音声認識が主に実用化になっている。
音声認識だと、方言なんかはむしろ楽勝。津軽弁程度でだめなら、標準語も認識率90%切りそう。
認識が困難な例としては、発音の複雑な中国の発音で日本語話せば、認識グダグダになる。
一番簡単な活字文字認識だと、「・」を正しく認識するのが難しい。最悪「一」「■」とかになる。
アスキーアート、絵文字の様にスラング的なものを考えれば、人間が識別できないものが身近にあふれているのがわかる。
最近だとCAPCHA認証かな。出来の悪いやつだと何回も失敗するでしょ。
人間が識別できないものは当然、機械では無理。
人間は識別対象だけをチェックしているのではなく、思い込みを多用しているから。
んで、とりあえず4億無駄遣いですか。運用コストで10億超えそうだね。
裁判員制度もそうだけど、司法関係者が、人間ってものを知らな過ぎる。
というより、録音データでは改ざんしにくいから、改ざん可能な文字データで残すのかな?
だとすれば犯罪だね。
135 :
名刺は切らしておりまして:2009/05/21(木) 03:12:49 ID:9ln+lldi
青森の上京かっぺって「訛ってないアピール」をするから嫌いだわ。思いっきり訛ってるから。
ってかそういうアピールをすること自体田舎臭い。百姓が都民ヅラしちゃいかんよ
どういう部分に金がかかったのか疑問だな。
どうせ、システム購入時の仲介役の人件費だろ。
映画「ネゴジエーター」にも、音声認識システムでてくるよね。
ネタばらしすると、警察幹部による身内の盗聴システムの一部としてだが・・・
>>124 それだと意味が通らないぞ。
一行目は、「ちゃうちゃうちゃう?」にしないといけない。
今のままだと、最初から否定している
141 :
名刺は切らしておりまして:2009/05/21(木) 15:19:47 ID:rd+oslQq
無料で提供しる 国はサービスしろい 裁判24時とかビデオで楽しめるようにしれ
「うんとねー」を多用するこどもピーンチ
143 :
名刺は切らしておりまして:2009/05/21(木) 15:33:02 ID:gFqZ/ZwH
地裁総務課
楽しそうだなWWW
北海道や沖縄なんてもっとムリだろ
145 :
名刺は切らしておりまして:2009/05/21(木) 20:33:33 ID:xUHLEPLL
証言のテープ起こし(最近ではデジタルだろうけど)に一件1万円かかるとして
2005年に裁判員制度の対象となるとされる事件が3629件らしいから
10年くらい使えばもとがとれるわけですかね。
146 :
名刺は切らしておりまして:2009/05/21(木) 20:50:16 ID:xUHLEPLL
死刑囚の生き死ににかかわるようなレベルで運用可能な
ミッションクリティカルな性能は当然持っているのだろう。
国会もにも当然運用可能だろうから導入してもらいたい。
>>144 北海道は浜言葉使う所は強烈になまってたりするけど、他はたいしたなまってねえべさ。
148 :
名刺は切らしておりまして:2009/05/21(木) 23:53:11 ID:pZyXX5bU
さすが、乱数表なしで暗号に使われた言語はひと味違うな。
あのーITにだまされないでください
>>145 裁判員制度対象の裁判にだけ使うわけじゃないよ
151 :
名刺は切らしておりまして:2009/05/22(金) 00:31:34 ID:CBu/3noY
津軽対応のためもう四億円必要だな
IBMのViaVoiceを音声認識エンジンとして使い、
ジャストシステムのVoiceATOKで文字変換
後はデータベースに登録する仕組みを付ける。
これで4億なんてことになっていそう・・・
>>138 土曜日に見ようと思ってたのにネタバレするなよ。
154 :
名刺は切らしておりまして:2009/05/22(金) 01:18:05 ID:73mVAFEi
大阪の人間は山口組の人間と同じ言語を話す。
裁判では不利になるのか。
155 :
名刺は切らしておりまして:
ジェンコなば青森だげでなぐ使うがら
他の東北もやばいんでねえの