【話題/IT】4億円かけた最高裁の『音声認識システム』、津軽弁の「うっと」を認識せず [05/19]

このエントリーをはてなブックマークに追加
1ライトスタッフ◎φ ★
二十一日の裁判員制度開始を前に、法廷での被告人質問や証人尋問のやりとりを
自動的に文字化して記録する「音声認識システム」が、「うっと(とても)」など
一部の津軽弁を識別しない可能性の高いことが十九日、分かった。

音声認識システムは、証言台の前に設置したカメラやマイクで法廷のやりとりを
映像と音声で記録。発言内容を自動的に文字化し、評議の際に録画映像とあわせ、
裁判員が確認できる。

最高裁が約四億円をかけて開発した自信作で、全国の約百六十法廷に導入。
関西弁に対応できるバージョンもある。

青森地裁でも一号法廷に設置されたが、同地裁総務課によると「じぇんこ(銭)」
など津軽弁の難解な方言はシステムでの認識が難しいほか、独特のイントネーション
もあるため、どの程度対応できるか分からないとしている。

システムには地名や人名など頻繁に使用する言葉の事前登録が可能。
ただ、「方言となると何が出てくるか予想ができない」(総務課)ため、今後は
青森地裁の法廷でよく使われる津軽弁の登録も検討するという。

最高裁は「前後の文脈から類推でき、実務に支障のないレベルは確保できる」
(広報課)と説明。

特有の方言がある各地の地裁は「システムは参照用で評議そのものに影響はしない」
(鹿児島)、「実際のケースを見ないと何とも言えない」(那覇)などとしているが、
当面は手探りの運用が続きそうだ。

◎ソース
http://www.tokyo-np.co.jp/article/national/news/CK2009051902000228.html
2名刺は切らしておりまして:2009/05/19(火) 14:37:32 ID:okPgK6Xm
「方言となると何が出てくるか予想ができない」(総務課)


はい差別、アウト
3名刺は切らしておりまして:2009/05/19(火) 14:38:51 ID:72CIPFry
ま、それぐらいならいいんじゃね?
4名刺は切らしておりまして:2009/05/19(火) 14:39:39 ID:2u3ppTqz
3億6千万位は色んな所に消える金だろ
5名刺は切らしておりまして:2009/05/19(火) 14:41:42 ID:AGpL5hr5
「うっと」じゃなくて「うって」だし。
6名刺は切らしておりまして:2009/05/19(火) 14:42:14 ID:OvySxb5m
もういい加減に人間が機会に擦り寄れば、音声認識も完璧になるだろ。
さしずめ2400ボーぐらいで、ピーーーーガリガイガリガリって感じで(w
7名刺は切らしておりまして:2009/05/19(火) 14:42:37 ID:JP/2rOxo
青森は海中に沈めて
新たな大陸棚として活用した方が良い
8名刺は切らしておりまして:2009/05/19(火) 14:44:11 ID:BwGLRxCY
日立製?

金儲けにはいいね
9名刺は切らしておりまして:2009/05/19(火) 14:45:07 ID:P503qttl
そら、無理やろ。
人間でも出来ん。
10名刺は切らしておりまして:2009/05/19(火) 14:47:54 ID:+YLrWI3w
PCの日本語入力に、
手書き認識を入れようとして、
音声入力を入れてしまい、
PCがしこたま遅くなった人を知っている。
解析系はやっぱり重いか今のPCでも。
11名刺は切らしておりまして:2009/05/19(火) 14:50:56 ID:dl0rjXxV
4億っていっても実際の開発費や製造費なんて2〜300万だからな。
後は、いろんなとこの色んな人のお財布に入る仕組み。それが政府それが政治。
12名刺は切らしておりまして:2009/05/19(火) 14:52:16 ID:C1z6k1Ix
おれすげぇ頭いいかもしれない。


津軽弁の犯罪者のときだけ


通訳者にその自動音声認識システムの前で

通訳させれば解決じゃね?????????

仕事も増えて最高じゃん!!!!!!!!!1

やばい超あたまいいかも
13名刺は切らしておりまして:2009/05/19(火) 14:52:21 ID:qwT/71vU
方言は無理だろ。
14名刺は切らしておりまして:2009/05/19(火) 14:52:39 ID:DGhySWFQ
南部弁は認識します
15名刺は切らしておりまして:2009/05/19(火) 14:54:01 ID:HwUANzo6
>>11
さすがに2〜300万では無理だろうw
16名刺は切らしておりまして:2009/05/19(火) 14:54:15 ID:eg8M5uCu
名古屋弁をテストしてみてちょうよ。
17名刺は切らしておりまして:2009/05/19(火) 14:54:30 ID:1CmZjA7j
音声認識システム

最高裁が 4億で発注
   ↓
特殊法人が1億の手数料を取って、大手メーカーに発注  1億は天下り役員の給料に
   ↓
大手メーカーが3億で受注
   ↓
子会社が1億5000万で受注
   ↓
孫会社が5000万で受注
   ↓
ソフトハウスが1000万で受注
   ↓
バイトが100万貰って完成させる
18名刺は切らしておりまして:2009/05/19(火) 14:56:35 ID:5KnBSQXm
導入する前にテストしないの
19名刺は切らしておりまして:2009/05/19(火) 14:57:20 ID:YTKz7PAf
天下り団体が3億ピンハネコースか?
20名刺は切らしておりまして:2009/05/19(火) 14:58:26 ID:4prWFfdY
>>17
ワラタw
21名刺は切らしておりまして:2009/05/19(火) 15:00:42 ID:z8vl65RO
まてまてまて、これ地方議会の速記では出来てたはずだろ

それを流用して、とか考えなかったんかよ
22名刺は切らしておりまして:2009/05/19(火) 15:02:32 ID:7j3dHsCh
スペクターとカールにやらせれば
23名刺は切らしておりまして:2009/05/19(火) 15:03:26 ID:cu7JNPKF
認識できない言葉をしゃべれば死刑にすれば対策費はかからない
24名刺は切らしておりまして:2009/05/19(火) 15:04:55 ID:wfFhdYv1
>>6

いま「ボー」って通じるのか?w
懐かしいなぁ
25名刺は切らしておりまして:2009/05/19(火) 15:07:25 ID:z+coAaEa
>>17
>バイトが100万貰って完成させる

と見せかけて、10万円で音声認識パッケージを買ってくる
26名刺は切らしておりまして:2009/05/19(火) 15:09:54 ID:1vuewJQR
津軽弁の「うっと」って「うんと」が促音便になっただけだから別に難しいと思わんのだが
27名刺は切らしておりまして:2009/05/19(火) 15:14:09 ID:iNfk5jGN
福岡の「これ、とっとっと?」も理解できないはず…

28名刺は切らしておりまして:2009/05/19(火) 15:15:08 ID:XUA/LmVk
速記最強伝説
29名刺は切らしておりまして:2009/05/19(火) 15:16:04 ID:OB5ZKOjv
 
 津軽弁って、何人が話してるの?
30名刺は切らしておりまして:2009/05/19(火) 15:16:22 ID:+rk+9sSR
オレも認識できん。
31名刺は切らしておりまして:2009/05/19(火) 15:17:55 ID:DAjmncWc
4億円で、完成度が高いものができるとは誰も思ってはいないよ。
いくら何でも、安すぎるよ。
32名刺は切らしておりまして:2009/05/19(火) 15:17:56 ID:+YLrWI3w
これは、辞書が不十分、単語切り出し困難 どっち?
33名刺は切らしておりまして:2009/05/19(火) 15:18:12 ID:VIXwiuf2
東北訛りのきつい人は本当に何言ってるか分からん
34名刺は切らしておりまして:2009/05/19(火) 15:19:37 ID:VEg2KoDj
>>17
> 音声認識システム
>
> 最高裁が 4億で発注
>    ↓
> 特殊法人が1億の手数料を取って、大手メーカーに発注  1億は天下り役員の給料に
>    ↓
> 大手メーカーが3億で受注
>    ↓
> 子会社が1億5000万で受注
>    ↓
> 孫会社が5000万で受注
>    ↓
> ソフトハウスが1000万で受注
>    ↓
> バイトが100万貰って完成させる
半島のバイトがIBMのVIA VIOCEをパクル。
ウリジナルだ!
35名刺は切らしておりまして:2009/05/19(火) 15:20:25 ID:o1oKjlt2
昔、炎の仙南弁サイトと方言サイトのポータルやってた先輩をなぜだか思い出した。

今なにやってんだろ?
36名刺は切らしておりまして:2009/05/19(火) 15:23:22 ID:DAjmncWc
>>32
イントネーションのパターン認識が弱すぎ。
中国やタイの音声システムように、声調が違うと違う音価と
認識させないと、方言はむり。

単語の切り出しなら、nグラムで辞書を引き出すのは
ハードウェア増強でいくらでも解決できる。
37名刺は切らしておりまして:2009/05/19(火) 15:24:04 ID:a/ENiQ5X
>>5 の発言は識別不能と考えられる。
38名刺は切らしておりまして:2009/05/19(火) 15:26:07 ID:iNfk5jGN
東北では、まんじゅうは舐めるものらしい

39名刺は切らしておりまして:2009/05/19(火) 15:26:42 ID:DAjmncWc
>>34
VIA VIOCEは、京都大学が関与した形跡があるな。
関西弁とか日本海側のリエゾンしまくりの言語でも
元の音に戻して、認識するみたいね。
40名刺は切らしておりまして:2009/05/19(火) 15:27:22 ID:wnWZ95bA
これって野村の?
41名刺は切らしておりまして:2009/05/19(火) 15:32:50 ID:b2mzUBco
方言だと形態素解析も難しいんじゃね?
ブログ記事のタグとかも、うまく生成されなさそう
42名刺は切らしておりまして:2009/05/19(火) 15:38:38 ID:uPYlRETW
そんなの人間でも青森県民以外は認識しないから。
43名刺は切らしておりまして:2009/05/19(火) 15:41:11 ID:XB1156qK
千数百円の同人エロゲですら音声認識をつかったソフト出してるというのに…
44名刺は切らしておりまして:2009/05/19(火) 15:45:01 ID:1vuewJQR
「じゃ」「ず」「きゃ」の語尾が頻繁に出てくるのが津軽弁
他の方言と比べやすい
45名刺は切らしておりまして:2009/05/19(火) 15:47:25 ID:/YCSdkDi
【津軽弁の調書】

犯人「ジェンコダセ! ドコサ・アンズヤ?」
(金を出せ!どこにあるんだ?)

被害者「マイネ!マイネ!スカフェラィネ!」
(ダメだ!ダメだ!教えられない!)

犯人「オンメ・シャンベネバ・ウンデ・モイデ・マルドー!」
(お前話さなければ腕をもいでしまうぞ!)

被害者「ナモ・ジェンコ・ダッキャ・ネーォン!」
(金なんかどこにも無いぞ!)

犯人「ナンボ・ジョッパリ・ダンズ!」
(何て強情な奴だ!)

こんな感じなんだろうな
46名刺は切らしておりまして:2009/05/19(火) 15:48:35 ID:OtCmVkBf
これ他でも使えるようにならんかなぁ。無理か。
聴覚障害のサポートに使えそうなんだが。
47名刺は切らしておりまして:2009/05/19(火) 15:49:40 ID:DAjmncWc
津軽弁より、紀州弁のほうがコェェよ。

雑巾「ぞうきん」→「どうきん」
象さん「ぞうさん」→「どうさん」

文字にしないと、区別つかなくなっている音が多いんだわ。
48名刺は切らしておりまして:2009/05/19(火) 15:53:41 ID:72CIPFry
>>11
二、三人月かよw
49名刺は切らしておりまして:2009/05/19(火) 15:55:08 ID:1vuewJQR
>>45
最後の行はダンズ、じゃなくてダバ、の方がいいかも
50名刺は切らしておりまして:2009/05/19(火) 15:56:35 ID:mY23Ne3L
>>11
極端なことを言えばモノの値段は全て人件費だしな
51名刺は切らしておりまして:2009/05/19(火) 15:56:51 ID:voypzIUr
>>45
青森東部の人間(地方が違うので、津軽弁は喋れないがある程度聞き取れる)だが、
スカフェラィネだけは全然意味とか由来が推測できないw
52名刺は切らしておりまして:2009/05/19(火) 15:59:15 ID:/YCSdkDi
>>51
教える→知かせる→スカフェル

外国語みたいな津軽弁の単語として
「マイネ(ダメ)」「マディニー(丁寧に)」「イェパタダ(変な)」などがある。
53名刺は切らしておりまして:2009/05/19(火) 16:12:29 ID:5hW9SLDm
>>1
マジレスすると、津軽の人はバイリンガルで、日本語も話せるから問題なし。

…日本語もちょっと訛っているけどな。
54名刺は切らしておりまして:2009/05/19(火) 16:16:56 ID:Z1t1kVdP
>>25
 
>と見せかけて、10万円で音声認識パッケージを買ってくる
  ↓
 と思ったが、中古のViaVoiceでも案外イケね?とか思う
55名刺は切らしておりまして:2009/05/19(火) 16:20:28 ID:Z1t1kVdP
>>45
 韓国語が日本由来の単語のおかげで、かすか〜に何言ってる
かわかるような気がするのと同じ程度に、何言ってるかわかるな。
56名刺は切らしておりまして:2009/05/19(火) 16:20:57 ID:YB43xJju
弘前のオレオレ詐欺・・・ないんだろうな。
57名刺は切らしておりまして:2009/05/19(火) 16:21:49 ID:mms6+zF+
どんまい☆
58名刺は切らしておりまして:2009/05/19(火) 16:21:51 ID:NOPQo+VC
人間ですら認識できない言葉を機械に認識しろと言ってもねえ・・・
59名刺は切らしておりまして:2009/05/19(火) 16:23:40 ID:T5cVbS2q
津軽弁は日本語じゃあないから、機械が正しい
60名刺は切らしておりまして:2009/05/19(火) 16:25:02 ID:l7kHbAZZ
伊奈かっぺいの
「う゛ぇ」の四段活用を思い出した
61名刺は切らしておりまして:2009/05/19(火) 16:27:40 ID:ol6/ooqL
んだがっす
62名刺は切らしておりまして:2009/05/19(火) 16:29:17 ID:1vuewJQR
>>56
「ワダィ、ワ、ワァ!」
「ナァ、ダィダバァ」
「ワァツッテランダネ!」
63名刺は切らしておりまして:2009/05/19(火) 16:34:18 ID:DAjmncWc
>>54
10万円のでは、API呼び出しができるSDKがついていない。

多分、SDK無限ライセンス付きで、ランタイムがイントラ内無限のやつは、
個別見積もりで、\2000万以上すると思う。
さらに、ソース開示ライセンスまで取得する調達すると、億単位だな。

航空機の予約システムで、何かのパッケージを
SDK付きランタイム配布可のやつを使っていたが、
もう違うので置き換えたかもしれない。

courts.go.jpの調達情報見ていると、パッケージは
ソフトハウス経由ではなく、別ルートから調達しているみたいだよ。
64名刺は切らしておりまして:2009/05/19(火) 16:39:07 ID:Uca/4GSe
吉幾三のオラ東京さ行くだを見事に変換できれば大したものだ
65名刺は切らしておりまして:2009/05/19(火) 16:40:00 ID:cGH9AhZr
それくらいおまけしてやれw
66名刺は切らしておりまして:2009/05/19(火) 16:40:10 ID:58CWAutz
まともなコーパスがないんだから仕方ないわな。
67名刺は切らしておりまして:2009/05/19(火) 16:55:18 ID:OECYmo/3
日本語が認識できるから良いんじゃね。
68名刺は切らしておりまして:2009/05/19(火) 16:58:12 ID:RQL8sMKW
言語資源の調達にいくらかかるか解ってない知障が多いな。
いろんな人間の声に対応できるように
(少ない学習データに対してオーバーフィッティングしないように)、
全国各地から何百人と人を探して、かつそいつら全員に
十何時間〜何十時間とテキスト読ませて、さらに呼んだテキストの
波形データと音素との対応づけオペレーターにやらせて・・・

そのぐらいやらないと実用に耐えうるものはできないから、
億単位の開発費がかかっておかしくねーんだよ。

マジ>>17とか酷すぎる。
Biz+とか本当は高卒ニートの集まりだろ。
69名刺は切らしておりまして:2009/05/19(火) 17:00:16 ID:mzTSmAJc
>>58
目からうろこ
確かに機械に求めすぎだな
70名刺は切らしておりまして:2009/05/19(火) 17:03:04 ID:ON46Hywz
>>52
>マイネ
イネが否定 マ=真かな 真心のマみたいな。
>マディニー
ディニーが丁寧 マが強調ではないかと想像する。
71名刺は切らしておりまして:2009/05/19(火) 17:08:18 ID:vjIKVw7D
納税者としてはvia voiceと機能や認識率の性能比較してほしいな
億単位って信じられんわ
72名刺は切らしておりまして:2009/05/19(火) 17:15:05 ID:UV53Mhta
>>68
とっくに(自分が賢いと思ってる)バカに占拠されてますが。
73名刺は切らしておりまして:2009/05/19(火) 17:19:49 ID:1vuewJQR
>>70

マイネ→打ち消しの助動詞〜まい+感嘆詞ね

マディニー→までに→形容動詞まて(実直、律儀の意)+に
74名刺は切らしておりまして:2009/05/19(火) 17:24:12 ID:gg5WHIt2
>>45
カタカナにすると笑えるなw

ホンズナス・バガワラスも認識きるんだろうか
75名刺は切らしておりまして:2009/05/19(火) 17:29:38 ID:7FPjmrTO
4おくえん・・
ふじつうカナ?
76名刺は切らしておりまして:2009/05/19(火) 17:36:01 ID:KXG4maeu
どうでもいいだろ。青森なんて
77名刺は切らしておりまして:2009/05/19(火) 17:39:01 ID:DAjmncWc
>>71
via voiceは、インスコしたばかりだと認識率は、ゼロに近いだろう。
自分用に半日かかって、データベース作って、やっと使えるようになる。

音声の特徴をつかんで、話者をプロファイリングして、近いデータベースを割り振るのが
音声予約システムのアプリケーション部分。

精度をあげるために、プロファイルを動的に切り替えていったりする。

誰が話しているかを切り替えながら音声認識させるのも必要になるから
その機能もつくのが、裁判所固有のアプリケーション部分。

結構手作りの部分が多くあって、プロファイル毎に何百人分ものデータベースを
作るという工数もあって、4億円なら安いと思うぞ。
78名刺は切らしておりまして:2009/05/19(火) 17:51:28 ID:cv2w5Amq
>>55
中古文が残ってるのでその部分は読めるかも

犯人「ジェンコダセ! ドコサ・アンズヤ?」
銭コ出せ。どこサあらずや。

被害者「ナモ・ジェンコ・ダッキャ・ネーォン!」
ナモは否定の「な〜そ」の名残なんだか「なんぼ」みたいな副詞の系統か、分からんな

ジョッパリは強情張りの後ろだけが残った形だな。
79名刺は切らしておりまして:2009/05/19(火) 17:56:16 ID:U2M1Ptbc
>>58
そりゃそうだ。w
80名刺は切らしておりまして:2009/05/19(火) 17:58:03 ID:xFQ9C2M1
方言全部を網羅するのは難しいだろうな。にしても素敵装置。
81名刺は切らしておりまして:2009/05/19(火) 17:59:07 ID:0vkNvxa7
音声認識って成果がすごい見えにくい印象がある
どこかですごい発展した時期、技術ってある?
82名刺は切らしておりまして:2009/05/19(火) 18:11:52 ID:cv2w5Amq
>>81
1960-80ころに、「音声は典型的な部分ではなく遷移(経時比較)が情報源である」ってことが解明された。
あとは電算機の発達で計算能力があがり、スペクトログラムを力任せに処理できるようになってきてからある程度実用になってきた。
個人差の吸収、言語間の違いは、まだ言語研究者や知覚研究者の話すレベルと、工学者の話すレベルが一致してないなあ。
人間の知覚のエミュレーションはこの2種類の研究者の話が一致するとできるようになる
83名刺は切らしておりまして:2009/05/19(火) 18:12:33 ID:ON46Hywz
>>73
へぇ。ちゃんと元がわかってんだな。
84名刺は切らしておりまして:2009/05/19(火) 18:23:51 ID:1vuewJQR
>>83
いや、語源の分からない単語もかなり多いんですよ…
「うじゃめぐ」とかどう考えても、勝手に誰かが作った単語が流行った
としか考えられんw
85名刺は切らしておりまして:2009/05/19(火) 18:32:41 ID:SMpnZ3pT
津軽弁はフランス語かスペイン語辺りの音声認識技術を使えば対応できると思う。

か、け!(Ca que' !)   : これ食べて下さい。
く!(Que !)        : はい食べます。
めか?(Meh-ca ?)    : 美味しいですか?
め!(Meh !)       : はい美味しいです。
86名刺は切らしておりまして:2009/05/19(火) 18:48:18 ID:LCGEaXyw
>>68
元請け社員乙
87名刺は切らしておりまして:2009/05/19(火) 18:52:48 ID:DAjmncWc
>>85
なるほど、津軽弁は標準語とは母音の数が違っていて、
漢文でいうところの入声があるのか。
88名刺は切らしておりまして:2009/05/19(火) 19:11:30 ID:1QxAtUF4
4億出すぐらいなら2,3人を数十年雇った方が安くねw
89名刺は切らしておりまして:2009/05/19(火) 19:50:04 ID:4WcpwUQZ
俺、構音障害だが、
自動音声認識の電話に梃子摺ったことがある。
もともと機械化は無理だと思われ。
90名刺は切らしておりまして:2009/05/19(火) 19:56:23 ID:F6w/d2OF
おk
とりあえず、南部と津軽を切り分けてくれ
91名刺は切らしておりまして:2009/05/19(火) 20:01:23 ID:yGW6VXSl
津軽と秋田は通訳雇った方が間違いないぞ
92名刺は切らしておりまして:2009/05/19(火) 20:13:46 ID:lYmLyYLQ
開発費4億のうち、人件費に3億8000万とか
93名刺は切らしておりまして:2009/05/19(火) 20:21:01 ID:DAjmncWc
>>92
いいねぇ。科学技術の投資だし、音声認識の運用はきっと役に立つ。
それに、人件費に厚めに回っていることは、乗数効果が出る。

ロケット開発して気象衛星をゲットできたように、
民間企業ではできないことを、もっと国はやるべき。

こういう投資は、もっとやって、将来の産業の種を蒔いてほしいぜ。
誰もが欲しがる技術になるから、成果はTLO(技術移転)して
民間企業が実施を担当することになり、雇用増大になる。
94名刺は切らしておりまして:2009/05/19(火) 20:22:17 ID:rlS7wXc/
http://www.nicovideo.jp/watch/sm5345366

こういうのも認識してくれるんだべか?
95名刺は切らしておりまして:2009/05/19(火) 20:25:02 ID:cv2w5Amq
>>84
「じゃわめぐ」が同義語とされているが、こっちは「ざわめく」の変化だな。
96名刺は切らしておりまして:2009/05/19(火) 20:38:50 ID:g6M4fi0j
名古屋弁の「やっとかめ」は認識してくれるのか?
三河弁の「ひずるしい」は?
97名刺は切らしておりまして:2009/05/19(火) 20:41:56 ID:5BtNwNkc
この手の物で4億ならたった4億って感覚の方が普通のような気がする。
結局ノウハウはどっかから持ってこなくちゃいけないから、それのレベルによって金額が変わるな。
98名刺は切らしておりまして:2009/05/19(火) 20:57:23 ID:uEfQC7Xv
これは許してやれよ。
津軽弁は日本語じゃないし。
と三八上北からやってきた俺は思う。
99名刺は切らしておりまして:2009/05/19(火) 21:13:00 ID:Evw6uw6G
当たり前だろ。
そもそも津軽弁って発音からして日本語から少しずれているし。
100名刺は切らしておりまして:2009/05/19(火) 21:27:15 ID:0WWknspL
税金で開発したソフトウェアは国民に無償提供しろよ・・・

国県市町村HPの読み上げソフトだって、国が作って配れば安く済むだろうに、
契約団体のサイトだけ読み上げ可能なんて馬鹿なサービスと契約して、
表面上だけアクセシビリティに配慮してますとか・・・
101名刺は切らしておりまして:2009/05/19(火) 21:46:52 ID:uEfQC7Xv
>>100
広く国民に情報を伝えるための官報でさえ
金取る国では無理だろ。
ネットは無料でいいと思うんだがなぁ
102名刺は切らしておりまして:2009/05/20(水) 00:48:48 ID:dEKorfA0
>>92
そんなもんじゃない? 開発に使った機械費用が300万でサンプルデータの収録に1000万(スタジオレンタル費用)
電気代で500万に家賃に200万?? 
人件費が一番高いというか、大部分が人件費だと思う。
103名刺は切らしておりまして:2009/05/20(水) 04:28:53 ID:VVQxQnia
>>98
かにしてけ
104名刺は切らしておりまして:2009/05/20(水) 04:52:20 ID:u/HzfpHU
青森なんて時給500円だろ?
人で解決しろ
105名刺は切らしておりまして:2009/05/20(水) 05:19:26 ID:W+4wj3d0
実は三億九千九百万が遊興費に消えた
106名刺は切らしておりまして:2009/05/20(水) 05:34:33 ID:UxJ7Djii
標準語も喋ることが出来ない奴は死んだ方が良いな
107名刺は切らしておりまして:2009/05/20(水) 05:54:29 ID:EFV5sRxC
日本の方言全て対応したら
金額の0が幾つ増えるの?

標準語を強制すればおk
108名刺は切らしておりまして:2009/05/20(水) 05:56:59 ID:O5xRMBQ1
A「とっとっと?」
B「とっとっと!」
A「なんばとっとっと?」
B「○○新聞ばとっとっと!」

この九州弁を、はたして認識できるのだろうか?
109名刺は切らしておりまして:2009/05/20(水) 06:34:24 ID:nvHeAeoh
正直青森のなまりは東北の人間でも判別不能
110名刺は切らしておりまして:2009/05/20(水) 06:41:51 ID:rGf+krY1
>>104
最低630円
111名刺は切らしておりまして:2009/05/20(水) 08:27:33 ID:Zd8vfRyE
人間が速記しようにも、津軽弁は津軽の人間じゃなければ認識できないだろ。
112名刺は切らしておりまして:2009/05/20(水) 08:32:30 ID:aD+htA98
>>108
それより鹿児島弁とか沖縄弁とかほとんど外国語の世界のレベルのがあるし。
113名刺は切らしておりまして:2009/05/20(水) 09:12:00 ID:5PkDMJY5
>>68
ネタにマジレスw
114名刺は切らしておりまして:2009/05/20(水) 10:20:05 ID:bUobJicc
とある私鉄にて、音声認識型自動券売機を試験導入するも、まったく使い物にならなかったのは極秘だ。
115名刺は切らしておりまして:2009/05/20(水) 22:07:12 ID:dq5JFm41
ホンズナス・バガワラス
116名刺は切らしておりまして:2009/05/20(水) 22:12:29 ID:SfiDCgi5
Via TalkとかVoiceAtokとかは
ちゃんと音声認識を意識してしゃべらないとダメダメだったけど
このシステムはそんなまともに動くのか?
117名刺は切らしておりまして:2009/05/20(水) 22:36:01 ID:EyenDgKp
4億ってたったの100KLぐらいか


まぁ仕方ないんじゃね
118名刺は切らしておりまして:2009/05/20(水) 22:37:20 ID:C9LEMLW3
>>109
青森でも津軽弁は特殊
119名刺は切らしておりまして:2009/05/20(水) 22:38:03 ID:V0Y9r9oG
>>1
>最高裁が約四億円をかけて開発した自信作で、全国の約百六十法廷に導入。

関西弁入れた程度で対応できると思っている
司法試験上位合格者で判事が構成される
最高裁って馬鹿なの?死ぬの?
ワープロの日本語変換とか自分でできるの?
120名刺は切らしておりまして:2009/05/20(水) 22:44:43 ID:9TJ9wsdE
言葉は変幻自在だからなぁ
121名刺は切らしておりまして:2009/05/20(水) 22:48:04 ID:V0Y9r9oG
4億かけて要求仕様を満たさないものを検収したらまずいでしょ?
領得罪なんだから
122名刺は切らしておりまして:2009/05/20(水) 22:51:16 ID:b/LWW8dD
若者言葉なんか誤変換しまくりだろうね
123名刺は切らしておりまして:2009/05/20(水) 23:02:36 ID:/ucCKJUI
>>121
仕様書を情報公開制度で見てきたらどうよ?
コピー貰ってきたら、黒塗りの枠がいっぱいだろうけど。
124名刺は切らしておりまして:2009/05/20(水) 23:16:28 ID:G8Veee5W
ちゃうちゃうちゃうんとちゃう?
ちゃうちゃう
ちゃうちゃうちゃうで
125名刺は切らしておりまして:2009/05/20(水) 23:35:46 ID:FoF6iDdv
まあ、そんなこと言い出したらきりが無いわ。
帰化人の訛った言葉も聞き取れるようにしとかないと
差別とか言われたりしてな。
126名刺は切らしておりまして:2009/05/20(水) 23:47:29 ID:QrNjuvwZ
うってうって姫
127名刺は切らしておりまして:2009/05/20(水) 23:49:45 ID:B4Hoil/p
津軽弁は日本語よりフランス語に近い。
128名刺は切らしておりまして:2009/05/21(木) 00:07:43 ID:gHqlkVVr
>>118
南部弁のほうが特殊だべ。
129名刺は切らしておりまして:2009/05/21(木) 00:38:47 ID:JcraZy+O
津軽弁の単語

「マイネ」(ダメだ)
「チャペ」(仔猫)
「ジャンボ」(髪)
「マディーニ」(丁寧に)
「イェパタダ」(変な)
「ズッパド」(たくさん)
「エンプテ」(煙たい)
「アコモコ」(悪口)
「ジャイゴ」(田舎)
130名刺は切らしておりまして:2009/05/21(木) 00:56:40 ID:wTAb9hOV
筆談で裁判やれ
131名刺は切らしておりまして:2009/05/21(木) 01:00:52 ID:JcraZy+O
>>130
津軽衆は「百円」を「ふぇぐえん」
「背中」を「へなが」と書きます
132名刺は切らしておりまして:2009/05/21(木) 01:04:06 ID:dCWaYLZ8
そもそもだ。

制作者が理解できないコトバを
制作物が理解できるわけが無かろう。
133名刺は切らしておりまして:2009/05/21(木) 01:07:59 ID:2dHrDSFK
津軽弁は、方言というより別言語に近いなw
134名刺は切らしておりまして:2009/05/21(木) 01:37:02 ID:0ZayVJ/R
なんでこう、自然言語処理系で実用レベルを高く設定するのかねw
ちなみに、活字文字認識、手書き文字認識、顔認証、指紋系認証、音声認識が主に実用化になっている。

音声認識だと、方言なんかはむしろ楽勝。津軽弁程度でだめなら、標準語も認識率90%切りそう。
認識が困難な例としては、発音の複雑な中国の発音で日本語話せば、認識グダグダになる。

一番簡単な活字文字認識だと、「・」を正しく認識するのが難しい。最悪「一」「■」とかになる。
アスキーアート、絵文字の様にスラング的なものを考えれば、人間が識別できないものが身近にあふれているのがわかる。
最近だとCAPCHA認証かな。出来の悪いやつだと何回も失敗するでしょ。
人間が識別できないものは当然、機械では無理。
人間は識別対象だけをチェックしているのではなく、思い込みを多用しているから。


んで、とりあえず4億無駄遣いですか。運用コストで10億超えそうだね。
裁判員制度もそうだけど、司法関係者が、人間ってものを知らな過ぎる。
というより、録音データでは改ざんしにくいから、改ざん可能な文字データで残すのかな?
だとすれば犯罪だね。
135名刺は切らしておりまして:2009/05/21(木) 03:12:49 ID:9ln+lldi
青森の上京かっぺって「訛ってないアピール」をするから嫌いだわ。思いっきり訛ってるから。
ってかそういうアピールをすること自体田舎臭い。百姓が都民ヅラしちゃいかんよ
136名刺は切らしておりまして:2009/05/21(木) 03:16:06 ID:0RUbaqA/
>>1
東京新聞w 余裕でわかりました
137名刺は切らしておりまして:2009/05/21(木) 04:56:15 ID:Y3OCjVIY
どういう部分に金がかかったのか疑問だな。
どうせ、システム購入時の仲介役の人件費だろ。
138名刺は切らしておりまして:2009/05/21(木) 05:03:26 ID:2dHrDSFK
映画「ネゴジエーター」にも、音声認識システムでてくるよね。
ネタばらしすると、警察幹部による身内の盗聴システムの一部としてだが・・・
139名刺は切らしておりまして:2009/05/21(木) 08:57:35 ID:tbz9t4sA
>>124
それだと意味が通らないぞ。
一行目は、「ちゃうちゃうちゃう?」にしないといけない。
今のままだと、最初から否定している
140名刺は切らしておりまして:2009/05/21(木) 15:06:55 ID:ApflnNh3
>>128
南部の方が日本語っぽぐね?
141名刺は切らしておりまして:2009/05/21(木) 15:19:47 ID:rd+oslQq
無料で提供しる 国はサービスしろい 裁判24時とかビデオで楽しめるようにしれ
142ああ子供は関係ねえよ:2009/05/21(木) 15:27:17 ID:Ytxa9W6c
「うんとねー」を多用するこどもピーンチ
143名刺は切らしておりまして:2009/05/21(木) 15:33:02 ID:gFqZ/ZwH
地裁総務課

楽しそうだなWWW
144名刺は切らしておりまして:2009/05/21(木) 15:35:52 ID:+fvLuH8Z
北海道や沖縄なんてもっとムリだろ
145名刺は切らしておりまして:2009/05/21(木) 20:33:33 ID:xUHLEPLL
証言のテープ起こし(最近ではデジタルだろうけど)に一件1万円かかるとして
2005年に裁判員制度の対象となるとされる事件が3629件らしいから
10年くらい使えばもとがとれるわけですかね。
146名刺は切らしておりまして:2009/05/21(木) 20:50:16 ID:xUHLEPLL
死刑囚の生き死ににかかわるようなレベルで運用可能な
ミッションクリティカルな性能は当然持っているのだろう。
国会もにも当然運用可能だろうから導入してもらいたい。
147名刺は切らしておりまして:2009/05/21(木) 23:19:24 ID:QzDHe7eY
>>144
北海道は浜言葉使う所は強烈になまってたりするけど、他はたいしたなまってねえべさ。
148名刺は切らしておりまして:2009/05/21(木) 23:53:11 ID:pZyXX5bU
さすが、乱数表なしで暗号に使われた言語はひと味違うな。
149名刺は切らしておりまして:2009/05/21(木) 23:53:54 ID:vQaSc0dZ
あのーITにだまされないでください
150名刺は切らしておりまして:2009/05/22(金) 00:04:39 ID:N+TQgjct
>>145
裁判員制度対象の裁判にだけ使うわけじゃないよ
151名刺は切らしておりまして:2009/05/22(金) 00:31:34 ID:CBu/3noY
津軽対応のためもう四億円必要だな
152名刺は切らしておりまして:2009/05/22(金) 00:34:58 ID:TvDHVnQm
IBMのViaVoiceを音声認識エンジンとして使い、
ジャストシステムのVoiceATOKで文字変換
後はデータベースに登録する仕組みを付ける。

これで4億なんてことになっていそう・・・
153名刺は切らしておりまして:2009/05/22(金) 00:43:52 ID:I4+yIvgd
>>138
土曜日に見ようと思ってたのにネタバレするなよ。
154名刺は切らしておりまして:2009/05/22(金) 01:18:05 ID:73mVAFEi
大阪の人間は山口組の人間と同じ言語を話す。
裁判では不利になるのか。
155名刺は切らしておりまして
ジェンコなば青森だげでなぐ使うがら
他の東北もやばいんでねえの