【技術】カメラで撮影した文字をパソコンで認識、リアルタイム出力…大阪府立大が技術開発 [09/07/24]

このエントリーをはてなブックマークに追加
1きのこ記者φ ★
大阪府立大学大学院の岩村雅一助教、黄瀬浩一教授らの研究チームは、
カメラで撮影した文書の記述などを、リアルタイムでパソコンに出力する
高速の文字認識技術を開発した。

1秒間に200―250文字を認識、斜め約45度の位置から撮影した画像でも、
文字の形を修正しつつ80%以上の認識率で読み込む。
実時間で動作する翻訳システムや、視覚障害者に対する音声補助など広範な応用を見込む。

デジタルカメラやウェブカメラで文字を撮影、読み込む際のパターン認識を簡略化し、
精度を落とさず高速化した。
文字の輪郭を認識するには、3点を抽出しベクトル方向を調べる必要がある。
今回計算手法を工夫し、従来よりパターン認識の整合回数を1万分の1に減らし、効率化した。

http://www.nikkan.co.jp/news/nkx0620090724aaaf.html
2名刺は切らしておりまして:2009/07/24(金) 21:38:36 ID:ywGSQy03
ハングルはカタカナに変換されるのか?
3名刺は切らしておりまして:2009/07/24(金) 21:45:21 ID:Y8jC+UED
本屋で立ち読みして携帯で写せばいいんだな。
4名刺は切らしておりまして:2009/07/24(金) 21:54:47 ID:Ff+dHnKT
本屋おわた
5名刺は切らしておりまして:2009/07/24(金) 21:55:01 ID:Vc6ljHg6
>80%以上の認識率

使いものにならないじゃん。
6名刺は切らしておりまして:2009/07/24(金) 22:02:55 ID:E60RheeR
フォントの制限なしで80%ならすごいと思われ。
7名刺は切らしておりまして:2009/07/24(金) 22:06:56 ID:3/Spk7zD
なんか面白そうじゃねえか
8名刺は切らしておりまして:2009/07/24(金) 22:07:11 ID:Vc6ljHg6
>>6
でも、使いものにならん。
9名刺は切らしておりまして:2009/07/24(金) 22:10:04 ID:E60RheeR
>>8
はいはい。あたま悪い子は消えときなさい。
10名刺は切らしておりまして:2009/07/24(金) 22:12:30 ID:Vc6ljHg6
>>9
でも、使いものならん。悔しい?
11名刺は切らしておりまして:2009/07/24(金) 22:13:16 ID:YlnLf9i9
速度を多少落としても認識率を上げろよ。
人間は1秒に200文字も認識しないし、
読み上げだってそんなペースで読み上げられても聞き取れないので、
そこまでの速度は必要ない。
12名刺は切らしておりまして:2009/07/24(金) 22:14:08 ID:E60RheeR
>>10
はーい。悔しいですよ。ぼくちゃん。笑。よかったでちゅねぇ。
13名刺は切らしておりまして:2009/07/24(金) 22:15:20 ID:Vc6ljHg6
>>12
でも、使いものにならん。それを誤魔化しちゃダメよ。
14名刺は切らしておりまして:2009/07/24(金) 22:17:28 ID:wL428yHA
ドコモN504isにURLをカメラで読み取るとかいう機能があったが、丸っきり使い物にならなかったな。
恐らく認識率とか数値にすれば10%未満だったと思う。

あんな未完成品を付けんなよ(´・ω・`)
15名刺は切らしておりまして:2009/07/24(金) 22:21:55 ID:J/Yf9ilv
OCRのカメラ版だろ。
2Dな世界でも誤認識が多発するのに、3Dじゃお手上げだろうに。
明るさ、フォントの種類、距離、解像度、いろんな条件が揃わないとムリ。
16名刺は切らしておりまして:2009/07/24(金) 22:26:10 ID:E60RheeR
>>13
そうだね。二次情報から得た結果しか見えない馬鹿にはその答えしか出ないよね。君の能力の限界さ。
17名刺は切らしておりまして:2009/07/24(金) 22:28:43 ID:Vc6ljHg6
>>16
一次情報で同情しちゃったの? 95%でも使いものにならんのに、80%なんて論外。
悔しさがにじみ出てるレスは、みっともないよ。
18名刺は切らしておりまして:2009/07/24(金) 22:41:17 ID:YlnLf9i9
>>17
まあ、入力補助としてなら80%でも無いよりは、遙かに助かるとは思うが、
視覚障害者への文章読み上げを用途と考えてるのに80%ってのはありえないと思う。
健常者は自分の目で確認できるが、それが出来ない相手に使おうとは馬鹿としか言いようが無い。
19名刺は切らしておりまして:2009/07/24(金) 22:47:17 ID:gWuH0spI
どう見ても ID:Vc6ljHg6 は頭弱い子
今の技術のまま製品化する訳でもないのに「使い物にならん」て
20名刺は切らしておりまして:2009/07/24(金) 22:48:54 ID:2NpoEn6m
IDとかPASS入力の際に、同時に文字列入力させるのがあるけど、
そのうち無くなりそうだな
21名刺は切らしておりまして:2009/07/24(金) 22:51:57 ID:Vc6ljHg6
>>19
試作レベルとしても80%じゃダメだろ。せめて、95%以上で発表しろよ。
この技術で80%を99.x%にするのは無理だろうと想像してるんだが。根拠はないけど。
22名刺は切らしておりまして:2009/07/24(金) 22:56:18 ID:YlnLf9i9
>>19
認識率が80%から90%では、折角工夫したとか言うご自慢の計算手法も全く別のものに作り直しになる。
90%と95%では更に別物。
製品化時に劇的に性能が良くなると思ってるなら、おまえは相当頭の悪い子。
23名刺は切らしておりまして:2009/07/24(金) 23:00:02 ID:gWuH0spI
>>22
>>19のレスのどの辺りから「製品化時に劇的に性能が良くなると思ってる」んじゃないかと疑えたの?
24名刺は切らしておりまして:2009/07/24(金) 23:04:04 ID:YlnLf9i9
>>23
認識率80%で使い物にならないって言ってる状況で、
81%にちょこっと認識率上昇したら使い物になると思ってるような馬鹿だったわけだ。
ごめんな。お前は俺が想像してたのとは違う馬鹿だったんだよな。勘違いして本当にごめん。
馬鹿ってバリエーションが豊富だなw
25名刺は切らしておりまして:2009/07/24(金) 23:04:10 ID:Vc6ljHg6
>>23
あれ? 普通にそう思わせるぜ。特に「そのまま製品化する訳でもない」辺り。
それとも製品時には、この技術の何倍もすごい技術が入るの?
26名刺は切らしておりまして:2009/07/24(金) 23:09:39 ID:Yr+atr7J
80だったらダメだろ。普通に。
27名刺は切らしておりまして:2009/07/24(金) 23:09:40 ID:AUYVZs6s
これは悪口や放送禁止用語を言わせるのに使えそうだ
28名刺は切らしておりまして:2009/07/24(金) 23:10:52 ID:YlnLf9i9
>>25
記事を読む範囲では、元々が目新しい技術を盛り込んだものではない。
高速化の為になされたことはパターン認識の簡略化のみしか触れてない。
コアとなる認識システムの肝がパターン簡略化なら、認識率の向上は難しい。
29名刺は切らしておりまして:2009/07/24(金) 23:13:08 ID:+1Pzwyes
OCRはたとえ96%でも糞だと思うよ
30名刺は切らしておりまして:2009/07/24(金) 23:14:02 ID:vS89i7t9
80%でよければOpenCVとニューラルネットで
何とかなりそうだな。
前段階の切り出しもFFTかDCTでベクトル抜けばいいし。

でも99%とか要求されると死ねるな。
31名刺は切らしておりまして:2009/07/24(金) 23:14:29 ID:9lg1AWqk
>斜め約45度の位置から撮影した画像でも、
>文字の形を修正しつつ80%以上の認識率で読み込む

ななめ45度じゃなければ80%超えるんだろ?
カメラの顔認識でも、最近まで45度も角度があったらできなかったのに、
すごい進歩だと思うが。
てか45度ってかなり急だぞw
32名刺は切らしておりまして:2009/07/24(金) 23:15:40 ID:s6kcsGiW
手書き文字の場合の認識率はどれくらいなんだろう。
33名刺は切らしておりまして:2009/07/24(金) 23:17:03 ID:jASjHqTe
どらか線にせんこらで火をつけると
じぬんをぐろぐろ回ります
34名刺は切らしておりまして:2009/07/24(金) 23:17:32 ID:G8c6HSxV
OCRソフトの認識率って、数字と使い勝手の良さが単純比例じゃないんだよな。
90%って聞くと、9割も認識してくれるから使いやすそうって思えるけど、
実際に使ってみると、誤認の識別なんかをしないといけないから、
結局認識50%くらいと使い勝手の良さが変わらないってことがよくある
35名刺は切らしておりまして:2009/07/24(金) 23:17:48 ID:Spj0kutU
斜め45度の条件ではなく
斜め±3度の認識率をかいてほしい。
36名刺は切らしておりまして:2009/07/24(金) 23:19:13 ID:bMmVTGZl
>>24
他のレスではまともな事言ってんのに このレスだけマジキチの揚げ足取りだなw
37名刺は切らしておりまして:2009/07/24(金) 23:19:56 ID:2n09MCeY
見てえいない文字もで勝手に補っちゃえる人間と比べるなよ
38名刺は切らしておりまして:2009/07/24(金) 23:21:25 ID:t0zxvkWl
最近の携帯電話の名刺読み取りスゴすぎる
39名刺は切らしておりまして:2009/07/24(金) 23:22:17 ID:gWuH0spI
>>25
いや、製品化を前提として考える必要がない って意味
40名刺は切らしておりまして:2009/07/24(金) 23:26:04 ID:PMExZ4XE
なんで「斜め約45度の位置から80%以上」という数値は出しといて正面からの認識率を出さんのかね?
恥ずかしくて出せないレベル?
41名刺は切らしておりまして:2009/07/24(金) 23:26:04 ID:Spj0kutU
>>37
実はなべらかえがっあてもひなとらよゆうでよるめよね。誤差率でいうならはぱんねぇ文章のなに。

超高速で流し読みしてみよう
42名刺は切らしておりまして:2009/07/24(金) 23:26:14 ID:mvdg0Mzz
はーい、データ入力業務の人
今日からあなたの仕事は機械が認識した文字が正しいかどうかチェックすることです
43名刺は切らしておりまして:2009/07/24(金) 23:30:38 ID:YlnLf9i9
>>36
何処がどう揚げ足なのか、キチガイにはさっぱり分からないので教えてください。
44名刺は切らしておりまして:2009/07/24(金) 23:30:56 ID:yXEkhVFH
今までこういう技術がなかったのが不思議
45名刺は切らしておりまして:2009/07/24(金) 23:34:33 ID:4Gf1GLNa
今月のJAL国際線の機内誌にiPhoneで動く同様のソフトウェアが載ってたけど
あれとは何が違うんだろ? 関学の生徒が作ったて書いてたな。
46名刺は切らしておりまして:2009/07/24(金) 23:50:04 ID:YlnLf9i9
>>40
多分斜めから取り込んだ時に、その状態の中で認識できた文字の変形状態から角度を割り出して、
全体にフィルターを掛けて補正するんじゃないかな?
ヨレヨレになった新聞から一文字ずつ認識するのと違って、単に傾けた平面上の文字を読み取るだけだから、
正面からの認識率とさほど違いは無いと思う。
47名刺は切らしておりまして:2009/07/24(金) 23:52:48 ID:qL8nOtrl
OCRを使ってみればわかるけど、たとえば98パーセントの認識率ですら
結構微妙なんだよね。
4000字の原稿の場合、80字の誤字を探して、手動で修正しないと
いけないわけだから。

まして80パーセントだとなあ…
48名刺は切らしておりまして:2009/07/24(金) 23:52:58 ID:pXONnFrr
>>42 認識した文字が正しいかどうかをチェックするより、
実際にそれを手動で打ち込んで、
差分をとった方が確実で速いんだよね。
経験上。

500文字/分レベルの入力速度があれば、って話だけど。
49名刺は切らしておりまして:2009/07/24(金) 23:53:36 ID:nSSjgXpS
スカウターのプロトタイプか
50名刺は切らしておりまして:2009/07/24(金) 23:56:35 ID:BkaLwPcY
OCR系に欠如してるのは文章解析力。
51名刺は切らしておりまして:2009/07/25(土) 00:03:44 ID:48geCIho
OCRで80%の認識率は玩具以下だね
52名刺は切らしておりまして:2009/07/25(土) 00:10:11 ID:mTfqNaDZ
フルカラーの濃淡画像からならそんなもんじゃね?
53名刺は切らしておりまして:2009/07/25(土) 00:31:13 ID:x5zEMK3L
これができれば掲示板のスクリプトチェックでゆがんだ文字を
入力させるのが意味なくなるな
54名刺は切らしておりまして:2009/07/25(土) 00:36:30 ID:/B0jIOh6
それにしても人の識字率はすごいな
逆さまでも歪んでてもほぼ100%。
55名刺は切らしておりまして:2009/07/25(土) 01:53:09 ID:krCheA8P
>>18
> まあ、入力補助としてなら80%でも無いよりは、遙かに助かるとは思うが、

80%程度の認識結果の誤り箇所を元画像見ながらいちいち同定して修正するよりは、
最初から元画像を見ながら打ち込んだ方が何倍も早いんじゃないかな
56名刺は切らしておりまして:2009/07/25(土) 11:12:22 ID:v3YmFShH
「実時間で動作する翻訳システムや、視覚障害者に対する音声補助」

いろいろ考えて使用される状況を考えたんだろうけど
80%前後ではやっぱり厳しいんじゃないかなあ。

英文字はもっと良好な結果が得られるかもだけどurl文字列
なんか1%でも間違えるようであれば全然厳しいと
57名刺は切らしておりまして:2009/07/25(土) 12:16:54 ID:a2ypHzaX
斜め45°で80%って書いてあるけどね。
実際使う時はオペレーションで左右されんじゃないの。
まさかわざわざ斜め45°で撮らないだろうし。
58名刺は切らしておりまして:2009/07/25(土) 16:58:00 ID:H4MT9T0D
まー 近い将来の美人アナロボ開発に役立つね
59名刺は切らしておりまして:2009/07/25(土) 17:01:22 ID:8DLiPo3z
レシート読み込んで、家計簿として使おうぜ
60名刺は切らしておりまして:2009/07/25(土) 17:27:40 ID:zkAqsxDn
認識率80%で、よく発表する気になったな
61名刺は切らしておりまして:2009/07/25(土) 17:31:51 ID:tzJJTOF3
レシート ええなぁ
62名刺は切らしておりまして:2009/07/25(土) 17:36:21 ID:zkAqsxDn
おいおい、認識してんのalphabetかよ
http://www.m.cs.osakafu-u.ac.jp/LLAH/

まじで何の役にたつんだ、これ?
CAPTCHA破り?
63名刺は切らしておりまして:2009/07/25(土) 17:45:25 ID:EvzdNyZ4
>>60
橋下猿が五月蝿いからね。
64名刺は切らしておりまして:2009/07/26(日) 08:05:29 ID:KZiY2YZw
>>60
製品化レベルに満たないと論文だせないと?お前高卒か?

80%の認識率だけしか見えてないみたいだけど
実時間処理・角度補正・webカメラ使用、までいれて80%だろ
それがどれだけ難しいか、あるいは簡単かもわからない馬鹿は
恥さらすだけだから黙ってたほうがいい

>>62
英語読めるならわかるはずだけど、それ別ものみたい。
内容がぜんぜん違った。
登録しておいた文書の画像が検索できるらしい。
65名刺は切らしておりまして:2009/07/26(日) 08:09:54 ID:VBIPrI1t
>斜め約45度の位置から撮影した画像でも、文字の形を修正しつつ80%以上の認識率

まともに撮影した場合の認識率も書かないから、余計に荒れるんだな。ここはニュー速か?状態。
66名刺は切らしておりまして:2009/07/26(日) 08:17:16 ID:O2UR9GwR
>>60
どこのDQNだ、おまえは。
67名刺は切らしておりまして:2009/07/26(日) 08:19:17 ID:O2UR9GwR
>>62
なぜに先に日本語対応させないといかんのだ。
68名刺は切らしておりまして:2009/07/26(日) 08:35:48 ID:VBIPrI1t
>>62>>1とはまた別だな。
カメラで録っている映像が、DB化された文書のどこにあたるのかを示す技術・・・用途は良く分からない
69名刺は切らしておりまして:2009/07/26(日) 15:21:21 ID:fITEnWDp
認識率を80%まで落とせるなら、そりゃ処理も軽くなるだろうな。
角度補正も特別な技術を必要とするとは思えない。
あるのは単にカメラで捉えたフレーム内に存在する文字を高速で読み取るってアイデアだけ。
アイデアを使い物になるようにする新しい技術が何処にも無い。
プリウスの開発で言うと、精々「燃費を二倍向上させる」「パワーユニットにハイブリッドに決定」の段階。
まじめに研究する気があるなら、この段階では発表しない。
この二人は、何らかの成果を発表しないとやばい立場の人間じゃないか?
70名刺は切らしておりまして:2009/07/26(日) 17:18:12 ID:KZiY2YZw
>>69
>角度補正も特別な技術を必要とするとは思えない。

煽りたいんじゃなくて純粋な好奇心なんだが,
具体的にどんな技術を使うとこういう事ができそうなのかを教えてほしい

昔文字認識をやったんだが,複数の文字で射影変換をした場合
時間をかけないと認識はお手上げ状態だった
今は普通にそんな事ができる手法があるんだ?
71名刺は切らしておりまして:2009/07/26(日) 17:23:45 ID:2o0d++Od
メガネの柄につけたカメラ

立ち読み

無線で通信

自宅のパソコン
72名刺は切らしておりまして:2009/07/26(日) 17:24:21 ID:fR3PAaR0
携帯にこの機能付いてるが全く使い物にならない
73名刺は切らしておりまして:2009/07/26(日) 17:25:59 ID:UJbuRb40
俺のきたねぇ字を読み取ったらちょっと感動する。
時間がたつと自分でも読めなくなるぜ。
74名刺は切らしておりまして:2009/07/26(日) 17:45:30 ID:2YKdngl9
今後は、画像読み取り性能自体よりも
文脈から誤字を検知して自動補正する機能に力を入れるべきだな
75名刺は切らしておりまして:2009/07/26(日) 21:39:23 ID:fITEnWDp
>>70
全体を一文字ずつ認識しようとするから時間がかかる。
全体の中から一部の認識しやすい文字(数字等)をサンプリングして
変形状態から傾きを測定して、全体に補正掛ければ良い。
または、本や紙に書かれた文字しか読み込まないなら、紙の縁の角から傾きを測定すれば良い。
76名刺は切らしておりまして:2009/07/26(日) 21:48:05 ID:Hq8gwkdE
カメラで撮影した文字をパソコンで認識させたときの

文字の認識率の悪さは異常。


認識率悪すぎて イライラするより
自分で手打ちしたほうがストレスが溜まらない
くらいのレベルwwwwwwwww

っつうか文字のフォントは無限大レベルにあるから
正直全てのフォントに対応させるのは不可能。

HDDが100PBなんか余裕だろwwwwwwくらいの時代になれば
そのくらいの技術ができるかもしれんな。
77名刺は切らしておりまして:2009/07/26(日) 22:02:17 ID:9ubHDcII
視覚障害者のサポートに使うなら
例え1文字の誤認識でも
致命的な結果をもたらす可能性があるよな。
78名刺は切らしておりまして:2009/07/26(日) 22:33:25 ID:u7sH5JCf
カメラをスキャン代わりに使うようになると、どうしても超高精細志向になるな。
かなり役に立っている。
 >>1の技術は、非常に嬉しい技術。認識率の向上を期待したい。
USBカメラから、引用したい本の部分をあっというまにText化。
79名刺は切らしておりまして:2009/07/26(日) 23:48:27 ID:espFO0o/
80%に噛み付いてる奴は高卒か馬鹿文系。
完全な技術が前段階なしにポンと出てくるとでも思ってんのかよ。
80名刺は切らしておりまして:2009/07/27(月) 00:25:53 ID:2IIR2FfO
これは、カメラからの読み込みとして80%の精度。
ワープロ機能との連携、解読速度のDOWN、2カメラによる精度向上を採用すれば・・・。

ていうか、そういうプラスアルファでうまくやるのが日本人の得意分野だったと思うんだけど
ID:Vc6ljHg6は、一つの技術で結論を出そうとする非常に知的水準の低い奴ではなかろうか。
81名刺は切らしておりまして:2009/07/27(月) 00:29:01 ID:519bLMV4
さすが大阪
82名刺は切らしておりまして:2009/07/27(月) 11:45:38 ID:uDsY/3kC
>>75
印刷文字のみなんだから単純に文字列や行間の幅と角度から傾きや回転を測定した方が速いな。

>>79
認識率の精度を上げることを甘く見てる中卒が言いそうなこと。
80%なんて低レベルではなくもっと高いレベルで認識率を上げようとしたら、
1%高めるだけでこの糞システムの認識にかかる処理よりも遙かに大量の処理が増えていく。

>>80
>解読速度のDOWN
この糞システムのアイデアのキモの即時性が消し飛ぶな。
単に「スキャナじゃなくカメラからの映像から文字を読み取る」という既存のアイデアとなる。
>2カメラによる精度向上を採用すれば・・・
頭良いね。カメラが2でも足りなければ3つでも4つでも増やせば良いし、これは使えるよ。
凄い発想だ俺には思いつかない。俺ならカメラを増やそうなんて考えるよりスキャナで取り込むなw


>今回計算手法を工夫し、従来よりパターン認識の整合回数を1万分の1に減らし、効率化した。
新しい技術も糞も、自分のアイデアに適合させるために従来の技術を簡略化しただけ。
しかもアイデアといっても、既に存在するアイデアに即時性を乗っけただけ。
大体、処理速度なんて別にこいつらが意見を出さなくても向上は必然。

いい加減、必死に擁護してる連中が関係者としか思えなくなってきた。
83名刺は切らしておりまして:2009/07/27(月) 12:18:01 ID:n614/rOW
これで見たい本は直ぐに
ネットにながれて
本代が浮くな
84名刺は切らしておりまして:2009/07/27(月) 12:20:04 ID:KeZR9vW7
あんま難しい技術に見えないけど未だに80%なのか
使えねー
85名刺は切らしておりまして:2009/07/27(月) 14:25:06 ID:yg2i9fx9
>>84
予想通りの頭悪すぎな反応でワロタ
86名刺は切らしておりまして:2009/07/27(月) 14:31:40 ID:hWfq2wyk
本にしか使えない技術をWebカメラで作るバカはいねえだろ。
スキャナで取り込めない看板とか標識にも使えるんだろ。
そうじゃないと視覚障害者に対する音声補助なんて言っちゃだめだよ。

そうなると『行間の幅と角度を計算して変換』なんて簡単な処理で行けるわけがない
行間も回転角も歪みも一定じゃねえもん。
87名刺は切らしておりまして:2009/07/27(月) 19:27:12 ID:dkJhqVGy
>>82
この研究が現時点で糞というのには同意
でもレスの節々が残念

文章前半正論,後半自分の価値観のおしつけワロス
物は知ってるけど思考力の足りない奴ってどうして私見に対しての吟味を怠るのかねー
ある程度知識あるのにもったいない


88名刺は切らしておりまして:2009/07/27(月) 19:28:02 ID:oidaK7Nn
これなんてOCR
89名刺は切らしておりまして:2009/07/27(月) 19:42:31 ID:uDsY/3kC
>>86
>視覚障害者に対する音声補助
を読んで、視覚障害者が看板や標識を音声で読み上げさせながら町歩きするのに使うと思ったのか?
視覚障害者には何処に自分にとって必要な情報が書かれた看板標識があるのかも分からない。
何処にどのタイミングでカメラを向けるべきかも分からないのに、有効に利用できると思うか?
広角レンズで取り込んだ広範囲を撮影した画像中の文字を全部読み上げさせながら歩かせる気か?
まあ、予め入力した必要なキーワードを発見したら報告するだけでも助かるかもしれないけど、
そもそも認識エラーが重大な事故に繋がりかねないような状況下での使用を開発者が想定するはずも無い。

常識的に考えれば、手元にある本などにカメラを向ければ読み上げる用途だろ。
90名刺は切らしておりまして:2009/07/27(月) 19:55:27 ID:awjWRDTR
>>87
何一つ自分の意見が無いくせに、妙に上から目線で、他人の意見をぼんやりと批判するが、
具体的に何処がどう問題かを突っ込んで指摘することは出来ない馬鹿には飽きた。
まず自分の意見をきちんと出して、お前が馬鹿じゃないことを相手に分からせてあげてねw

91名刺は切らしておりまして:2009/07/27(月) 20:00:24 ID:8E2Js/sH
現状で1処理80%なら、同時に多方向から撮影したり、動画中の複数フレームを
解析する事で認識率は上げれそうだな。

しかし、こういう技術開発見てると人間が持つ能力は凄いよな。
人間の眼と脳に機械技術が追いつくのは何時の事やら。
92名刺は切らしておりまして:2009/07/27(月) 20:00:30 ID:2IIR2FfO
>>82
否定している奴が馬鹿ってのは既に確定しているから
93名刺は切らしておりまして:2009/07/28(火) 00:48:10 ID:AfWIm4eR
>>92
何か一つくらいまともな反論があるかと思えば、反論一つ出来ない負け犬が勝利宣言かよw
それで満たされるちっぽけなプライドしかないのには同情する。
94名刺は切らしておりまして:2009/07/28(火) 07:46:20 ID:7CkNIukw
>>90
把握した

>この糞システムのアイデアのキモの即時性が消し飛ぶな。
単に「スキャナじゃなくカメラからの映像から文字を読み取る」という既存のアイデアとなる。

まさにその通りだと思う。記事を読む限り新規性はそこにしかない。

>頭良いね。カメラが2でも足りなければ3つでも4つでも増やせば良いし、これは使えるよ。
凄い発想だ俺には思いつかない。俺ならカメラを増やそうなんて考えるよりスキャナで取り込むなw

ここでスキャナの話になってしまう。
まだまだ実用レベルではないが視覚障害者への補助機能を想定するのであれば、
看板等の読み取りも前提にあるだろうからスキャナの話を持ち出すと話がずれる。
また、ステレオカメラでの文字認識の研究も実際にある。
それを知らずにわざわざ煽るようなことを書く意味がわからない。

>大体、処理速度なんて別にこいつらが意見を出さなくても向上は必然。

ハード(CPU等)かソフト(アルゴリズム)かどちらの事をさしているのかがわからないが

ハードであれば確かに向上しているし、これからも向上していく余地はある。
但し、ソフト側でなにもせずにハードの向上を待つとすると、
必要な処理能力になるまでに一体どれくらいの時間がかかるか見当もつかない
また、ハード向上が頭打ちしてしまった場合にはどうするのか?
(こんな技術いらない!は無しの方向でお願いします)

もしソフトの事を言っているのであれば、こういった類の研究を馬鹿にする事がおかしい。
このアプローチが間違っていてもなにが悪いのか、課題はどういったものかを
正しく書き出している論文であれば後の研究者の一助となりえる。
技術は急に生まれない。こういった積み重ねがあるから向上していくわけで、
この部分を否定して「向上は必然」というのであればそれは違うと感じる。

>82のような知識のある奴には否定じゃなく、なにがどう駄目でどうすればいいのかといった
もっと建設的な議論をしてほしかったんだ。

>>82,>>90
書いてて気づいた。
結局俺が馬鹿で自分の意見を押し付けてただけだった。
不快な思いをさせてしまってすまない。
95名刺は切らしておりまして:2009/07/28(火) 08:13:15 ID:9nl762cC
認識率80%かあ、そのままでいいから誰かフリーソフトで作ってLinux標準添付にしてくれ
別方式とクロスチェックすれば認識率上げられるんじゃないかな?
96名刺は切らしておりまして:2009/07/28(火) 08:15:48 ID:A42X11Yv
ただのOCRだろ。しかも性能の悪い。
80%の認識率ってゴミだろ。
97名刺は切らしておりまして:2009/07/28(火) 08:18:45 ID:cniua06J
SBMの905SHの時はまったく使い物にならなかったが
922SHにしたら、半分近くの名刺は一字一句間違わずに正確に認識するようになった
名刺に特化すると意外に使えるんだねぇ
OCR専用スキャナのように、画像も同時に関連付けて保存して欲しいと思った
どの道100%認識が無理なら、画像データの同時保存するだけで作業効率は格段に上がるのだ
98名刺は切らしておりまして:2009/07/28(火) 08:33:33 ID:4du9LmM7
これ結局内部で使ってる画像認識のアルゴリズム次第だと思うんだけど
カメラとかと連動させただけなら記事にするほどじゃない
99名刺は切らしておりまして:2009/07/28(火) 08:56:53 ID:68QWvyQZ
情報これだけだと、擁護しようもないと思うんだが、、、

せめて、これ以前の技術の認識率だしてもらわんと、80%でしか判断できんわな
100名刺は切らしておりまして:2009/07/28(火) 09:03:54 ID:iPy8Lx6K
>>99
八割なら昔と変わってないなと

OCRとな
101名刺は切らしておりまして:2009/07/28(火) 23:09:52 ID:eDHV/tcJ
パターン認識の分野ってどこが世界で強いんだ?
アメリカ?日本?ヨーロッパ?
102名刺は切らしておりまして:2009/07/29(水) 07:49:26 ID:VRDRoyg5
>大阪府立大学大学院

この辺に認識率80%のなぞが絡んでるような希ガス
103名刺は切らしておりまして:2009/07/29(水) 10:23:18 ID:NbR9R8ot
>>101
OCRの文字認識だと、今の所googleが最強じゃね?
google booksとかで鍛えてるし、たしか文字認識に関して最近
news releaseあったし。

ちなみに10年以上前のスキャナのおまけに付いてくるソフトでも、
認識率98%とかだったのにな、、、
104名刺は切らしておりまして
>>102
大阪府立大学の理系は国内でもレベル高いよ