【技術】カメラで撮影した文字をパソコンで認識、リアルタイム出力…大阪府立大が技術開発 [09/07/24]

このエントリーをはてなブックマークに追加
55名刺は切らしておりまして:2009/07/25(土) 01:53:09 ID:krCheA8P
>>18
> まあ、入力補助としてなら80%でも無いよりは、遙かに助かるとは思うが、

80%程度の認識結果の誤り箇所を元画像見ながらいちいち同定して修正するよりは、
最初から元画像を見ながら打ち込んだ方が何倍も早いんじゃないかな
56名刺は切らしておりまして:2009/07/25(土) 11:12:22 ID:v3YmFShH
「実時間で動作する翻訳システムや、視覚障害者に対する音声補助」

いろいろ考えて使用される状況を考えたんだろうけど
80%前後ではやっぱり厳しいんじゃないかなあ。

英文字はもっと良好な結果が得られるかもだけどurl文字列
なんか1%でも間違えるようであれば全然厳しいと
57名刺は切らしておりまして:2009/07/25(土) 12:16:54 ID:a2ypHzaX
斜め45°で80%って書いてあるけどね。
実際使う時はオペレーションで左右されんじゃないの。
まさかわざわざ斜め45°で撮らないだろうし。
58名刺は切らしておりまして:2009/07/25(土) 16:58:00 ID:H4MT9T0D
まー 近い将来の美人アナロボ開発に役立つね
59名刺は切らしておりまして:2009/07/25(土) 17:01:22 ID:8DLiPo3z
レシート読み込んで、家計簿として使おうぜ
60名刺は切らしておりまして:2009/07/25(土) 17:27:40 ID:zkAqsxDn
認識率80%で、よく発表する気になったな
61名刺は切らしておりまして:2009/07/25(土) 17:31:51 ID:tzJJTOF3
レシート ええなぁ
62名刺は切らしておりまして:2009/07/25(土) 17:36:21 ID:zkAqsxDn
おいおい、認識してんのalphabetかよ
http://www.m.cs.osakafu-u.ac.jp/LLAH/

まじで何の役にたつんだ、これ?
CAPTCHA破り?
63名刺は切らしておりまして:2009/07/25(土) 17:45:25 ID:EvzdNyZ4
>>60
橋下猿が五月蝿いからね。
64名刺は切らしておりまして:2009/07/26(日) 08:05:29 ID:KZiY2YZw
>>60
製品化レベルに満たないと論文だせないと?お前高卒か?

80%の認識率だけしか見えてないみたいだけど
実時間処理・角度補正・webカメラ使用、までいれて80%だろ
それがどれだけ難しいか、あるいは簡単かもわからない馬鹿は
恥さらすだけだから黙ってたほうがいい

>>62
英語読めるならわかるはずだけど、それ別ものみたい。
内容がぜんぜん違った。
登録しておいた文書の画像が検索できるらしい。
65名刺は切らしておりまして:2009/07/26(日) 08:09:54 ID:VBIPrI1t
>斜め約45度の位置から撮影した画像でも、文字の形を修正しつつ80%以上の認識率

まともに撮影した場合の認識率も書かないから、余計に荒れるんだな。ここはニュー速か?状態。
66名刺は切らしておりまして:2009/07/26(日) 08:17:16 ID:O2UR9GwR
>>60
どこのDQNだ、おまえは。
67名刺は切らしておりまして:2009/07/26(日) 08:19:17 ID:O2UR9GwR
>>62
なぜに先に日本語対応させないといかんのだ。
68名刺は切らしておりまして:2009/07/26(日) 08:35:48 ID:VBIPrI1t
>>62>>1とはまた別だな。
カメラで録っている映像が、DB化された文書のどこにあたるのかを示す技術・・・用途は良く分からない
69名刺は切らしておりまして:2009/07/26(日) 15:21:21 ID:fITEnWDp
認識率を80%まで落とせるなら、そりゃ処理も軽くなるだろうな。
角度補正も特別な技術を必要とするとは思えない。
あるのは単にカメラで捉えたフレーム内に存在する文字を高速で読み取るってアイデアだけ。
アイデアを使い物になるようにする新しい技術が何処にも無い。
プリウスの開発で言うと、精々「燃費を二倍向上させる」「パワーユニットにハイブリッドに決定」の段階。
まじめに研究する気があるなら、この段階では発表しない。
この二人は、何らかの成果を発表しないとやばい立場の人間じゃないか?
70名刺は切らしておりまして:2009/07/26(日) 17:18:12 ID:KZiY2YZw
>>69
>角度補正も特別な技術を必要とするとは思えない。

煽りたいんじゃなくて純粋な好奇心なんだが,
具体的にどんな技術を使うとこういう事ができそうなのかを教えてほしい

昔文字認識をやったんだが,複数の文字で射影変換をした場合
時間をかけないと認識はお手上げ状態だった
今は普通にそんな事ができる手法があるんだ?
71名刺は切らしておりまして:2009/07/26(日) 17:23:45 ID:2o0d++Od
メガネの柄につけたカメラ

立ち読み

無線で通信

自宅のパソコン
72名刺は切らしておりまして:2009/07/26(日) 17:24:21 ID:fR3PAaR0
携帯にこの機能付いてるが全く使い物にならない
73名刺は切らしておりまして:2009/07/26(日) 17:25:59 ID:UJbuRb40
俺のきたねぇ字を読み取ったらちょっと感動する。
時間がたつと自分でも読めなくなるぜ。
74名刺は切らしておりまして:2009/07/26(日) 17:45:30 ID:2YKdngl9
今後は、画像読み取り性能自体よりも
文脈から誤字を検知して自動補正する機能に力を入れるべきだな
75名刺は切らしておりまして:2009/07/26(日) 21:39:23 ID:fITEnWDp
>>70
全体を一文字ずつ認識しようとするから時間がかかる。
全体の中から一部の認識しやすい文字(数字等)をサンプリングして
変形状態から傾きを測定して、全体に補正掛ければ良い。
または、本や紙に書かれた文字しか読み込まないなら、紙の縁の角から傾きを測定すれば良い。
76名刺は切らしておりまして:2009/07/26(日) 21:48:05 ID:Hq8gwkdE
カメラで撮影した文字をパソコンで認識させたときの

文字の認識率の悪さは異常。


認識率悪すぎて イライラするより
自分で手打ちしたほうがストレスが溜まらない
くらいのレベルwwwwwwwww

っつうか文字のフォントは無限大レベルにあるから
正直全てのフォントに対応させるのは不可能。

HDDが100PBなんか余裕だろwwwwwwくらいの時代になれば
そのくらいの技術ができるかもしれんな。
77名刺は切らしておりまして:2009/07/26(日) 22:02:17 ID:9ubHDcII
視覚障害者のサポートに使うなら
例え1文字の誤認識でも
致命的な結果をもたらす可能性があるよな。
78名刺は切らしておりまして:2009/07/26(日) 22:33:25 ID:u7sH5JCf
カメラをスキャン代わりに使うようになると、どうしても超高精細志向になるな。
かなり役に立っている。
 >>1の技術は、非常に嬉しい技術。認識率の向上を期待したい。
USBカメラから、引用したい本の部分をあっというまにText化。
79名刺は切らしておりまして:2009/07/26(日) 23:48:27 ID:espFO0o/
80%に噛み付いてる奴は高卒か馬鹿文系。
完全な技術が前段階なしにポンと出てくるとでも思ってんのかよ。
80名刺は切らしておりまして:2009/07/27(月) 00:25:53 ID:2IIR2FfO
これは、カメラからの読み込みとして80%の精度。
ワープロ機能との連携、解読速度のDOWN、2カメラによる精度向上を採用すれば・・・。

ていうか、そういうプラスアルファでうまくやるのが日本人の得意分野だったと思うんだけど
ID:Vc6ljHg6は、一つの技術で結論を出そうとする非常に知的水準の低い奴ではなかろうか。
81名刺は切らしておりまして:2009/07/27(月) 00:29:01 ID:519bLMV4
さすが大阪
82名刺は切らしておりまして:2009/07/27(月) 11:45:38 ID:uDsY/3kC
>>75
印刷文字のみなんだから単純に文字列や行間の幅と角度から傾きや回転を測定した方が速いな。

>>79
認識率の精度を上げることを甘く見てる中卒が言いそうなこと。
80%なんて低レベルではなくもっと高いレベルで認識率を上げようとしたら、
1%高めるだけでこの糞システムの認識にかかる処理よりも遙かに大量の処理が増えていく。

>>80
>解読速度のDOWN
この糞システムのアイデアのキモの即時性が消し飛ぶな。
単に「スキャナじゃなくカメラからの映像から文字を読み取る」という既存のアイデアとなる。
>2カメラによる精度向上を採用すれば・・・
頭良いね。カメラが2でも足りなければ3つでも4つでも増やせば良いし、これは使えるよ。
凄い発想だ俺には思いつかない。俺ならカメラを増やそうなんて考えるよりスキャナで取り込むなw


>今回計算手法を工夫し、従来よりパターン認識の整合回数を1万分の1に減らし、効率化した。
新しい技術も糞も、自分のアイデアに適合させるために従来の技術を簡略化しただけ。
しかもアイデアといっても、既に存在するアイデアに即時性を乗っけただけ。
大体、処理速度なんて別にこいつらが意見を出さなくても向上は必然。

いい加減、必死に擁護してる連中が関係者としか思えなくなってきた。
83名刺は切らしておりまして:2009/07/27(月) 12:18:01 ID:n614/rOW
これで見たい本は直ぐに
ネットにながれて
本代が浮くな
84名刺は切らしておりまして:2009/07/27(月) 12:20:04 ID:KeZR9vW7
あんま難しい技術に見えないけど未だに80%なのか
使えねー
85名刺は切らしておりまして:2009/07/27(月) 14:25:06 ID:yg2i9fx9
>>84
予想通りの頭悪すぎな反応でワロタ
86名刺は切らしておりまして:2009/07/27(月) 14:31:40 ID:hWfq2wyk
本にしか使えない技術をWebカメラで作るバカはいねえだろ。
スキャナで取り込めない看板とか標識にも使えるんだろ。
そうじゃないと視覚障害者に対する音声補助なんて言っちゃだめだよ。

そうなると『行間の幅と角度を計算して変換』なんて簡単な処理で行けるわけがない
行間も回転角も歪みも一定じゃねえもん。
87名刺は切らしておりまして:2009/07/27(月) 19:27:12 ID:dkJhqVGy
>>82
この研究が現時点で糞というのには同意
でもレスの節々が残念

文章前半正論,後半自分の価値観のおしつけワロス
物は知ってるけど思考力の足りない奴ってどうして私見に対しての吟味を怠るのかねー
ある程度知識あるのにもったいない


88名刺は切らしておりまして:2009/07/27(月) 19:28:02 ID:oidaK7Nn
これなんてOCR
89名刺は切らしておりまして:2009/07/27(月) 19:42:31 ID:uDsY/3kC
>>86
>視覚障害者に対する音声補助
を読んで、視覚障害者が看板や標識を音声で読み上げさせながら町歩きするのに使うと思ったのか?
視覚障害者には何処に自分にとって必要な情報が書かれた看板標識があるのかも分からない。
何処にどのタイミングでカメラを向けるべきかも分からないのに、有効に利用できると思うか?
広角レンズで取り込んだ広範囲を撮影した画像中の文字を全部読み上げさせながら歩かせる気か?
まあ、予め入力した必要なキーワードを発見したら報告するだけでも助かるかもしれないけど、
そもそも認識エラーが重大な事故に繋がりかねないような状況下での使用を開発者が想定するはずも無い。

常識的に考えれば、手元にある本などにカメラを向ければ読み上げる用途だろ。
90名刺は切らしておりまして:2009/07/27(月) 19:55:27 ID:awjWRDTR
>>87
何一つ自分の意見が無いくせに、妙に上から目線で、他人の意見をぼんやりと批判するが、
具体的に何処がどう問題かを突っ込んで指摘することは出来ない馬鹿には飽きた。
まず自分の意見をきちんと出して、お前が馬鹿じゃないことを相手に分からせてあげてねw

91名刺は切らしておりまして:2009/07/27(月) 20:00:24 ID:8E2Js/sH
現状で1処理80%なら、同時に多方向から撮影したり、動画中の複数フレームを
解析する事で認識率は上げれそうだな。

しかし、こういう技術開発見てると人間が持つ能力は凄いよな。
人間の眼と脳に機械技術が追いつくのは何時の事やら。
92名刺は切らしておりまして:2009/07/27(月) 20:00:30 ID:2IIR2FfO
>>82
否定している奴が馬鹿ってのは既に確定しているから
93名刺は切らしておりまして:2009/07/28(火) 00:48:10 ID:AfWIm4eR
>>92
何か一つくらいまともな反論があるかと思えば、反論一つ出来ない負け犬が勝利宣言かよw
それで満たされるちっぽけなプライドしかないのには同情する。
94名刺は切らしておりまして:2009/07/28(火) 07:46:20 ID:7CkNIukw
>>90
把握した

>この糞システムのアイデアのキモの即時性が消し飛ぶな。
単に「スキャナじゃなくカメラからの映像から文字を読み取る」という既存のアイデアとなる。

まさにその通りだと思う。記事を読む限り新規性はそこにしかない。

>頭良いね。カメラが2でも足りなければ3つでも4つでも増やせば良いし、これは使えるよ。
凄い発想だ俺には思いつかない。俺ならカメラを増やそうなんて考えるよりスキャナで取り込むなw

ここでスキャナの話になってしまう。
まだまだ実用レベルではないが視覚障害者への補助機能を想定するのであれば、
看板等の読み取りも前提にあるだろうからスキャナの話を持ち出すと話がずれる。
また、ステレオカメラでの文字認識の研究も実際にある。
それを知らずにわざわざ煽るようなことを書く意味がわからない。

>大体、処理速度なんて別にこいつらが意見を出さなくても向上は必然。

ハード(CPU等)かソフト(アルゴリズム)かどちらの事をさしているのかがわからないが

ハードであれば確かに向上しているし、これからも向上していく余地はある。
但し、ソフト側でなにもせずにハードの向上を待つとすると、
必要な処理能力になるまでに一体どれくらいの時間がかかるか見当もつかない
また、ハード向上が頭打ちしてしまった場合にはどうするのか?
(こんな技術いらない!は無しの方向でお願いします)

もしソフトの事を言っているのであれば、こういった類の研究を馬鹿にする事がおかしい。
このアプローチが間違っていてもなにが悪いのか、課題はどういったものかを
正しく書き出している論文であれば後の研究者の一助となりえる。
技術は急に生まれない。こういった積み重ねがあるから向上していくわけで、
この部分を否定して「向上は必然」というのであればそれは違うと感じる。

>82のような知識のある奴には否定じゃなく、なにがどう駄目でどうすればいいのかといった
もっと建設的な議論をしてほしかったんだ。

>>82,>>90
書いてて気づいた。
結局俺が馬鹿で自分の意見を押し付けてただけだった。
不快な思いをさせてしまってすまない。
95名刺は切らしておりまして:2009/07/28(火) 08:13:15 ID:9nl762cC
認識率80%かあ、そのままでいいから誰かフリーソフトで作ってLinux標準添付にしてくれ
別方式とクロスチェックすれば認識率上げられるんじゃないかな?
96名刺は切らしておりまして:2009/07/28(火) 08:15:48 ID:A42X11Yv
ただのOCRだろ。しかも性能の悪い。
80%の認識率ってゴミだろ。
97名刺は切らしておりまして:2009/07/28(火) 08:18:45 ID:cniua06J
SBMの905SHの時はまったく使い物にならなかったが
922SHにしたら、半分近くの名刺は一字一句間違わずに正確に認識するようになった
名刺に特化すると意外に使えるんだねぇ
OCR専用スキャナのように、画像も同時に関連付けて保存して欲しいと思った
どの道100%認識が無理なら、画像データの同時保存するだけで作業効率は格段に上がるのだ
98名刺は切らしておりまして:2009/07/28(火) 08:33:33 ID:4du9LmM7
これ結局内部で使ってる画像認識のアルゴリズム次第だと思うんだけど
カメラとかと連動させただけなら記事にするほどじゃない
99名刺は切らしておりまして:2009/07/28(火) 08:56:53 ID:68QWvyQZ
情報これだけだと、擁護しようもないと思うんだが、、、

せめて、これ以前の技術の認識率だしてもらわんと、80%でしか判断できんわな
100名刺は切らしておりまして:2009/07/28(火) 09:03:54 ID:iPy8Lx6K
>>99
八割なら昔と変わってないなと

OCRとな
101名刺は切らしておりまして:2009/07/28(火) 23:09:52 ID:eDHV/tcJ
パターン認識の分野ってどこが世界で強いんだ?
アメリカ?日本?ヨーロッパ?
102名刺は切らしておりまして:2009/07/29(水) 07:49:26 ID:VRDRoyg5
>大阪府立大学大学院

この辺に認識率80%のなぞが絡んでるような希ガス
103名刺は切らしておりまして:2009/07/29(水) 10:23:18 ID:NbR9R8ot
>>101
OCRの文字認識だと、今の所googleが最強じゃね?
google booksとかで鍛えてるし、たしか文字認識に関して最近
news releaseあったし。

ちなみに10年以上前のスキャナのおまけに付いてくるソフトでも、
認識率98%とかだったのにな、、、
104名刺は切らしておりまして
>>102
大阪府立大学の理系は国内でもレベル高いよ