使い物になるOCR教えろよ!

このエントリーをはてなブックマークに追加
Omnipageのv10以降
ただし、日本語を流し込むと、文字数などが違ってくるから
ページ割が保たれるとは限らない。
英文を手打ちできるぐらいの分量なら、手打ち+レイアウトしなおしのほうが早い。
153名無しさん@英語勉強中:04/01/01 09:19
\118,000円。。。。。。

そんなん高いの買えねえっす。
分量は実は会社に沢山有りますが、どうしてもしょうがないのだけ持ちかえって自宅で
シコシコやってる始末です。元旦から。。。
正月からご苦労様です。
短期決戦なら、ABBYYの試用版という手は?
まだあったかどうか確かめてないですが。
155Goonies:04/01/13 10:04
英語・日本語混在資料のOCRはほぼ絶望的?
ソフトハウス3社のデモに同じ本を持ち込んで試してもらったけど、
だめっすね。
しかもその3社とも、その問題を解決しようという姿勢が感じられなかったし。
今年も苦労しそうだなあ。
156名無しさん@英語勉強中:04/01/18 06:11
フリーでいいの無いですか?
なんでびた一文も出したくない?
安いよ。OCRなんて。高いのは高いなりに価値があるし。
158名無しさん@英語勉強中:04/01/18 21:08
>>157
スキャナに付いてるやつとか ダメなソフト多いじゃん。
だから市販レベルでも 使えないのが多いのかなと
市販レベルでも使えないっていうんだったら、
あんたが言うダメでないのが、フリーで転がってるわけないじゃん。w
英文OCRなら、どれでもそこそこ使えるって俺は思うよ。
どれがどうダメだってのかなぁ。

自分で探せないの?
検索すれば出てくるでしょ。
それとも日本語?
なら板違い。
160XXX ◆GmgU93SCyE :04/03/23 14:42
a
161名無しさん@英語勉強中:04/04/06 03:55
( ・∀・)つ゛∩ ヘェー ヘェー
162名無しさん@英語勉強中:04/05/03 07:38
age
163yokohairi:04/05/18 12:38
中文では、「北京V4」って如何ですか?
良いのありませんでしょうか?


また、日本語手書きOCRの識字率の良いものはありますか?
164163:04/05/18 12:41
すいません。。。英語板だったんですね。。。ここ
(OCRで検索して、いきなりここだったんで、板をしりませんでした)
165名無しさん@英語勉強中:04/07/03 20:11
スレが立って約二年、そろそろ良いOCRは出て来たんかいな?

それとも確実なキー鬱入力か。。。
166名無しさん@英語勉強中:04/07/04 02:42
やっぱサイコミュだろ。
167名無しさん@英語勉強中:04/08/10 23:32
なら
168名無しさん@英語勉強中:04/10/15 02:38:09
保守
169名無しさん@英語勉強中:05/01/01 20:53:53
こんな感じそろそろ良い.
170名無しさん@英語勉強中:05/02/07 16:19:45
何でどれもこれも日英混在がちゃんとできないんだろ。
読んde!!ココはv10以降、英文の認識にはABBYエンジンに入れ替えたので
少しはよくなりました。でもそれならABBYを使ったほうが早い。
英文OCRとしては、読んdeの9までの版は全く使いモノになりません。
単語と単語の間のスペースすらちゃんと認識しませんので、
スペルチェックも出来ないし、ゴミを吐き出すだけでした。
あんなもんを平気で出してる神経がすごい。
和文の途中に一つでも英単語が入れば、めちゃなんですから、
普段英文のOCRをしない人だって分かりそうなもんなのに。
171名無しさん@英語勉強中:05/02/28 14:55:23
>170
読んde!!ココの11でも日英混在はまるでダメでしたよ。
混在モード指定って何のためにあるの?って説明員に聞いたら、
「分かりません」だって。あちゃ〜何それ、って思ったんで、
「失礼ですけど、あなたはOCRしたことあるんですか?」って聞いたの。
そしたら「ありません。使うこと無いですから」ってあっさり言われちゃった。
172名無しさん@英語勉強中:05/03/01 04:31:24
ここは
「使いこなしのテクニック披露禁止」
「ソフトの認識力」について語るのも禁止事項
ですか?
173名無しさん@英語勉強中:05/03/01 04:34:52
ちゃんとスキャニングして画像処理してる?
認識率が悪いっていってるやつは自分が間違ってるとおもったほうがいい。
混在でも普通に8〜9割の認識はする
174名無しさん@英語勉強中:05/03/01 08:32:12
>173
画像処理なんかの問題じゃないヨ。
英単語、英文の混じる和文を173はやったことないから、
そんなありきたりな説教するんでは?
しみやゴミを取るとか、しきい値を最適に選ぶとか、かすれをなくすとかは常識。
縦書きの百が一と白になっちゃう問題は画像処理でどうにかなるわけじゃない。

8〜9割読める=1〜2割化けるんだったら、
全部手で打つのとそんなに時間は変わんないよ〜。
175名無しさん@英語勉強中:05/03/01 10:22:59
>>172
なにそれ?
176名無しさん@英語勉強中:05/03/01 11:37:05
>175
ビジネスソフト板のOCRスレに、
「使いこなしのテクニック披露禁止」
「ソフトの認識力について語るのも禁止事項」っていう
メーカーべったりの馬鹿が暴れてるんだよ。

173みたいなのも、自分じゃOCRなんて
1ページぐらいしかやったことないのがもろバレ。
本を20ページぐらいOCRしてみれば、8〜9割の認識じゃあ
どうにもならないって分かるんだから。
177名無しさん@英語勉強中:05/03/01 12:26:07
無い物ねだりしてもしょうがない
その程度の認識のソフトとどうつき合っていくか考えた方がよくねえか?
178名無しさん@英語勉強中:05/03/01 13:56:28
100%認識する時代まで待てばいいよw
179名無しさん@英語勉強中:05/03/01 14:16:36
ねだらねぇと、まともなもんは出てこねぇのさ。
使ってない奴が作ったソフトを使ったことも無い奴が売ってんだから日本語OCRなんて。

英語OCRの進化に比べて日本語OCRの進歩が取り残されているって言ってんだよ。
日本のOCRソフトエンジニアがみっともないもん作ってて平気なのは、
177や178みたいに、間抜けなちょうちん持ちが要るからだよ。
日本語OCRだけの横並びでしか見てないからだよ。

OmniPage使ってみろよ。
かすれてようが傾いてようが、レイアウトそのまんまで100%読むぜ。
というと馬鹿がまた英文のほうがOCRは楽だとかアホなこと言って来ると思うと
笑っちゃうぜ。
180名無しさん@英語勉強中:2005/04/11(月) 13:23:09
817 名前:名無しさん@そうだ選挙にいこう[] 投稿日:2005/04/11(月) 09:52:35
etypistとかって前処理のごみとり処理とか原稿の斜め補正処理が弱いよね

・孫コピーされてゴミはいりまくりの原稿が斜めにスキャンされるともうダメ
・スキャナ部分が汚れたFAXから送られた原稿って
文字列の上にびーっと線が入っているときがあるけど
そういう部分があると全然ダメ

ominipageは上のような条件でもetypistよりマトモ
181名無しさん@英語勉強中:2005/05/18(水) 17:22:24
OCRなんて意味ねー
画像のままでいいよ
182名無しさん@英語勉強中:2005/05/22(日) 07:31:22
画像のままじゃ不便な人がいるって分からないのかね
183152:2005/06/16(木) 09:15:10
この記事のライターと私には、根本的な考え方の違いがあります。
ttp://www.itmedia.co.jp/pcupdate/articles/0506/14/news001.html
記事では、卓上のペーパーフィーダー付きスキャナーでPDF化して
「捨てる」と誇らしげに提案しているわけですが、
内容は、単なる記事に見せかけた広告に過ぎません。
PCで作られたと思しき一枚モノの資料は、その作者がその資料を作成したときの
Word原稿なりがあるはずです。
それを貰ったほうが早い。
社外、社内の文書であれば、会議室で配られ討議に必要なペーパーとは別に、
後日、そのオリジナルドキュメントをメールに添付して送ってもらいます。
最近は既にPDF化されていることが多く、こちらの手を煩わされません。
こうすれば、手間も要らずです。
名刺のOCRも同様です。
こちらからOutlook用の電子名刺データを送付すると、それに触発されてか、
向こうからも電子名刺形式で返送されてくることもしばしばです。
伝統的儀礼として、紙の名刺交換もいたしますが、電子名刺の簡便さを知るたびに、
紙の名刺の非能率さを再認識します。
一般資料は、まずネットに上がってないか調べ、なければOCRします。

結論:OCRニーズとして最後まで残るのは書籍資料だと私は思っています。
追記:それにしても日本語のOCRの精読率は進歩しませんね。
   斜め読みするには十分ではありますが。
184名無しさん@英語勉強中:2005/07/02(土) 20:05:16
一番下からage!age!
185名無しさん@英語勉強中:2005/07/02(土) 20:21:21
名刺のOCRって見に来てんの、窓際オッサンばっかり。
ああ、こいつらタイプ打てないんだって思っちゃう。
だって名刺のOCRなんて手で打ったほうがよっぽど早いもん。
186Goonies:2005/07/22(金) 12:13:54
e-learning展に行ってきました。
去年の半分に縮小しちゃってましたが、
手元の資料を講師が遠隔地の生徒に見せることがおおい、
e-learningこそOCRが不可欠だと思っているので
そうした機能が盛り込まれたシステムはないかと探したのですが、
全くありませんでした。
結局のところ、WordとExcelの画面をリモートで別のモニターに映しさえすれば、
”はいe-learningの完成です!”みたいな原始的なものばかり。

Webカメラに手元の資料を映しても、相手側ではほとんど判読不能です。
そんなときにすばやくOCRしてくれる機能は不可欠だと思うんですけどね。
あの展示会に出ている業者も来ている客も、まったく経験がないんだからいやになります。
いかに電子黒板が使いづらいか、一度も体験すれば、
e-learningにとってOCRつきの黒板機能がないことが問題だと分かりそうなものなのに。
それともう一つ、生徒Bと生徒Cとの間のコミニケーションも全く考えてないのも問題です。
187名無しさん@英語勉強中:2005/08/02(火) 09:12:30
社員乙
188名無しさん@英語勉強中:2005/08/05(金) 12:40:26
>187
186はどこの社員なんですか?
189名無しさん@英語勉強中:2005/08/12(金) 02:48:42
               | ちょ、ちょーとまって!!!誰か188に社員しかいないことを説明してあげて!!
     , ,-;:;:;:;:;:;:;:;:;:;:;:;:;:;:;:,.  ヽ─y──────────────   ,-v-、
    /;:;:;:;:;:;:ミミ;:;:;:;:;:;:;:;:;:;`、                          / _ノ_ノ:^)
    /;:;:;:;:彡―ー-、_;:;:;:;:;:;:;:;|                           / _ノ_ノ_ノ /)
    |;:;:;:ノ、     `、;;:;:;:;:;:i                        / ノ ノノ//
    |;:/_ヽ ,,,,,,,,,,  |;:;:;:;:;:;!                      ____/  ______ ノ
    | ' ゚ ''/ ┌。-、  |;:;:;:;:/                     _.. r("  `ー" 、 ノ
    |` ノ(  ヽ  ソ  |ノ|/               _. -‐ '"´  l l-、    ゙ ノ
_,-ー| /_` ”'  \  ノ   __       . -‐ ' "´        l ヽ`ー''"ー'"
 | :  | )ヾ三ニヽ   /ヽ ' "´/`゙ ーァ' "´  ‐'"´         ヽ、`ー /ノ
 ヽ  `、___,.-ー' |   /   /                __.. -'-'"
  |    | \   / |   l   /            . -‐ '"´
  \   |___>< / ヽ
190名無しさん@英語勉強中:2005/08/13(土) 01:24:20
なに被害者妄想入ってんだよ。意味不明。
このスレに社員なんか来てないよ。
191名無しさん@英語勉強中:2005/08/14(日) 05:30:39
                 / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
                 | ちょ、ちょっと待って! 被害者妄想って!?
                 | むちゃくちゃだよ!>>585あんたは勉強不足だよ!
                 | そもそもあなたねえ、僕は被害者じゃないよ!
                 ヽ─y──────────────
     , ,-;:;:;:;:;:;:;:;:;:;:;:;:;:;:;:,.                            ,-v-、
    /;:;:;:;:;:;:ミミ;:;:;:;:;:;:;:;:;:;`、                          / _ノ_ノ:^)
    /;:;:;:;:彡―ー-、_;:;:;:;:;:;:;:;|                           / _ノ_ノ_ノ /)
    |;:;:;:ノ、     `、;;:;:;:;:;:i                        / ノ ノノ//
    |;:/_ヽ ,,,,,,,,,,  |;:;:;:;:;:;!                      ____/  ______ ノ
    | ' ゚ ''/ ┌。-、  |;:;:;:;:/                     _.. r("  `ー" 、 ノ
    |` ノ(  ヽ  ソ  |ノ|/               _. -‐ '"´  l l-、    ゙ ノ
_,-ー| /_` ”'  \  ノ   __       . -‐ ' "´        l ヽ`ー''"ー'"
 | :  | )ヾ三ニヽ   /ヽ ' "´/`゙ ーァ' "´  ‐'"´         ヽ、`ー /ノ
 ヽ  `、___,.-ー' |   /   /                __.. -'-'"
  |    | \   / |   l   /            . -‐ '"´
  \   |___>< / ヽ
192名無しさん@英語勉強中:2005/10/23(日) 11:41:43
ETYPIST
193名無しさん@英語勉強中:2005/12/05(月) 19:59:20
194名無しさん@英語勉強中:2005/12/29(木) 02:04:06
ABBYY FineReader 8.0 $399.99
高いよ〜〜
195名無しさん@英語勉強中:2005/12/29(木) 05:44:50
ttp://www.forest.impress.co.jp/article/2005/11/29/smartocrlite.html
ってGUIとか設定とか市販ソフトと似てるね
196名無しさん@英語勉強中:2005/12/29(木) 11:10:25
e-typist11、英語かなり使えますよ。
今まで使っていて、手動で直した事ないもん。
197名無しさん@英語勉強中:2005/12/31(土) 16:45:57
和文英文混在したときどうね?
198名無しさん@英語勉強中:2006/01/12(木) 09:05:31
一太郎ってどんな感じ?
199名無しさん@英語勉強中:2006/01/14(土) 12:05:44
>>197
意外にいけます。
ソフトの設定と、スキャンした線の太さが最適だと、
英語のみでも、日本語のみでも、混在でもかなりいける感じです。

設定が最適でも上手くいかない場合は、線の太さというか、スキャンされた画像が
最適じゃない可能性が高いかも。

逆に言えば、状態が悪い紙をスキャンしたものからOCRすると
精度は落ちそうです。
200名無しさん@英語勉強中:2006/01/14(土) 22:32:31
>196
e-typist の英語エンジンってABBYだろ?
だったらABBY使えばいいじゃんか。

レイアウトとの再現力はOmniPageと比べちゃいけない。
でも価格相当の仕事はするよ。
ほとんどのユーザーはこれで満足じゃないか。
201名無しさん@英語勉強中
>>200
e-typist11は、アップグレード版なら、¥5,145で買える。