認識率が一番いいとおもわれるOCRソフトは?

このエントリーをはてなブックマークに追加
1名無しさん@そうだ選挙にいこう
なんでしょうか?
2名無しさん@そうだ選挙にいこう :2000/10/10(火) 16:33
よんでココ
3名無しさん@そうだ選挙にいこう :2000/10/10(火) 17:32
WinReaderというのがありますよ
4名無しさん@そうだ選挙にいこう :2000/10/10(火) 21:29
WinReaderは価格が高すぎ・・・198,000円
かたや読んde!!ココは10分の一の19,800円
パーフェクトな認識するわけでもないし、結局手直し入れなきゃだめなんだし
日本語と英語しか使わない環境だったら、価格や使いやすさで読んde!!ココの方がいいと思う。
ここは「認識率が一番いいOCRソフト」だからスレ違いだったかな。
5名無しさん@そうだ選挙にいこう :2000/10/11(水) 05:28
読んde!!ココの英語の認識力はかなり悪い。presto ocr proはさすがの一言。
英語を扱う人はSET販売品を買いましょう。
6名無し :2000/10/12(木) 20:48
プレストページメーカーというのがスキャナとかについてて、
英語の認識はこれにやらせた方が全然良かった 2年前までそうだった
けど、今もそんな感じなのだろうか
7名無しさんZ80 :2000/10/13(金) 17:28
むかし、新聞でNECが新聞の内容を97.5%で認識するOCRソフトを
開発したときいたことがあります
松下も似たようなきじがあったと思います
8名無しさん@そうだ選挙にいこう :2000/10/19(木) 05:27
住友電工のOKReader使えています。
日本語も英語もそここそこ行けます。
9元OCR開発者@今は窓際族。もうOCRは要らないらしい :2000/10/19(木) 19:11
下記のページに色々載ってるよ。
http://member.nifty.ne.jp/speleo/OCR_Soft_rev.htm

# もうOCRの技術者って、何処も必要としてないんでしょうか(涙)
>>9
なんだかよく分からないけど、がんばれ。
125>9 :2000/10/20(金) 09:44
presto ocr proはほんとに凄いです。自動処理だけで99%以上の認識率を
出してます。ほぼ無修正でいけます(但し英語しか試してませんが)。かたや読んde!!ココ6では体感で
95%くらいでしょうか。日本語の認識がOCR PRO並になれば絶対売れますし、買います。
 事務処理に革命が起こりますよ。企業には大勢のワープロ要員がいますが彼らを半減させる力がありますね。
日本のためにも頑張ってください。
13とおりすがり :2000/10/20(金) 13:32
0.1%でも間違いがあると、見直しを人力でする必要があるので
手間は変わらない。。
14名無しさん :2000/10/21(土) 02:47
そのとーり。
1512 :2000/10/21(土) 04:00
社会にでたらわかると思うけどね。一語一句間違いなく仕上げなきゃいけない文書と
概略が判ればいい文書があるのよ。全部を完璧に仕上げる暇も金も無いのが普通だよ。
 使えないやつに限ってその辺の見分けができなくて時間ばかり使って結果が出せないなんてことになる。
13,14は気をつけた方がいいね
16名無しさん@そうだ選挙にいこう:2000/12/21(木) 15:53
認識工房
17名無しさん@1周年:2000/12/21(木) 15:57
OCRって何?
何の略?
18名無しさん@そうだ選挙にいこう:2000/12/21(木) 20:39
Optical Character Readerだとおもう。
間違ってたらごめん。
19R:2000/12/22(金) 00:51
ほとんどの本は、Reader と書いていた。
一冊だけ、Recognize と書いていた本もあった。
20名無しさん@そうだ選挙にいこう:2001/01/05(金) 02:45
presto! ocr pro を買って、スペイン語を読ませてみたが、ほとんど誤読なし。
原稿は結構画質悪いコピーだったけど。久々に感動した。
21名無しさん@そうだ選挙にいこう:2001/01/05(金) 03:44
うちのカミさん。
22名無しさん@1周年:2001/01/05(金) 22:18
書体にも夜だろ
23>>21:2001/01/06(土) 13:51
鶴の恩返しですか?
24名無しさん@そうだ選挙にいこう:2001/01/12(金) 06:52
買ったスキャナに「e.Typist エントリー」と言うのがバンドルされてたんでけど、
使ってる方いますか?
2524:2001/01/12(金) 06:52
↑でけど>ですけど
26名無しさん@そうだ選挙にいこう:2001/01/12(金) 07:08
>24 おれも使い始めたところ。使いこなせてないけど、
今のところ、ちょっとがっかり。こんなもんか?
2724:2001/01/12(金) 07:10
>>26
私は未だインストールしてないんですけど、名前も聞いた事無いし
余り良くないのかな・・・。
28名無しさん@そうだ選挙にいこう:2001/01/13(土) 04:18
>24 別にインストールしても壊れないから。。
おたがいもう少し使ってみてから、ここでまた話しませう。
2924:2001/01/13(土) 08:37
>28
そだね。
30名無しさん@目黒:2001/01/13(土) 11:50
結構ね、いままでいろいろなOCRを使いましたが、
意外なことに、Brotherの複合機(MFC)についてきた
Presto!のMaxReaderが一番性能が良かったですね。
漢字辞書を持っていないくせにね。バンドル版ではなくて、
辞書ありの正式版があればいいのですが。
eTypistは英文の性能だけ、といった印象があります。
ただし、どのソフトも、罫線の入った表は、うまくいきませんね。
31名無しさん@そうだ選挙にいこう:2001/01/14(日) 06:41
東芝のエクスプレスリーダープロの認識率は 凄過ぎ
高いけど・・・
体験版でもインストールしてみれば
32TOTO:2001/01/14(日) 07:14
やっぱり ちと高いけど WIN READER です。
独自のエンジンを持って抜群です。
33名無しさん@そうだ選挙にいこう:2001/01/14(日) 12:11
>e.typist
バンドル版から、ver.5にアップグレードしたら、満足できる
認識率になりました。
コンシューマ向けの日本語活字OCRならばメディアドライブWinReaderか
東芝ExpressReaderで決まり。シングルバイト圏はPresto!がデファクト。
ちなみにe.typistはWinReaderとOCRエンジン部が微妙に異なるらしい。
手書き文字認識は識字率50%でればいいほう&仕方ない。

あとはねぇ例えば新聞とか、文字種が固定されている文書を読ませる場合は、
OCRメーカと協力してカスタマイズする事で大幅に識字率やレイアウト解析の
成功率をあげる事ができる。WinReaderとかで識字率あげられず不満をもって
るのはユーザがその辺を判ってないだけ。
文字の形を見てるんじゃなくて、点の集合として数値化して判断してるんだよ。
だから文字間が狭かったりすると複数の文字をまとめたりする。
ちなみに手書きOCRは文字の形を見たりする。
言い忘れた。WinReaderよりもe.Typistの方がわずかに識字率がいいかも?という
事も聞いてる。わずかに、ね。
36名無しさん@そうだ選挙にいこう:2001/03/18(日) 14:06
>>35
エンジン変わってるからね。e.Typistの最新版
の方がいいと思われるよ。
DPIに気をつけて取り込むと認識率が良くなるよ
37名無しさん@そうだ選挙にいこう:2001/03/27(火) 21:26
読んでココの新版でたね。だれか買った人いますか?
38名無しさん@1周年:2001/04/09(月) 22:25
キャノンのスキャナを買って、それにe.Typistのエントリー版があったのですが、
枠線などがある書類だと文字化けを起こしてしまいます。
枠線、罫線などもちゃんと認識してくれるOCRソフト(できればエクセルに対応)
だと、何がいいでしょうか?教えてください。
39名無しさん@そうだ選挙にいこう:2001/04/10(火) 20:39
これはどう?「表OCR forエクセル」
http://software.fujitsu.com/jp/ocr/hocr/index.html
4038:2001/04/10(火) 21:45
39さんありがとう。
「表OCR forエクセル」じゃないとエクセル対応の
ソフトでも枠線、罫線は認識しないんでしょうか?
e.Typistのエントリー版はエクセルに対応だったけど、線は無理だった
もので。
41名無しさん@そうだ選挙にいこう:2001/04/10(火) 22:52
>>1
42名無しさん@そうだ選挙にいこう:2001/04/11(水) 00:32
>40
いや、そんなことはない(はず)。
スキャナーの解像度を上げて、もう一度試してみてはいかがでしょうか?
普通OCRは線も読み込みますよ。

後は、Eタイピストの会社にメールで聞いてみては。
バンドルものなんでサポートしてるかどうかは分かりませんが。
43名無しさん@そうだ選挙にいこう:2001/04/16(月) 00:58
前を知らないんで、認識率はわからないけど、読んでココの7はActobatとの連携
がいいねぇ。

資料をスキャンしてPDFで管理しているんだけど、Acrobat 5(次のヤツ)だと透明
オブジェクトというのが扱えるようになる。Acrobat 5からココを呼び出して認識させ
て、認識後の文字列を"透明オブジェクトとして"文字イメージの上にオーバーレイ
する。
つまり、文書イメージはそのままに、検索だけをOCR後の文字で行う、ということが
可能になる。

検索用だけと割り切れば、メンテしなくても十分に使い物になるし、元の文章は
イメージで残るので、かなり便利です。もちろん、サイズはテキストだけより大きい
けれど、今時のハードディスク容量を考えれば悪い使い方じゃありません。

僕の場合、ノートPCの20GバイトHDDは、10GバイトがPDFで占められています。
まじめに便利よん。ま、使い方次第、用途次第なんですが...。
44名無しさん@そうだ選挙にいこう:2001/04/16(月) 02:00
スキャナを使って原稿を電子化するのって、実用レベルになってるの?
もしそうだったら買うんだけど。
俺がやってみたいのは、日本語およびドイツ語の本を丸ごとHDに
取り込むことなんだけど、活字認識率が95%以上もあるんだったら、
ちょっとした間違いくらいは読んでて自分で判断できたり、
あるいは直接に本を調べてどうにかなりそうな気がする。
でも、スキャニングに時間掛かったりしない?
45名無しさん@そうだ選挙にいこう:2001/04/16(月) 05:45
安いくせにOKReader!は性能良かった。
46名無しさん@そうだ選挙にいこう:2001/04/17(火) 00:10
>>44
私は、読んでココ!とOKReaderを試してみましたが、
どちらも実用レベルにはなりませんでした。
やったのは、新聞とか雑誌の取り込み。
将来きっといいOCRソフトが出現することを祈って、現在は
画像データのまま保存しています。
4744:2001/04/17(火) 00:20
そうですか、やっぱり実用にはなりませんか。
どうもありがとうございます。
エロ画像をウプするくらいならともかく、
活字データをちゃんと取り込むほどの実力が
スキャナにあるのかなと思って質問してみたのですが、
まだダメなようですね。
別に急ぐこともないので、もう少し待ってみます。
レスをいただけた事をもう一度感謝いたします。
48名無しさん@そうだ選挙にいこう:2001/04/17(火) 13:07
日本語は特に難しいんだよ。ドイツ語ならたぶん大丈夫だ。
49名無しさん@そうだ選挙にいこう:2001/04/17(火) 16:44
>43
たしか,読んde!!ココが連携してるのはAcrobatだけで,AcrobatReaderじゃダメでしたよね。
ところで,e.Typist6.0でpdfファイルを認識させることはできないんでしょうか?
認識率98%
よくて400字詰め原稿を8文字間違えるということだ。悪いときは…
51名無しさん@そうだ選挙にいこう:2001/04/17(火) 23:34
>>44
雑誌はともかく、新聞なら認識率はかなりいい。
後は文字の大きさ次第かな?
同じ新聞なら学習させることによって、認識率はかなり上がる。
46は実用レベルにならなかったと言っているが、いつの時代の話だ?

俺もこのスレを見て、OCRの性能には半信半疑だったが、バンドルソフトでも
充分だと感じた。
機種:CANON N1220U
使用ソフトはe-Typistエントリーだ。

ただ、混在はきつい。

また、メディアドライブ(e-Typistの会社)は東京・大阪ではたまにデモをやっている。
半信半疑なら、実際に試してみれば。
俺はそれで購入を決意。
52名無しさん@そうだ選挙にいこう:2001/04/22(日) 17:31
>>43
確かに透明テキスト型のpdfは使えそうですね。でもその使い方ならdocuworks
の方が使い勝手がいいかもしれませんね。
 
53名無しさん@そうだ選挙にいこう:2001/05/09(水) 14:22
今月号のパソコン批評に、OCRソフトのことが取り上げられている。
54名無しさん@そうだ選挙にいこう:2001/05/09(水) 22:27
>>52
Acrobat+読んde!!ココ+ePwareって組み合わせだとdocuworksよりもいいと思うのですがどう思いますかね?
って言うか、Acrobat+ePwareでdocuworksとほぼ同じ?
5552 受験生:2001/05/10(木) 00:38
知らなかったんだがどうもコニカが扱ってるDocuworks同種のソフト
みたいですね。
 性能仕様は似たようなものですから実際に使ってみないと何とも
いえませんね。
 ちなみに私は単なる資料収集はDocuworks、暗記すべき資料は読んでココ
でテキスト化してworkpadに転送したり読み上げソフトで聞いたりしてます。
まだ試行錯誤ですが
5654:2001/05/10(木) 07:17
コニカとクセロの共同開発らしいです。
クセロのHPの方が詳しく書いてますよ。
http://www.xelo.ne.jp/xelo/index.html
5746:2001/05/13(日) 00:06
>>51
私が最後に試したのは、読み取った原稿からすると1999年秋頃でした。
あれから一年半たった今、実用レベルに認識率があがったのかな?
個人的には新聞や雑誌などで明朝でかかれた活字は100%認識で、
特殊なフォントを使った部分や記号の読み取り部分で95%以上くらいないと
実用的とは言えないよ。
本一冊取り込むときに、誤認識チェックで本一冊読む以上の時間かけたくないし。
58名無しさん@そうだ選挙にいこう:2001/05/13(日) 22:42
うーん、100%を求めますか・・・
実用レベルは個人差があると思います。
私はhttp://www.wao.or.jp/naniuji/を見て、使いもんになるのかと思っていたんです。

で、実際にデモを見て、新聞で認識率97〜98%位なら私にとって、「実用に耐えうる」
レベルだなと思ったわけです。


>本一冊取り込むときに、誤認識チェックで本一冊読む以上の時間かけたくないし。

そうですね。これはそう思います。
ただ、手入力より早くて疲れないメリットを感じたために、私は購入しました。

でも1年半という歳月は、この業界では技術を格段に進歩させる時間としては充分でしょう。
2社がいい感じで競争してますし。
53の方が書いてるように、パソコン批評に編集部でテストした結果が出てました。

54さんも、試しに今のOCRを使ってみてはいかがでしょうか?
59名無しさん@そうだ選挙にいこう:2001/06/07(木) 13:10
OCRを使ってる人って、あんまり居ないのかな?
60氏名トルツメ:2001/06/07(木) 23:35
年配の人の崩し字、チャラ字、尚且つFAX送信のせいでところどころかすれてる原稿を
99%以上認識してくれるんなら50万で買う。
そんなの無いか…トホホ
61名無しさん@そうだ選挙にいこう:2001/06/08(金) 03:35
それは・・・・ヒトの仕事だな。
認識率が良くて98%か。
つーことは、頁あたりでかりに500語、
見開きで1000語載ってる洋書をスキャンして、
20語間違うという計算。。。。
頁あたり10語も間違えてるんだったら、照合とかに
めちゃくちゃ手間が掛かるんじゃないかな。
63名無しさん@1周年:2001/06/09(土) 10:18
>>62
洋書?
アルファベットで98%ってことはありえないと思うんですけど・・。
私は日本語読み取りに使ってますが、
それでももっと高い確率で正確に認識します。
64:名無しさん@そうだ選挙も近い:2001/06/09(土) 10:24
読み取り物語ってどう?
会社で買おうかと思ってるんだけど、業者にそれ薦められたんだよね。
ここで、名前挙がってないとこみると、マイナーなのかな。
使っている人いたら教えてください。
65名無しさん@1周年:2001/06/09(土) 10:59
>>64
お試し版ダウンロードしてみれば?
http://www.rsk-tokyo.co.jp/products/yomitoriv3/downenq.html
6665:2001/06/09(土) 12:01
>>64 追記
マイナー=低性能
メジャー=高性能
というわけではありません。
普及率No.1の「読んで!!ココ」は、スキャナバンドルNo.1でもあります。
(ちなみに私は読取革命)
67:名無しさん@そうだ選挙も近い:2001/06/09(土) 14:12
>>65
レスありがとう。v3のお試しはまだスキャナが無い。=機器とソフトを一緒に買う
つもりなので試せない。
性能と有名無名が一致しないのは分かってるんだが、2ch的にはどうかなと思ったんで。
うーん、先にスキャナだけ購入してお試し版使ってみようかな。
スキャナ+OCR+ADFで10万以内に収めようと思ってるので慎重に考えてみます。
68名無しさん@そうだ選挙にいこう:2001/06/09(土) 18:48
>64
業者に借りてみたら?
買う気があるんなら、大抵のことは便宜を図ってくれるはず。
69:名無しさん@そうだ選挙も近い:2001/06/09(土) 22:33
>>68
買うのはもう決定していて、後はスキャナとかソフトを予算の範囲内で
決めるだけなので、業者に相談してみます。
70名無しさん@そうだ選挙も近い:2001/06/09(土) 22:46
ソフトウェアOCRの高いのを買うより、こういうのが良いんじゃないかな。
http://www.hitachi-ul.co.jp/OCR/myq_v6/index.html
日立超LSIのOCRカードだけど、確か十万円台だったと思う。
71名無しさん@そうだ選挙も近い :2001/06/10(日) 02:07
ソフトもさることながら、ちゃんと光学400dpi以上のスキャナを買わないと
精度でないと思います。
まあいまどきのスキャナなら光学600dpiくらいあたりまえかな。
72名無しさん@そうだ選挙にいこう:2001/06/10(日) 06:37
では、お勧めのスキャナってどれですか?
真剣に購入を検討してます。
7365:2001/06/10(日) 11:24
>>72
あくまで個人的なお勧めですが、エプソンGT-8700(実売価格22,800円前後)。
理由@SCSI接続により高速読込可(当然SCSIボードが別途必要)
理由A別売ADF(定価10,000円)が接続可能
読み取り性能(1600dpi)はOCR目的には完全にオーバースペックだが、
上記@Aを兼ね備える現行機種はこれ以外にない(と思う)。
ただし、付属OCRソフト(読んde!!ココ バンドル版)は役不足なので
別途買い換えの必要あり。
詳しくはハードウェア板スキャナスレッドへ。
http://salad.2ch.net/test/read.cgi?bbs=hard&key=972911762
74名無しさん@そうだ選挙も近い
確かに高めのエプソンは良いよな。