1 :
スキャナ初心者 :
2001/07/30(月) 23:59 既出だったらすみません。 スキャナを買ったのですが、付属のOCRソフトが使えなくて悩んでいます。 横書きはいいのですが、縦書きだと見事に文字化けしてしまって。 縦書きでもOKなOCRソフトで、おすすめがあったら推薦してください。 できれば…2万以下で。
2 :
名無しさん@そうだ選挙にいこう :2001/07/31(火) 11:19
すみません、削除依頼を出しておきます…。 わざわざ、教えてくださってどうもありがとうございました。
4 :
1ではないが :2001/08/02(木) 17:34
既スレは過去ログにいちゃってるのですけれども? しかも、製品のホームページを見ただけでは、どこが良いのか判らないのですが?
これは失礼しました。(先日まで既スレが見れたのですが。)
過去ログ倉庫↓
http://mentai.2ch.net/bsoft/kako/977/977117663.html 既スレではOKREADERと読取物語を推薦する人がいました。
私自身は、読んde!!ココ → e.Typist v5.0 → 同 v6.0
→ 読取革命2001 を使用してきて、読取革命にほぼ満足しています。
OCRは、認識対象との相性や、
各ソフト特有の認識のクセみたいなものがあるし、
認識率以外の機能や使い勝手にもソフトにより一長一短があるので、
できれば各ソフトの体験版をダウンロードして、実際に試用のうえ
自分の用途に適するものを選ぶのがいいと思います。
2へ ありがとうございました。
7 :
名無しさん@そうだ選挙にいこう :2001/08/03(金) 16:20
「メールニュース配信における誤作動のお詫び」
トレーディングポストWEBマスターの伴と申します。
この度、平成13年7月31日16:29頃配信された、8月1日付けトレーディン
グポスト・メールニュース Vol.5につきまして、全ての受信者の氏名とメール
アドレスが記載されるという誤作動が発生致しました。
これは、メール配信ソフトの不具合によるもので、すでにこのような事が今後起こら
ない様に対応済みです。
トレーディングポストでは事の重大さを厳しく受けとめ、深く反省しております。
この件で多くの方に不快な思いをさせてしまいましたことを心からお詫び申し上げま
すと共に、今後このようなことのないよう、細心の注意を払う所存でございますの
で、何卒ご容赦賜りますようお願い申し上げます。
*************************
TRADING POST WEB MASTER
[email protected] www.lifegear-tradingpost.com
*************************
8 :
遅レス :2001/08/26(5) 37:00
>>1 OCRソフトはどれも横書き縦書き両方いける筈です。
商品によって認識率の差はありますが、
「縦書きだけが見事に文字化けする」というのは
その商品の性能の問題ではないと思います。
■考えられる原因(その1)
スキャナのバンドル版OCRは、製品版と違って
簡易版がついている場合があります。
どこが簡易かは、その商品によって違います。
製品版は横書き縦書き両方いけるけども
簡易版は横書きのみ、というケースがあります。
そういう場合は、添付の説明書かreadme
若しくはhelpに必ず書いてあります。
■考えられる原因(その2)
横書き縦書き両方いける製品版の場合でも、
認識ブロック毎に、そのブロックが縦書きなのか
横書きなのかを、設定する必要があります。
縦書き原稿なのに、それを横書きとして設定していると、
むちゃくちゃな認識結果になります。
9 :
皆さん、ありがと :01/08/27 23:51 ID:Rkw4mHf.
私も、1 さんと同様に、スキャナにおまけでついていた 「読んでココ」の簡易版で、縦書きがバケてしまい困っていました。 皆さんの情報が、とても参考になり、助かりました。 ありがとうございます。
10 :
名無しさん@そうだ選挙にいこう :01/08/28 23:21 ID:Foa6GOg2
「OCRソフトより、画像閲覧ソフトの方が、実用的」という コメントを別のスレで見たのですが、 OCRソフトは、使いにくいものなのでしょうか。
えっ、どーゆーこと? 全然方向の違うソフトのような気がするけど。 あっ、なるほど、こーゆーことか。 本や雑誌や書類の内容を、電子化するのに、 OCRでテキスト化するのと、 単に画像として保存するのと、 どっちがいいか、ということか。 そりゃまあ、 人によって、やりたい事 ちゅーか 求めるものは違うから、 その人がイイと思うほうがイイんじゃない? テキストの再利用はしなくて、単に画像として見られるだけでイイ という人は後者だろうし・・・ >OCRソフトは使いにくいか? 別に使いにくいということはないけど 結構手間がかかる、というか、手順が多いから、 まとまった量でなければ、手入力より時間がかかるデスネ。
12 :
名無しさん@そうだ選挙にいこう :01/08/29 15:58 ID:EgDWHarg
11様 DocuWorksというソフトが良さそうですが、 このソフト、どう思われますか? DocuWorksというソフトは、 OCRでテキスト化するのと、単に画像として保存するのとの 中間の感じがいたしますが。
13 :
名無しさん@そうだ選挙にいこう :01/08/29 16:01 ID:EgDWHarg
DocuWorksソフトに関する情報 日経PC21 4月号でも取り上げられた画像管理ソフトの決定版 各種アプリケーションで作成した文書でも同じウィンドウ内で一括して扱うことができ、 紙の文書もスキャナーで読み込むことによって他の電子文書と同様に扱えます。 個人の文書管理からグループ、さらには企業レベルでの統合的な活用まで、 異なるアプリケーションで作成した電子文書や、さまざまな紙文書を一元管理。 わずらわしかったドキュメント作業が効率的に進みます。 ■編集・整理・保管・検索 作成文書の保管・検索も素早く行なえます。 スキャナーで取り込んだ画像に対して自動的にOCRをかけることで、 画像データに対しても全文検索できます。 ■アウトプット 数種類のアプリケーションで作成した文書でも、DocuWorks文書として一括出力。 配信先のアプリケーションを気にせず配信できます。 ○対応OS Windows(R) 95/98/Me Windows NT(R) 4.0 (Service Pack 3以上) Windows(R) 2000 標準価格:\13,200- → bStore販売価格:\11,880-
14 :
名無しさん@そうだ選挙にいこう :01/09/02 11:12 ID:RVwhzl/U
カタログを見ると eTypist7より読んdeココの方がいいみたい。
15 :
:01/09/04 11:05 ID:GNbaF0Cs
ネットで必要な情報があると図や写真もある時は、キャプチャーでjpeg保存 してあるんだけど、それをOCRソフトで文章の部分をテキスト化したいんだけ ど、そういう事できるソフトありますか?
16 :
名無しさん :01/09/04 15:55 ID:7kKL4O7Q
>14 私はeTypist7も読んdeココも持ってますが,読み取り性能は eTypist7の方がけた違いにいいですよ。ココの方は辞書の搭 載語数が多いので良く見えるけど、認識エンジンの性能自体 が悪いです。
17 :
名無し :01/09/05 01:03 ID:Vh9XVJ6s
1番の方、原稿の向きはいかがな状態でしょうか。 ソフトとPC(ソフト同士もあり)の不具合がなければ 何通りにも、おいて、チャレンジしてください。 ちなみに 私、日本語縦書き、OKREADER2000 でなんとかなりました。
18 :
名無しさん@そうだ選挙にいこう :01/09/05 13:59 ID:iXTT0ioc
>>17 >>1 はソフトの設定間違えただけで、今ごろ恥ずかしい思いしてるんだから
それ以上突っ込まないでやってくれ
>>15 > 図や写真もある時は、キャプチャーで jpeg 保存してあるんだけど
文字も含めて全部ですか?
その画像になった文字を、OCRで再度拾う、ということですか?
それは多分ムリでしょう。
HPの本文の文字は、大体 10dot×10dot くらいで表示されていますから。
ニュースのタイトル文字でも、その倍くらいでしょうし。
一方、通常のOCRでは、
10point の文字を 400dpi で取り込むと、1文字は大体 50dot×50dot になります。
だから、どの OCR ソフトでも、解像度不足で認識できないんじゃないでしょうか。
カラーの背景に書かれた、カラーの文字なんかになると、なおさら・・・
20 :
15 :01/09/06 10:04 ID:0vktFdLc
>>19 ムリですかぁ。残念です。
ワープロに打ち出すのもめんどいし、キャプチャーjpegをプリントアウト
してスキャナーに読み込ませてOCRソフトに読ませるしかないのかなぁ。
資源と労力の無駄ですが仕方ないですね。ありがとうございました。
>>20 違うよ。そのまま読ませることできるよ
>>19 が逝ってるのは解像度が悪いからろくに読み込めないってことだろ
22 :
19 :01/09/06 19:20 ID:hvpkeevs
>>20 今、表示しているHPを、そのまま印刷した場合は、
画面上では10×10dotの文字でも、
ギザギザがとれて滑らかに印刷されてきますから、
それをOCRにかければ、認識してくれるかもしれません。
ま、もっとも、
今、表示しているHPなら、そんなことする必要は無いですが。
しかし、
>>15 の書込みを見ると、あなたは、
HPをキャプチャーして、既に画像として保存してある、とありますから、
それを印刷した場合は、画面上で10×10dotだった文字だと、
印刷結果も10×10dotのギザギザ文字になって印刷されてくるでしょう。
だから、その紙をOCRにかけても結果は同じです。
試しに、文字サイズ(小)で表示してある このページをキャプチャーして、
15 のあなたの書込みをOCRにかけてみました。
して、その結果は・・・
やっぱりダメです。
認識率云々以前に、全く認識結果のテキストを吐き出してくれません。
ソッポ向いてる感じです。
因みに、使用ソフトは、
4・5年前の発売当時は、雑誌の評価でもコンスタントにベスト3に入っていた、
「超整理er (Ver1.0)」です。
このソフトは、もう今は店頭ではお目にかかれませんが、
今でも、週間文春・週間新潮の記事だと、99%認識してくれます。
23 :
名無しさん@そうだ選挙にいこう :01/09/07 03:01
>>22 超生理erはファイリング・ソフトとしてはどうなのれすか?
>>23 「超整理er (Ver1.0)」についているファイラーは、
いろいろなファイルを管理できるファイリングソフトじゃなくて、
「OCRの対象となる画像」と「その認識結果のテキスト」だけを管理する為の
いわば、「超整理erでのOCR作業に特化されたファイラー」って感じですね。
このOCRの認識率は、今でも充分使える優れたものですが、
ファイラーも含めた それ以外の使い勝手は、はっきり言ってイマイチですね。
(Ver1.0) では、ファイラーに取り込める画像は、白黒2値の bmp と tiff だけですし、
フォルダーは、「キャビネット → フォルダー → ファイル」と、2階層(3階層?)までしか作れませんし、
また、OCRにかける画像は、必ず一旦このファイラーに取り込んで、
そこからOCRを呼び出す、という手順を踏まなければいけなくて、
OCRだけを単体では利用できません。
必ず、このファイラーを通す必要があります。
そこのところも、ちょっと不便ですね。
ただ、さっきも言ったように、このOCRの認識率は、今でも充分使える優れたものです。
とても丁寧なレス、参考になりました。 24さんは、 ソフトのバージョンアップ又は乗換をなさる予定は ないのですか? もしあれば、参考までに御意見をお伺いしたいのですが。。。
>>24 さんの解説、とても参考になりました。
ところで、
24 さんは、Windows環境でしょうか?
超整理erは、MacとWinのHi-bridですよね(?)
日本語ヴァージョンのファイリング・ソフトで、
Hi-Brid版は珍しいと思うので、
在庫があれば、買おうかどうしようかと。。
ファイルの共通性があるなら魅力ですから。
ちなみに、
他のファイリング・ソフトも、
単純な階層構造やOCR前の取り込みなどは、
同じようなものじゃなかったかと思います。
(今、手元にないのではっきりしませんが、多分)
超整理er 以外に、Mac対応のファイリング・ソフトありますか? 英語版なら、Paper Port があるみたいなんですけど、 日本語での全文検索可能なのがあれば。 Macは、シャーロックがあるけど、 画像とOCRテキストを別ファイルで持つのは面倒っぽいので。
29 :
名無しさん@そうだ選挙にいこう :01/09/10 13:37
超生理はマックでも使えるのか マックもあるからいいかもしれない。 他にもそういうソフトあるのかね?
>>26 >24 さんは、Windows環境でしょうか?
私はWindowsです。 MACではありません。
>>25 >24さんは、ソフトのバージョンアップ又は乗換をなさる予定はないのですか?
OCRのバージョンアップや買い替えの予定は、今のところありません。
>>28 >超整理er 以外に、Mac対応のファイリング・ソフトありますか?
>>29 >他にもそういうソフトあるのかね?
MAC用OCRも、一応売られてはいますが、Windows版ほど選択肢は多くはありません。
ましてや、ファイラーまでついているものとなると、私は知りません。
>>26 >超整理erは、MacとWinのHi-bridですよね(?)
>>29 >超生理はマックでも使えるのか
私の使っている超整理er は、ハイブリッド版のようですねぇ。 私も知りませんでした。
となると、MACでも使えるファイラーつきOCRということで、これは貴重な存在ですねぇ。
>>26 >日本語ヴァージョンのファイリング・ソフトで、Hi-Brid版は珍しいと思うので、
>在庫があれば、買おうかどうしようかと。。
超整理er (Ver1.0) は、4・5年前には、定価2万数千円、店頭価格2万円の値段がついてました。
私は乗り換え版を 13000円で買いましたが・・・
それが1年くらい前でしたか、処分品用ワゴンで 500円で売られているのを見ました。
あれ以来、店頭では見かけていません。
今日も、大きな PCshop を数件回ってみましたが、全く売られていませんでした。
VersionUp の案内も、3年半前に来たっきりですし、
>>27 のHPも、2年半前から更新されてないみたいですし。
もしかしたらNovaは、OCRからは手を引いたんじゃないでしょうかねぇ。
もしそうなら、サポートの面からも、他の製品のほうがいいんじゃないですかね。
それより、もう手に入らないでしょう。
32 :
名無しさん@そうだ選挙にいこう :01/09/11 23:12
>>31 情報、どうもありがとうございました。
Docu Works以外の情報が乏しいです。
ご存知の方いらっしゃいましたら、お願いします。
すみません。間違えました。 33は取り消します。 「Docu Works以外の情報が乏しいです」を 「Docu Worksの情報が乏しいです」と 見間違えました。
35 :
名無しさん@そうだ選挙にいこう :01/09/19 19:19
認識率を向上させるために、何か工夫されていますか?
・ 600dpiで取り込む。(←俺のスキャナでは これが最高) 400dpiに比べると、サイズは倍以上になるのに、 認識率は、ほんのちょっとしか良くならない。 けど、そのほんのちょっとの為に、 やっぱり600dpiで取り込んでいる。 ・ まっすぐに取り込むのは当然として ・ あと、一番注意しているのは、 取り込むときの、しきい値。 気持ち 薄め のほうがイイみたい。
37 :
読んdeココのユーザー :01/09/20 00:22
@面倒ですが、小さい文字の場合、拡大コピーするとか、 A辞書ファイルを鍛えるという方法もありますね。 新たな単語登録をその都度行う。 およそ使わないであろう文字を認識対象から外す。
あっ、そうそう、忘れてた。 あと、イメージのパターン登録。
39 :
名無しさん@そうだ選挙にいこう :01/09/21 23:24
倍角の文字の誤変換は困るなぁ。
40 :
名無しさん@そうだ選挙にいこう :01/09/25 21:16
ほんと、困りますね。 置換くらいしか対策が思いつかない。
>>39 倍角というのは、WP専用機でよく使われる、縦倍角文字・横倍角文字のことですか?
思いつく対策
●使われているのが本文じゃなくて、タイトルだけとかで文字数が少ない場合。
・ イメージをパターン登録させる。
・ その部分だけ手入力する。(こっちのほうが手っ取り早いか?)
●本文にも使われていて、文字数が多い場合。
・ 有効な対策が思いつきません。
・ 元のデータファイルがあるなら、OCRでなくて、
いっそのこと、コンバーターソフトを使って、形式変換する。
44 :
名無しさん@そうだ選挙にいこう :01/11/08 19:13
結局、どれがいいの〜? 超整理er ver.1.03を持ってるけど、そんなに認識率が良くないんで、 別に買おうかと思ってる。 けど、このスレを読む限り、これ以上のものは望めないみたい・・・。
DocuWorksのOCR機能はいいよ。 お気に入りです。
46 :
名無しさん@そうだ選挙にいこう :01/11/08 21:28
>>45 精度はどれくらいですか?
あと、DocuWorksって、更に外部のOCRソフトも組み込めましたよね。
超整理erも組み込めますか?
47 :
名無しさん@そうだ選挙にいこう :02/02/10 20:51
A.Iソフトの読んでココ&Presto!について語りましょう。 カスタマイズや学習 認識率 スキャナーとの相性 ナドナド
ここまでみてDocuWorksか読取物語にしようか迷ってる。
49 :
名無しさん@そうだ選挙にいこう :02/02/10 23:53
>>47 OCRソフトとスキャナとの相性は、無関係では。
50 :
名無しさん@そうだ選挙にいこう :02/02/11 13:02
OKREADER使えるよ
51 :
名無しさん@そうだ選挙にいこう :02/03/10 06:02
agetokou
52 :
名無しさん@そうだ選挙にいこう :02/03/10 13:20
フォントきたねえけど、docuお勧め
WinReader使ってるけどまぁまぁだぞ。 いい感じで読んでくれる。 結構お勧めかも。
54 :
名無しさん@そうだ選挙にいこう :02/03/23 18:26
名詞が沢山たまってきたのでスキャンして整理しようと思うのですが、 名詞ならこれがお勧めって言う奴有りますか?。 まだスキャナも持っていないので、とりあえずエプソンのスキャナと読んでココ を購入するか、小さなスキャナも付いている「やさしく名刺ファイリング」を購 入するかの二つを中心に検討しています。 名詞をスキャナで整理している人でこれは止めておけとかこれはいいぞってあっ たら教えて欲しいです。
55 :
名無しさん@そうだ選挙にいこう :02/03/23 18:39
>>54 読んde!!ココについてくる「読んで名刺」結構おすすめかも。
「やさしく〜」は使ったことないから、わからん。
>>55 情報ありがとうです。
う〜ん、でも他にも名刺用のOCRって結構あって
悩みますね〜〜。
Scanbox Pro 名刺管理って奴がネットで落とせて試用期間が
一月あるのでまずはそれを試してみます。
300dpiの古いスキャナは家にあるので……。
57 :
名無しさん@そうだ選挙にいこう :02/03/31 22:21
>>54 >小さなスキャナも付いている「やさしく名刺ファイリング」を購
>入するかの二つを中心に検討しています。
名刺データをPalmに入れて持ち歩くために、最近「やさしく名刺ファイリング」
を買って入力中です。入力したデータベースからエキスポートしてPIMソフト「Palmデスク
トップ」用の並びになるcsvファイルに変換して、「Palmデスクトップ」側でインポート
しています。これを同期してPalmで持ち歩くという寸法です。
良い点
安い。店頭での実売が1万円程度。
悪い点
URLなどの決まりきったことの認識率が結構上手くない。httpのあとはコロンと
スラッシュ2本だっちゅーに。coとjpの間にあるのは.だっちゅーの。あと、
カッコだったりハイフンだったりする電話番号の表記を、全部勝手に
03-xxxx-yyyyの一定のフォーマットに置き換えてくれると楽なのに。
似た製品に「名刺PORT」というものがありますが、こちらは店頭価格が
2万円くらいですね。その分認識率が高いのかどうかわかりませんが。
自宅にはスキャナとか持ってないので、「やさしく名刺ファイリング」
には値段から考えて結構満足しています。
でももし「名刺PORTのほうが効率が良くてストレスたまらないよ」などの体験談
があるかたがいらしたら教えてください(まだ入力途上なので、場合によっては
買い換えるかも……)。
58 :
名無しさん@そうだ選挙にいこう :02/04/01 06:49
>300dpi ではきついのでは?
>57
情報ありがとうです。
Scanbox Proでも mail address :
[email protected] を
[email protected] って認識してました。
mailの後は問答無用でアドレスに組み込まれるようです。
この辺りを賢く対応して貰えると楽になりそうなんですが。
それとも600dpiくらいあれば認識できたのかなぁ。
あ、もちろんこのアドレスは適当です。
Scanbox Pro 名刺管理を試してみました。
結論から言うと58さんの言うとおりに300じゃ辛かったです。
電話番号や住所などに含まれる数字の認識は良かったのですが、
文字の認識が悪く、うまくいきませんでした。
どのぐらいだと大丈夫でしょうか?。もし1200で誤認識が無く
なり、訂正や確認をせずに取り込めるのなら、すっごく助かるの
ですが……。やっぱり確認くらいは必要ですかね(^^ゞ。
60 :
名無しさん@そうだ選挙にいこう :02/04/18 13:34
Eタイピスト最高!認識率最高!
61 :
名無しさん@そうだ選挙にいこう :02/04/18 13:35
Eタイピストが「知子の情報」と連携できたらいいんだけどな。 できないでしょう?
62 :
名無しさん@そうだ選挙にいこう :02/04/19 11:23
>>60 それは、2-3年前の話ですよ。
最近の各種雑誌の比較実験見ると、
読取革命・読んでココ・OKReaderの方が認識率がいい結果だぞ。
63 :
名無しさん@そうだ選挙にいこう :02/04/19 14:13
東芝のExpressReaderProいいですよ。 縦書き、横書き、表混在、横倍角、縦倍角、なんでもござれ。 RTF形式での出力が出来るので、罫線のある文書を一太郎やWordへ 取り込む際に重宝します。
64 :
名無しさん@そうだ選挙にいこう :02/05/17 06:18
>63 ちょいと高くないかい。体験版で試したけどほとんどETypistと かわらなかったよ。
65 :
名無しさん@そうだ選挙にいこう :02/05/17 15:02
名刺の管理できるソフトを探しています。 要件としては、 1、スキャナで読み込みOCRでDB化。 2、登録した情報をブラウザやグループウェア等を使用して社内で共有。 こんなソフトはありますか?
66 :
名無しさん@そうだ選挙にいこう :02/05/23 00:02
名刺管理ソフトだと リコーからでてる「名刺フォルダー」っていうのがあるはずです。会社で使ってます。 認識率とかは 他の会社のと比べたことがないのですが 住所録を入力するよりは楽です しかも 20枚くらいまとめて専用機にセットできるんです 値段は分からないけど(^^;
69 :
名無しさん@そうだ選挙にいこう :02/05/31 09:43
法律関係は読んでココ
71 :
名無しさん@そうだ選挙にいこう :02/06/01 01:53
OmOCRってだれか使ってるかたいますか、Etypist7.0を使っているけど 切り分けがいまいちでその辺がOmCRだと学習できるみたいなのと自然言語 処理機能があるみたいなので興味があるのですが、体験版がないため導入に ふみきれない。どなたか感想をおしえていただけるとありがたいのですが、、 Etpisってそんなに悪くないけど連続画像取り込み100Pまでの制限がちょっと うざい。
73 :
名無しさん@そうだ選挙にいこう :02/06/08 14:13
読んでココで英文取り込ませたら、単語のスペース無視で全部繋がっちゃう なぜ…? 他はそれなりに認識してるけど、これじゃ使えないよ〜
74 :
名無しさん@そうだ選挙にいこう :02/06/08 15:24
>>73 英文モード又は、和英混在モードに、設定を変更で。
75 :
名無しさん@そうだ選挙にいこう :02/06/08 15:34
は〜るがキタ━━━━━━(゚∀゚)━━━━━━!! は〜るがキタ━━━━━━(゚∀゚)━━━━━━!! どこに〜キタ━━━━━━(゚∀゚)━━━━━━!! や〜まにキタ━━━━━━(゚∀゚)━━━━━━!! さ〜とに キタ━━━━━━(゚∀゚)━━━━━━!! の〜に〜も〜キタ━━━━━━(゚∀゚)━━━━━━!!
>>74 その英文モードへの設定変更はどこでできるの?
なんか見つからないボ。
78 :
名無しさん@そうだ選挙にいこう :02/06/16 23:28
あげ
79 :
名無しさん@そうだ選挙にいこう :02/07/06 07:55
OCR地獄1 OCR地獄にはまっている者です。 省力化の方策を教えてください。 書籍,計10,000頁を,対象とします。 スキャンは,A5,600dpi,で完了しました。 OCRを,6,000頁まで終了しましたが,まだ,4,000頁も残ってます。しんどいです。 もう少し省力化できないものでしょうか。 経験者の方,アドバイスを下さい。
80 :
名無しさん@そうだ選挙にいこう :02/07/06 09:21
81 :
名無しさん@そうだ選挙にいこう :02/07/06 13:20
OCR地獄2 (現在,一度に100頁しか扱えないこともあり),さらに,他のOCRソフトを導入し,併用を検討しています。 読んde!!ココ7が,メインです。最新パッチを当て,ツールバーをカスタマイズして,使っています。 読取革命2002は,購入し,まだインストールしていません。 読んde!!ココ8は,購入し,10月頃にインストール予定です。 (v6とv7で,パッチ無し地獄と、旧バージョン排他仕様地獄を,味わいましたので)。 e.Typist7は,購入し,ほとんど使っていません。 e.Typist8は,購入検討中です。
82 :
名無しさん@そうだ選挙にいこう :02/07/06 13:21
OCR地獄3 二段割注(地獄)に,はまっています。 二段割注とは,縦書文書で,1行の中で( )内だけ2行になっている,書式です。 読んde!!ココ7は,正確に変換できません。 そこだけ別に枠設定するのは、嫌になってやめました。 誤変換された二段割注部分を,全てキーボード入力しています。 なんとかならないものでしょうか。
83 :
名無しさん@そうだ選挙にいこう :02/07/06 13:24
>>79 スキャンは終わったんですよ。
現在の問題は,OCRソフトなんです。
84 :
名無しさん@そうだ選挙にいこう :02/07/06 13:29
>>79 スキャンも大変だったんですけどね。
一応,終わりました。
85 :
名無しさん@そうだ選挙にいこう :02/07/06 13:43
読取革命の発売開始っていつ頃なんですかね? 読取革命2002 ??年??月 読取革命2001 ??年??月 教えて下さい。 ちなみに, 読んde!!ココ7 2000年02月 読んde!!ココ8 2001年02月 e.Typist7 2000年07月 e.Typist8 2001年07月 ,と記憶しております。
86 :
名無しさん@そうだ選挙にいこう :02/07/06 13:45
訂正。年が間違っていました。 読取革命の発売開始っていつ頃なんですかね? 読取革命2002 ??年??月 読取革命2001 ??年??月 教えて下さい。 ちなみに, 読んde!!ココ7 2001年02月 読んde!!ココ8 2002年02月 e.Typist7 2001年07月 e.Typist8 2002年07月 ,と記憶しております。
87 :
名無しさん@そうだ選挙にいこう :02/07/06 21:13
88 :
名無しさん@そうだ選挙にいこう :02/07/07 01:42
>>各ソフトの評価をお願いします。
89 :
名無しさん@そうだ選挙にいこう :02/07/07 03:34
読んde!!ココ8と読取革命2002を使っています。 以前は読んde!!ココ8を主に使っていましたが、最近は読み取り革命が メインです。理由は動作は重いが、認識率が良い ということにつきます。 原稿の程度によりますが、認識率は読んでよりも良いと思います。 ただし、レイアウト認識がおバカですので、手動で指定してやらないといけないのが、難点です。 いずれのソフトも、レイアウト範囲の属性(文字なのか表なのか英文和文縦横)をきっちり指定してやることが、 正確な認識への近道かと。。 大量処理・自動処理は読んで の方が良いかも知れません。 スキャンは終わっているとのことですが、よっぽど細かい文字でない限り、400dpiで十分ですし、認識率が600dpiよりも良い場合すらあります。 e.Typistは使ったことがありません。 100ページ以上のOCRはしたことがありませんので、えらそうなことは言えませんが、 がんばって下さい。
90 :
名無しさん@そうだ選挙にいこう :02/07/07 09:03
>>88 読取革命2002の評判がいいみたいですね。
私も、OCRの最重要ポイントは認識率だと思っております。
自動化は、使える所もあるが、使えない所の方が多いと思っております。
7月下旬に時間をとれるので、導入します。
読んde!!ココ7は、
マニュアルがごちゃごちゃしています。
画面のレイアウトがケバいです。カスタマイズするまで嫌でした。
パッチが公開されるまで、基本機能に不具合が散見され、使い物にならなかったりします。
(最終)パッチを当てると、使い物になります。
読んde!!ココ7一本でここまで(6000頁)きました。これました。しかし、疲れました。
91 :
名無しさん@そうだ選挙にいこう :02/07/10 12:01
OCR地獄4 OCR地獄の入り口,OCRソフト購入について。 各OCRソフトに,いくつかの種類があり,正規版とアップグレード版とで,価格が(大きく)異なります。 アップグレード版使用可能対象者は,旧バージョンやスキャナバンドル版の所有者だったりします。 ソフトによって,乗り換え版が用意されています。 乗り換え版使用可能対象者は,他社(有名)OCRソフト(含 スキャナバンドル版)の所有者だったりします。 安価に購入したい場合,アップグレード権・乗り換え権を得る方法があります。 アップグレード権・乗り換え権は,スキャナバンドル版付きのスキャナを購入するで得るケースが,多いと思われます。 問題は,スキャナ1台を購入しただけでは,すべてのOCRソフトのアップグレード権を得られない,ことです。 使いたいソフトのアップグレード権・乗り換え権を得られるスキャナを買う,方法があります。 しかし,スキャナには,読み取り方式の違い,機能の違い,付属品・オプション品の違い,等,があります。 安易な選択は,後悔をもたらすでしょう。 「CCD式で,高速で,ADFを使える,このスキャナでは,あのソフトのアップグレード権がえられない・・・」。 ジレンマです。
92 :
名無しさん@そうだ選挙にいこう :02/07/10 23:11
CCD式で,高速で,ADFを使える>>現時点ではGT-8700しかないなぁ ADFは、ヨドバシが一番安かった。 読み取り革命2002は乗り換えアップグレード版があり安価で手に入った。
93 :
よろしくお願いします :02/07/13 17:12
教えてください! OCRソフトが存在しない言語について調べているのですが、 各言語ごとにOCRソフトの有無を確認できるようなサイトをご存知の方 いらっしゃったら教えていただけないでしょうか? 海外のサイトでもかまいません。 (英語分かりませんが辞書で調べますので・・・) よろしくお願いします。
>>89 >>90 読取革命2002は認識結果画面が見にくいのが難点
読んde!!ココは、認識結果を英数字カナを色分けしてくれる
96 :
名無しさん@そうだ選挙にいこう :02/07/14 02:45
そろそろe.Tyist8買ってくるかな・・・
体験版はまだ e.Typist v.7.0だね 自信があったらすぐ新しい体験版出すと思うんだけど・・・
98 :
名無しさん@そうだ選挙にいこう :02/07/14 11:09
@ノノヽヽヽ@ ミ _ ドスッ ( ・^▽^)─┴┴─┐ / つ. 1 0 0 │ /_____|└─┬┬─┘ ∪ ∪ ││ _ε3
101 :
名無しさん@そうだ選挙にいこう :02/07/16 18:49
保存できる画像ファイル形式 [読取革命2002] TIFF G4圧縮 TIFF 非圧縮 TIFF JPEG圧縮 BMP AWD DCX PCX JPEG [読んde!!ココ7] BMP TIFF 非圧縮 TIFF MH圧縮 TIFF G4圧縮 TIFF PackBits圧縮 PCX JPEG PNG [e.Ttpist7(オープンできる画像ファイル形式)] BMP TIFF 無圧縮 TIFF Packbits圧縮 TIFF G3圧縮 TIFF G4圧縮 TIFF FX JPEG PNG
102 :
名無しさん@そうだ選挙にいこう :02/07/16 18:53
EPSONスキャナ新製品 GT-8300は、 モノクロ2値OCRに向いてますか?
103 :
名無しさん@そうだ選挙にいこう :02/07/16 20:30
>>102 向いている。
ただ、モノクロなら、どのスキャナでも高速でスキャンできる。
データが小さいから。
問題は、OCRソフトを何にするか。
文字ならPNG保存できないと困る。
104 :
名無しさん@そうだ選挙にいこう :02/07/18 04:15
請求明細とか支払明細のような表形式を取り込まれている方で、 実用になるOCRソフトを教えて下さい。
105 :
名無しさん@そうだ選挙にいこう :02/07/19 00:54
読取物語を使用しています。
良い点
1.領域の作成が早い、認識作業も早い
2.認識率が高い
3.一度に200ファイルまで自動認識できる
悪い点
1.高い(私が買ったのは乗り換え版でしたがそれでも高かった…)
2.高いゆえにユーザーが少なく、集まる情報も少ない
私の場合は数万枚のファイルをOCRにかける必要があったため、
何よりスピードが最優先でした。個人的に値段の分の価値はあると
思います。
>>104 読取物語は表の認識も結構良いです。但し活字限定ですが。
手書きの文字がある場合は全然だめでした。
読取物語の試用版を使ったことあるが速攻で捨てた。 他のメーカと比べると完全に時代遅れ 長所は値段が高いことぐらいだろう
107 :
名無しさん@そうだ選挙にいこう :02/07/21 20:01
>>89 >>95 ようやく時間をとれました。今、インストール完了しました。
読んde!!ココ7、読取革命2002、e.Typist8、で、やっていく予定です。
読んde!!ココ7の良さを再認識しました。
設定項目の多い(多様な要求に対処できる)。
ツールボックスを自分に必要な作業で固めた時、作業効率が良い。
多量の文書を、手動処理する場合に、向いている、と思いました。
OCR(地獄)マニアの私には向いているのかもしれません。
機能はこのままで、
マニュアルをもっと論理的に書いてくれれば、初心者の方が取り組みやすくなると思います。
読取革命2002、e.Typist8、も、好印象です。(あくまで30分使っただけの段階ですが)。
読取革命は、認識結果のクセが少なく、使いやすそうです。
手動で訂正する必要があまり無いのかもしれません。
e.Typist8は、認識精度が、向上したようです。
他と比べて見劣りしないと思います。
いいソフトだと思います。
108 :
名無しさん@そうだ選挙にいこう :02/07/21 22:36
書籍をスキャンする際,ADFを使用するためには, 製本されている書籍を,バラす必要があると思うんですが, 具体的にどうやってやるんでしょうか。 経験者の方,アドバイスお願い致します。 コツや,ポイントは,どのへんでしょうか。 手でバラすと,切れ目がギザギザになります。裁断機で整えるんでしょうか。 バラすサービスなどが,あるんでしょうか。 失敗した場合の,修復方法はどうでしょうか。もう1冊購入するんでしょうか。 切り屑が,スキャンに悪影響を及ぼすことがあるでしょうか。
109 :
名無しさん@そうだ選挙にいこう :02/07/22 02:25
>108 私は裁断機で綴じてる部分を切ります。 裁断機は、近所の文房具やが持っているものを、ご厚意で使わせていただいております。 裁断機を使うと、 ・一瞬でできる ・紙の大きさが揃う のがメリットではないかと。 絶版ではない本ならば、2冊購入して1冊裁断が一番効率的ですね。
>>107 読んでココバージョン8は、更にいいよ。
111 :
名無しさん@そうだ選挙にいこう :02/07/22 10:10
112 :
名無しさん@そうだ選挙にいこう :02/07/22 23:25
全く同じ形式の帳票ばかりを大量に読み取る のが得意なOCRはどれですか? 以前使っていた業務用の帳票OCR(日立超LSI)では 一度エディットした構造情報をもとに100枚まで 全自動・連続読み取りできました。 こんな使い方の出来るOCRが望ましいです。 連続枚数の多少はあまり気にしていません。 e.typistを使ってみましたが、 どうもていねいに1枚1枚構造を認識してるようで セル構造が崩れてしまって良くありませんでした。
113 :
名無しさん@そうだ選挙にいこう :02/07/23 21:43
>109 裁断機は、1回で何枚程度まで裁断できますか。 900頁(450枚)の本を1回で裁断、などと妄想しますが、無茶でしょうか。
114 :
名無しさん@そうだ選挙にいこう :02/07/23 22:01
>110 読んde!!ココ8は、動作が安定してますでしょうか。 (現在までに8.00 8.01 8.02 の3ヴァージョンあるようです)。 10月頃まで待とうかと、考えていました。。 読んde!!ココ7では、 7.00と7.01の時に、悲惨な目に遭わされました。 (7.03は、すごく安定しています)。 旧バージョン排他だったので、戻るに戻れず、困りました。
115 :
名無しさん@そうだ選挙にいこう :02/07/23 23:18
本の背にアイロンをあててロウを溶かす
>103 私が使わせていただいているものは、所謂コピー用紙で1000枚位は簡単に裁断できるものです。 450枚くらいは別に妄想でも何でもなく、製本されている以上当然裁断機もあるわけでして。 近所に町の製本屋・印刷屋等がありますと、そちらを訪ねられては? アイロンで溶かすという技もあるのですが、 1.手間がかかる(裁断機は使える場所さえ見つかれば一瞬です) 2.紙がきれいに揃わない 3.ひもで綴じてある場合は、そもそも使えない という問題もありますので、一概にはどうかと。
117 :
名無しさん@そうだ選挙にいこう :02/07/24 01:09
>>112 e.Typist で認識テンプレートを使用してもだめですか?
118 :
名無しさん@そうだ選挙にいこう :02/07/24 01:12
表をエクセルに取り込みたいのですが、何のOCRソフトがいいでしょうか?
119 :
名無しさん@そうだ選挙にいこう :02/07/24 01:19
120 :
名無しさん@そうだ選挙にいこう :02/07/24 02:55
121 :
名無しさん@そうだ選挙にいこう :02/07/24 17:06
>116 製本を行う印刷屋をあたってみます。 以前、コピーサービス、出力サービス、を行う印刷屋で尋ねたところ、 100枚程が限度、と言われたので、諦めておりました。 アドバイスありがとうございました。
122 :
名無しさん@そうだ選挙にいこう :02/07/27 00:48
名刺用OCRソフトって実際のところどうなんでしょうか? 名刺なので様々なレイアウトがあるかとおもわれ それを誤認識なく データ管理につかえるものか? 使っているかたいましたら 教えてください
123 :
名無しさん@そうだ選挙にいこう :02/07/30 04:25
[同一ソフト複数起動の可否] e.Typist8 不可 読取革命2002 不可 読んde!!ココ7 不可
124 :
名無しさん@そうだ選挙にいこう :02/07/30 04:36
125 :
名無しさん@そうだ選挙にいこう :02/07/30 04:56
>>107 自己レスですが。
文書OCR for Word v3.0
文書OCR for Word v4.0
今度、知人の所で使わせてもらおうと思います。
[現状]
読んde!!ココ7 メイン。操作に慣れ、効率的なので。縦書専用としています。
読取革命2002 試用中。横書専用としています。
e.Typist8 試用中。2段割注の補正専用としています(読んde!!ココ7とセットで使っています)。
126 :
名無しさん@お腹いっぱい。 :02/07/30 07:10
127 :
名無しさん@そうだ選挙にいこう :02/08/10 13:32
>>125 自己レスです。
知人のPCのトラブル解決に追われ,
文書OCR for Word v3.0
文書OCR for Word v4.0
のテストどころではありませんでした。
次の機会に使わせてもらおうと思います。
128 :
名無しさん@そうだ選挙にいこう :02/08/10 13:45
129 :
名無しさん@そうだ選挙にいこう :02/08/13 14:09
[OCR作業,計1万頁を要求されたら] 仮に,これから全ての準備をするなら,現状では,以下のように考えるかもしれません。 スキャナ(ADF付き) canon製 DR-2080C スキャナ(フラットベッド) EPSON製 GT-8300UF OCRソフト e.Typist8 アップグレード版 読んde!!ココ8 アップグレード版 読取革命2002 乗換版 PC デスクトップ・タワー型 CPU 高速 メモリ 多量 内蔵HDD 静音・高速・大容量・2台以上 DVDマルチ 殻付DVD-RAM使用可能・高速(秋頃の新製品に注目か) 一体,何十万かかるのだろう……。
130 :
host9.po-konan.co.jp :02/08/13 15:05
nya
131 :
名無しさん@そうだ選挙にいこう :02/08/14 07:49
つ〜か 普通の結論だね・・・。
132 :
名無しさん@そうだ選挙にいこう :02/08/14 08:17
そうです、そうです。 普通の結論を目指しました。 うまくいかないと困りますから。 (もっとも、検証不十分ですが)。
133 :
名無しさん@そうだ選挙にいこう :02/08/14 08:56
[かつて,OCR作業,計1万頁を要求されて] かつて,以下の環境で作業していました。 スキャナ(ADF付き) 無し スキャナ(フラットベッド) EPSON製 GT-8700(ADF無し) OCRソフト 読んde!!ココ7 アップグレード版 のみ PC ノートブック・薄型 CPU 低速(Pentium2-333MHz) メモリ 少量(192MB) 内蔵HDD 静音不考慮・低速・小容量(6.4GB)・1台 MO 自分は何か大きな間違いをしているのではないか……。
134 :
名無しさん@そうだ選挙にいこう :02/08/14 10:58
毎日100頁、計1万頁、のように、枚数が多い場合、気になりますが、 数枚をたまに、のように、枚数が少ない場合は、気になりません。 枚数が多いが、時間をかけたくない場合、 適切な投資をして、時間短縮する、ということでしょう。 適切な投資の、試案の1つです。あくまで、試案です。
135 :
名無しさん@そうだ選挙にいこう :02/08/14 11:21
電子出版されていない書籍等を, わざわざ,OCRという愚直な方法を用いてまで,電子化するのは, それなりのメリットを認識し,それなりの目的を持っている,場合が,少なくないと思います。 そういう方には,無難な情報は,有り難いのでは,と思っております。 (かつて,よくわからないまま,「地獄」を味わった者としては)。
136 :
名無しさん@そうだ選挙にいこう :02/08/14 12:22
まあ、普通に、マタリといきましょうや。
137 :
名無しさん@そうだ選挙にいこう :02/08/15 04:10
OCRに関連する作業の(特に前期の)多くは,静止画像処理です。 静止画像処理について(今でも)専門知識を持たない私です。 OCRするにあたってよくわからなかったことを書き残して引退したいと思います。 間違いは,修正してやってください。
138 :
名無しさん@そうだ選挙にいこう :02/08/15 04:12
[スキャンした画像の保存] 画像ファイルは,(ファイル形式と圧縮形式の組み合わせで),多数のものが存在するようです。 OCRで重要なのは,ファイル形式では,何色扱うか(色数),であり,圧縮形式では,可逆圧縮・不可逆圧縮,圧縮率,です。 色数は,白黒2色(白黒2値・モノクロ2値)が,現状では向いています。グレースケール,カラー,はOCR認識率を下げる要因となりそうです。 画像ファイルの中で,モノクロモードをもたない(全てカラーとして扱う)ものがあります。データ量がかなり大きくなると思われます。(例えば,JPEG)。 圧縮形式は,可逆変換,無圧縮,が向いています。不可逆変換は避けるのが無難でしょう。(例えば,JPEG)。 結局,JPEGは,採用しにくいと思います。 OCRソフトは複数存在します。各OCRソフトにより,扱える画像ファイルが異なります。扱い方には,読み,書き,が有ります。 読んde!!ココ8 読取革命2002 e.Typist8 TIFF G4 ○ ○ △(読みだけ) JPEG ○ ○ ○ PDF ○ ○ ○ TIFFは,複数画像を1つのファイルにすることができるが,逆にそれがOCR上でやや扱いにくさにつながる。 JPEGは,不可逆圧縮である。モノクロモードをもたない。 PDFは,よくわかりません。画像専用ファイルというより,画像・文書等複合ファイルのような気がします。 JPEG専用スキャナは,購入をためらわせます。
139 :
名無しさん@そうだ選挙にいこう :02/08/15 04:12
[dpi] dpiの選択は,原稿の文字の大きさ(ポイント数)に依存します。注や,文庫本,など,の小さい文字については,dpiを精細に(例えば600dpi)にします。
140 :
名無しさん@そうだ選挙にいこう :02/08/15 04:14
[原稿の読点] 日本語なのに,読点が「。」ではなく「.」である書籍があります。 読んde!!ココ7は,文末判定に.を採用しない場合がすごく多いとおもいます。 読点「.」の原稿で1認識枠内に複数の段落がある場合,文末判定の失敗の故,1つの段落と誤変換されます。 (600頁の書籍のほとんどの段落を手動入力するのは苦痛でした)。 読取革命2002は,改行の設定を自動判定にすることで,何ら問題は起きません。 読点が「.」の書籍は,読取革命2002を使いましょう。読んde!!ココ7は,段落の修正に骨が折れます。
141 :
名無しさん@そうだ選挙にいこう :02/08/15 04:14
[ADF] 私は,所有していません。 コピー専用機のADFを複数使ってきましたが(全て富士ゼロックス製),かなりまじめに作らないと,役にたたなそうです。 原稿給紙機構が単純な方がいいようです。180度回転,よりも,0度回転,がいいのかもしれません。 多量のADFスキャンをする方は,基本的に,ある程度金をかけた方がいいのではないでしょうか。 EPSON製GT-8700の別売りADFを,以上の理由で敬遠した私です。
142 :
名無しさん@そうだ選挙にいこう :02/08/15 04:51
>>140 自己レス。
重大な誤植を発見しました。読点ではなく句点。
↓↓ 修正版はこちら ↓↓
143 :
名無しさん@そうだ選挙にいこう :02/08/15 04:53
[原稿の句点]※修正版※ 日本語なのに,句点が「。」ではなく「.」である書籍があります。 読んde!!ココ7は,文末判定に「.」を採用しない場合がすごく多いとおもいます。 句点「.」の原稿で1認識枠内に複数の段落がある場合,文末判定の失敗の故,1つの段落と誤変換されます。 (600頁の書籍のほとんどの段落を手動入力するのは苦痛でした)。 読取革命2002は,改行の設定を自動判定にすることで,何ら問題は起きません。 句点が「.」の書籍は,読取革命2002を使いましょう。読んde!!ココ7は,段落の修正に骨が折れます。
144 :
名無しさん@そうだ選挙にいこう :02/08/15 05:07
>>136 OCR使いにも,
文書の内容をコンピュータが保持することを希望する人もいれば(代替手段),
文書の内容を自分の頭が保持することを希望する人もいます(補助手段)。
前者は,誤変換へのこだわりが小さいですが,
後者は,誤変換へのこだわりが大きいです。
前者は,作業のあらゆる局面で,寛容ですが,
後者は,作業のあらゆる局面で,シビアです。
前者は,閲覧ソフト,検索ソフト,等に関心を向けますが,
後者は,変更方法(ワープロ),修正方法(学習機能,置換機能,ワープロ)等へ関心を向けます。
かみ合わないなと思ったら,目的が違わないか確認するのが大事っスね。
145 :
名無しさん@そうだ選挙にいこう :02/08/15 18:55
>>131 まあ,楽しくOCRするのが一番ですから,
私みたいなのは,ほっときましょう。
146 :
名無しさん@そうだ選挙にいこう :02/08/15 18:57
OCRがらみの開発をすることになったのですが、ライセンスがいろいろ面倒です。開発用とは別にライセンスが必要だと、顧客いっこ決まるたびに、ライセンス取得しなきゃいけないとか。 そこで、再配布自由なOCRソフト又はコンポーネントを探しています。フリーでなくてもかまいません。 とりあえず、エーアイはそういうのやってる事が解りました。他にもないものでしょうか? 以上、ご存じの方がいるならよろしくお願いします。
148 :
名無しさん@そうだ選挙にいこう :02/08/22 08:35
>>142-143 日本語なのに,句点が「。」ではなく「.」である書籍といえば、
前田本や内田本がそうだな。
149 :
名無しさん@そうだ選挙にいこう :02/08/23 00:44
要するに東京大学出版会ってこった
151 :
名無しさん@そうだ選挙にいこう :02/08/28 14:54
【読んde!!ココ7に注文】 ツールバーに「画像を保存」ボタンを作ってください。 デフォルトで表示されなくてもいいですから,「ツールバーの設定」の設定により表示できるようにしてください。 私の場合,頻繁に使うボタンです。メニュー経由は手間がかかります。
152 :
名無しさん@そうだ選挙にいこう :02/08/28 14:55
【読んde!!ココ7に注文】 unicode対応をお願いします。 特に,漢字以外です。欧文文字とか,ナンバリング用の記号とか。 書籍中に頻出なのに,未対応なのは,使いにくいです。 キーボード入力しても表示できなくて,困りました。
153 :
祇園精舎の鐘の声 :02/09/10 09:00
輸入機械の英文マニュアルを翻訳してます。 今の所手分けして人海戦術で原文をテキスト入力して、それを見ながら私が翻訳した和文を 併記する形で入力してます。が、生産作業ではない周辺作業と言う事で、主担当と並行して やらされているので、いかな外注にかなり頼んでいるとは言え予算的、納期的、体力的に限界を 迎えつつあります そこで英文マニュアルに絞ってOCRを探しています。 @10〜12ポイントのプレインテキスト(ボールド、イタリック、アンダーラインは無し)を 400字−600字詰め原稿一頁辺り4、5箇所以内の手修正でテキスト取り込みが可能なOCR能力を有する事。 Aイラストや画像(白黒)を原稿のレイアウト通りに取り込める事。 B連続取り込み機能で原稿をOCR取り込みしたら、テンポラリファイルネームが付けられて、指定のディレクトリに 自動的に格納される事。 Omnipage<良さげだが10万円以上でチョット。Textbridg<レイアウト崩れないか不安。 OKREADER<価格的に良いけど、レイアウト機能が不安。その他eTypist,読んでココはレイアウト 取り込みにも識字率にもやや不安が有って二の足踏んでます。 英文取り込み経験豊富な方、ぜひご意見を!
句読点に「,」「.」を使ったりするのって、 理系論文の伝統かなんかなの? すごい違和感あるんだけど。 で、結局どれがイイの? スキャナにバンドルされてるようなヤツは パッケージ版に比べて制限が多いんですかね。
155 :
名無しさん@そうだ選挙にいこう :02/09/10 19:56
eTypist8でPDFファイルのOCRをやると、ファイルの読込みでやたら時間を食うのでかなわん。 複数ページのうちの1ページだけをOCRかけたいのに、全部のページを読み込まなくてはならない。 10ページくらい入っているPDFだとOCR始めるまでに3分近く待たされる。正直うんざり。 読んdeココでの場合はどうなんでしょうか。体験談きぼんぬ。
156 :
名無しさん@そうだ選挙にいこう :02/09/10 23:44
>>154 >スキャナにバンドルされてるようなヤツは
>パッケージ版に比べて制限が多いんですかね。
これは、まぁ常識やね。
「,」「.」は理系の本では多いけど、正直違和感があるな。
誰もやったこと無いようなので結局自分で試した。読んdeココ8の体験版だけど。 Adobe Acrobat 5.0のアドインから、20ページ入ったPDF(1.4MB)をOCRにかけてみた。 結果、読んdeココの圧勝。たったの2分50秒弱で文字認識完了。 eTypist8は画像登録だけで6分費やし、文字認識完了までで計10分50秒弱。もうね、アフォかと。 ただし読んdeココは、Adobe Acrobat 5.0(約3万)が無いと、PDFのOCRはできない。 eTypistはAcrobat Reader(無料)だけあれば良いので、圧倒的に安くて済む。 もっとも、多数処理する必要がある場合は、この差額を払っても安く感じるであろう。 とはいえ、ADFスキャナに幅広く対応しているのはeTypistなので、まさしく一長一短ですな。
158 :
名無しさん@そうだ選挙にいこう :02/09/16 18:09
読んdeココでは認識結果をPDF形式で保存できるのみで、PDF読み込みはできません。 単体では加除修正できないので、いわゆる文書管理は困難であるといえます。 ちなみにeTypistなら、Acrobat Readerもインストールしてあれば単体でPDF読み込みも 可能なので、加除修正もやれなくはありませんが、読み込みに時間食ってお話になりません。
160 :
bloom :02/09/16 19:30
161 :
二つ目のお気に入りとして :02/09/16 23:15
162 :
名無しさん@そうだ選挙にいこう :02/09/30 18:37
間違いだらけですいません。 まだ間違っていると思いますが,以下でいかがでしょうか。
163 :
名無しさん@そうだ選挙にいこう :02/09/30 18:39
対BMP(%) ファイルサイズ(KB) 文書OCR for Word4 e.Typist8 読取革命2002 読んde!!ココ8 BMP 100.0%, 1834KB ○ ○ ○ ○ TIFF 非圧縮 99.2%, 1820KB ○ ○ ○ ○ TIFF G4圧縮 4.6%, 85KB ? ○ ○ ○ PDF 5.1%, 94KB ? ○ ? ? JPEG 78.0%, 1430KB ○ ○ ○ ○ PCX 27.3%, 501KB ○ × ○ ○ PNG 10.3%, 189KB ○ ○ × ○ TIFF MH圧縮 9.9%, 182KB ? × × ○ TIFF Huffman圧縮 9.9%, 182KB ? ○ × × TIFF G3圧縮 10.3%, 188KB ? ○ × × TIFF PackBits圧縮 24.2%, 444KB ? × × ○ TIFF JPEG圧縮 664.2%, 1430KB ? × ○ × AWD 16.6%, 304KB × × ○ × DCX 27.5%, 505KB × × ○ ×
164 :
名無しさん@そうだ選挙にいこう :02/09/30 18:41
うまくアップできなかった……。 ワープロ等で直してみて下さい。
165 :
名無しさん@そうだ選挙にいこう :02/09/30 18:43
A5,600dpi,白黒2値・モノクロ2階調・1ビット画像(16.7%)。 原稿 : 2002年7月19日初版第1刷,p.062。 読んde!!ココ7 で保存:BMP,JPEG,PCX,PNG,TIFF G4圧縮,TIFF MH圧縮,TIFF PackBits圧縮,TIFF 非圧縮。 e.Typist8 で保存:PDF,TIFF G3圧縮,TIFF Huffman圧縮。 読取革命2002 で保存:AWD,DCX,TIFF JPEG圧縮。
166 :
名無しさん@そうだ選挙にいこう :02/09/30 18:48
>>153 非ADFスキャナ・日本語OCR 10,000頁終了野郎より。
異なる境遇につき,アドバイスできませんが,いくつか。
「ハードウェア」板 「スキャナで連続スキャン」スレッド は,若干参考になるかもしれません。
もっとも,振り回されない方がいいでしょう。
最後は,自分しかありません。
有益な情報は英語圏で探した方が早いかもしれません。
誤変換にシビアと思われます(私もそうでした)。場合によっては,翻訳時に再修正と,割り切る事もあり得ます。
検索目的OCR派の方の意見は,余り参考にならないかもしれません。
167 :
名無しさん@そうだ選挙にいこう :02/09/30 18:49
>>153 非ADFスキャナ・日本語OCR 10,000頁終了野郎より。
自分で一つ一つ検証し,確実な計画を練り,持続的に達成可能な日々のノルマを割り出す。
あとは,脇目を振らず,ひたすらコツコツ進む。何があっても,日々のノルマはこなす。
諦める人が多い。そもそも,挑戦しようと思わない。
しかし,必ずゴールはやってきます。自分を信じて,進んで下さい。
終わった暁には,後進のために,書き込んでやって下さい。
ご検討をお祈り申し上げます。
168 :
名無しさん@そうだ選挙にいこう :02/09/30 19:01
上級者は,富士通製 文書OCR for Word4 も考慮した方がいいみたいです。 操作性はまだまだだが,認識精度はものすごく高いようだ。 スキャン,画像修正,等,はとソフトで行い,エンジンだけ利用する, という手法がそろそろ出てきてもいいと思います。
169 :
名無しさん@そうだ選挙にいこう :02/09/30 19:07
誤植修正版 上級者は,富士通製 文書OCR for Word4 も考慮した方がいいみたいです。 操作性はまだまだだが,認識精度はものすごく高いようだ。 スキャン,画像修正,等,は他ソフトで行い,エンジンだけ利用する, という手法がそろそろ出てきてもいいと思います。
170 :
名無しさん@そうだ選挙にいこう :02/09/30 22:48
読んdeココ8の透明文字つきPDFの画像部は、取り込み画像のままで、解像度は 変更できないのだそうだ(仕様)。 おしいなあ、e.Typist8のように変更できれば、ファイルサイズを小さくできるのに。
171 :
名無しさん@そうだ選挙にいこう :02/10/01 06:40
OCR処理をするかどうかの判断は, 書籍・原稿の内容によるべきである。 書籍・原稿の書式によるべきでない。 (OCR処理可能な書式である限り), 内容で判断すべきである。 内容を伴わない書籍・原稿をOCR処理することは, 労力・時間の無駄である。 OCR処理に先立ち, 書籍・原稿の内容の評価を終了していなければならない(と思います)。
>>170 環境設定→出力→画像領域の設定→画像の出力解像度
これが効かないってこと?
読んdeココ8のヘルプでは
>画像の出力解像度(R)
>認識結果を保存する場合、Word形式/HTML形式/一太郎形式/PDF形式のいずれかが
>指定されたときに、イメージ領域を指定された解像度に変更して保存します。
>解像度は、72dpi/96dpi/150dpi/200dpi/元画像の解像度から選択します。
>出力解像度を下げると、結果のファイルサイズを小さくすることができます。
となってるけど…
>>172 そうだよ。部分画像の使われる「標準」でのみ有効。
元原稿のオリジナル性を保持するための処置だそうだ。
>>173 「標準」てのは「透明テキスト」でない方のモードだね。
こっちは全然使わないから意味無いなぁ…。
かといってeTypistにPDF食わせると死ぬほど重いし(w
175 :
名無しさん@そうだ選挙にいこう :02/10/07 00:24
200dpiに対応できるOCRを出してほしい。
176 :
名無しさん@そうだ選挙にいこう :02/10/07 04:35
177 :
名無しさん@そうだ選挙にいこう :02/10/07 19:33
>>131 悪かったね。ごめんごめん。
元気出してくださいな。
最近CANONのスキャナを買って、付属の e.Typistエントリーを使ってます。 バンドルソフトとはいえ、認識率には不満はありません。 しかし、小さめの文字の原稿だとある文字とその隣の文字の偏を一緒に認識してしまって 誤認識するのがちょっと嫌です。 例:「会社」を「斜土」とか 間違って二文字ち認識したのを一文字として認識させることはできますが、 一文字と認識したのを切り分けることができません。 e.Typist v.8.0ならこういう切り分けができるのでしょうか? また、他のソフトで認識単位を切り分けることができるソフトがありましたら 教えてください。
>>178 読んdeココは、可能。
他のソフトはしらぬ。
eTypist8.0も、切り分けはできないようです。 私も「場合」という語を「船」などと誤認識されまくって ピキピキしますた。 ちなみに読んdeココではいまのところそういう目には遭っていません。
>179、180 ありがd 読んdeココ Ver.8体験版をインスコしてみましたが、文字の分離機能はいい感じ。 e.Typistエントリーよりレイアウトの認識も賢く、文字認識も上回っている印象です。 早速購入決定です。ほんと情報いただいて助かりました。
182 :
名無しさん@そうだ選挙にいこう :02/10/08 02:44
読取革命2002が最強
読取革命2002も試してみました。 こちらでも文字の分離はできますね。 ただ、スキャン機能が私には使いにくいのと 誤認識した場合にその文字が候補にもでないことが 読んでココVer8、eTyupistエントリーより多いように感じました。 (読んでココは候補を30個だせるので一概に比較できませんが) また読取革命2002は文字認識のスピードも倍以上遅いです。 しかし、レイアウトは読取革命2002が一番原型を保持してWordにもっていけます。 やっぱり用途によってよしあしがあるようです。 テキストにだけしたい人には、読んでココがベストかな。
184 :
名無しさん@そうだ選挙にいこう :02/10/09 10:09
>eTyupistエントリー 誤認識ですか?
OCRで辞書に二文字以上を登録できるソフトを教えてください。 フォントにない○の中にイを(イ)として登録し、変換させたいのです。 eTypistと読んでココではできないようです(どちらも体験版)。 よろしくお願いします。
186 :
名無しさん@そうだ選挙にいこう :02/10/10 12:02
>>185 読んdeココ7だが、
置き換え機能を使うことで可能。
これを使って(イ)に変換している。
>186 thnx!! 古い本には結構この手の記号が多いので困ってたんですよ。 ちゃんと製品版を買ってマニュアルを読み込むことにします。
読んdeココ Ver.8体験版やe.Typistの体験版をインストール すれば、読取革命2002の乗換え版はインストールできますか?
>>188 実は、他社のOCRソフトをインストールしていなくても、
乗り換え版はインストールできる。
ノートンも同様。
191 :
名無しさん@そうだ選挙にいこう :02/11/08 22:07
>>129 自己フォロー。
以下の雑誌が,OCR用の(フラットベッド)スキャナ選びの参考になるかもしれません。
「PC USER(ソフトバンクパブリッシング刊)」2002年11月24日号No.157の
特集記事『決定版!スキャナー徹底比較』,
「デジタルフォト専科(ソフトバンクパブリッシング刊)」2002年11月号の
特集記事『フィルム派に贈るフラットベッドスキャナ』。
前者は,大変参考になると思います。
後者は,デジカメ雑誌らしく,CCDの画素ピッチへの言及があります。
ADFスキャナの補助とする場合,重要な視点です。
単体スキャナの本格的な特集記事が組まれるのは,今期が最後かもしれません。
(来期以降は重点が複合機に移りそうです)。
一読してみるのも良いでしょう。
192 :
名無しさん@そうだ選挙にいこう :02/11/09 15:38
193 :
名無しさん@そうだ選挙にいこう :02/11/09 18:36
>>192 解像度変更のダイアログを出すファイルをつきとめて、削除せよ。
194 :
名無しさん@そうだ選挙にいこう :02/11/09 20:08
>>193 全ての画像に対してこのダイアログが出ます。ファイルオープンのところで
プレビューを表示させると、水平・垂直解像度とも0dpiになります。
JPEGファイルなのですが、BMPに変換しても同じです。これは普通の現象
なのでしょうか?
195 :
名無しさん@そうだ選挙にいこう :02/11/09 23:55
>>194 そのような現象は出る場合と出ない場合がある。
200dpiで取り込んだjpgファイルを取り込んだ場合、解像度変更のダイアログが出た。
300dpiで取り込んだjpgファイルやtiffファイルを取り込んだ場合、出ない。
196 :
名無しさん@そうだ選挙にいこう :02/11/10 00:45
読んでココの文字認識を外部のアプリからコントロールすることは出来ないでしょうか? accessから読んでココを起動し、自動実行で画像を取り込んだ後、画像の文字部分をテキストに 抽出する処理をできるだけ自動化したいのです。
199 :
名無しさん@そうだ選挙にいこう :02/11/22 00:40
OCRソフトの「e.Typist V.8.0」 を購入したのですが、スキャンする漢字の文字が歴史書物で難しい(古い?)ものが多く、 標準のものでは文字認識はもちろん、手動で漢字修正しても漢字が出ません。 なにか漢字認識を増やせるソフトとか?こういった場合どうしたら良いのでしょうか。 どなたかご存知の方いらっしゃいましたら宜しくお願いします。
200 :
名無しさん@そうだ選挙にいこう :02/11/22 01:05
>>199 正字正仮名の文献ですか?
正直、認識率は期待しない方が良いですが・・・
お使いのソフトの場合、第2水準漢字の追加設定をしましたか?
>>200 第二水準漢字は完全収録って事だったので購入したのですが、
何か設定とかするんですかね。。
正字正仮名の文献??
えっと、書道の文献で日本語で書かれた中国の歴史モノなので
訳のわからない漢字が頻繁に出てきて困ってます。。
>>200 第二水準の設定しましたけど、それでも駄目でした。。
203 :
名無しさん@そうだ選挙にいこう :02/11/22 02:36
中国語対応のバイリンガルOCRじゃないと無理のような・・・ 繁体字対応のヤツ。 素朴な疑問なんですが、認識されないのは第1・2水準漢字なのでしょうか?
ん? 第一か、第二水準漢字かは分からないのですが、 たとえば「くさかんむり」の下に「市」 って書く文字だったり 読み⇒(フツ) 「たけかんむり」の下に「移」と書く文字だったり。。 読み⇒(イ) ご迷惑かけてすみません。わざわざ有難うございます。
205 :
名無しさん@そうだ選挙にいこう :02/12/05 02:32
参考になったのでage
206 :
名無しさん@そうだ選挙にいこう :02/12/07 09:06
読取革命Ver7いいですね 乗り換え版が8000円程度で買えるし 機能もいい
207 :
佐々木健介 :02/12/07 09:29
>>1 ______
/_ |
/. \ ̄ ̄ ̄ ̄|
/ / ― ― |
| / - - |
||| (5 > |
| | | ┏━┓| / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
| | | | ┃─┃| < こんなサイトを見つけた
|| | | | \ ┃ ┃/ \ 正直、スマンカッタ
| || | |  ̄ \_________
http://freeweb2.kakiko.com/mona/
下線や括弧が多用されている書類を読みとりたいのですが 現在誤認識が多くて閉口しています。 これは、OCRソフトの限界ですか。それとも認識率を上げる 方法があるのでしょうか。 ちなみに、今回は400dpiで取り込んだtiffファイルを 読んでココ体験版で認識させました。 もし少しでも認識率が上がれば、そのソフトを購入したいと思っています。 ご存じの方よろしくお願いします。
209 :
名無しさん :02/12/17 06:52
>208 読んでココのバンドル版は、認識率がかなり悪い。 エーアイソフトに言わせれば、製品版を買えってことだろう。 しかし、あんなに性能の悪いソフトを掴まされると、製品版の出来が不安になる。 だから、おれはe.Typistを買った。 エプソンは読んでココと手を切ってほしいね。
210 :
名無しさん@そうだ選挙にいこう :02/12/18 00:33
>>209 エプソンがエーアイソフトと手を切ることはない。
なぜなら、エーアイソフトってエプソンの子会社だから
211 :
名無しさん@そうだ選挙にいこう :02/12/18 04:28
>210 そうなんだ。知らなかった。 プリンタ・スキャナ・OCRは相性や値段で密接に関わり合っているから、OCR目的の人はCANON系を 買ったほうがいいな。個人的には、プリンタ単体ならエプソンが一番良いと思っているだけに 残念。
エプソンスキャナ使用中なのですが、他社OCR入れても問題ないスよね?
213 :
名無しさん :02/12/19 01:05
>212 ソフト会社が発表している動作確認済み機種で、確認したほうが無難だと思う。
214 :
名無しさん@そうだ選挙にいこう :02/12/19 11:38
>>209 バンドル版と体験版を混同しているようだが…
体験版は製品版と基本は同じもので、認識率は飛躍的に良いぞ。
たしかにe.Typistはデフォルトでは認識率が良いけど
読んdeココも認識辞書で誤変換癖を修正していけば同等。
どれでも少なからず誤変換癖はあるから、手間は結局似たり寄ったりだよ。
軽快感や図表の認識の得手不得手など、ホントに一長一短だし。
どっちで決まりとは断言できないんで、俺は両者を場面に応じて使い分けてる。
215 :
名無しさん@そうだ選挙にいこう :02/12/19 14:50
何年かぶりにe.Typistをバージョンアップしてv8.0にしました。 前のバージョンでは認識途中でセーブして後でその状態から 再開できなかったのですがそれが可能になっていて良かったです。 日本語認識は以前から悪くなかったのですが、古いプログラム ソースを読み込ませてみて、変換精度がかなり良くなっていました。 Epson GT-7600U 400dpiで読み込ませています。
>214 いちお、バンドル版と体験版の違いはわかってます。 体験版での比較をせずに、読んでココのバンドル版は質が悪い→e.Typistを買うをやったので、読んでココの製品版はどのような出来なのかは知りません。 軽快感や図表認識は、読んでココのほうが良いのですか?
認識率 読取革命>読んでココ>>>>>>e.Typist 操作性 読んでココ>読取革命>>>>>>e.Typist
>>216 今まで使ってみた限りでは、軽快感はダントツで読んdeココ、
図表の認識ではe.Typistの方が優秀というような印象です。
やはり体験版を比較して決めるのがいいでしょう。
読んdeのムカつくところはエラーで強制終了すると(結構よくある) そのあとツールバーとかの表示が初期状態に戻ること。 新しいスキャナ買ったらe.Typistエントリーが付いてきたので 来年はe.Typist Ver.9にしてみようかと思う。
hosyu
221 :
名無しさん@そうだ選挙にいこう :02/12/28 01:22
キャプチャー画像のテキスト化に強いOCRソフトあります? WinReader6.0ではOCRできませんでした。 画面では12ポイントぐらいなんですけど。
>>221 単にキャプチャー画像って言われてもなんだか判らないがな。
キャプチャーした状態で表示して12ポイントだったら普通は無理だと思うぞ。
ドットで16ドットくらいだろ? スキャン原稿換算で3ポイントにも満たないからな。
そうなんです。でも、サイズが小さい代わりに、スキャンに伴う カスレとかが一切ないのでなんとかならないかなと思いまして。 で、レスをヒントに、画像処理ソフトで2倍に拡大してみたら、 なんと半分以上認識されるようになりました。 この方向で工夫してみます。どうもありがとうございました。
224 :
名無しさん@そうだ選挙にいこう :03/01/02 21:02
読んdeココ Ver.8 とエプソンGT8300UFを買いました。 数字ぎっしりの紙の表(主に財務諸表関係)をエクセル に落としまくろうと思ったもんで。 しかし,と.をうまく判読してくれない。これじゃ全然使えないっす。 なんとかなりませぬか??
そっか、substitute関数で置き換えりゃいいのか!解決っす。
226 :
名無しさん@そうだ選挙にいこう :03/01/03 02:19
置き換えなら読んdeココ上でもできまっせ。 認識辞書を鍛えるのも良し。
227 :
名無しさん@そうだ選挙にいこう :03/01/07 18:53
e.typist8で、「画像PDF」を「テキスト付きPDF」に変換すると、 変換後のファイルサイズが20倍近くになって困ってます。 相談窓口に相談しても解決せず。 170のいう「変更」ってどうやるんだ? >読んdeココ8の透明文字つきPDFの画像部は、 >取り込み画像のままで、解像度は変更できないのだそうだ(仕様)。 >おしいなあ、e.Typist8のように変更できれば、 >ファイルサイズを小さくできるのに。
すみません。解決しますた。。。。
229 :
名無しさん@そうだ選挙にいこう :03/01/07 22:11
>228 何をどうしたら解決したのか、同じトラブルをかかえている人のためにも 記録としてココに書き込んでおいて下さい。 質問だけして逃げないように!!
230 :
困ったチャン :03/01/09 21:09
あの・・・業者さんにOCR頼むと1枚あたりどれくらい取られるの? 100枚ぐらいの書類を電子化したいのです。 業者さんがソフトより高かったら自分でソフト買ってコツコツやろうかな・・・。
>>229 失礼しました。
1.メニュー「その他」→「環境設定」
2.「その他」タグの「図領域出力DPI」で、解像度を変更。
ちなみに、私は
DPI=「96」
に設定しました。
ただし、画像の解像度を失っているかもしれません。これは不明です。
変換の前後で画像サイズがあまり変わらないので、もしかすると実質的な解像度は同じかもしれません。
もっと最適な方法があるかもしれませんが、今はこの方法しか知りません。
試行錯誤でみつけました。
本来なら、
DPI=「原稿画像DPIを保持」
という設定のままでサイズが維持されるべきだと思うのですが、
この設定のままでは、変換後のサイズが20倍近くになってしまいます。
PDF読込み時に解像度をあげ、解像度を戻さずに保存しているのかもしれません。
相談窓口のお姉さんに同じファイルで試してもらいましたが、同じ症状でした。
以上です。
232 :
名無しさん@そうだ選挙にいこう :03/01/12 00:08
ありがとう。<傍観者より これはコピペ保存するに足る情報だ。
233 :
名無しさん@そうだ選挙にいこう :03/01/12 15:41
>224 公官庁の出版している細かい数字の表を取り扱う目的で、 e.Typist8・読んde!!ココ Ver.8・読取革命2002などを さまざま試してみました。 結局、東芝のExpress Readerが認識率・速度とも最良でした。
でも¥20万じゃなー
235 :
名無しさん@そうだ選挙にいこう :03/01/14 01:19
e.typstエントリーの事で質問があります。 キャノンのスキャナー(のおまけでついてきた体験版なんですけど 体験版だとテキスト編集みたいな事できないんでしょうか? 色々やってみるんですが文字化けしてしまって訳がわかりません。 サポセンに何度電話しても繋がらなくて途方に暮れてます。 バージョンアップしないと正常に動かないんでしょうか? それともやり方が悪いんでしょうか? ご存じの方いらっしゃったら教えてください。
>235 認識結果が文字化けするんですか? 解像度はいくつくらいでスキャンしてますか?
237 :
名無しさん@そうだ選挙にいこう :03/01/15 02:31
テキスト編集ができないわけないので 表示フォントが外国語になっちゃってるとか 初歩的なところを疑うのは失礼でしょうか? あ、画像部分(もしくはロゴみたいにでっかい文字)を 強引に文字領域として認識させると製品版でも化けることある。 そのことかな? 製品版での知識でアドバイスすると(エントリー版は一度も使わぬまま アップグレード版で上書きしたので)、認識領域を自動解析モードにするか、 怪しそうなところは手動で画像領域に指定して再度トライだ! つーかまず素直に読めそうなところを文字領域で指定して、 すこしずつ練習してごらん。
238 :
名無しさん@そうだ選挙にいこう :03/01/15 11:34
>>235 読みとり精度が良くて、カスタマイズしやすい
読んdeココか、読取革命の最新バージョンを買えば、よい。
>>236 >>237 >>238 ご回答ありがとうございます。
それでですね、私がバカかアホかってな感じだったんです。
すいませんでした。OCRそのものをよく理解していませんでした。
ほんと申し訳ありませんでした。罫線を使ったフォームを編集したかった
んです。それで罫線が文字化けの原因って事がわかり。。。
ホント間抜けな質問してすいませんでした。
ピタットフォームというフォームの編集ができるソフトの体験版を
DLしてから回線切って首吊って逝ってきまつ・・・・
(^^)
そんなに恐縮しなくても(笑)。
242 :
名無しさん@そうだ選挙にいこう :03/01/16 14:43
244 :
名無しさん@そうだ選挙にいこう :03/01/16 15:29
>243 >244 レスThanks! 「TWAIN規格」(?)対応のスキャナでないと言うことで ちっと心配でした。PDFでできるのですね! で、LECって何??
246 :
名無しさん@そうだ選挙にいこう :03/01/17 18:55
読んdeココのお試し版をアクロバットのプラグインとして 使おうと思ったのですが、設定の仕方が分かりません。 読ココお試し版をインストールするだけで自動で設定されると 思ったのですが・・・。 お試し版ではプラグインとして使えないのでしょうか? ご存じの方がいらっしゃいましたら教えて下さい。
スタート→プログラム→読んdeココ→アドインの追加と削除 でAcrobatにチェック入れるとプラグインがインスコされるよ。 ちなみにアンインスコはチェック外すだけ。
>>247 有り難うございます。
プラグイン出来ました。
早速使ってみます!
ウヘ ,--─i'''"" 'ヽ、 / i, ヽ, ..i |. i, / _i-、 ___, i, | ┌'  ̄ ̄ ヽ、 l | l i, | | i ,,,,,,,,,, ,,,,,,,,,,,, ヾ, i .| / _ " __ "' i ,--i .ト、.l -=・=- -=・=- ト'/"i | .| l :::::. ::::::::::::::::::∂ l | l ::::::... ...:::::::::::: -' ノ .| '~- -::::::::::::::::::::::::::::┌-' ヽ, i \___/ `i:::::::::::::::::l ヽ, \/ ::::::::::::::::::ノl \ ...::::::::::::::::/::ト、 ~ト、....:::::::::::::::::::/::::/ >、 il,  ̄ ̄ ̄ ̄::::/ / \ _,,-| \ ::_,--'" / ヽ-、 _,,,.--'"~ | >,-'''" / | ~"--,,_ _,,.-'" / |i i" ヽ // | ~''-,,__
252 :
名無しさん@そうだ選挙にいこう :03/02/04 00:57
いつのまにか読んdeココの8.03アップデート出とる… 自動アップデート実行記念age
253 :
名無しさん@そうだ選挙にいこう :03/02/05 02:11
読ん de!! ココは Ver.9 が近いですね アップグレード版は初回?万本限定で 5000 円ほどらしい
254 :
名無しさん@そうだ選挙にいこう :03/02/07 23:34
e.Typist8.0もアップデート来たzo(1/28 R1b)
255 :
これから導入予定野郎 :03/02/09 11:30
仕事で1冊200ページ程度の文献を数十冊程 Word ファイルに入力をしなければならなく なりました。 上司からは「外注でバカみたいに金をかけるんだったら、OCRで 『ちょい、ちょい』 と読み 込んで作成しろや。ゴルァ」との指示。 この「ちょい、ちょい」というのにも腹が立ったのですが、くやしいので「おう!やってやろう やんけぇ!」ってなノリの現在です。 ここで、OCRソフト使用歴の長い諸先輩方のご意見を拝聴したいデス。 やっぱ仕事で使うのであれば、東芝の「Express Reader Pro」とかメディアドライブの 「WinReader PRO」とかの高いソフトが必要なのでせうか? どうせバカ上司からの指示なんで、会社から金は出ます。 ソフトの金額に糸目はつけずに考えたいと思います。 上の2つのソフトの使用感、また、安くてもこんなに良いぞ、みたいなソフトがあれば 教えてください。 教えて厨で申し訳ありません。ぜひおながいします。
雑用係か・・・・。 雑用係か・・・・。 雑用係か・・・・。 雑用係か・・・・。
>>255 試用版をとりあえず使ってみよう。
人に意見を聞くよりも、そっちの方が納得するし、確実だ。
その上で人に聞く方が(・∀・)イイ!!
しかし
>1冊200ページ程度の文献を数十冊程 Word ファイルに入力をしなければならなく
>なりました。
とは・・・。
地獄を見ると思うよ。
>256 まったくもって、そのとおりですな。(自嘲 「情報処理」という名のまさしく「雑用」ですわ。。。 >257 ありがとうございました。 確かにそうですね。 ただ、あまり高価なソフトは体験版ってなくて、、、 そのほかのソフトについては、試用版を確認してみます。 20万円のソフトを使用している方、是非インプレをおながいします。
>>255 その文章は英文でしょうか和文でしょうか。
また,正確性はどの程度要求される文章なのでしょうか。
和文で正確性がある程度要求される文章ならば,もう,そ
れは257氏のおっしゃるように,地獄ですよ。強度のマゾ
以外の方にはオススメしません。
とりあえず,数ページ体験版でやってみてはいかがですか。
それを数千ページくりかえすことになるのですから。多分,
いやになると思います。
ちなみに,高いソフトでも,認識率は劇的には変わらない
と聞きます。
age
でも、各社とも体験版のエンジンは製品版とはちがうんじゃなかったっけ? 体験版はおんなじで、スキャナ等バンドル版がおもちゃなんだったっけ? 忘れちゃった。
その上司もバカだなしかし。 外注に金掛ける変わりにソフトに金かけて、 かつ部下の就業時間を生産性の低い単純ルーチンワークで消費しちまうんなら、 その管理職は無能だ。 きっと、その用途ってPDF等で電子化するだけで事足りたり、 せいぜい検索テキスト付きPDFで済むような用途なんだぜきっと。 検索キーワード程度なら鬼のような誤字修正でなくても済むんだぞ。 だいたいシロートって「パソコンならポンポン、とやればできるんでしょ?」な 認識の奴が多すぎるよ。その上司ってちゃんと情報処理部門の人なの??
>>262 しかし世の中の「上司」と呼ばれる奴のほとんどはそんな奴だよな。
265 :
名無しさん@そうだ選挙にいこう :03/02/10 16:02
ぽんぽんでできるなら、お前がやれよ。って言ってやりたい
266 :
名無しさん@そうだ選挙にいこう :03/02/11 01:19
あら、ソフトウェア板でちょうどその話題が・・・ けど他に誰か実使用者がいたら教えてつかぁさい。
268 :
名無しさん@そうだ選挙にいこう :03/02/11 13:50
ソフトウェア板でガイシュツだが、価格・性能とも OmniPage>>>PrestoOCR≧TextBridge
269 :
名無しさん@そうだ選挙にいこう :03/02/11 14:24
上の話の腰を折るようで申し訳ありませんが、再登場の255です。 インフルエンザに体力負けして寝込んでおりました。 バカ上司のウィルスが脳に入り込んだのかも・・・?(w >259様 文章は和文です。 いままでの研究文献的な報告資料を電子媒体に変換しようという試みです。 そうですか、、、あまり認識率に差はないですかぁ。。。 >262様 今の私の職場には「情報処理部門」的な専門セクションは無いのが実情です。 他人よりややパソコンの使用歴が長い私に白羽の矢があたったのです(泣 「チミは情報処理担当『併任』だ!」って言われまして・・・ >264様 笑ってやって下さい。 その上司は予算を握っているいわゆる会計責任者なのですが、私が以前に必要だと 進言したパソコンについて、 「お前はデスクトップ型で良いと言ったじゃないか!」 「液晶タイプとは一言も聞いてないぞ!」 「お前の趣味で会社の金を無駄遣いされたらいくら金があっても足りんわい!」 と、会社の予算ドロボーみたいにボロクソになじられました。 意味わかります? つまりその上司は「デスクトップ型」=「CRTモニター」だということを言いたいらしかったのです。 呆れて物も言えなかったっす。 コイツが「ボタンでちょいちょい」って言うのですわ。。。 >262様 さすがに今のおやぢ連中は、この時代の波の速さに追いつけずに苦労してるのでしょうが 「費用対効果」って意味も解ってないのがツライです。 >ALL やっぱり業務レベルで使用に耐えるソフトは無いと考えた方が良いでしょうか? それと、たとえ僅かでも、私が泣きをみないで済む方法があれば教えて下さい。 文字通りの教えて君&長文厨でスマソ。
270 :
名無しさん@そうだ選挙にいこう :03/02/11 15:08
業務用の特殊な世界は知りませんが、普通の OCR ソフトだと
東芝 ExpressReader、メディアドライブ WinReader
以外はクソと思ってください。
WinReader=eTypist の上位版ですが、259 の通り大きな差があるか
どうか微妙で、場合によっては、eTypist のほうが認識率が良い
ケースも生じます。しかし、差が少なくても、99%と99.9%の差は
効率に大きく響きますので、仕事で使うなら、上のどちらか以外の
パッケージソフトは薦めません。20万というコストパフォーマンスは
悪くとも、金さえだせば性能が買えるならばという世界です。
あとは、ドキュメントスキャナですね。
http://pc3.2ch.net/test/read.cgi/hard/1039872188/ で語られているのは個人用です。400〜600dpi で高速で
取り込めるスキャナは、最低でも40万はしますが
業務なら普通でしょう。ExpressReader の推奨
スキャナは、それ以上のものだったはずです。上のスレの
2-8 あたりのリンクを見てください。
パソコン本体は、現時点で普通のもので十分ですが、
ドキュメントスキャナの標準は現時点ではSCSIです。
USB2.0のものはまだなく、USB1.0、パラレルのスキャナは
業務用ではないと考えてください。
271 :
名無しさん@そうだ選挙にいこう :03/02/11 15:11
>270 ありがとうございます。有り難うございます。 早速の情報に感謝します。 そっか、、、スキャナも高額になるのですね。 んじゃ、これを上司にぶつけてみて 「こんなに金がかかるんじゃ!ワレ!」 「その上実務にあたる人間は地獄を見るんじゃい!コラ」 と言ってみます。
>>272 勇気ありますね(w
というより,そもそもその文章を全文デジタルテキスト化
する必要があるのかどうかを検討された方がよろしいかと
思います。
単にスペースの問題だけなら,画像としてスキャンすれば
足りますし,インデックスをつける(但し見落としがない
保障がないインデックス……意味ねえ)だけならOCRでも
十分実用的だと思います。
というより,上司もそんなOCRでちょいちょいとできるの
ならば,専門の打ち込み業者があんな値段では成り立たな
いことぐらいわかるでしょうに……。
274 :
名無しさん@そうだ選挙にいこう :03/02/12 00:05
>273-274様 正確に言いますと、文書ファイルを「XMLファイル」にして保存するのです。 Micerosoft Word からは XML へ変換するのが容易なんだそうで、とりあえず「.DOC」ファイルへ 保存する、という聞き方をしたのでした。 つまり、LAN上の内部的にもインターネットの外部からも(無論外部用には HTML への変換が必要ですが) 全文検索が可能なファイルとして保存せよ、とのお達しなのです。 う〜む。。。。 やっぱ、PDFに検索用キーワード貼り付けってヤツが一番だったのかな? しかし今となっては「XML変換エンジン」導入決定後だし、、、 ああ鬱だ。 なんか愚痴スレにしてしまい、このスレを汚してしまいましたことを皆さんにお詫びします。
あらら、Microsoft Word ですた。 こりゃ誤変換ですかな?(w
ふーむ、XML化がゴールでしたか。私も「なんでWord化?」と思っていた一人です。 WordやExcelでストレートにhtml形式で保存できるのはご存じですか? 保存時のファイル形式でhtmlを選択するだけです(今はXMLも直でできるのかな?)。 で、その結果をブラウザで見てみると、レイアウトが恐ろしいことになっているのが 一目で分かるでしょう。しかも、その恐ろしいイモhtmlを修正しようとしてごらんなさい。 まるでいうこときかずに地獄を見るのが分かると思います。 Wordのタブ/インデントがいうことをきかない比ではありません。 お手元にある、ちょっと凝ったレイアウトのWord文書やExcelシートを (それこそちょちょい、と)html形式で保存してからブラウザで見てみる、というデモを その上司の目の前でやってみせると良いです。それこそポンポン、でできちゃうデモです。 で、「おまえが言ってるパソコンでチョイチョイって、こんなオモチャレベルの性能なんだゴルァ!」と アピールすれば上司の目も覚めることでしょう。 パソコンって魔法の箱じゃない。しょせん電卓同様、業務の「一部」を手伝わせる「文房具」なんだ、 きちんとしたレベルに仕上げようとすればそれなりに工数もお金も必要なんだ、と。 で、要は全文検索可能なのがゴールであればPDF&検索用キーワードとかDocuworksも ひとつの解です(googleでもpdfがヒットしたりするでしょ。外部からでもOKなのよ)が、 どーやらその上司のレベルからして「検索でヒットした後いちいちAcrobatが起動するのが苦痛だゴルァ!」 とか「一台ずつインストすんのかゴルァ!」とか言いそうだ(そもそもAcrobatを知ってるのかな?)。 しかしどーせXMLでもIEが起動するんだし、「その文書」だけ単品ファイルとして転送したり 配布したりするのにはPDFの方が向いてるし、文献の表組みや図、レイアウトまで崩さず 電子化して検索・共有したいならPDFのほうがいいですよ、という線で説得する方がいいとおもう。 「Acrobatってタダなんですよ!」というのもその上司の性格にはアピールしそうだし。 といいながらXML変換エンジン導入が決定してるんならいまさらXML以外にするわけにはいかないし‥。 ここをどう用途付けするかだな‥。みんなでいい知恵を出せればいいが‥。
読んdeココのバージョン8使ってるんですが 表を読みこませると、認識結果にアスキーアートで器用に表をつくってしまいます これを文字だけ出力させるように変えられないでしょうか オプションや右クリックメニュー、ヘルプをざっと見たのですが分かりません。
すいません、解決しました。
280 :
名無しさん@そうだ選挙にいこう :03/02/12 19:15
>>279 1分で解決ってめちゃ速いなーw
後々のためにもどういう解決方法なのか書いてくれよ
>>280 選択した領域で右クリック
認識タブの種類別で表だから表にチェック入れてたんだけど
これにチェック入れると、アスキーアートで表が生成されてしまう。
宣伝か・・・・。
( ´_ゝ`)フーン じゃ、普通の絵を認識させたら上手なAA作ってくれるかな?
勘違いしてた 認識結果に見た目だけ表が表示されるが マウスで選択してメモ帳に貼り付けると テキストだけ出力されてた 使い始めて3日ぐらいなのでかってがつかめてなくてスマソ。
285 :
名無しさん@そうだ選挙にいこう :03/02/14 15:55
e.Typist8.0で認識結果を保存すると最後に ---------------------[End of Page 1]--------------------- っていうのが勝手に入るんですが これ入れないようにできないでしょうか?
>>285 テキストファイル形式で保存したときだね?
複数画像を読んだデータを保存するとき、
一ページ分ずつ別ファイルとして保存するか
先の認識結果の最後にどんどん付け足してひとつのファイルとしてまとめていくか
を選択できるのだが、後者を選択してるとそうなる。
メニューツリーのどこで設定したかは今手元に環境がないが
たしか認識結果ファイル保存ダイアログの下半分に
保存方式のチェックボックスがあって、そこで選択できたんじゃなかったっけ。
>>286 有難うございます、できました。
e.Typistの環境設定ばかり見てたんですが
保存時のオプションでページ区切り設定というのがあって
そこで区切り文字のフォーマット指定、区切り文字ON/OFF設定がありました。
明らかに使う場合のほうが少ない機能だからデフォルトでOFFにしてくれればいいのに・・・
ところでややスレ違いなのですが、私は在宅で文字入力のバイトをしています 皆さんが使われている定番の文字数カウントツールってどんなソフトでしょうか? 類似スレ探したけど見つかりませんでした また、文字数のカウントに改行などの制御記号は含めるのでしょうか? 情報お願いします。
wcに決まってる。
>>288 完全にスレ違いの感じがするけれど,エディタのマクロでやるのが一番では。
単純な文字数のみならず,何文字×何行というカウント方法もとれるし。
置換を利用すれば>285のような問題も解決可能です。
ソフトウエア板で調べた方がいいかもしれません。
>>289-290 有難うございます
WCというのを探して、ソフトウエア板にも行って見ます。
> 明らかに使う場合のほうが少ない機能だからデフォルトでOFFにしてくれればいいのに・・・ そうでもないよ。複数ページドキュメントを読む人だって多い。
293 :
名無しさん@そうだ選挙にいこう :03/02/25 12:50
詠んdeココ!、etypist、読取革命の3つのうち 表形式の読取が一番優れているのはどれでしょうか?
294 :
名無しさん@そうだ選挙にいこう :03/02/25 19:01
読んココ9がまもなく出るけど、表読み取り強化したとかいてあったがじっさいのできはどうだろ。
おまいは今手に入らないものについて質問されたら不快にならないか普通
映画のDVDでも「今度出る○○の画質はどうでしょうか」と聞く奴が後を絶たないが そのたびに「バカって いなくならないんだなー」と思う。
そりゃそうだ。 いなくならんよ。 学校時代の成績と頭の良し悪しが100%イコールではないのは自明だが 相関関係にはあるわな。 学校時代バカでバカでしょうがなかったヤツが、社会ではそれを忘れてノウノウと生きている。 忘れるなよ! オマエは人よりバカなんだよ!
298 :
名無しさん@そうだ選挙にいこう :03/03/02 01:28
あ〜あ。。。エラい言われようですナ。 袋叩きやんか。
ウチの会社の上司が「読んde!!ココ」をどうしても「読んでねココ」と 言ってしまうのですがどうしたらいいですか?
300 :
名無しさん@そうだ選挙にいこう :03/03/03 00:15
>299 まだ良い方。 ウチの職場の課長は「イントラネット」の事を「インタートッド」だとよ。(w オイラ、其奴が何のことを言ってるのか理解するのに時間かかったわ。 すれ違いスマソ。
>>300 まだ良い方。
知り合いのSOHOやってる社長は「ワードパッド」の事を「ノートパッド」だとよ。(w
「ワードパッドはたまにしか使わないから間違えるんだ〜」とか言ってっけどフツーはどっちも使わねえんだよ!
すれ違いスマソ。
302 :
名無しさん@そうだ選挙にいこう :03/03/04 03:33
303 :
名無しさん@そうだ選挙にいこう :03/03/04 04:44
(^^)
305 :
名無しさん@そうだ選挙にいこう :03/03/16 00:26
正直何のソフトが良いんだぁ〜?
306 :
名無しさん@そうだ選挙にいこう :03/03/16 11:33
オレにスキャンした画像おくってくれれば活字ひろうぞ。1字1円。
307 :
名無しさん@そうだ選挙にいこう :03/03/16 11:35
やっぱり1字10銭でいいや。
308 :
名無しさん@そうだ選挙にいこう :03/03/16 14:14
読んでココ9購入age
309 :
名無しさん@そうだ選挙にいこう :03/03/16 14:47
311 :
名無しさん@そうだ選挙にいこう :03/03/18 01:24
期待age
>>308 使い心地をぜひ報告してください。
312 :
名無しさん@そうだ選挙にいこう :03/03/18 05:43
313 :
名無しさん@そうだ選挙にいこう :03/03/18 16:17
314 :
名無しさん@そうだ選挙にいこう :03/03/25 01:08
読んde!!ココ9体験版を使ってみた。見た目は殆ど変わりないが、使ってみると認識辞書への登録が自動化されたおかげで認識率の向上が容易になっているのを実感した。 一通り認識させてから主な修正を加え、いったん結果を破棄して再認識させると目に見えて高精度になっており、その後別の文書を読み取らせてもやはり高い認識率を維持している。「認識辞書を楽に鍛えやすくなった」という感じ。 あと、環境設定→その他→その他の設定→認識前後の処理を自動化する で「文字列の複数置換」にチェックすると、認識と同時に置換処理が完了するのはありがたい。辞書を鍛えても時折残る誤認識をこれで全自動で潰し込めるのは大変良い。 ただし惜しいのは、PDFからOCRを行う場合に使う「Acrobatプラグイン」での「PDFから自動で認識」モードでは、この自動複数置換が機能しないこと。多量の書類を予めPDFにし、後からOCRしようと考えているような人(ScanSnapユーザーなど)には、大きなネックとなりそう。 以前に比べればかなり誤認識が減っているとはいえ、より完璧を期した透明テキストPDFを作成したい場合は、「PDFから"手動"で認識」モードで1ページづつ認識→Acrobatへ送る(重ね合わせ)を繰り返すことになる。 これと同じ欠点は「OCRファクトリー」の自動処理にもある。まったく何のための自動実行なのか、と疑問が大きく残る。 なお、同じ設定画面の、画像データ入力時の処理「原稿の向きの自動補正」は、変えなくても良い原稿の向きを変えられることがあり、向きが間違ってないならチェックを外した方が良い。その他の機能拡充も特に目覚ましいものはない。 正直なところ買うべきかどうかかなり迷う。ただ登録ユーザーは3900円でダウンロード版(名刺OCRなし)を買えるらしいので、今回は安く上げてガンガン改善要望をぶつけるというのもありかもしれない。 長文スマソ。
315 :
名無しさん@そうだ選挙にいこう :03/03/25 17:45
>>314 報告ありがとう!
認識率の向上は買いなのかな。
参考にします。
(^^)
319 :
名無しさん@そうだ選挙にいこう :03/04/18 17:29
320 :
動画直リン :03/04/18 18:38
>>321 スマソ。適度に改行入れるべきとは思ったんだが、
縦に長くなりすぎてもマズーと思いまして。
そろそろ試用期限が来るけどまだ決心がつかない。うーん。
∧_∧ ( ^^ )< ぬるぽ(^^)
お久しぶりの 255 です。 皆さまからの貴重なご意見をいただき、上司に相談してみました。 結果・・・ 東芝 ExpressReaderPro とADF機能付きネットワークスキャナの購入が決定してしまいました! 。。。皆さん笑ってやって下さい。。。 思いっきり墓穴を掘り、自ら埋まり込みそうな今日この頃の自分です。。 くっそーー! こうなったら数十万円するスキャナとOCRの実力を見てやる!とことん使い倒してやるワイ! ・・・5月病まっしぐらの香具師でした(泣
>>324 お久しぶりです。私の書き込みが少しはお役に立ったのかもしれないと
思うと、嬉しく思います。
ADF機能付きネットワークスキャナは、255さんの仕事以外にも
役立つことがあると思います。ExpressReaderPro は、まあ最高水準とは
いえ、現時点ではけっこう泣かされると思いますから、1勝1敗といった
ところでしょう。
>326 ええ?! そんなに泣かされちゃうんですか? 私、結構打たれ弱い性格なんですが・・・ せめて1勝1引き分け位になりませんか? 教えて君で誠に申し訳ないのですが、ExpressReaderProのどのあたりが「DQN」な部分なのでしょうか?
>>327 DQNではないです。いいソフトだと思います。
ただ、今の技術水準ではまだ足らないということです。
99.9%の識字率でも、1000字に1字間違えますので、
人の目でしっかりチェックしないといけない。
そこに時間を取られます。
しっかりした原稿をしっかりスキャンできれば、
比較的精度は高いと思いますよ。
つまり一言一句間違えてはならないような文書であるのであれば、その何十冊もの本を 自分で全部読むことになる訳だ。 まあ地獄に落ちて拷問されるよりマシだと思って、頑張って下さい。 一人でやる訳じゃないんでしょ? ちなみにOCR作業で見た文書って意外と頭に残らないんだよね。
330 :
名無しさん@そうだ選挙にいこう :03/05/04 21:30
しかし、全部の本が頭に残ったら、凄い博学になっちゃうね。
それが残らないものなのよ。 文字や単語は覚えてはいるのだけど内容はええと何だったっけ?ってことが多い
332 :
名無しさん@そうだ選挙にいこう :03/05/14 02:24
>331 ワラタヨ 確かにそういうもんかもしれない
来週早々ExpressReaderProが納品になる。 な ん と な く 鬱になっている自分はなんなんでしょー?。。。
人間だったということです
>>255 心配するな。
余りの効率の悪さに、途中で作業中止命令が出ると思うから。
もしくは
上司 「(゚Д゚ )ゴルァ!!
>>255 『たかが』OCR作業に、いつまでかかってるんだ!
今月中に出来なけりゃあ、貴様クビ(か社史編纂室辞令)だ!」
>>255 Σ(´Д`lll)
‖
('A`) スキャナ ナンテ コノヨニナケレバ ヨカッタノニ...... サヨウナラ...
( )
|. | |
|
/ ̄ ̄ ̄ ̄
336 :
名無しさん@そうだ選挙にいこう :03/05/18 00:42
>335 >貴様クビ(か社史編纂室辞令)だ このあたり、ミョーにリアルなんだけど(w
338 :
動画直リン :03/05/18 01:12
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
340 :
名無しさん@そうだ選挙にいこう :03/05/22 23:28
保守age
∧_∧ ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。 =〔~∪ ̄ ̄〕 = ◎――◎ 山崎渉
342 :
名無しさん@そうだ選挙にいこう :03/05/31 00:04
344 :
名無しさん@そうだ選挙にいこう :03/07/07 02:04
フリーソフトでないよね??
345 :
名無しさん@そうだ選挙にいこう :03/07/07 02:58
346 :
名無しさん@そうだ選挙にいこう :03/07/12 00:45
http://academy2.2ch.net/test/read.cgi/english/1029756768/113-118 の113です。
Gooniesという人の言っていることを読み、「国産OCRの英文認識力は糞」と
短絡してしまったのですが、このスレなどを見て、少し考え直しています。
Goonies氏なら、このスレで挙がっているようなOCRについて、ひととおりは
知っているはずです。すると、氏のOCRに期待する英語認識力のレベルが
かなり高いから、こういう言い方になるのでは? と思っています。
私がしたいのは、「日本語で書かれた英語の参考書で、英文の殆どは短文
であるものを、効率よくOCRする」ことです。
これなら、国産OCRで十分でしょうか? だとしたら、何がお勧めでしょうか?
効率がコストより優先します。
347 :
名無しさん@そうだ選挙にいこう :03/07/13 21:54
348 :
名無しさん@そうだ選挙にいこう :03/07/13 22:07
>>347 ご親切に、ありがとうございます。実は、この板で最初に発見したのが、そのスレで、
そこからこちらへ飛んできたのでした。もう一度、覗いてみます。
__∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉 ~ ̄ ̄ ̄ ̄
保守age
∧_∧ ∧_∧ ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。 =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕 = ◎――――――◎ 山崎渉&ぼるじょあ
(⌒V⌒) │ ^ ^ │<これからも僕を応援して下さいね(^^)。 ⊂| |つ (_)(_) 山崎パン
354 :
名無しさん@そうだ選挙にいこう :03/08/18 04:10
OCR用途がほぼメインでスキャナーを探しています。 スキャン対象の書籍はB5より小さいものがほとんどです。 エプソンのGT-8400Uあたりを考えているのですが、文字の認識率を上げるためには これより上のスペックのスキャナーが必要ですか?それとも、OCRソフトにこだわった ほうが良いですか?よろしくお願いします。
355 :
名無しさん@そうだ選挙にいこう :03/08/19 00:38
OCRの認識には300〜400dpiあればよく、 欲張っても600dpiあれば上等すぎます。 なので認識率のためには最低機種でも充分なのですが、 スキャン・スピードがストレスの原因となりますので その意味で予算の許す限り上位機種を買った方が スカスカ読み込めてよいでしょう。
356 :
名無しさん@そうだ選挙にいこう :03/08/19 00:46
なるほど、よく分かりました。 予算と相談して再検討してみます。 どうもありがとうございました。
これから仕事でe.Typistのv.1を使おうと思ってます。 恥ずかしながら今までOCRソフトを使ったことがありません。 ここを読むともうv.9まであるのですね。 ウチには大昔に買ったv.1しかないのですが、 やはり新しいものはさらに便利になってるのでしょうね。 初めてOCRを使ってみてその利口さに驚いてるのに 今はもっとスゴイなんてさらに驚きです。 v.1を使いこなしてからv.9の購入を考えます。 独り言シツレイ致しました。
359 :
名無しさん@そうだ選挙にいこう :03/09/29 20:02
ちょっとageちゃおうかな?
361 :
名無しさん@そうだ選挙にいこう :03/10/05 18:57
スキャナに付属してるetypistに、アップグレード版を買ってきて バージョンアップさせる場合、最初に付属版を入れてから 上書きでアップグレードするんですか? ウィンドウズのアップグレード版のように、 途中でだけ前バージョンが必要になるのですか? それから、一度、前バージョンを使ってアップグレードすると 他の人にその前バージョンをあげちゃって、その人が また自分でアップグレード版を買ってきて、その前バージョンを 使ってアップグレードすることもできますか?
> 最初に付属版を入れてから > 上書きでアップグレードするんですか? そうです。インストールプログラムが旧版の存在をチェックする。 > 自分でアップグレード版を買ってきて、その前バージョンを > 使ってアップグレードすることもできますか? ライセンス上できません。
363 :
名無しさん@そうだ選挙にいこう :03/10/06 16:05
>ライセンス上できません。 法律的に不可能という意味にとどまるのか それとも、物理的に不可能なのか、どっちなんだろうね?
OCR何でも相談室(無料) OI2O-69-OI96
OCRソフトでwinreader winexpressreaderと読んdeココ、e-typistの中間 くらいのソフトってないですか?読んdeとetのお試し版使ってみましたが もう少し日英同時変換の識字率UPを希望しているのですが。
e-typistのほうが日本語、英語(特に)とも識字率やスペースの空け方が 良いように思われますが、日英混在文章の識字ができないようです。 5万以下のOCRソフトでは、やっぱ読んdeココしかないのでしょうか。
> 日英混在文章の識字ができないようです。
んなこたあないでしょう。
読んdeココをつくってるA.I.ソフトって会社の製品は品質悪いですよ。
http://www.aisoft.co.jp/indexupdate.asp?NAME=KOKO こんなに不具合があって20メガも更新ファイルをダウンロードしなきゃならないの。
ソフトはちゃんと作ってあってあたりまえ、あとはどっちの機能が優秀か
だけが選択基準だと思ってる人は後悔するよ。
けっこうひどい品質(バグ、不具合満載)でも平気で発売してる会社あるから。
367さんありがとうございます。 ご指摘の通り、お試し版のe-typist ver.7では、日本語認識と英語認識と 二通りあり、どちらを使っても日英文字認識をいたします。 混在になると英語の文字認識がかなり悪くなるようです。英語だけの文章 であるならば相当正確に認識してくれるのですが。 結局、読取革命ver.7を購入することにいたしました。段組等を気にしない という条件でet,読んde,読革と比較した結果、読取革命がもっとも識字率 が高かったもので。 読んdeは長年使ってきましたが、識字に問題ありです。 367さんのご意見にはまさに禿同
ExpressReader PRO V4.0 高精度読取オプション 40万円はどうなんでしょうか。 認識率アップするでしょうか。
↓こういうのは、どう認識されますか。 工エエエエエエエ工
>>367 指摘の仕方はちょっとアレだけど,エーアイソフトの
やる気のなさっつーか技術力のなさにはホントにあきれるよな。
エプソンコーワもそうだし,98互換機の頃のEPSON本体もそうだったけど
エプソングループはソフトに関して相当低レベルだな。
企画と営業は間違ってないんだが。もうちょっとまともなプログラマー雇えよ。マジで。
>>371 もしかして開発は国外(アジア方面)外注なんだろか?
憶測&偏見ですみません。
なまじ親会社が大企業だけにそういう強制的な方針があり得る気が。
このOCR市場ぞくぞく参入状態はなんなんだ?
自己レスだが、 年賀状ソフトシーズン>紙で貰った住所録を登録したい>Excel OCR>ウマー ちうことかにゃ?
OCRエンジンの数自体は変わってない。 単に被せる皮の数が変わっただけ。
皮が増えたつーことはやっぱり市場性が認められたっつうことか。 デジカメでPCで写真を使うことを覚えた >どうせならこれまでの紙写真もCDに焼きたい >スキャナを持ってる人が増えた >つぎはついでにOCRも買わせろ。年賀状で住所録ニーズもあるだろ。
378 :
名無しさん@そうだ選挙にいこう :03/11/24 13:55
PDF形式をエクセルに起こせるソフトって? TWAIN非対応のスキャナーなのでpdfからの読み込みオンリーなのですが どなたかPDFファイル→エクセルってやってる人いませんか? (現在アクロバットより新規保存で一枚ずつ TIF形式にて古いソフトに て加工処理してます)よろしくレスおねがいです。
>>378 マルチポスト氏ね
720 名前:名無しさん@お腹いっぱい。 本日の投稿:03/11/24 13:50 ID:AST/A1H9
PDF形式をエクセルに起こせるソフトって?
TWAIN非対応のスキャナーなのでpdfからの読み込みオンリーなのですが
どなたかPDFファイル→エクセルってやってる人いませんか?
(現在アクロバットより新規保存で一枚ずつ TIF形式にて古いソフトに
て加工処理してます)よろしくレスおねがいです。
「一発!OCR Pro for 一太郎」を使っています。 雑誌の目次をOCRする目的で購入したのですが(スキャナもセットで)、 全くうまくいきません。写真やイラストの多いタイプがうまくいかないだけで なく、文字の大きさが異なっていたり、段組があったりする白黒のものでも 「領域設定」が、とても細かく勝手に設定され、誘拐犯の犯行声明のような 文字の大きさや種類がめちゃくちゃな文章になってしまいます。 そもそも、書類をOCRするのって、本でいうと、目次ではなく本文限定 でしていくことが前提なのでしょうか?
OCR結果と画像を両方保存すれば問題なし。
383 :
名無しさん@そうだ選挙にいこう :03/12/24 19:52
読み取り革命Ver.8はどうでしょうか?現在Ver.7を使っているのですが、 使い勝手に大きな差はありますでしょうか?お試し版ホスィ
手軽なOCRってないのかな。 デジカメ画像にある1行だけの文を読み取って、Excelの1セルに入れる。 それを連続処理できるようなもの。もちろん英数だけで良いのだが。 やはり海外のソフトを当たるしかないかな…。
385 :
名無しさん@そうだ選挙にいこう :03/12/31 03:47
381 :名無しさん@そうだ選挙にいこう :03/12/06 13:53 OCR結果と画像を両方保存すれば問題なし。 透明文字つきのpdfならひとつのファイルで実現できるよ。
387 :
名無しさん@そうだ選挙にいこう :04/01/23 16:08
活字認識じゃなくて楽譜認識ソフトの話題は皆無だな。 楽譜認識ソフトのスコアメーカー3.0(KAWAI)は、 音符や音楽記号の認識率100%レベルになったと思う。 パソにとっては、活字より音符の方が簡単だろうし。 今はパソが楽譜を演奏する時代になったんだよ。
388 :
名無しさん@そうだ選挙にいこう :04/02/10 16:00
名刺をOCRにかけて管理しようと思っているのですが、 csv等でのエキスポートだけではなく、取り込んだ画像データ も各人のデータとリンクさせてエキスポートできるような ソフトはありませんでしょうか? 一度スキャンした名刺は捨ててもいいようにしたいんですが、 これができないと、一つの名刺ファイリングソフトと心中しないと いけなくなってしまうので。。。
389 :
名無しさん@そうだ選挙にいこう :04/02/11 14:44
DOS/V MagazineでOCR特集。 etypistが選ばれてた。
390 :
名無しさん@そうだ選挙にいこう :04/02/13 14:01
あげ。
>>389 これね。記事を丸々ネットに載せるのって、雑誌社としてどうなのよとか思うが(w
http://www.sbpnet.jp/vwalker/series/testlab/art.asp?newsid=6250 まあ、このレビューではフラットスキャナでせいぜい数十枚試したくらいだろうから、
動作が緩慢でもデフォで認識率の高いe.Typistが評価高くなるのもわかる。
ただね、ADF使ったりして数百枚単位で処理するとあの遅さは耐え難いし、100枚制限もネック。
認識率は辞書の鍛え方次第で相当向上するし、使い込むと読んdeココの速さは効いてくる。
短時間の雑誌レビューでは、認識辞書を鍛えるなんて要素は眼中にないだろうからな。
まあでも読んdeココの図表・レイアウト認識のヘタレ度は認めるよ。V.10でどの程度マシになったかな。
392 :
名無しさん@そうだ選挙にいこう :04/02/21 02:08
CanoScan Lide 50 というスキャナを買って、e.Typist9.0の体験版でドイツ語を 読み込ませてみたのですが、遅いな、という印象です。 以前はスキャナはHPのScanJet 4c(SCSIインターフェイス)で、ソフトは 海外のRecognitaというのを使っていたのですが、現在のマシンより数段遅かったのに より早く読みとれました。 これは、ソフトの違いということでしょうか。スキャナをCanoScan 8200 などに 変えても変わりはないのかな? あと、スキャナの読みとり速度で、 3.1msec/line(600dpi) などと書いてありますが、msecってどういう単位なんですか? この値が大きいほど速いのか、それとも遅いのか、教えてください。
>>393 このソフトよりも、e.Typist体験版の方が、ドイツ語認識率はよいようです。
読んdeココVer10出たね レイアウト認識はだいぶましになった。 まあUPGは4900円だから、そのくらいの値段の価値ならあるかな
亀レスだが、OCRには300-400dpiあれば十分。 600dpiではかなり重い画像になるので、メモリ上処理が遅くなるのかも。 もちろんモノクロ画像にした方が軽くなるし。 あと海外ソフトは日本語処理エンジンがないぶん、相当軽くて速いのだろうと思う。 海外文献しか読まないのなら、国内製品はパスした方がいいだろうね。
エー・アイ・ソフト 読んde!!ココ Ver10 松下電器産業 読取革命 Ver.8 メディアドライブ e.Typist v.9.0 上の三点を使ってみましたが、「読んde!!ココ Ver10」が 一番グーでした。雑誌専門ですが 「読取革命 Ver.8」レイアウト認識は いいのですが認識率が悪いです。ほかのソフトと比較すると かなり修正がいるので数回使用してやめました。 「e.Typist v.9.0」と「読んde!!ココ Ver10」比較すると 「読んde!!ココ」の方が早いし認識率も少ないです。 「e.Typist」のバージョンアップで良くなることを期待しましょう。 A.I.ソフトっていう会社「367」さんがおっしゃるようにほかのソフトはあまりっていうかほとんど使い物になりませんが、 読んde!!ココはVer8(?)位から良くなったという印象です。
>399 DiskX Toolsはかなりイイと思うが。
401 :
名無しさん@そうだ選挙にいこう :04/04/12 07:36
age
ちょっとプリンタ印刷物からデータ化する必要ができて、ほとんど 使ってなかかった EPSON GT-6600U+付属の「読んde!ココ for EPSON」 で試した。しかし認識率悪かった。 予算がないのでソースネクスト「本格読取」を買ってきた。 まずまずの認識率で一安心。\2,079 だからこれでヨシとしよう。
403 :
名無しさん@そうだ選挙にいこう :04/05/03 07:39
age
404 :
名無しさん@そうだ選挙にいこう :04/05/07 19:53
v
405 :
名無しさん@そうだ選挙にいこう :04/05/18 00:02
光で読み取るの?
406 :
名無しさん@そうだ選挙にいこう :04/05/19 19:40
読んdeココ認識率悪いよ。なんだよアレ。
407 :
名無しさん@そうだ選挙にいこう :04/05/19 21:36
「超整理or」ってまだあるのかな?
408 :
廉価なOCRソフトで :04/05/24 03:45
2001/07/30(月) 23:59から始まったこのスレも、いまや2004年に突入。 息の長いスレ。 光陰矢のごとし。 EPSON7400Uを買うつもりです。 読んdeココって、あんまり認識率よくないんですか? バンドル版でなく、今OCRソフト買うなら何が良いでしょうか? 目的は、A4サイズの本をテキストデータ化することです。 内容は、PerlとかMySQLとかの技術書です。 ご意見をお聞かせください。 (*^ー゚)/~~
409 :
名無しさん@そうだ選挙にいこう :04/05/24 19:57
410 :
名無しさん@そうだ選挙にいこう :04/06/28 15:38
411 :
名無しさん@そうだ選挙にいこう :04/07/10 08:29
>>1 2万でなく、20万円出せば、そこそこ質の良いソフトが手に入るよ。
さらに、500万円近く出せるならば、手書き認識OCRも手に入る。
ソフトウェア板のスレ落ちた?
落ちたな。
etypistの体験版を使用してるんですが 100ページ以上のPDFファイルは どうやって分割すればいいんですか?
416 :
名無しさん@そうだ選挙にいこう :04/08/07 16:34
>>415 詳しくはPDFファイル関連スレに行かれるのがよいと思いますが、
「ページの抽出」(「抽出後にページを削除」にチェックを入れる)で分割し、適当な大きさに調整したファイルをつくればいいのではないかと思います。
ただ私はAdobe Acrobat Sandardを使っているので、Readerで同様のことができるのかはちょっと分かりませんが・・・
私からは別の質問なんですが、
e.Typistや読んdeココを使って、透明テキストを埋め込んだPDFファイルから、透明テキストを削除して、
また元の画像のみのPDFファイルにするにはどうしたらよいのでしょうか?
よろしくご教示ください
以前はフリーのPDF分割ソフトが公開されていたんだけどね。今は公開されていない。 海外のフリーソフト探せばあるかもしれないけど、Acrobat買うのが最も手っ取り早い。 透明テキストの除去を一括的に行いたいなら、Acrobatで一旦TIFFかJPEG出力して それをPDFに再作成するのが合理的かと。 バッチシーケンス組めば作業は楽だし、組むのもそんなに難しくないよ。
ちなみに30日間限定で全機能使えるAcrobat Professionalの体験版がAdobeでDLできるので、 分割や編集する機会が少ないのなら、それで済ませるのもよし。
あと、ここの「お役立ち情報」のところにPDF関係のフリー/シェアウェア情報がまとまっているので参考にどうぞ。
私は詳しく見ていないのでどれがよさそうとか分からないから自分で判断してね。
http://www.cs4u.co.jp/
それ1ページづつに分解しちゃうんだね。 マルチページPDFにしてくれるといいのになぁ。
体験版の読取革命のPDF読み込みができない。 Readerを起動して画像を変換してるって表示されたまま いつまでたっても終わらない AcrobatReaderは、6.0.1
423 :
名無しさん@そうだ選挙にいこう :04/08/12 14:04
供述調書のように、罫線間に文字が記載されている文書のOCRはどうすればいいの? 読んでココ!だと認識領域外になってしまい全然認識してくれない。
手動でレイアウトすれば?
425 :
名無しさん@そうだ選挙にいこう :04/08/17 00:43
E-TypistのVer10って値段はいくらだろう? ナントカ賞受賞記念の安いVer9アップグレート版が無償でVer10にできるけど Ver10待つよりこれ買った方が得かな?
426 :
名無しさん@そうだ選挙にいこう :04/08/17 00:47
公式HPいったら値段書いてあった。 Ver10アップグレート版は4900円で今のVer9キャンペーン価格と一緒か。 読んでココとの差をなくしたのかな。
>>423 亀だけど、
他のソフトも試してみたら?
etypistは読めたよ
去年の夏にe.Typistを導入しました。 秋にバージョンアップされてもう次のv.10.0ですか。 現行バージョンは認識などはほぼ満足していますが、 操作性というか、どこをいじるべきか分からないことが結構ありましたね。 このあたりの改善具合が気になります。
読んでココの最新版、製品版を購入しました。 で、このOCRを利用してPDFの文章を読み込みしようと思っています。 読みこむ文章は、e-bookです。洋書なんですが、パソコン画面 ではさすがに読みにくく、OCRにかけてテキスト化し、 それで印刷して読んでいきたいと思っている次第です。 読んでココの説明書には、acrobatを利用した"自動認識" (全ページ一括での認識動作)を行うには、テキスト化されているPDFでは 不可能であるとの旨が書いてありました。 (おそらく、コピー防止策だと思うのですが・・・) で、e-bookはテキスト形態の状態にするとテキスト化してしまいます。 勿論、テキストはコピー不可能なのですが、これは読んでココにも あてはるのでしょうか? 読んでココを利用して、PDF文章を一括で読みこみした方がいらしたら、 それがテキスト化された文章だったかどうか、教えてください。 お手数ですが、よろしくお願いします。
スキャナ付属の読んで使ってみたら大バカだったので体験版を試してみたけど,体験版もバカだった。 というより,機能は増えてても認識率そのものはあんまり変わっていないように感じた。 なんかアチラを立てればコチラが立たずみたいな認識結果になっていて。 扱う文書に下線や注釈,日本語英数字混在が多いせいかも知れんけどどうにかならんかな?
431 :
名無しさん@そうだ選挙にいこう :04/09/03 20:57
MY-QREADERはどうよ?
432 :
aotdog :04/09/04 22:01
初めて訪れて すいません PDFってPDFで良いような気がします OCR事始って言うソフトが出会いで色々試してみましたが いまは、etypistバージョン7(ふるー)で間に合ってます パソコンを始めてDOS上で動くWIN3.1の時代ですNECさんに聞くと 手書き文字を読み込むのに100万円位のソフトでした ソフト全般に言えると思うのですが、値段より 自分にあったソフト、つまり使いこなせるソフトが良いのでは ないでしょうか(使い込んだソフト)機能いっぱいでも 一杯ありすぎて・・使い方分からん で 使えない ではね!
433 :
aotdog :04/09/04 22:03
初めて訪れて すいません PDFってPDFで良いような気がします OCR事始って言うソフトが出会いで色々試してみましたが いまは、etypistバージョン7(ふるー)で間に合ってます パソコンを始めてDOS上で動くWIN3.1の時代ですNECさんに聞くと 手書き文字を読み込むのに100万円位のソフトでした ソフト全般に言えると思うのですが、値段より 自分にあったソフト、つまり使いこなせるソフトが良いのでは ないでしょうか(使い込んだソフト)機能いっぱいでも 一杯ありすぎて・・使い方分からん で 使えない ではね!
434 :
名無しさん@そうだ選挙にいこう :04/09/04 22:08
つまりMY-QREADER>>>etypistということか?
今度インターナショナル版はOmni SEに変わるみたいですけど、どんなもんでしょ。 肝心のOmni Proの方は日本代理店価格はぼったくりですねぇ。 #現地で購入したOmni Pro 8.0正規版もっていても、 日本ではアップグレードパッケージ輸入できないみたい。
436 :
名無しさん@そうだ選挙にいこう :04/09/15 06:40:08
ocrみんな使わねーの?
OCR使って効率が上がるような業務って、そんなに多くないんでは? 趣味で使うもんでもないだろうし。
俺は完全に趣味だよ 辞書、辞典のたぐいばかりやってる。
439 :
至急 :04/09/15 12:49:08
etypistで表を取り込んでそのまま表としてhtmlファイルにする一番簡単な方法教えてください。
パッチ書けばいいじゃん
マクロでいいじゃん
445 :
名無しさん@そうだ選挙にいこう :04/09/17 23:38:12
e.Typist 10買った人います? 認識率上がってますか?
OCRソフトはやっぱそれなりに高価なものじゃなきゃだめかな。 会社で7〜8000円程度のOCRソフト使ってるけど化けすぎる。 ソフトがそれなりなのかそれとも読み込みで300dpiなのが少なすぎなのか。 どうでしょう? ちなみにエクセル用で7〜8000円、ワード用と合わせると13〜14000円のソフト
うちは400dpiで本のスキャンしてるけど、大抵は8割9割読むよ
449 :
宮沢 :04/09/21 21:17:52
MY-QREADERは、日本語の縦書き文書に強いが、英文混じりの日本語を読ませると、 意外と弱い。つまり、英文が隙間(単語の間のスペース)が認識差あれず、詰まった 形になり、使いにくい。 ハードウェアで処理するので、100頁は3分で終了します。やはり、業務用のため でしょう。しかし、英語混じりの日本語を処理したいのなら、「読取革命」を勧め ます。漢字も半角認識しているみたいです。そのおかけで、英文もきちんと単語ごと に区別しています。漢字もまれに、半分分ける形で認識される(まれ)ことがある ので、びっくりすること。 Typistは、英語だけした方がいいです。日本語混じりの文を読ませると、英語の方はまあ、認識できるけれど、日本語はどこかつまずくと、なぜか、その後の文がめちゃくちゃで、とても見られません。 市販のOCRの欠陥は、認識した後の修正が大変不便で、読めない漢字なんか、入力する方法がなくて、呆然することも。候補漢字でさえ出してくれない。。。日本語は出しても、英語のミスに対してはしらん顔というソフトが多い。 だから、横書きの日本語の文書だけ使うつもりなら、市販のOCRソフト、縦書きの方が多いのなら、MY=QREADERがいいのですが、ただ、ハードウェア式なので、30万円近くします。。。
450 :
名無しさん@そうだ選挙にいこう :04/09/27 07:52:40
業務用で数十万ぐらいの性能のいいやつってないのかな。 読んでココとか使ってるとアホすぎるし改善できそうな要素がいっぱいありそうなんだけど
あるよ、このスレにも出てきた
452 :
名無しさん@そうだ選挙にいこう :04/09/29 15:28:22
読取革命 Ver.9 はそろそろですかね?
例年通り
454 :
名無しさん@そうだ選挙にいこう :04/10/03 12:50:07
読んdeココ10の認識率って、他社と比べると酷い気がする
eTypist ver.10の感想キボンヌ
>>456 読取革命、本格読取がいいらしいと聞きました。
本格はひどいよ
現状でもよっぽどひどいソースじゃなければ 8、9割認識するしいいと思うんだが・・・ タイプが早い人なら自分で打った方が早いのかな?
体験版で比べてみたけど、読んdeココ10はカッコ系()とかの記号や、複雑な文字が並んでる部分、英語の小文字大文字の認識が悪く感じた。 読取革命8はちゃんと()とか認識してくれて、細かい所で読んdeより間違いが遥かに少なく感じた。 英語モードはどっちも良かった。 eTypist ver.10はインストールしようとするとエラーが起きるのでやってない。
定番ソフトってのが出てくるのはまだまだ先の話なんでしょうかね・・・。
君の求める定番と世間の求める定番との差は大きいみたいだね もうくるな
?
etype、読んであたりは定番って言っていいとおもう
今読んでココの10使ってるが、なかなかいい認識率では? 3年前のものより格段によくなってるような つかいこんで、よい使い方がわかってくれば、もっと効率よく 作業できそうだ。これはいい買い物をしたかも。
467 :
名無しさん@そうだ選挙にいこう :04/10/14 03:25:21
まあ、読んでとetypeを買っておけばハズレではないな
468 :
名無しさん@そうだ選挙にいこう :04/10/14 15:15:03
>>465 だな。
仕事で資料を取り込む必要があったんで「長く使わないから体験版でいいや」って適当にココにしたんだが、
ひさびさに感動したぞ。
スキャナなんて買ったはいいがあまりつかわないでいたが、これはいいよね。
まぁ、難点を言えば(体験版だからかもしれないが)
ワード形式にしたときにレイアウトが変わっちまうことかな?(用紙サイズの都合?)
スキャニングしたときの変換精度は感動ものだよな。
世の中進んだものだ。
OCR IME 翻訳ソフトとか昔を知ってる人なら 進歩してるのが実感できるけど、 パソコンが万能だと思ってて初めて使うときは そうじゃないみたいだね。
7〜8年前は、変換して誤りが1文字も無い行が1/3くらいだったが、今は誤りのある行が 1/3という感じ。格段に進歩している。
471 :
名無しさん@そうだ選挙にいこう :04/10/22 23:41:24
「ワンタッチOCR Ver.2」で出来ることは 「読んde!!ココ Ver.10」でも出来るということでしょうか? メーカーのホームページでそれぞれの紹介を見てると 「読んde!!ココ Ver.10」は「ワンタッチOCR Ver.2」の 上位互換のような感じがしたものですから…。 どなたか違い・特徴を教えて下さい。
472 :
名無しさん@そうだ選挙にいこう :04/10/23 12:52:07
WinReader PRO v.6.0を使っているのですが、 画像ファイルから読み込めるとのことで、 IEに表示画面を保存して読み込もうとしたのですが、 文字の認識をしてくれません。 どうすれば認識するようになるのでしょうか?
↑質問の意味を認識できませんでした
>>472 画像の拡張子の関係で読み込めないって事?
皆さんレスありがとうございます。 分かりにくくてすみませんでした。 ブラウザで文字を表示している状態をキャプチャして その画像をOCRで読み込んだ上で、 その文字の部分を認識しようとしているのですが。 画像の形式はbmpとjpgの両方試してみました。
画面表示の解像度は100dpi位でOCRには、ちょっときつい。 表示フォントのサイズを大きくしてみたらどうでしょう? FAXが200dpiだから2倍のフォントサイズくらいは欲しいところ。
そういうことだったんですね。 まったく知りませんでした。 Win Shotというキャプチャソフトのdpiをあげても 全く反映されなかったのでまだわかりませんが、 プレビューで拡大したものをPrintScreenでキャプチャして 読み込んだら、一応認識「は」してくれました。 但し誤認識だらけでしたが…。 ということで477、478さんありがとうございました!
>>479 あの、HTMLを保存するか、テキストを選択してコピペした方が早いと思われますが、、、
何の実験ですか?
>>479 拡大したら認識率おちるよ
WinShotだと72dpi(bmp)で保存されるからGIMPとかを使って200-400dpiにするだけ
>>480 コピペできないページもあるし、PC画面のOCRしたいときもあるでしょ。
482 :
名無しさん@そうだ選挙にいこう :04/10/29 23:53:09
スンマセーン
どなたか
>>471 の質問に答えてくれませんか?
>>482 両方とも体験版があるから
誰も答えないのですよ。
自分で試して判断しろってこと
484 :
名無しさん@そうだ選挙にいこう :04/10/30 20:45:06
etypistの9を使ってますが、認識率が非常に悪い。 表を読み込もうとしてるんですが、半角数字すらまともに読んでくれない。 日本語にすると二文字いっぺんに読むし、英語にすると該当なしになる。 レシートでよく使われるようないわゆるOCRフォントなのに読めないとは どういうことだろう。 使い方が悪いのか読ませる原稿の質が悪いのか、今までまともに使えたことは無いなあ。 もう僕疲れたよ、、、、
英語モードだと候補文字も出ないし、そもそも認識すると 勝手に画像全表示に縮尺を変更するのでスペルチェックなどの 対話モードもまともに読めないし、つ、使えん!
他のソフト試してみたら?
489 :
名無しさん@そうだ選挙にいこう :04/11/02 15:20:29
e.typist で、専用のスキャンユーティリティを使いたいんだけど 通常の TWAIN ドライバしか使えないんだけど どうすればいいの? スキャナ設定で、TWAINドライバを使わないように設定しようとしても チェックボックスがグレーアウトしてて使えないし・・・ 専用スキャンユーティリティに対応した CanoScan LiDE 40 使ってます
490 :
名無しさん@そうだ選挙にいこう :04/11/03 08:11:26
age
255氏はどうなったのかな・・・・気になるなあ 社史編纂室かな
492 :
名無しさん@そうだ選挙にいこう :04/11/04 14:49:39
493 :
489 :04/11/06 09:17:28
e.typist 10 にアップグレードしたら問題なくなった なんだったんだろうか でも、e.typist10 で、自動アップデートをかけようとすると メモリ周りのエラーで落ちるのは仕様ですか?
本格読取に読取革命の体験板入れたら(ry って言うのを見たことがあるような、ないような。 誰か知らない?
495 :
名無しさん@そうだ選挙にいこう :04/11/09 23:50:06
CANONのPIXUS買ったら読取革命Liteが付いてた。 最近のCANONのスキャナーには読取革命が付いてるの?
読取革命9の体験板ダウンロードが見当たらないのは発売前だから?
そうです。
499 :
名無しさん@そうだ選挙にいこう :04/11/10 22:50:46
読取革命Lite なかなかいいです。 読んde!!ココ Ver.10を買ってたけど、これより精度が断然よい。 エーアイ金返せ!!!
500 :
名無しさん@そうだ選挙にいこう :04/11/11 19:51:08
500
501 :
名無しさん@そうだ選挙にいこう :04/11/13 21:23:24
エクセル変換のOCRで何か良いものありませんか? 見積書スキャンしてエクセルで計算したいいですけど。
502 :
名無しさん@そうだ選挙にいこう :04/11/13 23:33:34
503 :
名無しさん@そうだ選挙にいこう :04/11/18 14:20:48
e.typist VER10 で認識中に落ちます 結構症状でますが みなさんでませんか?
504 :
名無しさん@そうだ選挙にいこう :04/11/19 07:43:43
読取革命8と7がMXであるが、おちてこねーよ。 誰かupしてよ。 できればshareの方が早くていいんだけどwww
>>503 毎日使ってるけど落ちたこと無いよ
PC環境書いてくれないとアドバイス出来ないよ
506 :
名無しさん@そうだ選挙にいこう :04/11/19 22:23:17
読取革命9の体験版ないの?
ここで聞くよりサイト見た方が早くない?
>>506 サイト行ったけど見つけられんかった。8のときは簡単に見つけられたのにね。
すいませんがリンク貼ってくれませんか?
511 :
名無しさん@そうだ選挙にいこう :04/11/20 08:36:39
>505 さん どうもです。 e.typist ver10 落ちる件ですが BIOS、ビデオカードドライバー XP等 いろいろやってみました 結果は 単語登録検索で単語の登録しすぎかも、あるいは文字パターン辞書の 登録しすぎかもしれません。 再インストールして 前の辞書使うとだめで(マイドキュメントにある辞書)、 インストール直後の辞書だとOKです。 単語登録多すぎたのかも知れませんね。 最初は使えていたのですが途中から落ちるようになりました。 最初からキャノンスキャナーについていた e.typist entryではOKでした このソフトは高機能だけど、設定の項目が判りにくいですね 辞書なら辞書で一箇所にまとめて欲しい それと、縦のカタカナ文章って《ページ》の横棒とか カタカナにはないのですよね 1、I、| とか使われますね 一括置き換えで何とかなりますが、日本語の仕様だから仕様がない? 後は 、 。 . の句読点などでしょう ご認識ですかね 日本語は複雑だな あと外字も使えると趣味で使うには楽しいですね。
>>511 メーカーが再現できるようなデータを送りつけて
直せっていうと直してくれる場合もあるよ。
513 :
名無しさん@そうだ選挙にいこう :04/11/20 10:29:57
>512 そうですね ありがとうございます 他の症状の件もあるので、検証中です その後ですね とりあえず落ちる原因がわかったので使い込んでみます 違う件でサポートには連絡してあって、メールで連絡して 欲しいとのことでした。 日本語は大変だな プログラマーさん お疲れさんです 漢字、ひらかな、カタカナ、アルファベット、横書き、縦書き レイアウトなど これらを実用域で99%認識するのは神技ですね
>>512 >縦のカタカナ文章って《ページ》の横棒とか カタカナにはないのですよね
よく分からないけど縦書きフォントの”ー”じゃ駄目なの?
俺に聞いてるの? 元の文書いてないからよくわからんけど,文章の途中の1文字だけ フォントを変えるのは良くないだろう。ソフトが 縦書きか横書きかで自動的にフォントを変えるべき。
516 :
名無しさん@そうだ選挙にいこう :04/11/21 08:26:06
>514 そうです カタカナのバーですよね → | これは誤認識しますね OCRは10年前に比べれば、凄く良くなった でも、縦の文章は認識わるい というより、日本語の曖昧さで その文字がないんですよね? こうなるとOCRソフトがフォントを自前で持つしかないのでは ないかな。 辞書切り替えで 横文章、縦文章に対応できますけどね。 あと、外字にも対応してもらいたいな。
>>515 縦書き認識すればいいだけでは?
フォントも切り替わるし・・・
何でオレが聞かれるてるのか良くわからんけど・・・ あれじゃないのかな。縦書きだと形は|みたいになるから, 認識したとき「ー」になってくれないっていう話じゃないんかなあ。 できれば最初に質問した奴に言ってあげて欲しい...
>ソフトが縦書きか横書きかで自動的にフォントを変えるべき この一文のせいかと
511は学習させればいいんじゃないの? ただ俺はページが読み取れなかったことはないんだよな よっぽど元原稿が汚れてるんじゃないのかな
ああなるほど。 だって > 縦書きフォントの”ー” って書いてあるから そこだけ自分でフォント変えたら?っていう意味かと思ったんだもん。
522 :
511 :04/11/22 11:28:35
落ちる件と縦書き文章誤認識は別件です 落ちるのは解決済みです(単語登録多かったようです) 縦文章で カタカナの言葉を伸ばす 文字や、句読点、などが もう少しきれいに認識できないのかなと思っているんですけど 、ソフトの問題でなく、日本語フォントの仕様なんですね 外字は使えないと言うことですし、範囲内で当てはめるしかないのでしょう 私は仕事に使ってるわけではないので(趣味ですから)、高度な仕様は 必要ないのですが。 でも昔のOCRソフトから今のソフトは良くなっていますよ
523 :
名無しさん@そうだ選挙にいこう :04/11/22 22:03:36
新しく出た読み取り革命どうなの?使った人教えて。
525 :
511 :04/11/22 23:36:55
体験版早くだしてくれ よみかく。
526 :
名無しさん@そうだ選挙にいこう :04/11/23 16:22:02
>>524 じゃあ俺は読んでココ11を買ってレポートするから
お前は読取革命9買ってレポートしろ。
正直,読んdeココのレポートはもう要らない。 完全対象外。
528 :
511 :04/11/24 10:43:03
よんココ 体験版あるよ 30日限定
どうせ主観だらけのレポートになるんだから いらない
自分が損したくないから他人を使うのは関心しない
>>437 亀。
俺は趣味でOCR使うつもり
本をテキストファイルにして、読み上げソフトで読ませるつもり
ScanScnapは、もう買った
遊びとして、なかなか面白いと思うのだが・・・
SSはOCRには向かないってFA出てるのに・・・
よみかく9の体験板もやっぱりウマーなんかな? ナローだから×だったら_| ̄|○
>>533 言い訳しないで自分で試せよ
自己中かえれ
536 :
名無しさん@そうだ選挙にいこう :04/11/26 01:10:19
読取革命9買ったぜ。画面の見栄えが良くなった。 ナビ機能は初心者にはGood。でも俺には必要なし。 フォルダーウォッチャーは何も操作せずに変換できるので 編集が必要がない場合は重宝しそう。 あとはページの入れ替えや一覧画像のリサイズもできるようになった。 認識率は前と比べて・・・比較する暇はない。
537 :
名無しさん@そうだ選挙にいこう :04/12/04 00:56:20
PDF→WORDに変換できるソフトありますか?
539 :
名無しさん@そうだ選挙にいこう :04/12/05 14:07:17
パナソニックの子会社(?)が「一発!OCR Pro2 for 一太郎」というのを出してるんだけど、 これって読取革命を別名でだしてるってこと?
541 :
名無しさん@そうだ選挙にいこう :04/12/10 11:53:40
会社で契約書を読みこんでOCRしてこれを修正するって仕事が あるんだが(つまり法務部門)、こういう用途には何のソフトがいいですかね? 今は数年前の読んでココ使ってるけど、修正がけっこう大変なので、 認識率のいいのがほしい。レイアウトは無視するので、このあたりの 機能はいりません。 あと英文の契約をOCRするのにはやっぱりそれ専用のがほしいんだけど、 こちらもお勧めはありますか?今はOmnipage Pro 10を無理やり使ってる。 本当に無理やりで、日本語winに普通にインストールするとOSが起動しなくなる。 システム部門に頼んでなんとか動くようにしてもらったくらい。 ちなみにソフトが必要になるのは、今度会社のPCが更新されるので、 併せてスキャナもソフトも更新したいから。Omnipage Pro 10ってWinXPでも 使えるのかな?使えるならそのまま使えばいいかも。
>>541 各社が体験版を用意してあるんだから
まず試してからにしろよ
対応してるかは、公式サイトを見るなりサポセンで聞くのが一番
543 :
名無しさん@そうだ選挙にいこう :04/12/11 09:46:56
544 :
名無しさん@そうだ選挙にいこう :04/12/12 17:15:44
>>541 英文は、日本語OCRにおまけで付いてくるヤツで十分だよ。
Omnipageは修正しやすいとおもう 認識率はどれも同じようなもん
546 :
名無しさん@そうだ選挙にいこう :04/12/13 03:47:05
OCRの精度、ってどの程度?
549 :
名無しさん@そうだ選挙にいこう :04/12/18 02:07:23
OCR使えねぇええええええええええええええええええええええ。 PCが、windows95から、一般化し、はや10年近くたとうとするのに OCRだけは未だに使えないレベル。 他のソフトでも一定以上使えるレベルになったのに。 ハードウェアの性能向上は目覚しいがOCRの性能が使えないレベル。 グラフなどになると、もう全然使えない、変換に時間かかりすぎる。 全くもって、使えない。いつになったらまともになる?
PCに向かないことさせようとしてもね・・・ 道具に合わせられないなら、一生無理だろうに・・・
すこし前の版だけど活字を読み込むのにはほぼ完成の域かと。 活字以外は知らないが・・・
元原稿に左右されるから 一概に性能が高いとも低いとも言えない
読取革命って何がいいのかなー。 e.Typistの方が低解像度原稿の認識精度高くてうれしいんだけど。
\ / \ / (●)(●) (●)(●)(●) \__ (●)(●)(●)(●)__/ カサカサ (●)(●)(●(●)(●) __(●)(●)(●)(●)(●)__ / (●)(●)(●)(●))(●) \ __(●)(●)(●)(●)(●)__ / (●))(●)(●)(●)(●) \ __(●)(●)(●)(●)(●)__ / (●)(●)((●))(●) \ (●)(●)(●)(●) カサカサ (●))(●)(●) (●))(●) (●)
画像を文字として認識する能力はどれも同じようなもの。 しかし,候補文字の中からどれを選択するか, あと,画像からどの範囲を1文字とするかとか 前後の文字から適当なものを判断したり ユーザーの行った修正を学習して次の判断に考慮する ゆがみをどう補正するかなどに差がある。 ソフト全体の使いやすさにも差がある。 エーアイソフトはこの辺が酷い。ユーザーの使い勝手なんかどうでもいい, とにかく何も知らない人が店で見てつい買ってしまう営業宣伝文句至上主義。 以前は乗換えとバージョンアップでかなり価格差があって 貧乏なオレは読んde!!から他に替えられなくて10年近く使ったが もうサヨナラだ。
>>556 それは、自分に合わなかっただけじゃないの?
俺は、革命が一番使いやすかった
その次に読んでここ、使いづらかったのはetypist。
んー,主観的な評価なのは否定しないけど。 「こんな機能追加しました!」とか騒ぐ前に もっと直すところあるんじゃネーノって感じ。 「@」が「(D」になるのを認識辞書に@を登録したあとやり直しても 同じ結果になるとか
それは登録が失敗してるかスキャンが汚いかどっちかだとおもう 少なくともうちは平気だし、登録しても同じ結果になるとは聞いたことないし
意味不明
読んでのバグを指摘すると必ず「うちではそんなこと起きない」と 書く奴が一人いるみたいだな。
562 :
名無しさん@そうだ選挙にいこう :04/12/22 03:14:39
>>550 、OCRって、PCに、向かないの?
>>551 、そう?
研究論文、グラフなどを引用するのに使いたくて使いたくて。
っでも使えねぇし。
趣味の2次元美少女画像を取り込んでみたいが、やったことねぇし。
新聞の変換などもアレなレベルだし。ひたすら使えねぇ。
563 :
名無しさん@そうだ選挙にいこう :04/12/22 07:12:12
だいたい、スキャナ取り込みっとゆう手順からしてアレな気がする。 仕方ないけどさ。 スキャナで、それこそ、300ページ取り込むだけでも、時間かかるは、それを、 OCRに1枚1枚するのが、たまらん。
>>563 ADF買えば解決。
ドキュメントスキャナなら取り込んですぐOCRかけて
まとめてPDF出力する機能も持っているものがある。
文庫本一冊で3、4時間かかるからね・・・
英字の斜体が割と頻繁に出てくる文書が多いんですが、 斜体の認識率を上げる設定とかありませんか? 読革、読んで,イータイプ試したんですがどれもいまいちでした。 単語登録しても,2文字が1文字になったり,単語間のスペースが 認識されなかったりします。 それと、テキストボックスははっきりいって修正がしにくいので、 書式とか、フォントサイズとか、段組とかはいらないので 保存形式でテキスト+空白+図形だけが保存できるようにできないでしょうか。
名刺読み取りってよく雑誌で取り上げられているし、ソフトも スキャナつきで店頭で見かけるけど専用スレッドが見つかりません。 こちらでいいんですかね。 「あんなもん使えねぇよ」ということで2ch的に結論が出ているとか? 雑誌の評価をみるとそそられるんですがね。 鵜呑みは危険と解ってはいるんですが。 早くvCardでのやり取りが当たり前になればいいんですが。 こちらでいいんであれば各社のリンクは探してみます。
>>568 vCardってなんか知らんが、世の中デジタル人間ばっかじゃないし、
紙の書籍がなくならないように名刺もずっと使われ続けると思うよ
7年前から使っていますが、意外と使えます。 デザインに凝った名刺はダメですが。 名刺専用だと、住所、氏名、会社名などの辞書を使って認識補正をしてくれるせいか 普通のOCRとは認識精度のレベルが違う。
>>568 2ちゃんの結論って信じられるのはどうして?
>>568 使ってる人が少ないので
ぜひ人柱になってください。
>>569 まぁたしかに「担当の○○です。よろしくお願いします」なんていいながら名刺を交換することがなくなるとは思わない。
Palmがはやり始めたころ、ビームで自分の情報を飛ばすって言うのができるよっていうのがあったけど結局数回しか
やったことなかったし、やったのも遊びでやってただけだし。ただよく考えると、メールなり何なりデジタルで送ったほうが
お互い楽なんじゃないかと思っているだけ。ちなみにvCardはこんなもの。
ttp://www.itmedia.co.jp/mobile/0103/05/keyword_2.html Outlook、最近の携帯では結構使われているような。Outlookのアドレスをメールに添付して、携帯に送るとそのまま登録
したりできます。もっとも自分は携帯には電話番号と名前くらいしか登録しないからわざわざそんなことしないけど。
Thunderbirdは自分のvCardをつけたり、添付されているvCardを取り込むことはできるみたいだけど、任意のアドレスを
送るって言う機能はなさそうですね。すでにはやることなく廃れつつあるのかもしれない。時代はQRコードか?
ttp://qr.quel.jp/whatsqr.php >>570 どの製品をお使いですか? どうせならまだ使っていないのを私が買ったほうが人柱としては面白い? でも安いのしか
買わないです。多分。専用スキャナはついていたほうがいいと思いますか?
名刺用の辞書を持っているから認識率が高いというのは考えたことありませんでした。
>>571 2chの結論だなんて信じていない。ただ、世の一般向けパソコン雑誌では定期的に取り上げられている分野なのに
取り上げられているスレッドがないのは何でなのかな、と思っただけ。
>>572 どれかリクエストありますか? 安いやつしか買わないよ。
574 :
名無しさん@そうだ選挙にいこう :04/12/27 03:44:51
>>564 、ADF、ってなに?
あの、読み取って、PDFにするやつアレは却下。使えない。
スキャナで読み取って、OCRにかけて電子化してそれを流用、参考にするのが目的だから。
PDF、はダメ。
>>565 、ね〜。まったく。
nyっで成年一般漫画ノベル文庫雑誌問わずにスキャンして放流してくれる人いるけど、
凄いね。ほんと。尊敬する。
こんな、糞作業、ってゆーっか単純作業たまらん。単純なくせして絶対に人手がいるから、
時間が、作業効率が。
自動スキャン作業、メカっとか、ロボっとか、1万くらいでできないかな?
ほんと、たまらん。
575 :
名無しさん@そうだ選挙にいこう :04/12/27 03:50:12
コピー作業とスキャン作業はたまらん。 特に、スキャン。どれだけPCが良くなろうが、スキャナ実機がの性能が 良くならない限り早くならん。 あと、昔、ハンドスキャナあったけど、あれのUSB2.0タイプが欲しいんだけど。 売ってねーし。ノートPCと、アレつかって、出先で配られて即取り込む。ってのを やってなんとか、帰ってきてからメインPCで、OCR化するだけにしておきたいんだけど。 スレ違い、板違いだな。ごめん。
>>574 > ADF、ってなに?
オートドキュメントフィーダ
> スキャナで読み取って、OCRにかけて電子化してそれを流用、参考にするのが目的だから。
OCR認識率は100%じゃないとだめってこと?
検索だけなら今の「透明テキスト付きPDF」で十分事足りるんだがな
> あと、昔、ハンドスキャナあったけど、あれのUSB2.0タイプが欲しいんだけど。
ハンドスキャナは平行かつ一定の速度で動かさんといかんから難しいよ。
シートフィードスキャナなら持ち運びできるやつありそうだけど
577 :
名無しさん@そうだ選挙にいこう :04/12/29 06:49:49
>>576 、流用が目的だから、どうしても電子化100lじゃないとダメなんだ。
そうしなければ他部門での使いまわしも聞かないし。いや、全部が全部ってわけじゃないけど。
オートドキュメントフィードね。個人ではちょっと。こういったの全て個人持ちだから。
最低限のものしか支給しないし。
当然PCも自作して、それを使っている。まぁ、古ぼけたのや、リース待ちなんかよりはよっぽど使えるし。
ハンドスキャナ難しいんだ。それでも新しいのださないかな。
>シートフィードスキャナ
これ、実物みたことないからわからないけど、小さいの?
ADFならセットして終わり。文庫本なんて30分もすれば自動で終わってる。 今時手差しでスキャンする馬鹿なんていないよ。
本を自動的にめくってくれるADFを紹介してください。
>>580 \10,000/ページ で俺がやってやるよ。
583 :
名無しさん@そうだ選挙にいこう :04/12/31 12:29:42
横から済まんが、既に印刷してある文章をスキャン⇒pdfになったfile からtext(誤判断可)にするには、どんなソフトがあるの? 教えてクンでした。
>>583 読んdeココとか。
というか、Acrobat7に読んdeココエンジンが搭載されるとか。
>>583 今のOCRなら大抵どれもその機能はあるよ
586 :
名無しさん@そうだ選挙にいこう :04/12/31 16:18:51
ともかく 3Qです。
読んdeココでPDFにOCRをかけると、フォーカスを取られて ウザイんですが、裏に回せることはできませんか?
>>587 質問の仕方がむかつく
新年そうそうだからなおさら・・・
いいからさっさと教えろよ、クズ。
わかったからもういいよ、この野郎
593 :
名無しさん@そうだ選挙にいこう :05/01/02 18:11:11
なんかこのスレ怖いよママン
594 :
名無しさん@そうだ選挙にいこう :05/01/04 12:38:31
読み取り革命、領域設定の仕方とかよくわからないんですが、なにこれ? 縦書きで「同一な」が「同△な」と読まれてしまい(「な」の上部を点と読んで、 「一」の横棒と併せて△と見たらしい」)、文字分離をすればいいのかと思って、 マニュアルにあるとおりやっているつもりなのですが、ダイヤログボックスの 「二文字分離」がグレイアウトしていて選択できないようになっています。 それ以前に領域の削除とかがイマイチよくわからず、サイテーです。 読んでココのver.6でやってみたほうが操作性、認識率とも段違いによかったです。 金返せ、松下!PCもシェーバーもOCRも、おまえんところはカタログスペックだけだ。
>>594 お前すごいバカ。無知。能無し。クズ。ゴミ。どうしようもない。役立たず。
お前に見捨てられてパナも喜んでるよ。
596 :
名無しさん@そうだ選挙にいこう :05/01/04 14:09:00
>594 アホか。パナが使えないことは常識だろうが
辞書をOCRしてるんですが 色とか太字とかも再現してくれるのはありますか?
あります。
600 :
名無しさん@そうだ選挙にいこう :05/01/12 18:09:07
原稿に赤入れが入っているとOCRの時じゃまですが、 この赤の色だけを取り除くことってできますか? それともみなさん、消しゴムツールで一つ一つ消しているんでしょうか? ちなみにOCRソフトは、読んでココと、読取物語を使っています。 いい案があったら教えてください。
601 :
名無しさん@そうだ選挙にいこう :05/01/12 19:01:06
赤セロファンの上からスキャンする
603 :
名無しさん@そうだ選挙にいこう :05/01/13 09:43:25
>>601 それは有効ですか?
ならばこれから赤セロファンを買いに走りますが…。
やったことないが、スキャン後の赤黒画像を白黒に変換すればなんとかなるだろ。 ただ、それを変換するツールがあるんだとすれば、 わざわざセロファン使わなくても、ソフトウェアでフィルターかければすむだけ。 # というのが写真屋(photoshop)の意味
605 :
名無しさん@そうだ選挙にいこう :05/01/13 17:03:09
>>604 どうもありがとうございました。
フィルターをかけるというのはやったことがないんですが、
一応手順の意味はわかりました。
では、ocrのソフトのほうで色を指定して消すと言う機能
はないんですね。残念…
なんか感じ悪いな・・・
608 :
605 :05/01/14 18:43:50
>>606 すみません。そんなつもりはないんです。
>>607 え! 読取物語V4使っています。
どこにそんな機能があったんだろう、調べてみます。
ありがとうございました。
読取物語は非常に使いにくいソフトですが、
普通の文章の認識率はかなりいいので、気に入っています。
読んでココよりいいと思う。
但し新聞記事のような段組などには全然ダメです。
これは、読んでココのほうが断然いい。
OCRの命は認識精度。 PDFに出せようが翻訳できようがそれはあくまでも補助。 認識に関しては3万以下クラスの中では読取物語が間違いなく最高。 リコーなんていうダメメーカーが出してるから売れてないし 更新もされていないが。
610 :
605 :05/01/15 14:11:17
>>609 ですよね〜。
でも、あの使いにくさは何とかならないものでしょうか。
慣れるまでに相当時間かかるし、慣れても使い勝手が悪い。
読んでココの使いやすさと、読取物語の認識率が合体
すれば最高のソフトになると思うんですが…。
高価でもいいので、そんないいソフトありませんか?
それから、読取物語でカラーのドロップアウトができるの
教えて下さったかた、ありがとうございました。
わかりました。
スキャンするときのtwainの設定のところでできました。
同じスキャナなのに、読んでココではできないんですよね〜。
611 :
名無しさん@そうだ選挙にいこう :05/01/15 14:12:15
612 :
名無しさん@そうだ選挙にいこう :05/01/15 15:31:05
e.Typistって良くないの?
誤爆でした。
614 :
初心者 :05/01/21 05:51:04
表OCRforEXCEL V4.0 L10を買ってかなり経ちますが、文字ボケで 使い物になりません。サポートもフリーダイアルじゃないし金かかって どうしようもない。 文字のサイズも11〜28位で試しても全くだめ。何でなんでしょうか?
>>614 解像度は?
あと他のソフトの体験版があるから試して見れ。
616 :
名無しさん@そうだ選挙にいこう :05/01/25 11:20:49
617 :
初心者 :05/01/26 06:14:56
>>615 400です
どんなのがお薦めでしょうか?
>>617 表OCRforEXCEL V4.0 L10です。
これも使いこなせないなら何使っても一緒かと・・・
620 :
名無しさん@そうだ選挙にいこう :05/01/27 03:49:02
欧文に強いOCRってありますか? omni pageなどを考えています。。。
622 :
605 :05/01/28 18:28:53
また、教えてください。 読んでココで、ocrしたテキストを画像と同じファイル名で 保存したいのですが、どうしたらできるのでしょうか? 実は以前necのパソコンで使っていたとき、これがいつの間にか 出来ていたのです。今回FMVにインストールしたら、どうやっても できない。 necのとき、どこを設定したのか全く記憶にないのです… サポートセンターに聞いたら、ocrファクトリーがどうのこうの という返事が返ってきたけど、ocrファクトリは使っていないのです…。 というわけでサポートセンターの言うこともちょっとずれていて…。
e.Typist v.10.0 プラスアジアってのが出たので お,やっと〜と思って体験版入れてみたけど・・・ なんじゃこりゃ・・・ やっぱ専用の買ったほうがいいみたいね。
何がいいたいのか分からん
625 :
名無しさん@そうだ選挙にいこう :05/02/01 17:41:18
1.e.Typist v.10.0 2.読取革命 3.やさしくPDF OCR 2と3はサイズが大きい(ページ数の多い)PDFファイルだとメモリー不足で終了する。 ※アプリがPDFを画像ファイルに変換(印刷)している模様。 使えるかはデモ版で試せ。他にもありそうだが今のところ事足りているので知らん。
>>625 読んde!!ココ Ver11 2005年2月25日発売予定で出来るらしい
>>625 ごめん、
>>627 はまちがいで、pdfファイルを入力に用いても、出力を同じ
名前の透明テキスト付きpdfファイルに上書きできるとは限らないなぁ。
Acrobat 7ならOCRソフト買わなくても出来たはず。
>>626-628 Acrobatだと修正とかの使い勝手があまりよくない、と
Acrobatのスレにもあったので、OCRソフトで検討してみます。
情報ありがとうございます。
>627 10と根本的には変わってないだろうから興味ない。 いくら英文エンジンをABBYに変えても、結局 日英混在モードがまるっきりダメだ。 いまどきの和文なんて、英語の単語の一つや二つ、必ず入っているだろうに。
631 :
名無しさん@そうだ選挙にいこう :05/02/08 12:01:22
一度、漫画を取り込んでOCRにかけたい。 かけたらどうなるか、やってみたい。 やったことあるヤシ、います?
>>631 出版社変えて再販するときに、フォントの著作権の関係で、活字の部分だけOCRして
自動的に入れ換えていたよ。
633 :
名無しさん@そうだ選挙にいこう :05/02/08 19:23:29
富士通ミドルウェア(株) 表OCR/文書OCR V5.0L10 アプリケーションの起動にはAdministrator権限が必要です。 (゜Д゜)ハァ? 死ねよ 会社で使えねーっての さすがあのクソ会社が下請けやっているだけはあるな(w
起動に必要ってのは凄いなw
635 :
名無しさん@そうだ選挙にいこう :05/02/10 13:57:52
>>632 、漫画の絵自体はどうなるんですかね?
絵も線だから認識しちゃってCGになったりします?
疑問に思うなら自分でやってみれば?
>635 諧調つけてスキャンしたものをOCRすると 認識度かなり悪いですよ。 もともと漫画の台詞をOCRすることにあんまり意味があるとも思えませんが、 釣られてあげました。
638 :
名無しさん@そうだ選挙にいこう :05/02/10 19:41:00
>>636 、時間と、暇と、スキャナが、無い。
っとゆーっか、漫画をまるまる、スキャンする、気力が無い。
>>637 、絵はどうなるんでしょうか?
絵自体はそのまま。ガッやギョエェェという吹き出し外の文字もそのまま。 市販のOCRではなく、フォントを変えて再出版するための作業専用のOCR だったと思う。OCRの製品名は覚えていない。
とゆーっか、 何も考えてねぇんじゃねぇの。
>>638 探せばサンプルページなどもあるし
webコミックとかでもいい。
それにお前に時間があるかどうかは問題ではない。
このスレでは 読んdeココ の評判悪いね。 ver.9の頃、"読んde"と"etype"と"読取"の体験版を使ってみて 傾き補正とか消しゴムとか誤認識文字の訂正とかの使い勝手で あえて"読んde"を選んだ。 認識率は言われているほど酷いとは思わない。 ほとんどマウスを使わずキーボードだけで作業できるところが 気に入っている。 もっとも、書籍や新聞記事をtxtに落としてPDAで読むのが主で pdfとの連携とかの難しいことはしない。 ver.15くらいになったら改めて比べてみるつもり。 どれがイイんですか、と漠然と聞いている人がいるけど、 自分で使い比べてみるべき。体験版があるのだから。 でもって、不満点など自分なりの感想をレスして欲しい。 勘違いで便利機能を使ってなかったりしたらもったいないよ。
読んdeを3からづっとバージョンアップして使ってきた。 日英混在を指定してもしなくても、ちょっとでも英語がはいるとめちゃめちゃ。 あそこの社員は自分のところの製品を一度も使ったことがなくて、 客の意見も聞く気がないんじゃないかとさえ思う。 会社全体が自画自賛体質じゃないのかなあ。 今までづっと根本問題はほったらかしで、読み取り精度は向上してないもの。 ちんけなバージョンアップばかりやっている間に、ライバルの英語OCRは相当進歩したよ。 見開きページの自動傾き補正なんて英語OCRならどれでも常識なのに、まだ手動。 縦書き原稿の漢数字は相変わらずそのまま二○○五年みたいに横表示しているし。 結局数字部分は手修正だし、縦書きのカタカナ精度は落ちる。 綴じ代部分もほったらかしのまんま。 今度の25日に11が出る。 今度もまたダメなら、もうバージョンアップしない。
>>643 ただでさえ、縦書と横書があって、手間ばかりかかるのに、見開きページの自動補正なんか
やってられるか。スキャナを持っているやつにしか売れん割にソフトの値段は、めちゃくちゃ安
いし。
英語OCRは、英数字と記号のことだけ考えていればいいのに、日本語OCRは漢字、ひらがな、
カタカナに加えて、英数字のことも考慮せなあかんのじゃ。
英語OCRの方が楽だろうという誤解が多いみたいですね。 ならなんであんなに日本語OCRでの英文読み取りの成績が悪いんです? 確かに日本語は文字種が多いけれども、 カーニングも2、3行にまたがる行頭の飾り文字もないし、 文字ピッチは一定じゃないですか。 英文はプロポーショナル・ピッチですよ。 英文のほうがイタリックも多いし、ポイント数も小さい。 見開きページの傾き補正なんか簡単ですよ。 頼まれてもいないのに会社側の肩持って切れるほどのことじゃない。w 特に縦書き原稿だったら、傾きを直さないことには 小さなカタカナ、アエイオウッが狂うじゃないですか。 いいソフトを作りたいと思うなら、OCR精度上げるのは根本的なことではないでしょうか。 しきい値の自動判定だって何でやんないんだろ。 あまり効果のないかすれ補正はあるけども、基本的にしきい値設定は手動ですもん。 スキャナ持っている奴にしか売れん、安いというなら、バンドルなんか止めたらどうです? 旧版なんか付けたら、OCRなんてこんなもんかって思うだけじゃないですか。
日本語OCRは、英語OCRを包含しているということでは? それなら英語OCRの方が楽というのも一理ある。 あと日本語もプロポーショナルでは?
英語認識に関しては、来週発売の新バージョンでは NEW 世界中で評価が高いABBYY社製英語OCRエンジンを搭載。英語文書や日本語 が混在している文書、数値情報において、高い認識精度を実現します。 と謳っているから、メーカーも弱いと認識していたんだろ。 英文にはカーニングやプロポーショナルがある一方で、日本語文にはスペースで単語が区 切られないという難しい(=単語の切り出しが難しい)点があるから、一概にどちらが簡単・ 難しいと言えるもんではないだろうな。 だから、エーアイに限らず、どこのメーカーも日本語文エンジンはオリジナルでも、英文に関 しては海外製エンジンを採用していると思われ。
ABBYYってどこかと思ったらロシアの会社か。英語圏じゃないぜよ。 そのうち、日本語OCRにも中国あたりが進出してくるのだろうか? (と思って調べたら既に進出していた)
以前OCRソフトを英文で比較したんだけど、北緯45度のN45○ ←○は小さいやつね、をきちんと認識したのは eTypistだけだった。新ココは数値情報も高い認識精度って書いてあるから期待してみるかな。 eTypistは大きなPDFだと落ちちゃうみたいなので、良ソフトになっていることを願うばかり。
読んdeで将棋世界を読ませてみたら全くと言っていいほど認識できなかった。 やっぱ将棋盤の図面は無理か。
将棋棋譜専用OCRがある。 他にも囲碁のOCR、楽譜のOCRやらいろいろある 上のレスに漫画専用OCRのこともあったけど
>649 日本語OCRで英文をやってみてから内包のなんのとおっしゃって下さいな。 一理だろうが二里だろうが、まるでOCRと言えるしろもんじゃないですから。 日本語のどこにプロポーショナル組版が?さぁ見たことないですよ。 >650 文字単位でパターン認識してます。 スペース区切りの単語として扱っているわけじゃないと思うんですが。 ABBYYは安く買えるからでしょう。良いから採用しているとは思えませんね。 v8からv9でよくなったなんて、とても思えませんでしたよ。 同じ英文ページ、日英混在ページを8と9で認識させてみて比較しました。 皆さん、実際にやってみてからご意見を。
あああああ あああああ あああああ りりりりり りりりりり りりりりり ゃゃゃゃゃ ゃゃゃゃゃ ゃゃゃゃゃ 長さが違って見えるけど、これはプロポーショナルとはイワンの?
>643 OCRが使い物にならないというのであれば 使わなきゃいいじゃん。 2ちゃんで吠えててもソフトは進化しないよ。
>656 > 文字単位でパターン認識してます。 > スペース区切りの単語として扱っているわけじゃないと思うんですが。 おいおい、「皆さん、実際にやってみてからご意見を。 」などと書いておきながら 最近の日本語OCRでは(文字単位以外に)単語単位で認識しているのを知らん のか? 読んde!!はじめとして「××分野○○万語の専門用語辞書搭載!」などと皆、 謳っているだろ。 それに、俺は読んde!!のVer.10をたまぁに使っているけど、英文に関してもそれ ほどひどいとは感じていない....もちろん、100%ではないよ。 OCRは元原稿の汚れ具合やフォントの種類・サイズ、また、読み取り精度など の影響をたぶんに受けるので、あなたが「v8からv9で認識させてみて」云々と 言ってみても、元の原稿の状態や読み取りの仕方がわからない限り、それだけ では何とも言えない……例えば、読み取りの仕方が悪けりゃ、新旧バージョン を比較しても意味がないということね。
Wordを使って、日本文段落と英文段落が交互になる文書1ページを作成して、それを 10.5Ptで白紙に印刷したものを、「読んde!!ココVer.10」を使って300dpi・モノクロでスキャン して認識させてみた。 日本文部分は英単語が何カ所か混じっているので「日英混在」を、英文部分は「英語」 を指定。それ以外はデフォルト。 ちなみに、日本文段落と英文段落の間には空白行をもうけてあるのに、認識時に適切な モード(「日本語」「英語」「日英混在」)を自動的に選択してくれず、すべて「日本語」になっ てしまう。 モードの指定自体は簡単だが、対象ページが何十ページもあったら嫌になるだろな。 認識結果はちょっと微妙かな。 ざぁっと眺めた範囲では日本文・英文とも【文字の】誤認識はない模様。 ただし、「日英混在」で認識させた日本文部分の「句点(。)」が何カ所か英字小文字の「o」 と誤認識されているのはいただけない(正しいところもある)。 日本文部分を「日本語」に変更して認識させてみたところ、句点の間違いは無くなったが、 今度は日本文中の英単語や数字列の誤認識が何カ所か発生(笑)。 というワケで、経験的に言っても、完全に日本文だけの文書・英文だけの文書の場合は 悪くないが、 日本文中に英単語が混じった技術文書 日本文中で英文段落を引用しているような文書 の場合は「もう少し頑張りましょっ」って感じかな。 ここら辺がVer.11で改善されていることを期待したい。
>659 辞書はOCRしたあとで、ユーザーが任意に行う誤認識部分の検出に使っているだけだよ。 辞書と照合といっても、ロジカルに見ているわけじゃないから、 「一人一一五年」と八を人と誤認し、二を一一としてもチェックできるわけじゃない。 日本語のスペルチェックなんてものが出来たら、MSに売ってるよ。Wordにだってないんだから。 OCRはやり方、経験が大きい分野だということは同感。 統一させるために、 あした月曜日のJapan Timesの一面でもやってみましょうか。 >657 イワンのよね。その例はただ、文字によってフォント領域枠の横幅が狭いってだけよ。 >658 勿論、2chだけで吼えてるわけじゃないのよ。 OCRソフト関係者の名詞を10枚以上持っていて、定期的に話し合ってから、 お説教垂れてくださいな。 ユーザーが報告、批判するからソフトが進歩するのであって、 「使わなきゃいいじゃん」じゃんだったら 「分からない話には首をつっこまないほうがいい」っていってあげたくなるじゃん。
「ユーザーが報告、批判するからソフトが進歩するのであって」は同感だが、 そう言いつつ、「OCRソフト関係者の名詞を10枚以上持っていて、定期的に話し 合ってから、 お説教垂れてくださいな。」などと書くのはいただけないなぁ。 そんな「ユーザー」、世の中にほとんどいないんだから……自分がそうだからと 言うのなら、こんなとこで書いていないで、自分のWebサイトで書くなりブログで 書くなりした方がいいでしょ。
>661 追伸ね。 わたしは「OCRソフト関係者の名詞を10枚以上持っていて、定期的に話し合って」 いない単なる1ユーザだけど、 > 辞書はOCRしたあとで、ユーザーが任意に行う誤認識部分の検出に使っているだけだよ。 > 辞書と照合といっても、ロジカルに見ているわけじゃないから は経験的におかしいと思うな。 実際、今まで数多くの技術系ドキュメントをOCRさせてきたが、何にも単語辞書を 指定しない場合と、あらかじめ相応の単語辞書を指定した場合とではあきらかに 認識結果の精度が異なる。 また、「ロジカルに見ている」はどういう意味だが、よくわからないが、エーアイソフ トのWebページなどに > 解析エンジンをさらに強化。単語レベルの処理だけでなく、文章を的 > 確に判断し認識結果の出力を行います。 といった解説があるところを見ても(実際にそれがどの程度の機能を実現している のかは不明だが)一応、文章の構造を解析して、そのうえで辞書と照合しているも のと思われる。 違うかな? 「OCRソフト関係者の名詞を10枚以上持っていて、定期的に話し合って」いるらしい 661さん、わかりやすく説明してちょうだい。
みんな,落ち着け!
>>661 はOCRメーカーに恨みがあって,OCRメーカー全体が
こんなバカばかりだと世間に思わせようとしている芝居だ!
たしかに読○de!!●●とか使ってたらこんなバカと名刺交換してる連中が
作ってるんじゃしかたないなあと納得してしまいそうだが,中にはまともなメーカーもあるはずだ!
大宇宙のどこかに。
>>643 プロポーショナル・ピッチの英文と文字によってフォント領域枠の
横幅が狭くなる日本語では、どうして英文の方が認識が難しいのか、
よく分かりません。業界に詳しいようなので、よろしかったら教えてく
ださい。
>>661 あなたがOCRアプリの開発関係者なら
自分の無能を棚に上げて、ということになるし、
関係者でなければ、吠えてるだけ、に
変わりないのでは?
661は2ch以外のどこで吼えてるのか書いてから偉そうなこと書いてくださいな。 テメーの言い分は他人に聞いてもらって当然といわんばかりのくせに 自分の意に沿わない他人の意見には黙ってろと封殺するような態度。 こんな調子じゃおまえさんがどんなに正論を書こうが誰にも相手にされなくなるぜ。
>>667 正論ってわけでもないよ。
釣り師なんじゃないかぁ。
> ユーザーが報告、批判するからソフトが進歩するのであって、 だから、2ちゃんで報告・批判しても仕方ないって。
そんなことないよ。自社はもとより他社も含めてチェックしてるよ。
悪口書かれてないかのチェックだけで製品の質の向上のためじゃないけどね。 (ってか製品の質を上げる気は元からない。)
672 :
名無しさん@そうだ選挙にいこう :05/02/21 11:32:03
mediadrive の e.typist 10 使ってて 自動アップデートやろうとするとエラーで落ちるし 仕方がないのでWebにアップデータ出てないかみるようにしてたんだけど、 今新しいパソコンの方にインストールし直して 自動アップデートかけたらアップデータがあった。 Webを見たらないことになってた。 自動アップデートが確実に動くとは限らないのに 複数の方法でアップデートを提供しないようなところなんて やる気ないのがみえみえだよな
673 :
名無しさん@そうだ選挙にいこう :05/02/21 14:45:27
>>671 思いこみだけでそこまで決めつけれるんですね^^;
>>674 10年も使い続けた客にそんなことを言うなんて・・・ヨヨヨ(泣
ひどいひどすぎる!
あんなクソみたいな製品を世に出して平気ってのはどんな神経だと
ずっと思ってたけどやっぱりまともな感覚持ってないのね!
676 :
名無しさん@そうだ選挙にいこう :05/02/22 01:21:17
>>675 あの糞エプソンの関連会社だからな。
欠陥商品を出しても、文句を言う客が悪いと思う体質は同じ。
>>675 あなたにはクソみたいな製品でも
普通の人にとっては普通の製品なわけで・・・
それはねーな(笑)そう思いたい気持ちはわかるが。
ところで、このスレには工作員はいるの?
682 :
名無しさん@そうだ選挙にいこう :05/02/23 21:13:43
2chで頭がいいところを見せようとすると、 メーカー側に立った発言しかないの? ユーザー同士罵り合わせてガス抜きさせようとする罠じゃないかとまでは 考える知能がないんだね。 まんまと工作員にリードされてりゃ、北朝鮮に勝てないよ。
ユーザー同士じゃなくてユーザーとメーカーの罵り合いだが。 どんなバカなユーザーでもここまで来てエ●ア○ソフトを 擁護する奴はいないだろw
そもそもユーザーなんていない
685 :
名無しさん@そうだ選挙にいこう :05/02/24 03:13:26
枠組みのある表(すべて数字)を取り込むためになにか買おうかと思ってたのだが・・・ どれを買っても手直しが必要なのでしょうか?
セルシオを買ったわけでもない、軽の一番安いのを買っておいて、 パワーがないだの、狭いだの、エアコンの効きが悪いだのいってもしょうがないでしょ。 ユーザーの意見をいくらフィードバックしたところで、高級車にはなりませんよ。
結論 ▲ー□イソフト=三菱自動車
>>686 そうか、体験版かぁ〜。思いつかなかった、ありがとう〜!
>684 それどういう意味? 日本語で書こうぜ。
読んでココを貶める工作員がいるようですが・・・
ここに買ってるユーザなんかいるのか? 正直に言えよw割ってるんだろwww
>692 人部の姿でしか他を計れないわけね。 アキバでビラまいてろ。
694 :
名無しさん@そうだ選挙にいこう :05/02/26 09:32:27
読んでのv11見ましたよ。 ダメだ。 10と変わらない。 僕もバージョンアップしない。今回パス。 これこれの文書は読めませんと箱の外側に書くべきだと思う。
×今回 ○今後
なぜこうも盛り上がらないのだろう? 十分実用的というか、OCRの能力に素直に感心してる自分は変人なのか? そりゃ一部ファンキーな解釈になるけど、100%なんて望まないし。 ま、満足してる人、使いこなしのテクニックのある人は、 ここには何も書かないか。
>697 660/662/663を書いた者だが、同感。 ちなみに、697さんが使っている製品は何? 俺はe.Typistのスキャナバンドル版・読んde!! Ver.10・ワンタッチOCRを持っているが、 メインで使っているのは読んde!!。
手を変え品を変え事実をねじまげようとするその努力が却って涙を誘う。 満足してれば満足してるで「これはいいなあ。買ってよかったよ。」って 書く人が一人ぐらいはいるものなのに・・・
>>698 すみませんが、日常的に利用しているわけではありません。
その為の習熟期間といったところです。
読んde!!ココ Ver.10、e.Typist v.9.0、読取革命 Ver.8、読取物語EX V4
の4本の試用版を試した結果、
個人的には「読んde!!ココ Ver.10」が一番よく出来ていると感じました。
一番、認識結果が良いというのではありません。一番良いのはe.Typistでしょうかね。
ただe.Typistは画像の前処理があっさりしすぎで、なんか納得いきません。
ま、あんまり書いても叩かれるようなので、この辺で。
>>700 OCRに関しては毎日毎日何時間も格闘して、
一定水準の結果を得るためのセオリーを発見したからね。
満足してるさ。
>701 ”毎日毎日何時間も格闘して”いらっしゃるなら、 ビジネスソフト@2ch掲示板@スレッド一覧のOCRぐらい 試していただけるのではないと。 セオリーでどうにかなるところをご披露いただけば、 悩める者への励みになりますので。
私、ただいま600万画素のデジカメでもOCRソフトを使えるんじゃないかと思って調べております。 たぶん、みなさんはスキャナで取り込んでいると思うのですが、 A4サイズなら、どのくらいの画像サイズでOCRにかけているのでしょうか? 普段、dpiしか意識していないとは思いますが、判りますでしょうか? ちなみに、私のデジカメでは最大 3152×2068 のサイズで撮影できます。
>>703 何かいってあげたいのは山々だけど、
このスレで禁止されている「使いこなしテクニック」の披露にあたりますので、
残念ですが、ご自分で各社試用版をお試しください。
>>703 A4を600万画素だと250dpiくらいかな。FAXのOCRができるんだから十分できると思うが、
認識率は悪そう。
スキャナで取れるものはスキャナでやって、それ以外はデジカメってのがいいんでない?
バックアップソフトがゴーストとドライブイメージの寡占状況から TrueImageに一気に市場独占されたようなことがOCRでも起きねーかなあ。 読取物語がそこそこまともなインターフェースにして値段下げたら ココやタイピストなんか一瞬で駆逐できると思うのになあ。
>704 なにそれ。 勿体つけちゃって。
>704 >このスレで禁止されている「使いこなしテクニック」の >披露にあたりますので へ? なにそれ。
どのソフトも毎回のバージョンアップでそこそこ売れてるんだから
満足してる人は多いのでは?
ここで苦情をいう割合=世間の割合だなんてどうして思うんだろう・・・
>>708 スレ嫁w
>708 何をいくら読んでも、 「使いこなしのテクニック披露禁止」ってのは分からん。 無いものは出ない。だから追い詰めるなってか? そこそこ売れてるから、いいのか。 もうちょっと他にましな理屈言ってくれよ。
>>705 ありがとうございます。
私の方も計算してみました。
EPSONのA4対応スキャナで10200×14040(1200dpi)とのことですから、
300dpi(くらいが必要として)なら、2550x3510ということで、
デジカメで使えるのは2068x2847pixとなり、約240dpiとなりました。
600万画素のデジカメでA4のアップは認識率がやや落ちそうですね。
調べてみましたら、スキャナも1200dpiクラスのモノはオマケソフトも付いている上に
取り込みも数秒、値段は1万円以下と、
OCRソフト単体で買うより遥かに安くつきそうですので検討してみます。
>>711 試しもしないで、机上の計算だけで納得ですか。
そんなんで文句を並べる人ばかり。
だから、披露しても意味ないって言ってるんですよ。
>712 私はあなたに何かを伝えようとした覚えはありませんけれど? 文句を並べた憶えもないですが、 勝手な幻想を抱いているようですが、何か変なものでも食べているんですか?
>>713 けんか腰にならないで素直に他人の意見も聞いたらどうですか?
711でやってるこはまったく意味がない
705の最後の行理解してないのか?
デジカメで240dpiとスキャナ200dpic(仮)だとスキャナのほうがいいぞ
ソフトもオマケと製品版比べるのもナンセンス
713の上2行はまあ分かるが
>勝手な幻想を抱いているようですが、何か変なものでも食べているんですか?
これは関係ないだろ。子供じゃないんだから相手を貶す必要ないだろ
>>703 >私のデジカメでは最大 3152×2068 のサイズで撮影できます。
デジカメもってるならOCRの体験版つかってやってみればいいのでは?
その結果を書いた方がためになる
ソフトウェアの質問スレから来ました OCRソフト探しているのですが、何処のが一番良いでしょう? スキャナはEPSONGT-6600U Win2K CPU Celeron 2.53G メモリ1.5G 大体、目算で12ピクセル前後のカラーの文字を取り込みたいと思っています 画像は取り込むつもりが無く、その中にあるテキストのみ カラーデータも必要なく、テキストのみ、そのレイアウト、行を維持したまま エクセルやワードなどではなく、簡易な秀丸やメモに書き出せるソフトを探しています なるべくなら低い解像度でも、誤字が無い方が嬉しいです…… フリー、シェア、問いませんので。オススメのソフトがあればお願いします
>>713 後で文句を並べに来そうだって事。現にスルー出来ないじゃん。
>>703 では、
> 私、ただいま〜と思って調べております。
非常にいい事言ってるじゃないの。この時点では感心したよ。
なんで試用すらしないのか、かえって疑問。
俺は200万画素、1600*1200のデジカメで実験しまくって、
興味深い結果を得ているよ。結局、それが貴重な経験になるだろ。
「きのこの山」(゚д゚)ウマー
デジカメのデータからOCRする話しだけれど、結局、 初心者は単体でOCRソフトを購入するより、 OCRソフトのオマケが付いたスキャナの方が安くつくんじゃないの? 気になるのは、 >714さんの、 >ソフトもオマケと製品版比べるのもナンセンス って事だけれど、 ナンセンスって言うくらいオマケのソフトって酷いモノだったっけ?
>>718 製品版もひどいけど、付属品はもっとひどい
気をつけないと機能限定版とかあるぞ
>>718 安くつくも何も、試用版ダウンロードして使ってみるのってそんなに大変だろか?
試用版は製品版と同じ認識力なんだから、試用版で試してみるのがいいと思う。
それに対して、バンドル版は認識力が低いと散々言われているわけで。
試用版→バンドル版と使ってから、バンドル版に満足しても損することはありませんよね。
時間を惜しんで、最高の結論に一足飛びにいきたいと考えると、
結果的には一番時間を失うことになると思います。
>>721 きれいな原稿は認識率がよくて
薄かったりぼけてたり汚れのある原稿は認識率が悪い
って程度のことでしょ。
>>722 >試用版は製品版と同じ認識力
本気で言ってるのか?
>>724 ごめんごめん。
「ソフトの認識力」について語るのも禁止事項でしたね。
いや、ほんとにすまない。
もう書かないからゆるしてね。
もうなんか必死だな。
「ソフトの認識力」について語るのも禁止事項 え?そうなの? じゃぁこのスレって何話すんだっけ。 どこで買うと安いかなら、価格ドットコムみりゃいいし。
誰かから反論があると禁止事項とか言って逃げるなら さっさとこのスレからいなくなればいいのに
英語板にあるOCRの方が、 メーカーべったりの、OCRやったことなさそう、 しどろもどろ禁止事項逃げがいない分だけまし。
731 :
名無しさん@そうだ選挙にいこう :05/03/01 04:29:45
>>728 こんな糞スレでも必要としてる人はいます
あなたが見に来なければいいだけです。
( ´,_ゝ`)プッ
どうでもいいから使えるソフト教えれ
>730 727の発言と1と両方読んだが、730が何を言いたいか分からない。 >731 禁止事項だから語れないトンズラ男と、来るなという人は同じ精神構造? 731さん、あなたはこのスレで何を必要としているんです?
735 :
名無しさん@そうだ選挙にいこう :05/03/01 12:24:42
暇つぶしです
>735 暇つぶしなら、他にもっと面白いスレあんのに。
何がおもしろいかは人による 735にとってはこのスレが最高なんだろw
某社Webページにある認識サンプルに、日英混在文書のOCR例が載ってない。 なのに旧バージョンとの比較表には日英混在に○ 自社比ってやつですかあ。 735の暇つぶしさん、会社の昼休みに答えてよ。 かすれ/つぶれなんて、本を一冊OCRするなどボリュームのあるときは、 最初にしきい値いろいろ変えて、最良値を測定してからやりますって。
使ってみる→ソフトがクソでムカつく→ここに書いてウサ晴らし →ムカつくので使うのやめて放っとく→しばらくして思い出す→最初に戻る
>>738 日英混在○の意味分かってないの?
例が載ってないことから自社比がどうのって馬鹿なの?
>740 何が言いたいの。 頼まれもしない会社の肩持って、 ユーザーに噛み付くことのどこが面白いんだよ。 自分が頭がいいことを、こういう場所でしか示せないとか? じゃあ、はいはい、740、あんたは頭が良いよ。 そこで、日英混在○の意味を言ってくれ。
>740 おれも聞きたい。 あの日英混在モードってなんだよ。 740さん、教えてけろ。 あんたから見りゃおらも馬鹿らしいから。
743 :
名無しさん@そうだ選挙にいこう :05/03/05 02:02:47
某社ってどこですか?
英語の参考書って、一行おきに英文和文になってること多いです。 そういう本をOCRしてPDAで見たいんですけど、 読取革命、e-Typist、読んde!!ココの体験版だとどれも??で困ってます。 日英混在っていうんですか、このスレを拝見すると、 上手くいかないで悩んでいる人、私だけじゃないみたいですね。 英文と和文の領域を手で全部指定して、一ページづつやるんでしょうか? OCR達人の技を教えてください。
745 :
名無しさん@そうだ選挙にいこう :05/03/05 14:03:10
すみません。教えてください PC変えたらイータイピストのCDなくしたことに気付いてインストールできず、 読んでココ体験版をインストールしました。 うまく動くんですけど、自動処理するとファイル名を指定できません。 PDF文書001みたいなのになって、その後、自分で変更しないといけない。 そんなはずないと思うんですけど、 どこをいじればいいか分かりません。 助けてくださーい。
>745 そもそも「自動実行」ではファイル名を自動的に付けるようになっている。 それがイヤなら、手動で処理する。 あるいは、「自動実行」でつかられる「PDF文書001」といったファイル名 の「PDF文書」を変えたいのであれば、「OCRファクトリ」で設定する。 上記の詳しい操作はヘルプを参照されたし。
>745 デフォルトの「認識結果」で終わってから、あとでリネーム。 >746 よかったなぁ、日英混在ペケ話題からそらしてくれる人が現れてくれて。 それとも745は746の自演か? そんなことないよな、土曜日だもんな。 お疲れさん。
>746,747 どうもありがとうございました。 取りあえず読んでココは断念して、読取革命体験版をダウンロード。 なぜかスキャン中にフリーズ続出。 結局、部屋中さがしてイータイピスト10のCDを見付けだしました。 でも、スキャンしたあとOCR途中に突然終了したりする。 バージョン9のときはこんなことなかったのに。 パソコンの能力不足かもしれない。 しかし、読んでココの自動で名前まで付いてしまう設定って 不便すぎない? デジカメのソフトみたいに日時で管理するというなら まだ分かるけど。イータイピストはファイル名入力の直前まで自動でやってくれるから その点はいいと思った。
>748 > しかし、読んでココの自動で名前まで付いてしまう設定って > 不便すぎない? デジカメのソフトみたいに日時で管理するというなら > まだ分かるけど。イータイピストはファイル名入力の直前まで自動でやってくれるから > その点はいいと思った。 読んde!!はOCR結果をWordやExcelなどで利用することを主な用途とした オフィス向けのソフトなので、ユーザがいちいち認識結果のファイルを意識 する必要はないようにとの配慮だと思う。 もちろん、748さんのような意見もあるだろうが、746の言うとおり、既定の ファイル名は設定で変更できるのだから、俺は現状仕様でいいと思うな。
読み取り革命使ってんだけど、WORDに出力したときの 編集のしにくさったら無いね。どれもこんななのかな。 テキストボックス沢山使ってレイアウト整えようとしてるんだけど、 テキストボックスは編集しにくいんだよ。 これはWORDに原因があるんだろうけど
読んdeココは認識は改善されていると思うけど、英文の編集が全然駄目 テキスト編集してword転送すると、全行末に改行が入るか、行末と次行頭が連結してしまう 日本語はそれでいいんだろうけど、全行改行編集しないといけないのは鬱
>>750 >どれもこんななのかな。
各社の体験版つかってみればいいだけ
753 :
名無しさん@そうだ選挙にいこう :05/03/18 10:59:23
テキストファイルに落としたい原稿がPDFファイルなんですが、編集禁止に なっている(光学データになっている)ので、ファイルの変換ができません。 で、各ページのデータをOCRソフトで読み取らせたいのですが、そういう処理が できる製品はありませんか?
>編集禁止になっている には、理由があるからなんですよ。 それをやる、法を犯すことになるという認識がありますか・・・
>>754 嘘付け。
誰の、どんな著作物だろうが、商品だろうが
個人的な利用の範囲ではどんな風にいじろうと改変しようと法には触れない。
暗号化されたデータを解読するのも、個人利用の範囲なら問題ない。
有価証券やお金は別だが。
>>753 単にリードオンリー属性になっているならHDDにコピーして書き込み可能にすればいい。
pdfファイルに内容保護ロックがかかっているなら
vectorにでも行って「pdf 解除」をキーワードにして検索してみれば
ツールが見つかるはず。
>>755 しったかぶりいくないw
法律板いってこいw
757 :
753 :05/03/19 13:33:15
>>754 翻訳の仕事なんですよ。直接のクライアントじゃないから
ハードコピーしかくれないので、仕方ないから元々の文書を
ダウンロード販売で買ったのです。そしたらロックがかかっていて・・・
ソースクライアントは当然翻訳の権利を持ってるんでしょうから
交渉すればロックのかかっていないPDFを無料でもらえたんでしょうが、
何しろ時間がないので。
とりあえず、画面内容をキャプチャしてOCRソフト(e.Typist)で解析、という
手順なんとかしてます。
>>755 ありがとうございました。ちょっと探してみます。
>ソースクライアントは当然翻訳の権利を持ってるんでしょうから そうでなかったらどうする? 間にいくつ業者が入ってようが、どうも怪しいですな。
759 :
753 :05/03/19 22:26:12
>編集禁止になっている には、理由があるからなんですよ。 これでFA
(笑) ←自分は犯罪者ではないと言い聞かせるためのおまじない
>画面内容をキャプチャしてOCRソフトで解析、 これでもう753さんは、善意の第三者ではなくなってます。 また仮に、755さんの指摘が正しいとしても、 > 個人的な利用の範囲ではどんな風にいじろうと改変しようと という前提を逸脱してますね。個人利用ではなく、営利なわけですから。 > ハードコピーしかくれない のならば、その範疇で仕事をすべきでしょう。 翻訳権契約をきちんと確かめてから 着手する習慣をつけたほうが良いと思います。
翻訳で金もらってるならさ、 なんでOCRにこだわるんだ。 まさか機械翻訳で金もらえると? なら英語板のケンにも紹介してやれ。 この先100年は「おれは翻訳家だ」って言うぜ、奴なら。w
>そんな闇の仕事はしてませんよ(笑) 自分の仕事を胸をはって言えるのって幸せなことだぞ 今の世の中子供に自分の仕事ちゃんと言える人がどれくらいいるんだろうね
765 :
753 ◆IZuNZWcrdI :2005/03/21(月) 09:37:50
翻訳って、実際は皆さんが想像してるような仕事じゃないんですよ。 もちろんうるさいくらいに契約書を交わす会社もありますが、出版翻訳でも 口約束だけの場合が多いらしいですし、ましてや技術翻訳の場合は、ソース クライアントと直接取引するケースなんて希なわけでして。間に入るエージェント との間でも、契約書を交わさないケースがほとんどです。 技術文書の場合は、翻訳対象テキスト以外に原語のまま転記する英数文字列が 多いので(リストなら“原文テキスト入る”としますが、文章中に含まれてる 場合はそうはいかないので)、原文のファイルが合った方が何かと便利なんです。 機械翻訳なんて使いませんよ、ばかばかしい。 とにかく私はOCRソフトの件で質問したのであって、翻訳の仕事に対して空想や 妄想でとやかく言われても迷惑です。 以上。 追記: 2ちゃんの性格上、偽物が現れてとやかく騙り始めそうなのでトリップを付けて おきました。あしからず。
キモい犯罪者ですね。
>>766 犯罪犯罪って、いつからおまえらそんなにモラリストになったの???
766=754=756=758はゆとり教育の弊害
769 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 12:05:57
770 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 12:35:41
>>765 私も翻訳の仕事をしていますが、英文から文字列を
転記して入力するのも仕事の一部だと解釈しています。
お気持ちは分からないでもないですが、あまり楽をしようと
思わない方が良いのでは?
そのうちに本当に機械翻訳にも頼るようになってしまいますよ。
771 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 12:56:17
タイピストが駆逐されたように翻訳者もいなくなる日が来るよ。
772 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 13:01:44
>>770 765の翻訳よりは機械翻訳の方がマシだから大丈夫www
>>771 PCの機械翻訳のレベルで我慢できるようになるか、そうじゃなきゃ
誰もが英語で読めるようになるってこと?
いくらなんでもそれはありえないだろ
>753 > 機械翻訳なんて使いませんよ、ばかばかしい。 両手を挙げて同感です。 「タイピストが駆逐されたように翻訳者もいなくなる日が来るよ」 ↑が一、二万のソフトで英語になるなら誰も苦労しませんよね。w 元英文を引用、差し込むなら、正確さが要求されますね。 現況、日本で販売されているOCRの主だった製品は、基本的に日本語OCRです。 英文部分はABBYエンジンを外部調達して対応しています。 「e-Typist」も「読んde」も同じABBYなので精度に差はありません。 つまりどちらも、そこそこどまりなので、OCR後のチェックに手間がかかります。 私はOmniPageを使い続けてますが、高いだけのことはあります。 自分が不得手な言語ですと、OCR後のチェックはとてつもなく時間がかかるので、 その手間を考えると、元原稿を貰えない仕事は逃げることにしてます。w
774 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 13:57:47
>>773 昔、タイピストにそう言ったら怒ってたよ。
彼曰く、「日本語には漢字があるので絶対になくならない」だそうだ。
775 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 14:44:22
>>774 そしたら将来、SEも作曲家も映画監督もアニメ制作者も駆逐されちゃうね
776 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 17:45:11
>>775 昔は、翻訳に創造力が必要だと思われていたよな。
今となってはそんなもの必要ないことがわかっているわけだが。
777 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 18:07:11
>>775 翻訳のようなルーチンワークはコンピュータにやらせたほうがいい。
作曲家や映画監督と自分を同列に語ってるあたりで充分わかる。
778 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 18:46:21
>>776 >>777 おまえら翻訳の現状知らなすぎ。
一時「機械翻訳」が流行ったけど、その結果があのWindowsのクソヘルプの
大量生産につながったわけだ。今はそれが見直されて、やっぱり職人技が
必要だってことになってるよ。
まあド素人は黙ってなさいってこった。
779 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 18:49:22
>>777 君は本当に馬鹿だな。
>>775 が言いたいのは「翻訳者が不要になるような
高性能ソフトウェアができるんなら、自由に曲を書いたりCGつなげて映画を
作ったりできるようなソフトウェアだって可能だ」ってことだよ。それだけ翻訳
ソフトってのは難しいんだよ(日英の話だけどな)。
翻訳をルーチンワークとしか思えないような浅知恵しかないんなら口を出すなよ。
もうそのへんにしとけよ・・・ 馬鹿共相手に完全に釣られてるじゃん。しかもsageてないし・・・ ムキになって釣られる方も傍迷惑って点では馬鹿に等しいぞ。
781 :
779 :2005/03/21(月) 19:35:16
>>780 はーい・・・
んでもOmniPageってのが気になるな。試してみようかな
最後までバカ丸出しでしたw
783 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 21:15:05
>>779 そういえば件のタイピストもそんなこと言ってたな・・・
トオイメ。
784 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 23:41:23
785 :
名無しさん@そうだ選挙にいこう :2005/03/21(月) 23:42:59
英語が分からないが 仕事で必要に迫られてる人もいるわけで^^; あんまり視野の狭い意見はいわないほうがいいですよ^^;
788 :
名無しさん@そうだ選挙にいこう :2005/03/27(日) 12:55:19
スレタイおかしくないか?
e-typist v.10.0 プラスアジア アップグレード版 「ご使用のオペレーティングシステムには、 e-typist v.10.0 プラスアジアをインストールできません」。 だって(涙)。 FAQを試しても解決しないし、旧版再インストしてもだめだ。 5年以上前からe-typist愛用者なのに残念。 ※この文章を読んで不快になった方すみません。
790 :
名無しさん@そうだ選挙にいこう :2005/04/06(水) 16:19:51
なんていうか,どれもこれもいい加減な作りなんだよな。 もしかして新人のOJTの材料にでもされてるのか?
792 :
789 :2005/04/06(水) 18:37:47
あーもう。「e-typist v.10.0 プラスアジア」 は Windows2000には対応してないんだよ。 パッケージに「XP Pro / Home 」のみ対応 って書いてあるじゃん。 迷惑をかけてすみませんでした。ゴメソ
行間がつまって、上下にくっつきそうなテキストを認識してくれるOCRは無いでしょうか? e-typistの最新版だとレイアウトは自動で取ってくれるのですが、15行くらいのテキストが巨大 な「議」や「熱」といった1文字になってしまいます。 読んでココの最新版ではレイアウトの自動はめちゃくちゃで、手動だと認識率10%くらいはいき ますが、それ以上は無理でした。 手動で1行ずつ指定しようとしても、上下の行が少しでも入ると結果がめちゃくちゃになってしまい、 手がつりそうです。orz
>>793 体験版あるんだから自分で試せよ馬鹿
元原稿によってかなり左右さるから
他の人がうまくいってもお前に会うとは限らない
>>794 読取革命体験版をダウンロードして試しましたが、読んでココと同レベルでした。
自動でレイアウトが取れず、手動では10%くらいの認識率。
会社で誰も使わず転がっていたImageOfficeの古いバージョンも全くダメでした。
都合4製品ほど試しましたが全滅でした。
聞いたことのない会社に体験版があるかどうか問い合わせ中です。
>聞いたことのない会社に体験版があるかどうか問い合わせ中です。 ホームページ見たりぐぐれば済むことすら人に頼るんだね あんたすごく嫌な人間だな
バカか?「ホームページ」とやらがない会社でも体験版を 用意していることもあるだろ。役にも立たないことを必死で書いて あんたすごく嫌な人間だな
そんな会社のOCRは使い物にならない気がするのですが
799 :
名無しさん@そうだ選挙にいこう :2005/04/07(木) 13:35:18
絵に描いたような問題のすり替えw
絵に描いたようではないが 問題のすり替えではあるな
>聞いたことのない会社に体験版があるかどうか問い合わせ中です。 なんでこれが >ホームページ見たりぐぐれば済むことすら人に頼るんだね 人に頼ってるように解釈出来るのかわからないんだが。 ソフトの前に自分の読み取り精度上げろよウンカスwww
>>802 お前も読み取り精度低そうだけどな。
50dpiくらい?w
2ちゃんねるに来てる人に読解力求めてもね〜
まともな反論ができなくなったときの最後の抵抗 「2ちゃんで○○とか言ってもなあ」
「ネタにマジレスカコワルイ」「釣れた釣れたw」等もあるね
この流れも慣例通りだねw
>>808 >802
流れくらい読めるようになろうな
お前が一番読めていない希ガスw
809の認識能力は50dpi以下か
あまりの頭の悪さが哀れなのでツッコんでやりたいがどうせ 「釣れた釣れたwwwww」の流れなので放置
812はCCD
>認識能力は50dpi以下 これ今の流行?
>>814 >802
流れくらい読めるようになろうな
817 :
名無しさん@そうだ選挙にいこう :2005/04/11(月) 09:52:35
etypistとかって前処理のごみとり処理とか原稿の斜め補正処理が弱いよね ・孫コピーされてゴミはいりまくりの原稿が斜めにスキャンされるともうダメ ・スキャナ部分が汚れたFAXから送られた原稿って 文字列の上にびーっと線が入っているときがあるけど そういう部分があると全然ダメ ominipageは上のような条件でもetypistよりマトモ
>>817 なんでominiと比べてるんだ???
ただ批判したいだけか?
819 :
名無しさん@そうだ選挙にいこう :2005/04/11(月) 13:15:11
>>818 etypistにもがんがって欲しいな。。。て思ったの
820 :
名無しさん@そうだ選挙にいこう :2005/04/11(月) 13:21:52
新手の工作員だな
179 名前:名無しさん@英語勉強中[sage] 投稿日:05/03/01(火) 14:16:36 ねだらねぇと、まともなもんは出てこねぇのさ。 使ってない奴が作ったソフトを使ったことも無い奴が売ってんだから日本語OCRなんて。 英語OCRの進化に比べて日本語OCRの進歩が取り残されているって言ってんだよ。 日本のOCRソフトエンジニアがみっともないもん作ってて平気なのは、 177や178みたいに、間抜けなちょうちん持ちが要るからだよ。 日本語OCRだけの横並びでしか見てないからだよ。 OmniPage使ってみろよ。 かすれてようが傾いてようが、レイアウトそのまんまで100%読むぜ。 というと馬鹿がまた英文のほうがOCRは楽だとかアホなこと言って来ると思うと 笑っちゃうぜ。
↑間違ったことは言って無いと思うが? 実際,1つだけ飛びぬけて優秀にならないよう機能・性能を小出しに上げていくよう 談合していることは間違いないし,使った人間なら誰でもわかるような ふざけたUIやバグになんの疑問も感じていないのがメーカー。
おいおい…「談合していることは間違いないし」って証拠でも握ってんのか。 同じような不満は俺も感じてるけど、憶測をさも事実の如く語るようなら どんなに正論っぽいことを他に言ってたとしても説得力失くすぞ。 ネットで虚言癖が身についちまうとリアルでもつい出て信用失うから注意しな。
では
>>822 のカキコに不適切な表現がありましたので
「ことは間違いないし」
を
「としか思えないし,」
にお詫びして訂正します。
そもそも「間違いない」って主観的な推測の表現じゃん?
「・・なのは事実だし」って書いたら事実の摘示だから
現認してるか証拠でも要るだろうけどさ。
とはいえ
>>823 程度の言語能力の奴は多いだろうから
「何を根拠に言ってんだ!ゴラァ!」とされる可能性は高いわな。
>そもそも「間違いない」って主観的な推測の表現じゃん? 馬鹿かコイツ 「間違いない」というのは推測ではなく断定文句だ 言語能力鍛え直して出直してこい
>>825 事実と意見の違いくらいは読み取れるようになろうな
822は主観をさも客観であるように言ってるのが問題だろ 各社の違いを感じ取れない鈍感な人間だし >使った人間なら誰でもわかるようなふざけたUIやバグ バグは分かるがUIの感じ方は人それぞれ 自分のセンス=普通だと思ってるところが凄い
829 :
名無しさん@そうだ選挙にいこう :2005/04/14(木) 06:26:57
英語だと omnipageとe-typistはどっちが精度高い?
自分で比較検討も出来ないのかね・・・
両方買えってか?アフォだろお前。 体験版とか言うなよ。
何故すぐ煽るんだ。
おいおい、それすら解らずに「自分で検討しろ」とか煽ってたワケ?マジですかー!?
煽ってるのはお前だと思うんだが
>>795 体験版入手して試しました。
手動でテキストを拾うための特殊なOCRのようです。
テキスト枠の指定だけでも10通り方法があり、そのうちのひとつでうまくいきました。
何に使うんだか多角形指定なんてのもある。自動がダメなのは他と一緒です。
ただ値段は207,900円で、稟議が通りそうにないorz。使用期限まで使ってGWだ。
では、また困ったことがある時までさようなら。
840 :
名無しさん@そうだ選挙にいこう :2005/04/15(金) 23:30:19
牛肉や豚肉を食べることは否定しないのに 人肉は否定されるのはなぜだろう
>>837-838 体験版では判断しきれないという事実も理由も知らず
「自分で比較検討も出来ないのかね?」とカキコしてる馬鹿w
煽るの意味解ってないのはお前の方だよ。
理由もまだわからないんだろ?ヘタレ君は消えろって。
>>842 >体験版では判断しきれないという事実も理由も知らず
馬鹿なの?^^;
>>842 スレ読んでるか?
今回の質問は体験版では判断しきれないとは関係ないぞ
今年も空気が読めない人増えましたね
846 :
名無しさん@そうだ選挙にいこう :2005/04/17(日) 13:29:42
からけ
847 :
名無しさん@そうだ選挙にいこう :2005/04/17(日) 15:20:33
分からない人には教えてあげればいいのに・・・ 煽るだけのレスは無駄なだけ・・・ 他の人にも参考になるようなレスをお願いします・・・
画像編集ソフトで行間を空けてもいいと思うんだけど、 行間がランダムなのかな。 たとえ数が多くても、規則性さえあれば、ソフトやマクロで出来るし。
849 :
名無しさん@そうだ選挙にいこう :2005/04/21(木) 15:04:52
新聞スクラップを読み込ませる→画像と文章(保存前に一部改変)に分けてPDF(もしくは文章を検索しやすいファイル形式に) ってOCRで出来ますよね?
画像と文章に分けてってのがよくわからんが 透明テキストのことでよければできるなぁ
>>850 わかりにくくてすいません。
写真部分と文章部分を分けて、
文章だけを改変可能な形にして保存したいのです。
透明テキストっていうので大丈夫そうです。
どうもありがとうございます。
>>851 説明がよく分からないが
例えばワードみたいな形式で保存したいってこと?
それとも画像ファイルとテキストファイルに分けたいってこと?
>>852 画像と文章が一緒に乗っている、
所謂PDFファイルのようなものにしたいのです。
文章があとからでも編集可能
文章が単語検索に引っかかる
画像も抜き出し可能
を満たしていればいいので、HTMLでも良いのですが。
体験版使って自分で判断しろ 俺はPDFファイルは編集しづらいとおもうがな
>>854 そうですか・・・
とにかく試してみます。
ありがとうございました。
中国語版WindowsXPで動く日本語OCRソフトを探しています。 いいのはないでしょうか?
857 :
856 :2005/04/27(水) 16:07:12
ソフト板こんなソフトウェアありますか? スレよりテンプレ借用
【必要な機能】 日本語OCR
【. 目 的 】 日本語で書かれた本をスキャナでスキャンし,MS-Word文書にする
【. 使用OS 】 Windows XP 中国語版
【. 条 件 】 日本語・中国語・英語OK
■試したけど条件を満たさなかったソフト
【. 名 称 】 (1)FENG-OCR無料版 (2)ブラザーOCR
【. 概 要 】 共に日本語OCR
【駄目な理由】 (1)認識エンジンが糞 (2)文字化けで何とか使える程度で買う気しない
■これだけはやりました
【
>>1-10 、FAQ集、上手な検索の仕方 を読んだ 】 はい
【 調べたサイトの名前 】 Vector
【検索キーワードは? ..】 OCR
858 :
名無しさん@そうだ選挙にいこう :2005/04/27(水) 21:52:06
>>857 日本語と中国語は別のソフトのほうがいい
認識率とか単語登録の使い勝手のため
>(1)認識エンジンが糞 (2)文字化けで何とか使える程度で買う気しない 釣りか・・・ 使いこなせない馬鹿だったのか・・・ 答えなきゃよかった・・・
>>858 サンクス! 今落としているところです。
>>859 ???
探しているのは日本語・中国語両対応のOCRソフトでなく,
中国語版窓で動く日本語OCRソフトですが?
>>861 >【. 条 件 】 日本語・中国語・英語OK
こう書いてあるんですが^^;
質問する前にまず日本語の勉強をするのが先ですよ
>>863 言葉足らずでスマン。
メニューやダイアログとかが日本語で書かれていてもいいし,中国語で書かれていてもいいし,
英語で書かれていてもいい。という意味です。
いい加減うざくなってきた このスレ中国語OCRは禁止にしないか?
>>858 このソフトは文字化けが少なく,とてもいいです。
どうもありがトン!
e.Typistを購入しましたが,R1から最新のR2bにアップデート しようとすると「e.Typist v10.00がインストールされていません」 とエラーがでて,中止してしまいます. マイドキュメントのデータフォルダの消去も含めてアンインストールし, 再インストールしても同じです. アンチウイルスなどの常駐ソフトを切っても変わりません. 他に,同社の名刺ファイリング4.0も使っていますが, 問題ありません. WinXP Pro SP1です. 対処法を教えてください.
それだけじゃわからんよ
869 :
名無しさん@そうだ選挙にいこう :2005/05/01(日) 07:51:16
871 :
856 :2005/05/01(日) 14:54:31
>>868 他にどんな情報が役にたつでしょうか?
>>869 既にAdmin権限で行っています.
>>870 SP2にしてソフトが動かなくなったという話を良く聞くので,
恐くてやっていません.その辺,大丈夫でしょうか?
OSだけ入れたクリーンな環境作って eTypistだけをインストール それで出来るかどうかやってみて
ここ何日も、メディアドライブのHPにつながりません。 何かありましたか?
876 :
名無しさん@そうだ選挙にいこう :2005/05/06(金) 11:08:32
コピペ出来ない、画像の中から、数字を、OCRで認識して テキストで出力したいんですが・・・。 OCRというものでしょうか? 画像(JPG BMP)の中から、数字を認識してくれる フリーソフトは、ありますか? スキャナーから、読み取るのではなく、 もうすでに、 JPG、BMP、でファイルとして 存在する画像ファイルがあります。 この、画像ファイルの中に、数字が書かれているのです。 しかも、その数字は、手書きとかではなく、 きれいな、 MSゴシックのフォントで書かれており レベルの低いOCRでも、認識は可能と思える程です。 このような、画像ファイルの中から、数字を認識してくれて、 テキストファイルに 出力してくれる OCRソフト(出来れば、フリーソフト)を探しています
877 :
名無しさん@そうだ選挙にいこう :2005/05/06(金) 11:09:54
>876の続きです・・・ 前記した、・・・ >レベルの低いOCRでも、認識は可能と思える程です。 これを、実例に説明しますと、・・・ここに、 数字を書きます! 1 2 3 4 5 6 7 次に、プリントスクリーンキーで、デスクトップそのものを、キャプチャしてください。 次に、ペイント(ソフト)を立ち上げて、 そこに、貼り付けてください ペイントには、デスクトップ(この掲示板含めて) 貼りついていますよね。 次に、先ほど書いた数字 1 2 3・・・だけを、 切り抜き、 JPG、もしくは、BMPで、 保存してください。 そうすると、数字だけの 画像ファイル(JPGか、BMPか)が出来ています。 このような、かなり、きれいな くずれのない、 数字なら、誤認識する可能性は低いと思います。 軽くて、簡単に、数字認識してくれるOCRソフトが無いので、ほしいと思いました。 初心者なので困っています。優しく教えて下さい。 今日中にお願いします。
880 :
名無しさん@そうだ選挙にいこう :2005/05/07(土) 08:35:09
>>880 そこの回答って本当なのかな。みんなスキャンした文書のことを書いてるような。
でも、スキャンした文字と画面の文字ではピクセル数がケタ違い。
実際、WinReaderに12ポイントのテキスト画像を読ませたら全滅だった。
4倍以上に拡大したらやっと少し認識したけど、認識率は半分以下。
>>873 成功しました!
理由は良く分かりませんが,.NET. Framework 1.0と1.1が
同時にインストされたいたので,1.0のほうをアンインスト
し,これまでet10_R2b.exeをHPからダウンロードしてアップ
デートを試していたのを,e.Typist10.0自身の自動アップ
デートからやってみたところ成功しました.
883 :
名無しさん@そうだ選挙にいこう :2005/05/08(日) 13:21:24
おめでとう なんだかわからないけど こちらにも参考になりそうです 検索置換の日がつづくのでせう
884 :
無しさん@そうだ選挙にいこう :2005/05/08(日) 20:16:50
>>881 キャプチャー画面をイルファンビューで4倍にして読みとって、次に間違いの仕方をワードのマクロに仕立てて、200語暗いの変換マクロをつくってみると
直すところはホンの少しになりますネ
一文字ごとの変換でなく、熟語っぽく誤認識を変換するのが
ポイントですネ
885 :
名無しさん@そうだ選挙にいこう :2005/05/14(土) 15:07:56
e.typistにominipageが統合されたら最強
etypist使えないから意味無いよ
文盲がポップしましたよw
日本語文字認識に関して言えばe-typistが他を寄せ付けずにダントツでトップだろ
そう思います.
891 :
名無しさん@そうだ選挙にいこう :2005/05/16(月) 14:28:48
でも ばたらない → ばならない の誤読は直すのもきついよ 的た → 的な とか 少し活字の違う本を扱うと仮よみのほうで つかれてしまって ほかのもこう読むのかなあ
社員うざいw
893 :
名無しさん@そうだ選挙にいこう :2005/05/16(月) 20:34:19
他のソフトだと > ばたらない → ばならない ぱ十二らなん → ばならない > 的た → 的な 白勺た → 的な
どうせ割るんだから なんでもいいきもする
>>893 ということは文章チェックと連携してないのか。
精度より速度優先で。
あんまり進歩してないのかなあ。
>>893 体験版使った限りだと
そんなひどくはないけどな
間違いの数は各社同じくらいだと感じた
897 :
名無しさん@そうだ選挙にいこう :2005/05/17(火) 11:03:25
>>895 30MHzぐらいのCPUでのころから使っているけど、
速度はソフトではなく、マシンの進歩に負ってるところ
が大きいとおもう
当時は精度優先、速度優先のオプションもあった
精度は格段によくなっていて、あと一歩と言う感じ
文章チェックで努力するというのをメーカーに望むのは
ちょっとはずれていると感じるのだけど
でもそのあと一歩が本当にすすんでるのかと
グレードアップするたびに近頃思う
(第二水準対応はすごいと思う)
でも 的た の たとな はどう修正のアルゴリズムを自分で
考えても、全部読むしかないので辛いですね
898 :
名無しさん@そうだ選挙にいこう :2005/05/20(金) 20:17:43
OCRってオシリの略ですか
そう。
900 :
名無しさん@そうだ選挙にいこう :2005/05/22(日) 22:45:16
さりげなく900
901 :
名無しさん@そうだ選挙にいこう :2005/05/27(金) 05:53:30
etypistって100ページまでの制限があるんだな 使いにくい
嘘までついて(ry
903 :
名無しさん@そうだ選挙にいこう :2005/05/27(金) 14:53:29
読み間違いのリスクのある認識には (?)って出してくれれば、直すのも楽なのに そうすると他社に弱みを見せることに なるのかな
904 :
名無しさん@そうだ選挙にいこう :2005/05/27(金) 16:46:44
?が認識できたときに困る
905 :
名無しさん@そうだ選挙にいこう :2005/05/27(金) 18:13:24
そうだなあ
アイコンとかでってことでは? 馬鹿なの?
907 :
名無しさん@そうだ選挙にいこう :2005/05/28(土) 10:18:39
アイコンでは検索できないでしよう。 ベクタにあるのなら観覧車とかのような連続置換ソフト を使ってみると便利かと思っていたのだが 使っていませんか
現状でもご認識のところは赤く色がつくし それで十分でしょ
909 :
名無しさん@そうだ選挙にいこう :2005/05/28(土) 13:38:58
そうだなあ
>>907 ワードのアイコンは検索できるし
やろうと思えばできるとおもいますよ
911 :
名無しさん@そうだ選挙にいこう :2005/05/28(土) 22:43:44
いらねーよそんな機能
912 :
名無しさん@そうだ選挙にいこう :2005/05/29(日) 17:53:11
そうだなあ
必要としてる人もいるって分からないのかな・・・
「一発!OCR Pro3 for 一太郎」 誰か使ってる人いない? これ使えるなら一太郎と一緒に買おうかなと思うのだけど・・・
916 :
名無しさん@そうだ選挙にいこう :2005/06/03(金) 21:19:32
(゚听)イラネ ETYPISTでいいよ
全部大文字で書かれると全く別物みたいだな
918 :
名無しさん@そうだ選挙にいこう :2005/06/05(日) 05:36:18
スレストッパー
919 :
?1/4?3?μ?3?n???》???3/4?I???E´?¢?±?? :2005/06/06(月) 15:34:29
ttp://pcweb.mycom.co.jp/special/2000/trush/008.html 数万枚の紙をデジタル化した実績からいわせてもらえば、OCRは使うべきで
はない。大量の紙をデジタル化することで捨てるのであれば、OCRは人生の
無駄である、というのが筆者の結論だ。
なぜか。それはひとえに(現状では)OCRの精度が低すぎるという理由に尽き
る。OCRは、次の理由から、現実的に実用には堪えない。
(1)OCRは印刷文字の字体に合わせて設計されるので,古い活字の昔の印刷物
には利用できないことも多い(ディジタル図書館【図書館・情報メディア双
書】III/田畑孝一/勉誠出版)。
(2)OCRの校正には、入力よりも手間がかかる。個人レベルでも無駄が多く、
遊びの範疇を超えない。高性能なOCRは、文字をできるだけ間違えずに読み
取ろうとする。そのため、似た文字を認識し損なうことが多い。似た文字
とは、「カ」と「力」、「0」と「O」、「朶」と「柔」などである。これ
の校正はほとんど不可能である。しかし、校正しない限り、「老人カ」は、
「老人力」では検索できない。
その後の文章が重要
「朶」と「柔」はともかく、「カ」と「力」、「0」と「O」は文字種の色分け表示を使えば簡単に校正できる。
昔の新聞は、辞書登録しまくってもろくに認識できなかった。その点は認める。
どんな道具も使う人次第だな
924 :
名無しさん@そうだ選挙にいこう :2005/06/10(金) 11:34:39
繁体字+略字含の漢文資料を試してみたら数式みたいなのがでてきた
使えないなら自分でタイプすればいいのに・・・
926 :
名無しさん@そうだ選挙にいこう :2005/06/12(日) 01:22:47
>>919 人生の無駄とは思わないな。
今のOCRって多分画像に埋め込まれるテキスト情報として使われることが
多いはずだよね。
漏れはドキュメントスキャナ持ってるんでスキャンしながらOCR→PDF作成と
いう手順を踏んでいるが、実際テキスト情報がなければ検索は不可能に近い。
前ページスキャンした分厚い本のデジタルファイルでも、二度と開くことなく終わってしまうだろう。
全文検索に引っかかる。これが重要。
OCR技術自体に完璧を求めるのは機械翻訳・音声認識と並んで砂上の楼閣と
思えるが、検索の一助としてなら現状のOCR技術でも十分実用になっている。
その後の文章で美崎先生はその旨ちゃんとお書きになっている 919は切り取り方が意図的
928 :
名無しさん@そうだ選挙にいこう :2005/06/12(日) 12:18:51
とはいえ、OCRに実用性への可能性がないわけではない。具体的に いえば、「非校正OCRフルテキスト」を、全文検索のタグとして使 う、というやり方はある。この方式は、デジタルミュージアム、 デジタルライブラリーなどを使う場合には、それなりに有効に使 われているようだ。単に文字テキストを、全文検索のタグとして 使うのである。 筆者の知る限り、この「非校正OCRフルテキスト」は、奈良科学 技術大学、東京大学文学部などが利用している。では個人の場合 にはどうするか、というと、単に画像で一覧するだけでも十分実 用になるのではないか、と考えるのである。実物の画像を見れば、 文字は書いてあるわけで、それをみるだけでも充分実用になるの ではないだろうか。
実用的かどうかはOCRする目的によるな〜 例えば本をまるまるOCRして 検索して書いてあるページが分かればいいなら 画像+非校正OCRテキストでもいいが 全文をテキストファイルにしたいなら現状だと校正は必須。 OCRが非実用的だっていってる人は 後者に近い目的だとおもう
930 :
名無しさん@そうだ選挙にいこう :2005/06/12(日) 18:22:31
どんなにしても人間のチェックが入らないと 完全にはならないよね
目的と対象だね。昔の新聞が全く認識できなくても、OCRは昔の活字ではなく現代の活字用だと 割り切ればよい。ベニヤ板が切れないからといってハサミに問題があるわけではない。
人間がチェックする出版物でさえ誤字脱字はあるんだし 非校正OCRが実用範囲内にくるのもそう遠くないとおもうだんが・・・
というか919は前世紀の評価 対象分野によるとは思うが、既に実用目的で使っているけど
実用的かどうかは時代によって変わるぞ 10年後から見たら今のOCRは非実用的になるとおもう 昔のOCRも当時は業務に使われただろうしさ・・・
935 :
名無しさん@そうだ選挙にいこう :2005/06/13(月) 12:12:00
ていうか郵便番号読取装置では OCRが今も昔もがんがってますが
936 :
名無しさん@そうだ選挙にいこう :2005/06/13(月) 12:16:16
キヤノンのスキャナ(Lide500)を買ったら、読取革命Lite forMacがついてきたんで、 eTypist ver.8 forMacと比べてみたけど、さすがにLiteじゃない製品版の事だけある。 eTypistの圧勝だったよ。2割位違うね。
2割で圧倒的って^^;
未学習の廉価版でその差なら、製品版では逆転されるな。
意味不明w
940 :
名無しさん@そうだ選挙にいこう :2005/06/26(日) 21:59:17
読み取ろうぜ
936も938もどっかの信者か社員だろ
942 :
名無しさん@そうだ選挙にいこう :2005/07/09(土) 16:51:19
ETYPISTサイコー
社員乙
944 :
名無しさん@そうだ選挙にいこう :2005/07/11(月) 16:25:00
>936も938もどっかの信者か社員だろ モナー
945 :
名無しさん@そうだ選挙にいこう :2005/07/11(月) 22:43:56
もう社員とか言うのヤメレ e-typist最高
従業員乙
読んでココと比べたけど、e-typistの方が断然いいじゃん 認識率5%は違うね
サンプル数が分からないけど 5%なら誤差範囲では?
949 :
名無しさん@そうだ選挙にいこう :2005/07/13(水) 21:28:13
書類の状態や内容で逆転する程度だと思われ
951 :
名無しさん@そうだ選挙にいこう :2005/07/16(土) 02:02:12
わしは翻訳ちゃんなんだが、いやー、abbyy のやつ、いいねえ。 すごいねえ。 日本語も使いたいから、読んde とか読取革命も試用版いじって みたんだけど、abbyy 製エンジン積んでるつーわりに、吐き出し 結果の具合が、ぜんぜん違うのな。不思議。エンジン同じなら、 結果同じでもいいのにな。アプリの設計って、難しいんだな。 abbyy のやつ、2バイト言語対応してくんねえかな。 BCL のも試したけど、やっぱ abbyy の勝ち。
これだから素人の知ったかぶりは怖い
953 :
名無しさん@そうだ選挙にいこう :2005/07/16(土) 17:57:50
業者乙。すまんね素人で。 素人にもわかりやすく使いやすいものを作ってけろ >> 業者
素人はエンジンなんか気にしないのでは? さらに比較までする素人はいないと思われ
>>953 951-952の流れで分かりやすくしてくれっておかしくない?
比較して意見するならお前さんがもっと勉強すべき。
流れ無視の煽りとしての分かりやすくなら同意
956 :
名無しさん@そうだ選挙にいこう :2005/07/16(土) 20:23:17
すまんすまん。一般論のつもりだった。 勉強なー。時間あったらやりたいけど、なかなかなー。 日銭稼ぐのにヒッシな、情けない野郎だから、漏れ。 これでも、ががーと資料読んで、ばばばーと試した つもりなんだよ。ほんますまん。 ネタは、ある商品の化粧箱の pdf で。直方体を展開した 状態だから、文字列があっちこっち向いてるんだな。 セパレータで区切って、分割して複数ページにして、 回転してから読み取り、ってすればいいんだろうけど、 実験のつもりで、そのまま「えいや」って読ませたのよ。 そうすっと、一番がんばってたのが、abbyy のやつだっ た。 「そんなんで比較すんなよー」と言われそうだけど、 使う側の勝手な意見としては、「傾き補正あるんなら、 90°ごとの回転なんて、内部的に自動でやってくり」 てな気分なんだな。
人間目線じゃなくて PC目線で考えた方がいいぞ
958 :
名無しさん@そうだ選挙にいこう :2005/07/17(日) 21:40:56
928 >単に画像で一覧するだけでも十分実用になるのではないか、と考える これってocrいらないってことじゃない。ちがう?
大雑把で良いからOCRエンジンとその搭載アプリをまとめてくれよ。 そろそろ1000だしさ。じゃ頼むよ。
>>958 文盲?
最近は読解力ない人増えたね・・・
962 :
名無しさん@そうだ選挙にいこう :2005/07/18(月) 17:17:38
>928 >実物の画像を見れば、 文字は書いてあるわけで、それをみるだけでも充分実用になる
おまえが理解すべきなのはこっち >全文検索のタグとして使う、
画像だけで実用的な人もいれば OCRが必要な人もいるだけの話
965 :
:2005/07/23(土) 00:09:38
OCRソフト「本格読取」、「e TYPIST v.10.0 アップグレード版」、「読んde!!ココver11アップグレード版」のうちどれか使っている方はいらっしゃいますか? 僕のスキャナはエプソンCC-650Lなんですけど、良いソフトがあれば教えてください。
966 :
965 :2005/07/23(土) 01:11:11
体験版をいろいろ試してみることにしました。
967 :
名無しさん@そうだ選挙にいこう :2005/07/23(土) 14:59:52
>>966 書き込む前に その結論に達しなかったお前を軽蔑する
採点作業がいつも大変で、なんとか自動化したいと思っています。OCRで 間違いなく読み取るのはできないと思うので、マークシートを検討してます。 普通のスキャナーと普通の紙の組み合わせで使えるソフトがあるようですが、 どなたか推薦してもらえないでしょうか?
970 :
名無しさん@そうだ選挙にいこう :2005/07/24(日) 23:08:00
>>969 スキャナーが普通か上等かとか、紙が普通かもっさいかとかは、
ocr から見たら、あんまし問題ではないと思うな。だいたい、
スキャナーまでの問題っぽいので。ocr の選択は、ocr そのもの
の程度の善し悪しで判断できそうな悪寒。
いずれにしても、ここの住民が腐ってそうやから、たぶん、
しばらくは質問するだけ無駄やで。誰も何も答えてくれん。
悪態ついとるばっかりや。答えるだけの脳が無さげ。チーン。
クマー
973 :
名無しさん@そうだ選挙にいこう :2005/07/25(月) 21:41:25
>>972 うるさいわぼけえ。アドバイスできひんのやったら、
だまっとけごるあ。
>969 採点用途ならArea61 マークリーダがおすすめ
マーク以外は糞
>>973 用途がしっかり決まってるんだから
ここで聞くより自分で試した方が
確実だとおもうんだけど・・・
>>974 へー、こんなの作った人いたんだ。ちょっと感動。
宣伝乙
979 :
名無しさん@そうだ選挙にいこう :
2005/07/29(金) 19:36:18 readirisはどう?