■OCRソフト、読んでココか、Eタイピストか■

このエントリーをはてなブックマークに追加
935名無しさん@お腹いっぱい。:04/06/03 10:40 ID:RXTZ6dw2
次のような条件に当てはまるOCRソフトはありませんか。

1.用途は英語の読み取りのみ。
2.PDFファイルも読み取れること。
3.日本に代理店があること(経理処理の都合)。
4.価格は5万円以下。

OmniPageが良さそうなのですが、値段が……。

936名無しさん@お腹いっぱい。:04/06/03 12:15 ID:YFSxP6J+
Readiris
937934:04/06/03 17:30 ID:5tAv4hbC
>935
今しらべて初めて知ったんだけど、OmniPageProって・・・高いのね。。
確かにSEですら読み取り精度はかなり高く感じるから
業務用にはよいのかもね。

自分の環境ではドイツ語のみの実験しかしなかったけど
皆さんも言う通りe.Typist9 も結構よい結果だった。

速さもOmniPageSEよりは速く感じる。。
(もちろんOmniPageProはもっと速いんだろうけど)
938935:04/06/04 00:41 ID:BYosQvFV
>>937

レスをサンクスです。

日本語OCRソフトの英語認識でも、何とかなりそうなので、そっちで考えます。
読んでココv.10を持っているので、これにAdobe Acrobatを買い足すか、e.Typistか読取革命を買うかなんですが……。
読取革命は体験版ではPDFの認識ができない(バクらしいけど、パッチは製品版でないと当てられないとか)ので試せませんでした。
939933:04/06/05 18:38 ID:wk+VnOog
「やさしくPDF OCR」の体験版を使ってみました。
新聞のレイアウトや文字自体の認識率は高かったけど,大きさが違う図が複数あって
図の中に文字が含まれていたりすると(例えばグラフなんかの場合)
文字領域と勘違いして?とんでもないレイアウトになりました。
手動で図を囲っても何故か複数の認識枠ができてしまって,削除,修正が一苦労。
文書領域全体を手動で大きく枠指定した後で,その上に重ねて図表枠を指定できたり
不要な図表部分だけを認識除外するような機能はないんですね。
940名無しさん@お腹いっぱい。:04/06/09 00:13 ID:RedquFBe
>>939
>その上に重ねて図表枠を指定できたり
ツールバー右側の領域種別指定で図領域を選んでから範囲指定をする。

>不要な図表部分だけを認識除外する
画像ウィンドウのツールバーの削除範囲設定を選んで範囲指定する。

ではだめ?
941名無しさん@お腹いっぱい。:04/06/10 07:15 ID:iRwbqJWx
e.Typistでは、読んdecocoにあるような認識した文字を分離する、ということは出来ないんでしょうか
バージョンはエントリーR3aです
942名無しさん@お腹いっぱい。:04/06/11 09:22 ID:cu73tZfK
>>941
もう少し詳しくお願い。
943名無しさん@お腹いっぱい。:04/06/12 03:53 ID:nHoXSpx4
今、ここに出てるOCRの体験版をいくつか使ってみました(読んでココは以前使っていてかなりよかった)。
サンプルは古い「SFマガジン」に載った小説。これをデジタルテキストデータ化して一太郎ファイルにし、出版サービスで製本するのが夢です。
今日使った中では「読み取り革命」がダントツに使いやすくはかどる。
ただ、多機能な分操作が分かりにくい。
レイアウト認識すると、読み取り順序が勝手に表示されますがこれがまたよく間違う。
これを変更したいのですがどうしてもうまくいきません(右クリックすると順番変更とあるのですがこれをクリックすると「その順番にクリックしなさい」と出て終了してしまいます。
意味が分かりません。
また手動でエリアを指定すると勝手に横書き認識してしまいます。
いちいち属性変更で縦書きに変更するのが面倒なのでデフォルトで縦書きに設定したいのですがどこで設定すればよいのでしょうか?
よろしくお願いします。
944名無しさん@お腹いっぱい。:04/06/12 14:53 ID:JffkyoUr
その順番にクリックしなさい
945943:04/06/13 05:09 ID:mBloqA7d
>>944

そのとおりでした。
ポップアップの出た状態でやらないとだめなんですね。
でもこのソフト、編集が凄くしやすくて助かります。
「た」と「だ」の誤認が多すぎるけど、修正するとき、同時に他の同じ候補文字を
持つ部分もまとめて出てきてチェックできる。
今日1日で二段組で150ページ分ぐらいデジタルテキストデータ化できました。
もう100ページぐらいで出版できます。
946名無しさん@お腹いっぱい。:04/06/13 16:35 ID:mBloqA7d
ところでソースネクストの「本格読取」って評価版はないんでしょうか?
値段が安いから金を捨てるつもりで試しに買ってみてもよいですが、
OCRなんて、使えないのはとことん使えない(手入力のほうが速くて無意味、
ただのごみ)から、できればタダで機能を確認したいなあ。
947名無しさん@お腹いっぱい。:04/06/13 17:10 ID:mBloqA7d
一発!OCRPro for一太郎の体験版を使ってみたら、
一太郎返還機能限定の読取革命ですた。
948名無しさん@お腹いっぱい。:04/06/14 02:11 ID:lxiAjBSp
e.Typist 9は400dpi以上のPDFを読み込めないのか。
だめぽぉ・・・
949名無しさん@お腹いっぱい。:04/06/14 23:02 ID:z1YxIwde
>>946
自己レス。
購入して使ってみたら、読取革命の機能限定版でした。
自動文書変換はワード、エクセル、テクストの3種のみ。
しかし一番いたいのは、ハイパーチェッカーがないこと。
これがあるかないかで編集能率が倍は違う。

ただこれを持っていると読取革命を乗り換え版7000〜8000円の安価で
買えるので、読取革命購入することにしました。
正規に買うと17000〜18000円するので、
これ+乗り換え版で10000万円以内だからはっきり得。
読取革命買ったらこっちは友達にただであげよう。
950名無しさん@お腹いっぱい。:04/06/14 23:06 ID:z1YxIwde
>>865
最強は
「本格読取」購入→それを持参し乗り換え版「読取革命」購入
これで1万円以内に収まる。
ハイパーチェッカーが要らなければ、ほかの機能はほとんど同じな
「本格読取」で十分じゃろう。
951名無しさん@お腹いっぱい。:04/06/15 21:13 ID:Bsv2UO9u
読取名人ってWindowsXPみたいにネット認証が必要ですか?
952名無しさん@お腹いっぱい。:04/06/16 14:46 ID:PESmRZTy
>>949
いや、最近笑ってないとかいうことはないんだけど、
久々に壺にはまっちゃたアルヨ。

わたしの奥さんちゅごくじんあるね。スマヌ、止らん。
953名無しさん@お腹いっぱい。:04/06/17 04:27 ID:CPXvLBB0
>>952

え、そんなにおかしいあるか?

どこが? 説明キボヌ。
漏れの行動がおかしいあるか?
それとも読取革命の価格設定?
954名無しさん@お腹いっぱい。:04/06/17 11:22 ID:ldL5KzWa
( ´_ゝ`)
955名無しさん@お腹いっぱい。:04/06/20 00:08 ID:4OBOKtIG
EPSONについてきた、読んでココを使ってみました。ものすごく認識率が悪いです。
バージョンアップする気になりません。本当にいいのですか?ご指導お願いします。
956名無しさん@お腹いっぱい。:04/06/20 10:29 ID:LJeHHL6C
>>955
付録版とは比べものにならないほど紙資料については認識率はいい。
特徴や弱点などは過去レス参照。
というか、付録版なんて使用頻度が多い人は普通そのまま使わないと思うが。
957名無しさん@お腹いっぱい。:04/06/20 10:34 ID:LJeHHL6C
というわけで、最新版の読んdeココVer.10体験版を導入してみてから判断してください。
http://ai2you.com/ocr/guide/koko10dl00.asp?C=2
958名無しさん@お腹いっぱい。:04/06/20 11:22 ID:xSlzHO4e
和文と英文が混合されていると、認識率が悪かった。読んでココVer.10を導入すれば
改善されますか?値段的には、本格読取→読取革命に魅力を感じます。
読んでココは、26穴・図表に弱点ありというスレを見ました・・・
これらの点を踏まえて、アドバイスしてくれたら、助かります。お願いします。
959名無しさん@お腹いっぱい。:04/06/20 12:48 ID:B5kWBtFt
認識率はどんな原稿かによって変わるし、インターフェイス(操作しやすさ)もそれぞれなので、
結局は体験版を試して感触を掴んでくれと言うほかないのだが…
和英混在文では、l(L)と1、一とーと→、Jと↓、。とo(O)と0(0)などで誤認識が多いが、
製品版(体験版)は付録版に比べてかなりマシだといえる。
ついでにいうなら、最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。
960名無しさん@お腹いっぱい。:04/06/20 13:03 ID:VQqdHuLQ
>最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。
横レスで申し訳ないんだが、認識辞書を鍛えるって、具体的にはどういうことをいうのでしょうか
認識のたびにご認識を修正していくの?
さらには、鍛えた成果は他のPCにも移せますか
よろしく教えてください
961名無しさん@お腹いっぱい。:04/06/20 15:31 ID:jnuppIUd
>最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。

製品紹介をちゃんと読めば書いてあったと思うけど、今の読んdeは自動学習だったような。
日本語文書については認識率は不満なし。
また、誤認識の癖Ex.(1)(2)が正しく変換できない も使ってればわかるので簡単に対処できるし。
要は使いこなし次第。

読み取り革命は2000の時に使ってたけど、その後読んdeを使ってみてこっちの方がよかったので
それ以来ずっと読んdeです。バージョン重ねるごとに製品間の優劣とかは変わってるでしょうけど、
まああえて買い直すほど不便はないなと思ってそのまま同製品のバージョンアップを重ねています。

最後は、自分の用途ではどうか、を各製品の体験版で比較して一番いいのを選択するしかないと思います。
962名無しさん@お腹いっぱい。:04/06/21 22:24 ID:PwRAEobN
>>958
今日、読取革命の乗換え版を買いましたが、特に他社製品の提示は
求められませんでした(新宿ヨドバシ)。
本格読取買う必要はないかもしれません。
もしかして、これって常識?
952さんが笑ったのはこのことだったんでしょうか?
すいません、純朴なもので……
(それとも、店によっては、提示求めるところもあるのかな?)
963名無しさん@お腹いっぱい。:04/06/21 22:31 ID:v0fYkvU+
OCRはとにかくテキストのみならいいけど、図などが入ると使えない。
964名無しさん@お腹いっぱい。:04/06/21 23:25 ID:1tbBQotT
>961
レスさんくすです。
あくまで横レスなので、読んdeの取説も手元にないんですが、
一般にこうした学習した分というのは、転送可能なものなんでしょうか?
折角育てたのが、OS再インストでおじゃんではかなしんですが・・・
program fileのやつを上書きすれば良いのでしょうか?
965名無しさん@お腹いっぱい。:04/06/21 23:30 ID:qVlt3rlk
>>964
C:\Documents and Settings\ユーザー名\Application Data\Aisoft\Yonde\Usrdic
ってフォルダがあるよ。
966名無しさん@お腹いっぱい。:04/06/21 23:32 ID:qVlt3rlk
>>962
インストール時にチェックされなければいいのでは?
販売店ではチェックされません。
アップデート版も同様。
967名無しさん@お腹いっぱい。:04/06/22 00:08 ID:0wOAhrQA
>>965
サンクス!
しかし手作業でバックアップとるのも限界なのかな〜
何かしら漏れがあるような気がするし
まあApplication Data丸ごとバックアップして、丸ごと上書きすればいいのかも知れないけど
968名無しさん@お腹いっぱい。:04/06/22 12:51 ID:xko6xFie
このスレは、勉強になります。手書きの書類がたまっていて、適時修正をしながら入力を
しなければならないのですが、音声入力ソフトの使い勝手を知りたくなりました。
厳しいご指摘をさけ、ご指導をしてもらえたら、助かります。お願いします
969名無しさん@お腹いっぱい。:04/06/22 15:30 ID:PpY6iLP+
>>968
スレ違いだけど、私も知りたい。
970名無しさん@お腹いっぱい。:04/06/22 16:12 ID:8yAsl0j3
2、3年前の奴だけど、学習させれば結構な精度で入力できた。
でも、咳したりつまったりして、間違って入力されたものを修正する手間を考えると、
タイピングのスピードが結構なレベルの人にとっては、まだまだだったなぁ。

最新の製品については知らないけど。
971名無しさん@お腹いっぱい。:04/06/22 20:07 ID:4pwWYjLk
970さん、ありがとう。ところで、なんていうソフトですか?
こういうスレがないですよね・・・
972970:04/06/22 20:32 ID:l1qblHgF
>>971
IBMのやつだったと思う。今もあるのかな?
973名無しさん@お腹いっぱい。:04/06/22 20:52 ID:4pwWYjLk
966さん、ほかのソフトでも、いきなり乗り換え版を買っても、家でインストールするときに
不都合が生じてしまうのですか?ど素人なので、教えてください。
音声入力ソフトって高いんですが、乗り換え版を購入すれば半額になるようなので、そこのところを
知りたいのです・・・
974名無しさん@お腹いっぱい。:04/06/22 21:36 ID:53yVWTCF
ヨドバシカメラとかで調べてみればすぐわかるんじゃないの?
http://www.yodobashi.com/

あと、製品出してる会社のページいって製品紹介読めば終わりでしょ。
975962:04/06/23 00:16 ID:p7bl4B4h
>>966

インストール時のチェックもなし。
いちおう本格読取入った状態でしたが、たぶん関係ないと思います。
ただ、読取革命の試用版が入った状態ではインストールされないので、
これをアンインストールしてからインストール、でした。

早速使いまくっていますが、認識率は普通だと思いますが
とにかくハイパーチェッカーの使い勝手が最高です。
画像、図表の入った原稿には向かないと思うが、小説などの
長文テキストをメインに扱う文系ユーザーには最適なOCRだと思う。

ちなみにマニュアルによると、アップグレード版の場合は
インストール時に旧バージョンがないとだめなようです。
976名無しさん@お腹いっぱい。:04/06/30 22:56 ID:XAyNW3oo
読取革命の試用版を試した後、「コントロールパネル」の「プログラムの追加と削除」で削除したのですが、MS-WORDのメニューバーに現れた読取革命のアドイン表示が消えません。
どうすれば消えますでしょうか。
977962:04/07/01 06:37 ID:kqjgVCkK
>>976
wordのユーザー設定の一番下の読取革命を選択し、
右の削除ボタンで消えませんか?
ちなみに私は現に使っているため試せません。
978名無しさん@お腹いっぱい。:04/07/01 08:41 ID:Zrh6dlUU
>>977
ありがとうございます。

> wordのユーザー設定の一番下の読取革命を選択し、

ここにはそういう設定がありませんでした。ちなみにMS-WORD2003です。
「ユーザー設定」の「テンプレートとアドイン」の設定も外しましたし、「Documents and Settings」の「\Application Data\Microsoft\Word\STARTUP」にあったアドイン用ファイルを削除しても消えません。

WORDの設定に関するどこかにあるんだろうと思いますけど……。
979名無しさん@お腹いっぱい。:04/07/01 09:37 ID:lVoersTa
>>978
自己レスです。
解決しました。

「\Application Data\Microsoft\Templates」のテンプレートを削除したら消えました。

お騒がせしました。
980名無しさん@お腹いっぱい。:04/07/03 15:08 ID:xxEZgAJV
すいませぬ、e.typistと読んdeについてですが、
例えば、マイドキュメントにあるjpegやbmpなどのA4サイズの文章の画像を読み込んで
それから文字データとして変換みたいなことは出来るのですか?
981名無しさん@お腹いっぱい。:04/07/03 16:39 ID:y/Qf1y5F
自分で試してみろ
体験版もあるんだし
982名無しさん@お腹いっぱい。:04/07/03 21:50 ID:kM/MMzno
難なくできますよ
983名無しさん@お腹いっぱい。:04/07/04 22:31 ID:RgNTRRVJ
読んdeココ使ってるけど
表を読み込んでエクセルに送ったとき
レイアウトも再現してくれるのが便利
専用ソフトで作ってる表を「エクセルでくれ」
とか言われたとき重宝する

こんな意見も少しは参考になるかな?
984名無しさん@お腹いっぱい。
eタイピストを使っているんですが、
自動レイアウト解析を完全に遮断することってできますかね?
これだと目次などでページ数だけ別枠になって、コピペしたときに不便なんですよね。
prestoのようにある程度レイアウトも再現しつつ、べたにテキスト化するのが理想なんですが。
取説を見る限りでは、範囲指定も結局は自動レイアウト解析で認識枠をつくるだけですし・・・
どなたかご教示ください。