■OCRソフト、読んでココか、Eタイピストか■

このエントリーをはてなブックマークに追加
796名無しさん@お腹いっぱい。
洋書(英文)を翻訳して読むのにスキャナー(GT9300UF)買ったんですが付属のソフトじゃだめで
本格読取買ってみてもダメ、読んでココ体験版でも読めなかったですが、ABBYYのファインリーダー体験版はエラーなく読めるようでした
あと読取革命体験版はちょっとエラー出ますが、使い方悪いのかもしれないですがここはABBYYのソフトを買うのがいいでしょうか?
ネットで海外製品買ったことないですが大変ですか?

http://www.amazon.com/exec/obidos/tg/detail/-/B00006AGQU/qid=1077072153/sr=1-2/ref=sr_1_2/103-5342626-7156647?v=glance&s=software
797名無しさん@お腹いっぱい。:04/02/18 18:27 ID:b+I+V/MC
>>795
試してみたけどだめっぽいね。。。
798名無しさん@お腹いっぱい。:04/02/18 22:06 ID:9G9rMBAZ
>>796
和製OCRソフトの殆どはABBYYのエンジンを使ってる。
認識の設定で和英混在とか英文主体とか選択できるから(少なくとも読んdeココは可能)
ヘルプを参照してもう一度試してはいかが。
799796:04/02/19 00:47 ID:LllmSbCF
>798
あ、やっぱりそうですか・・・やってみます

それと読取革命体験版ですが気になったのは、本がななめになってると
1行読めなかったりしましたが、これも設定の問題ですかね


800名無しさん@お腹いっぱい。:04/02/19 02:47 ID:sgwLgyPi
八百(σ・∀・)σ ゲッツ !!
801796:04/02/19 22:56 ID:rhx8tQ1e
>798
スキャナー付属の読んdeココで読めました
認識パラメータを英語にしてもちょこちょこ漢字とか混ざってましたが
スキャナーの画像取り込みの濃度をうすいにするとエラーなくなりました
それとなぜか付属のソフトが読み込みも認識も圧倒的に速いです

本格読取1980エソ買ってしまって無駄ですた
もう一つ買った本格翻訳はエキサイトよりはかなりいいです
どうもお騒がせしました...
802名無しさん@お腹いっぱい。:04/02/20 14:48 ID:jqt28BDc
>797
あ、やっぱりそうですか・・
803797:04/02/21 17:57 ID:uM7dcJpi
>>802
読取革命での画像修正機能はないよりまし、くらいに考えて
先にvixででも目的の画像を一括で回転させておけばいいかもしれませんねー。
8ではできないのかな。。。
804名無しさん@お腹いっぱい。:04/02/22 21:56 ID:k7QPJenZ
読取物語V4をもうちょっと使いやすくして
安くした(20000円ぐらい)新バージョンでねーかなあ。
はっきり言って読んでココやe.Typistなんか軽く
吹っ飛ぶと思うんだが・・・

オレはリコーは大っ嫌いなんだけど読取物語だけは全面支持する。
805名無しさん@お腹いっぱい。:04/02/22 22:17 ID:93EwQKfH
読み取り物語って、初めてきいたわ
806名無しさん@お腹いっぱい。:04/02/22 22:30 ID:ZD/aWwe/
新台入荷ですか?
807名無しさん@お腹いっぱい。:04/02/23 04:54 ID:LGCbJhV/
>>804
どこがいいの?
808名無しさん@お腹いっぱい。:04/02/25 17:30 ID:jauiArzM
超初心者です。教えてくんで、すみません。
新聞記事のスクラップや写真入の雑誌記事のスクラップを
したいんですけど、e.typist9.0 + やさしくファイリング5
を買いました。取り合えず、ばんばんスクラップをスキャンして
CDに焼く(スクラップ)のが目的のときには、OCR処理しなくても
良いの? 後から必要なときに処理すればよいのかな。
「やさしくファイリング5」 の方で十分なのでしょうか。
スキャンした画像っていうのでしょうか、は印刷してみてもコピー撮ったみたいに鮮明です。

OCR処理を掛けるのは、後から編集するときですか?
あと、そのときにはPDF形式で保存しておくのが良いの?
それともスキャンしたままのJpeg。で良いのかな。
あんまり大きなファイルにしたくないのです。
アホ丸出しの質問で、すみません。
809名無しさん@お腹いっぱい。:04/02/25 18:17 ID:DPC3j3To
読取革命Ver.8の乗り換え版を買った。

製品版と乗り換え版はCDが共通だった。
810名無しさん@お腹いっぱい。:04/02/25 18:50 ID:y3w5at0b
>>808
> スキャンした画像っていうのでしょうか、は印刷してみてもコピー撮ったみたいに鮮明です。

うらやましい...

> OCR処理を掛けるのは、後から編集するときですか?
> あと、そのときにはPDF形式で保存しておくのが良いの?
> それともスキャンしたままのJpeg。で良いのかな。

画像より,文字情報として PDF にした方が,
ファイルサイズも小さく,閲覧にかかる処理も少なくなるでしょう.
はい.画像のままならば,jpeg にすべきです.

ところで,jpeg と png がどっちがいい?
811名無しさん@お腹いっぱい。:04/02/25 18:59 ID:+a/pPrLR
>>810
スキャナで取り込んだものなら、高画質設定のJPEG。
812名無しさん@お腹いっぱい。:04/02/25 21:26 ID:+NLzAsKT
>>809
乗り換え版って、通常版とどう違うの?
CDが同じなら、通常版を買う意味ないですよね。
813名無しさん@お腹いっぱい。:04/02/25 21:58 ID:+NLzAsKT
>>804
「読取物語 EX V4」の試用版を試してみた。
確かに、認識性能は高いように感じるけど、
画面デザインがアレでは、他社と直接競合するのは無理っぽい。
814名無しさん@お腹いっぱい。:04/02/25 22:08 ID:RPxWtsb+
>>804 には OKREADER2000 をお勧めする。
815808:04/02/25 22:19 ID:dWHd61q/
ありがとうございました〜
そっか、PDFは画像→文字なんですね。にゃるほど。
816808:04/02/25 22:28 ID:dWHd61q/
自己レスです。分かりました、Ctrl.+Altで反転してみたら
透明テキスト付きのPDFになってますた。どょうも〜
817名無しさん@お腹いっぱい。 ::04/02/25 22:30 ID:dWHd61q/
Ctrl.+Alt → Ctrl.+A
818名無しさん@お腹いっぱい。:04/02/26 10:56 ID:n4/fs/aF
デジカメを利用した原稿入力には、書籍を分解せずに済むメリットがあると思います。
現在、主力と思われる3本のソフトについて検証してみました。
・e.Typist v.9.0 :MEDIA DRIVE
・読んde!!ココ Ver.10 :A.I.soft
・読取革命 Ver.8 :Panasonic
デジカメデータは、200万画素、1600*1200で、文庫本の片ページを1枚として撮影したものを使用。
その他、ISO感度、カラー/モノクロ、フラッシュ等、色々な条件で試しました。
819名無しさん@お腹いっぱい。:04/02/26 10:56 ID:n4/fs/aF
・e.Typist v.9.0 :MEDIA DRIVE
体験版の機能制限項目に"デジカメ監視ツール"とある。
エクスプローラから画像をまとめてD&Dしたところ、無事に読み込んだ。
[ツール]>[操作設定]>[ファイル読込]で、
画像色:[白黒] DPI:[400]
としたときに、一番きれいに取り込めているようだ。
認識力は非常に高く、なんでもかんでも文字に変換する。
また、ルビを分離する能力も高い。
反面、変換が手当たりしだいといった感じで、
括弧や、句読点の変換が弱いので、意味不明の文章になりやすい。
デジカメデータのOCRとしては、今一歩という感じ。
820名無しさん@お腹いっぱい。:04/02/26 10:58 ID:n4/fs/aF
・読んde!!ココ Ver.10 :A.I.soft
→注 :体験版はVer.9です。
画像をエクスプローラーからD&Dしたところ、暴走。原因不明。
メニューから読み込ませたところ、問題なし。
読み込み時の解像度変更に時間がかかるが、回転/傾き補正は完璧に近い。
[環境設定]>[その他]>[その他の設定]>認識前後の処理を自動化する>[設定]
□画像のノイズ除去を行う
の設定で、認識結果が格段によくなる場合があります。
認識力は充分で、比較的読みやすい結果が得られます。
ルビを分離する能力も高いです。
ただし、文字として認識できないものは、あっさり切り捨ててしまいます。
取りこぼしが多くなるので、デジカメでの利用は辛いと感じます。
821名無しさん@お腹いっぱい。:04/02/26 10:58 ID:n4/fs/aF
・読取革命 Ver.8 :Panasonic
デジカメ画像の認識がウリになっているソフト。
デジカメの接続を監視するツールが付属。
[オプション]>[環境設定]>[自動画像補正]
の設定項目があるものの、自動での補正は最低限にとどめたほうがいい感じ。
自動での画像の取込/変換には首を傾げざるを得ない。
[画像]メニュー以下の、[減色][コントラスト][ガンマ補正]等を駆使して最適化する必要がある。
手動で最適化した画像の認識力は非常に高く、最も優れていると感じる。
ただし、ルビに関する設定が存在せず、あらかじめ手動で消しておく必要がある。
全体に、職人向けツールという感じで、手間をかけたくない人には向かない。
しかし、他のソフトが手も足も出ない画像であっても、手動で何とかできる点がいい。
デジカメデータのOCRには、一番向いているように感じる。
以下、問題点。
・ルビに関する設定項目がなく、ルビを含む漢字は意味不明のものに変換されやすい。
・画像の取込時に、DPIを上げる処理が欲しい。
・画像補正ツールのプリビューが小さ過ぎて、結果が把握できない。
・ツールが多いのに、アンドゥが1回限りなので、始めからやり直しになることが多い。
・[傾斜][カラーフィルタ]等、一部のツールが、どう使っても結果を悪くするだけ。
・とに角、オートが弱い。

オート任せで実用に耐えるのは、「e.Typist」だけでしょう。
822名無しさん@お腹いっぱい。:04/02/26 12:49 ID:UEwGibKV
>>818-821
レポ乙
823名無しさん@お腹いっぱい。:04/02/26 18:25 ID:5lxjsOkG
読んDeココのテキストボックスについての解答を書いておくぞ。
(知っている人はスルーでお願いします。)

ttp://ai2you.com/ocr/user/guide05.asp
を見たら分かります。
以上。
824名無しさん@お腹いっぱい。:04/02/26 18:39 ID:I9Tm2Kzc
>>812
その通りです。
825名無しさん@お腹いっぱい。:04/02/26 20:24 ID:p29jEEZH
>>814のお言葉に従ってOK READERを買ってみようかと思ったのだが
売ってねー。
826名無しさん@お腹いっぱい。:04/02/26 21:17 ID:S2we82g9
>>811
やってみました.一長一短のようですが...
それでもファイルサイズは png の圧勝 (小さい) です.

文字の多い画像に適するのは jpeg か,png か.
理論的な根拠を知っている方,教えてください.
827名無しさん@お腹いっぱい。:04/02/26 23:21 ID:p7bgNrAx
>>826
jpgは、輪郭がぼやけるのに対し、
pngは、輪郭がシャープ

従って、文字の多い画像には、pngがおすすめ。

>>818-821
詳細レポ、参考になります。
828名無しさん@お腹いっぱい。:04/02/27 09:14 ID:mdnlIRDs
単色の部分が多い場合はpngの方がいい。
でもスキャナで取り込んだ場合は、
背景の白の部分でも微妙に色が違ったりするから、
jpegの方がサイズ的に有利になる場合もある。
原稿やトーンカーブの設定などによって結果は違う。

色数が少ない、単色が多いもの→png
色数が多い、微妙な色があるもの→jpeg

gifとjpegとpngの比較(pngはgifとほぼ同様)
http://www.komakusa.net/internet/gazou.html
829名無しさん@お腹いっぱい。:04/02/27 15:59 ID:XPbXRsbu
趣味の競馬データを取り込んでいますが、四角記号(ロ)の中の数字、、
(角囲みの数字)が外字扱いのためまったく認識してくれず手入力しかありません。
外字登録しても認識されません。丸囲みは大丈夫なようです。
どなたか似たような処理でいい方法を知ってる方いませんか?
830く ろ し ろ:04/02/27 16:03 ID:9ZgP8gni
w
831名無しさん@お腹いっぱい。:04/02/27 19:44 ID:8yhQg74a
>>829
認識辞書に登録して外字にひもつけするのではダメなのか?
832名無しさん@お腹いっぱい。:04/02/28 13:57 ID:eRFipMI2
デジカメデータの認識。その後も、検証を続けております。
だんだん撮影テクニックの方が、上がってきました。(w
当たり前のことですが、撮影が最も重要です。
特に重要なのが、ページ全体にむらなく光を当てることです。
そのため、ズーム(3倍)をテレ端にし、フラッシュを使用した場合が最もよい感じです。
露出補正も、少し明るめにするといいでしょう。

・e.Typist v.9.0 :MEDIA DRIVE
[ツール]>[操作設定]>[ファイル読込]は、
画像色:[フルカラー] DPI:[400]
の設定で問題ないようですね。
むらのない撮影を行えば、設定をいじってもほとんど変化はありませんでした。
端から端まで、手当たり次第に、文字に変換します。
[文字認識]>[認識字種設定]>[認識字種]>[□記号]に、チェックを入れることで、
括弧や句読点も認識してくれました。なぜ、デフォでOFFにする……。
後から気づいたのですが、非常に行儀の悪いソフトですね。
デスクトップのアイコン及び、コンテクストメニューを勝手に追加され、
マイドキュメントフォルダ内に、"e.Typist User Data"フォルダが作成されました。
起動時のもたつきも、少し気になります。
833名無しさん@お腹いっぱい。:04/02/28 13:57 ID:eRFipMI2
・読んde!!ココ Ver.10 :A.I.soft
→注 :体験版はVer.9です。
撮影の上達で、取りこぼしが減ってはきたものの、根本的な解決は無理でした。
オートでどうにもならない場合、手の打ちようがないのが欠点です。
レイアウトの認識が悪い意味でものすごく、
文庫の1ページが極めて複雑なレイアウトに化けます。
認識された領域内で右クリック>[パラメータの設定]>[認識パラメータの設定]で、
認識のデフォルト設定を登録できることに気づきましたが、
レイアウトそのものには影響しないようです。

・読取革命 Ver.8 :Panasonic
とに角、画像のコントラストを高くすることです。
文字が薄くならないように、ガンマ補正も使います。
画像の補正が上手くいったときは、ほとんど完璧に変換できてしまいました。
行の傾きに弱いので、[画像]>[傾き補正]>[手動]で調整します。
傾いてさえいなければ、ある程度までは、ルビも自動で無視するようですが、
樽型、糸巻型のゆがみに弱いです。
オートではほとんど使えない点にも、注意が必要です。
834名無しさん@お腹いっぱい。:04/02/28 13:58 ID:eRFipMI2
・読取物語 EX V4 :リコーシステム開発
も試したのですが、
画像の変換が[編集]>[モノクロ変換]くらいしかありません。
しかも、プリビューがないので非常に調整しづらいのです。
なぜか、[設定]>[環境設定]>[カラー画像処理]のほうにはありますが……。
どうあれ、これを使いこなそうと思えるようなデザインではありません。
他のメジャーソフト3本が揃えられるほどの値段の割には、お粗末だと思います。
リコーの想定している市場が違うのでしょう。

全体の感想としては、「e.Typist」のお買い得感が高いです。
オートでも、そこそこ使えますし。
少々妙な認識結果でも、取りこぼしが少ないのは安心できます。
読込時の画像処理性能が上がれば、さらによくなりそう。
「読んde!!ココ」は、3本のなかでは、最もインテリジェントに処理していると感じられ、
それだけに、オートで対処できない部分が惜しまれます。
Ver.10に期待してますが、OCRソフトにコピー機能とか必要かな?
「読取革命」もなかなか捨てがたい能力なので、難しいところです。
でも、レタッチ職人を何百ページも行うとなると、実用的ではありません。

どのソフトも興味深く、なかなか短くまとめることができませんでした。
また何日も使っている間に、各ソフトの印象が二転三転したことも付け加えておきます。
読みにくいレビューにお付き合いいただき、ありがとうございました。
835名無しさん@お腹いっぱい。:04/02/28 16:28 ID:ps5XnACv
ホントに読みにくい上に何の役にもたたない自己満足の長文ご苦労さん

と、読んdeココのバカさにむかついて半分八つ当たりしてみる。
836名無しさん@お腹いっぱい。:04/02/28 16:42 ID:Cgh0X90D
>>835
おまえ最悪だな。
>>832
レビューお疲れ様です。非常に参考になると思います。
837名無しさん@お腹いっぱい。:04/02/28 17:04 ID:v4Fq0Wgh
読んでココ!ver8 使用です。
英語の小説本を取り込んでテキスト変換してるんだけど、横一段組の文章な
のに時々妙に単語間の空白が数行揃ってしまい、2段組のブロックと認識し
て分割して読み取られてしまうことがあります。

これを手動で一段組みの文章として認識させるような機能はあるんでしょう
か。
838名無しさん@お腹いっぱい。:04/02/28 17:47 ID:q4wu6rXP
やっぱ e.Typist かなぁ
839名無しさん@お腹いっぱい。:04/02/28 19:04 ID:owmOa9Dk
>>832-834
乙。いろんな使用場面での得意不得意が浮き彫りになって興味深いね。

>>835
読んdeココに手を焼く所は同情の余地があるが、とりあえず氏ね。
840名無しさん@お腹いっぱい。:04/02/28 19:08 ID:owmOa9Dk
>>837
その不具合の出るページだけ、認識枠の設定を手動で行ってみてはどうでしょう。
841名無しさん@お腹いっぱい。:04/02/28 20:09 ID:v4Fq0Wgh
>>840
レスありがとうございます。
2段組に認識されてしまう部分(例えば10行)を手動で枠で囲い、
そこだけ別に認識させるということですよね。
それもトライしたんですが、同様に2段組と認識してしまうんです。ホントハラタツ…
1行ずつやるのも空しいし、打つ手ナシか〜……
842名無しさん@お腹いっぱい。:04/02/28 20:31 ID:J9JQZV+w
でも認識結果の正確性を優先するなら、1行づつの枠設定もやむをえないかと。

あとは、Ver.10の体験版が出たらレイアウト認識の改善度を試してみるとか。
843名無しさん@お腹いっぱい。:04/02/28 21:28 ID:v4Fq0Wgh
>>842
ですね〜。今は、ちょうど真ん中辺で分断された2段を1行ずつ左右繋ぎ合わ
せて対処してます。

ふと思ったけど、全体のレイアウト自動認識モードと、ひと枠は一行として
強制的に認識させる手動モードの2パターン切り替え機能を搭載するのって
難しいんでしょうか。これが出来ればずいぶん使い勝手が向上すると思う
んだけど…。
844名無しさん@お腹いっぱい。:04/02/28 21:59 ID:U6JPCAWO
>>843
今、試してみたけど。

1. 2つの枠のうち片方をクリック
2. 選択された枠内で右クリックして、[枠の消去]を実行。
3. 残っているほうの枠をクリックした後、
ふちをドラッグして選択範囲を必要なだけ拡大。
4. アイコンメニューから認識を実行。

で、いけるみたい。
845844:04/02/28 22:06 ID:U6JPCAWO
ごめん。
"2."の[枠の消去]は、Deleteキーでいけたわ。

しかし、枠を自由に変形させても、認識範囲が改善されるわけじゃないのね……。
846名無しさん@お腹いっぱい。:04/02/28 22:33 ID:EhyDRMSI
本の場合、毎回レイアウト認識させる必用ないんだよな。
枠情報保存、読み込みとかあるし

何を苦労してるんだか、さっぱりわからん。
847名無しさん@お腹いっぱい。:04/02/29 07:17 ID:CgFi9dVh
>>846
えー!どうやるの?
「読んde!!ココ」の場合、設定した枠と実際の認識範囲が一致しないから問題なわけで。
見つけた。[ファイル]>[枠情報の保存]ですね。
これは、単票でないと、原稿がずれるから使えないのでは?
認識したい範囲を枠で囲って、右クリックから[認識]でも、
設定した枠内だけ認識しますね。気づかなかった。_| ̄|○
でも、レイアウトは改善されるけど、取りこぼしに関しては変化がないです。

「e.Typist」だと、枠で囲って[認識]アイコンクリックで絨毯爆撃してくれる。
848名無しさん@お腹いっぱい。:04/02/29 10:09 ID:CgFi9dVh
デジカメでペーパーバックを撮影し、認識させてみました。
例によって、片側1ページを撮影してます。
ラフに撮影して、わずかに文字領域が台形になった画像を使いました。
→デジカメの小さな液晶でまっすぐ撮るのは、案外難しいです。
日本語の文庫に比べて、文字数が多いにもかかわらず、
印刷が太く、くっきりしているため、日本語より認識しやすいようです。
各ソフトとも、英語認識モードに切り替えて行いました。
・e.Typist v.9.0 :MEDIA DRIVE
ほぼ文句なし、ほとんど修正の必要も認められません。
英文だと、傾きなんか障害にならないようです。
また、誤認識部分の赤字での表示も正確でした。
・読んde!!ココ Ver.10 :A.I.soft
→Ver.9使ってます。
1行くらいしか、認識してくれませんでした。
文字領域が台形に変形しているせいでしょう。
別にレタッチソフトでもないとどうしようもありません。
・読取革命 Ver.8 :Panasonic
オートではどうにもなりません。
[画像]>[長方形化]で、テキストを水平にしてあげると、非常に良好に認識しました。
ペーパーバックの場合、コントラストの修正なしで済みました。

>>835
ウザくてごめんね。
849名無しさん@お腹いっぱい。:04/02/29 10:12 ID:CgFi9dVh
現在、「読んde!!ココ Ver.10」体験版、
ナローバンドでダウンロード中……。_| ̄|○
850名無しさん@お腹いっぱい。:04/02/29 11:01 ID:wD6dOWJa
自動領域抽出時に表領域を抽出しない(N)
自動領域抽出時にイメージ領域を抽出しない(I)
自動領域抽出後の領域は段組なしにする(P)
851名無しさん@お腹いっぱい。:04/02/29 11:02 ID:l3ejVJY3
>>848
コテハンにするかトリップをつけていただくというわけには行きませんか?
852名無しさん@お腹いっぱい。:04/02/29 11:11 ID:wD6dOWJa
段組み

文書に段組みがあるかどうかを指定します。
通常はデフォルトの[自動判別(L)]のままにしておけば
システムが自動的に段組みの有無を判別します。
段組みにしたくないときは、[なし(N)]に変更します。
枠種別を[表(B)]に設定した場合は選択することはできません。
この場合、段組みは[なし(N)]になります。
853名無しさん@お腹いっぱい。:04/02/29 15:29 ID:CgFi9dVh
>>850
全部チェックしてあるけど、
複雑なレイアウトの自動判定には影響してないです。
854名無しさん@お腹いっぱい。:04/02/29 16:55 ID:S9dE7KKE
>>849
公式ページにはまだ体験版来てないじゃないか。
ワンタッチOCRのと勘違いしてない?
855名無しさん@お腹いっぱい。:04/02/29 16:59 ID:CgFi9dVh
>>854
うん、勘違い。
856名無しさん@お腹いっぱい。:04/02/29 17:08 ID:JSl5zdy1
857名無しさん@お腹いっぱい。:04/02/29 17:12 ID:S9dE7KKE
Vectorではもう落とせるのか。盲点だったな。thx
858837:04/02/29 18:25 ID:ev3S9u/7
>>852
!! ここに設定あったのか〜
ヘルプのキーワードで「段組み」入れても何もヒットしないんでてっきり…。
試したところ確かに一行として読み取りました。
どうもありがとう。
昨日レスくれた人達もありがとうございました。
859名無しさん@お腹いっぱい。:04/03/02 22:16 ID:Gp1s1U/T
どどど・どうしたんだ!
しばらく来ないうちに、この一ヶ月ほどすごい良スレだったんだね!
860名無しさん@お腹いっぱい。:04/03/03 08:02 ID:68fvt6sD
どこがだ。
861名無しさん@お腹いっぱい。:04/03/04 21:08 ID:NEGp0nGO
ココ10はだいぶインターフェイスがe.Typistに似てきたね。
862名無しさん@お腹いっぱい。:04/03/04 21:28 ID:PMqNoyn3
重要なのはインターフェースや転送や印刷じゃなくて
認識能力なんだけどなあ。
863名無しさん@お腹いっぱい。:04/03/06 21:15 ID:kuZWW9fT
で、読んdeココ10の認識能力はどうですか。
864名無しさん@お腹いっぱい。:04/03/06 23:13 ID:iy+7odC/
びっくりするほど良いですね
865名無しさん@お腹いっぱい。:04/03/06 23:34 ID:JEm9WZyR
読取革命の試用期間短すぎる _| ̄|○
866名無しさん@お腹いっぱい。:04/03/07 21:09 ID:Ux3Vu8vZ
厨な私に教えてください。
OCRソフト(e.Typist9.0)を用いて、スキャナで読み込んだ雑誌の原稿
(モノクロ。OCRを行うため、400dpiでスキャン)を、日本語OCR処理
をした上で透明テキスト付PDFファイルにして保存する際、OCR処理後
の画像ファイルは400dpiも要らないので、150〜200dpi程度に画質を
落とした上で、透明テキスト付PDFファイルとして保存したいのですが、
今いちやり方がよくわかりません。
>>698 には、リサンプルという方法が書かれているのですが、当方、
なにぶん厨なもので、マニュアル読んでもやり方がよくわからないの
です(Acrobatはマニュアルがわかりづらいし!)

e.Typist9.0とAcrobat5.0(Readerじゃない奴)を持ってます。
激しく既出であれば、ここ嫁とか教えてくれれば、すぐ逝きます。
867名無しさん@お腹いっぱい。:04/03/07 21:24 ID:WFjiuZfr
>866
読んde!!ココには出力時の画像dpiを指定するところがあります。
[オプション]-[環境設定]-[画像領域の設定]-[画像の出力解像度]です。
72,96,150,200dpi、元のままの5つから選択できます。

読んde!!ココしか使ってないので、他のOCRではどうだかは知らないです。
868名無しさん@お腹いっぱい。:04/03/07 23:04 ID:Ux3Vu8vZ
読んde!!ココ には設定があるのですね。
e.Typistとは性能的に一長一短なようだけど、乗り換えも
検討しようかな。
869名無しさん@お腹いっぱい。:04/03/08 02:42 ID:SOQVxIGU
短の部分の方が多いから後悔しないかな‥。
870866:04/03/08 21:52 ID:tBoc1Fkf
e.Typist9.0でも、 >>867 と同じ機能を発見しました。
「ツール」→「環境設定」→「読込・保存」→「認識結果の保存」
で、「図領域・背景の出力DPI」を変えることができます。
「72、96、120、144、168、192」の各dpiと、デフォルトのままの
都合7段階に可変です。大変失礼しまつた。

・・・でも、192dpiにして印刷すると、漏れ的には今イチなんだ
よね〜〜 雑誌の論文とかが多いんだけれど、192dpiだと、やや
文字がかすれ気味に印刷される。Acrobatでリサンプルできている
人はど〜なんでしょ。

>>869
やはりそーなんですか。もう少しe.Typist9.0で頑張ってみます。
871名無しさん@お腹いっぱい。:04/03/09 17:30 ID:IhF7S1gl
すみません、e.Typist9で質問です。
複数の文字が1文字で認識されてしまうのですが、
読んでココの様に文字を分離して再認識させる機能は無いのでしょうか?
>>756で既出の質問ですが、FAQにも無いのとサポセンが5時までしかやってないので、
今一度質問させて頂きました。
872名無しさん@お腹いっぱい。:04/03/09 20:30 ID:4IScVx97
>>871の自己レス
VwalkerのOCR比較特集見たら
「1文字に認識されたデータを複数の文字に分割する機能がない」
と書いてありました。うーーーーーん。
873名無しさん@お腹いっぱい。:04/03/14 13:11 ID:9EvBU3hH
質問です
読んで10を使用しています。
スキャンしたデータをPDF透明テキストで
保存しています。

PDFを開いた時に1ページ2ページと
複数のデータを表示できますよね。

私も複数のデータをまとめて
一つのPDFファイルにしたいと思いますが
どうやったら出来るのでしょうか?

874名無しさん@お腹いっぱい。:04/03/14 13:20 ID:OuBHkuPy
>>873
左の画像を複数選択したまま保存。
875名無しさん@お腹いっぱい。:04/03/14 14:00 ID:9EvBU3hH
>>874
サンクス

左側に画像リストが表示されていなっかた
のでわからなかった。

有りがトン
876名無しさん@お腹いっぱい。:04/03/17 00:46 ID:VGOdP+ko
他所のパソコンのAcrobatで作成した「透明テキスト無し」の
PDFファイルを、自宅のパソコンのe.Typist9.0でOCRかけて
「透明テキスト付」PDFファイルに変換しようとした。
出来なくは無かったものの、最初のファイルの読み込みに
異様に時間がかかったYo。
また、当初は高々2〜300KBくらいのサイズだったのに、OCR
して透明テキスト付きにして上書き保存したら、なんと10MB
のファイルになっちった。
やり方まずったのかな〜 わかる人いたら教えて下さい菜。
877名無しさん@お腹いっぱい。:04/03/17 19:27 ID:x0NLRpT6
PDFのOCRにやたら時間が掛かるのは8.0から変わってないようだね。
相変わらずダメダメだなー

PDFは上書きするとサイズが大きくなるのは有名な話で
「名前を付けて保存」で別ファイルに書き出すとたいがい小さくなる。
878名無しさん@お腹いっぱい。:04/03/18 00:06 ID:s97fn9J3
上書きNGは既出だったのかぁ。ありがとん

やたら時間がかかるのみならず、何十頁ものPDFだと
メモリ不足だ、とか言ってエラーが出やんの。
ダメダメだなー
Athlon XP 1900+ に512MBなんだけど。
879名無しさん@お腹いっぱい。:04/03/18 01:20 ID:LkQwer2e
そのスペックならマシンには罪はないよ。
PDFファイルのOCRなら、読んdeココ+Acrobat(Readerに非ず)の組み合わせが良。
ただ読取革命もPDFからOCRできるようになったらしいので、ひとつ試してみてほしい。
http://panasonic.co.jp/pss/pstc/products/yomikaku/demo.html
880名無しさん@お腹いっぱい。:04/03/18 18:06 ID:kPydAEve
スキャナにバンドルされてた読んで此処使ってるんですが
ルビまで認識してくれるのはいいんですが本文の横に結果が出力されるので
テキスト整形するのがとてもめんどくさいです。
ルビを漢字の後ろに表示する事は出来ないんでしょうか?

ちなみにバージョンは

読んde!!ココ_パーソナル_Ver.3

です
881名無しさん@お腹いっぱい。:04/03/18 19:19 ID:xAWkD9cj
読んdeココVer.9では 環境設定→認識 の中の
「ルビの処理」で「埋め込む」を選べばOK となっている。
パーソナルではどうなのか知らないが、見つからなければヘルプを探しな。
882名無しさん@お腹いっぱい。:04/03/20 14:53 ID:ilLl3y/U
e.Typist9でExcel表を読ませてワンボタンでExcel転送した。
認識も修正も転送もほとんどシンプルにできて十分実用できる。

でも、Excelに送った表の数値を「=SUM(A0:A1)」とか集計させようとしても
「0」になる。セル属性を数値や標準にかえても「0」。なんでだろ?
エラーとか「#VALUE」とかならまだ分かるけど、なんで「0」なんだろ。

マニュアル会社にあるからわかんないや。
でも住所録や顧客リストなんかを読み込ます分には十分べんりだよ、e.Typist9。
883876:04/03/21 00:23 ID:ff4YO4sC
>>879
ありがとうございます。読取革命と読んdeココ10を検討して
みます。

あと、>>794 に出ていた、「やさしくPDF OCR」が既に発売
されてますね。
「PDF(透明テキスト無)」→「PDF(透明テキスト付)」の処理
スピードはどうなんだろう? 試した人います?

既にe.Typist9.0 持ってるので、処理スピードが速くなったの
なら、実売4000円前後だし買ってみようかな、と思うのです
が、実は単なるe.Typist9.0の機能制限版みたいな奴だった
りすると、 _| ̄|○ になってしまうので。


「やさしくPDF OCR」
http://pac.mediadrive.jp/topics/20040210_pocr.html
884名無しさん@お腹いっぱい。:04/03/21 00:42 ID:O0bbSnDS
まず間違いなく機能制限版でしょう。
体験版がリリースされて試してからの方がよいかと。
885名無しさん@お腹いっぱい。:04/03/21 17:33 ID:GRhrlZuI
>>883
本格的にテキスト付きPDFにしたいなら、Mac版eTypistですよ。
一瞬といったらおおげさだけど、普通のTIFFファイル読み取りと同じスピードです。
886名無しさん@お腹いっぱい。:04/03/24 00:55 ID:NVD8ZmFM
ほほー、いいこと聞いた。
しかしそのためだけにMac買うわけにもいかんざき
887名無しさん@お腹いっぱい。:04/03/29 07:34 ID:y4741GyY
読んdeココ Ver10.0のバグと思うんだけど(汗)・・・

画像ファイル(BMP・PNG等)を読み込んで(300個以上)これをそのままPDF方式
で保存するとき(複数ページファイル化)に129個?目を書き込んでいる所で
読んdeココが強制終了してしまいます。

一応、エーアイソフトのサポートにメール出したけど・・・まだ返事こない
888名無しさん@お腹いっぱい。:04/03/30 13:09 ID:Wo/CfPMV
889名無しさん@お腹いっぱい。:04/03/30 14:49 ID:wob826Ea
OCRソフトでフリーでオススメはあるでしょうか?
890名無しさん@お腹いっぱい。:04/03/30 16:12 ID:wob826Ea
すみません、フリーでは大したものは無いみたいですね、シェアにします
英語だけでいいので、認識率の高いソフトは何があるでしょうか?
891名無しさん@お腹いっぱい。:04/03/31 11:46 ID:/9INOszL
>>887なんですが、エーアイソフトから、回答キターー!

やはりバグだった模様で・・・、PDF複数ページファイル化保存すると130個め
を書き込んでいるところで強制終了してしまう

修正モジュール「Mem_pdf.DLL」が送られてきたので読んdeココのフォルダに
上書きで入れたら正常になった。良かったーーー。

・・・これ目当てでVer10買ったからな(認識率は二の次で(汗))、もしだめなら
コレ買った意味なかったんでね・・・・

そのうち、エーアイソフトから自動アップデートで修正が入ると思う(この地点で
まだ上がってない)
892名無しさん@お腹いっぱい。:04/04/03 07:41 ID:kuxNa9iu
読んdeココVer9.02を使っているんだがPNG形式の画像ファイルを読み込めなくなった。
確か最後にしたことが4色PNG画像をいくつか読み込もうとして強制終了したことだったと思う。
なにせ久々に使おうかと思ったからよくわからないけど。
後は強制終了した後にもう一回起動させたら変更したはずのツールバーもインストール時と同じに戻っていた。

これって再インストールするしかないんだろうか。
スキャナにバンドルされていたやつから乗り換えたから
バンドル版→アップグレード版
といった順にインストールしかなきゃならないのだろうか?
893名無しさん@お腹いっぱい。:04/04/12 07:35 ID:3/CZousJ
age
894名無しさん@お腹いっぱい。:04/04/13 00:48 ID:z4fvk2kY
UPGRADE対象のCDを持ってれば、いきなり9から再インストールしても大丈夫だよ。
途中でCD入れろとメッセージが出る。
895名無しさん@お腹いっぱい。:04/04/13 18:19 ID:ZaYV1iYp
e.Typist9.0にて、[環境設定]-[読込・保存]-[PDFファイル]で
読み込みDPIの設定が200dpiでグレー表示になって、変更できないのは何故?
ヘルプには「PDFファイル読み込み時の解像度を設定します」とある。
PDFを読み込んで、透明テキストPDFにしてるのですが、
元ファイルに比べて結果のPDFの画像が荒くなるので
読み込み解像度で調整しようと思ったのですが。
896名無しさん@お腹いっぱい。:04/04/14 10:17 ID:lhR6SjVf
↑すみません。カン違いでした。
NT4.0はPDF読み込み未対応ですね。実際に作業で使っているWin2000では設定できます。
897名無しさん@お腹いっぱい。:04/04/20 23:54 ID:0sFjSJ6Q
pdfを読み込むのに時間がかなりかかっています。

MDC printerが勝手に立上りそこで何か印刷する素ぶりをしていまして
この動作に時間がかかっています。

このMDC printerの立ち上げを停止する方法はないでしょうか?
898名無しさん@お腹いっぱい。:04/04/21 14:04 ID:1mMKnwrK
おそらくPDFを画像情報としてeTypistに渡すための仮想印刷ドライバだろう。
それなしではPDFをOCRに掛けることが出来ないと思われ。
899名無しさん@お腹いっぱい。:04/04/23 18:11 ID:RcbsEjNS
PC-Watchに紹介されていたブラザーのOCRソフト。
ttp://www.brother.co.jp/jp/honyaku/info/ocr/ocr_ove.html
900名無しさん@お腹いっぱい。:04/04/24 19:22 ID:dT+uYK2W
その値段でその程度の機能しかないならソースネクストの奴がマシだろ
901名無しさん@お腹いっぱい。:04/04/25 11:13 ID:bSIMzEgc
マニアックな質問で申し訳ないのですが、
ドイツ語のひげ文字(German text, Fraktur)を読み取り可能な
OCRソフトってありますでしょうか?
スレ違いでしたら申し訳ありません。
他にOCRに関するスレが見あたりませんでしたので。
902名無しさん@お腹いっぱい。:04/04/25 12:56 ID:rbmefwBc
>>901
このスレッドのログを「ドイツ」で検索すると >>413 >>754 の発言がヒットする。
そのうち >>754 の発言は日本語とドイツ語の混在論文をeTypistというソフトで取り込んでいて
「認識率が高い」という評だな。

んで、そのeTypistというソフトの発売元のページは
ttp://pac.mediadrive.jp/et/outline/index.html

ついでだ。
ttp://www.sbpnet.jp/vwalker/series/testlab/art.asp?newsid=6250
「PDF出力対応のOCRソフト5製品を比較する」
というタイトルで複数ソフトの比較記事もある。
ドイツ語とは関係ないし、PDFもどうでもいいだろうが、OCRソフトに関する知識にはなる。

まあ、スレッドログの検索くらい自力でやってから質問してみてもいいとは思うぞ。
903902:04/04/25 13:13 ID:rbmefwBc
おっと、失礼。ドイツ語の「ひげ文字」だったか。
よく読まずに嫌みったらしいことを書いた。失礼。

Googleで「ドイツ語 ひげ文字 OCR」で検索すると
Text Bridge PROというのがひげ文字認識ができたというサイトにぶつかり、
このソフトを調べるとeTypistのインターナショナル版に含まれるようだ。

とりあえず素のeTypist体験版でひげ文字が読めるかどうかやってみれば?
904901:04/04/25 13:18 ID:bSIMzEgc
>>902さん
丁寧なお答えありがとうございます
ただ、私の質問の意図はちょっと違っていて、
ドイツ語はドイツ語でも通常のアルファベットではない(というと語弊がありますが)
ゴチック体を扱えるOCRはないだろうかということだったのです。
一応現行ログは読ませて頂き、ドイツ語・フランス語等についても語られていたので、
私のような質問でもOKかなと思い、質問させて頂きました。

ちなみに、私が言うひげ文字とは以下のURLで表示されているようなものです。
tp://www.tulips.tsukuba.ac.jp/misc/export/cat/goth/goth.html
また、Googleで「ひげ文字 OCR」で検索すると、「テキスト・ブリッジ・プロ」では可能である
との記述も見つけることができたのですが、
実際にメディアドライブに問い合わせてみると、少なくとも現行バージョンでは無理とのことでした。
途方にくれていたところ、このスレを見つけたというわけなのです。

ちなみに私はPresto OCRを使っているのですが、OSをXPに変えたところ、動かない。しかもXP対応バージョンは
もうofficialでは売ってないと、困っているところです…。しかたがないので、店頭在庫品を探してみようと思っています。
OmniPageも考えたのですが、よほどのメリットがないとさすがに難しいですね。
どなたか使っていらっしゃる方がおらられば、是非コメントお聞きしたいです。
905901:04/04/25 13:26 ID:bSIMzEgc
>>902さん、
わっ、時間的にかぶってしまいましたね。失礼しました。
Text Bridge PROについては、↑に書いたとおりなんですよ。
OmniPageのページもみてみたのですが、German text, Frakturは可能言語に
含まれてませんでした。
やっぱり海外版で探すしかないんでしょうか…。
まだ探してもいないのに申し訳ないんですが、
ちなみに海外版の製品は皆さんどうやって入手されてます?
アマゾンでは買えないようですし、何か法律で禁止されているんでしょうか?
906名無しさん@お腹いっぱい。:04/05/03 14:06 ID:tctgkrud
読んdeココ10とe.typist9を試した。
エクセルの表を読みとった結果はe.typistの圧勝。
ボタン一発でほぼ再現した。
けっこうきれいに印刷されてたのに読んdeココは
認識できない文字がいくつかあった。
最初に設定しないと表の形で読み取ることができない?
のもどうかと思った。

次に切り貼りしてある名簿に手書きの注釈がしてあるものを読み取った。
これもe.typistの圧勝。
こっちは比べものにならないほど差がついた。

e.typistはデフォルトのままで直感的に操作できたのに対して、
読んdeココは「こうかな」?と思っても違うことがあって戸惑った。
使用前は読んdeココを評価してたんだけど(まったくの先入観)、
思いっきり評価が変わりました。




907名無しさん@お腹いっぱい。:04/05/03 17:31 ID:Kqy/Quml
>>906
普通のレジュメとか基本書とかだと、読んdeココ10はほとんど訂正入らないくらいで
満足していたんですが、驚きました。
e.typist9も試してみよう。
908名無しさん@お腹いっぱい。:04/05/04 01:46 ID:BKDaK4vM
質問なのですが、eTypist9のアップグレード版は、旧版からアップグレードできるそうですが、
かなり古いバージョンからでもアップグレードできるのでしょうか?
それともバージョン8からのアップグレードとうことなのでしょうか?

自分が昔買ったスキャナに
e.Typistバイリンガル2というソフトがついてきたのですが、
そんなに古いバージョンで、しかもスキャナに付属のものでは、
アップグレード版を買ってもアップグレードは無理なのでしょうか?
バイリンガルというシリーズももうないようですし、アップグレードは無理っぽいかなあなどと思っておりますが、
一抹の期待をこめて質問してみますた。
909名無しさん@お腹いっぱい。:04/05/04 13:09 ID:tLzt914i
たぶん大丈夫
心配ならメーカーに確認してから買うべし
910名無しさん@お腹いっぱい。:04/05/04 17:59 ID:BYthjB8M
なぜ公式ページに書いてあるようなことを聞くのだろうか。

最新e.Typistシリーズのアップグレード対象製品
(バイリンガル・プラスファイリング・インターナショナル全対象)
●下記メーカー製品に付属のe.Typist エントリー・バイリンガル2 ・LE2 ・LE 等の
e.Typist シリーズをお持ちのお客様

●e.Typist v.8.0・v.7.0 ・v.6.0 ・v.5.0 ・98 ・97 ・v.2.0 ・v.1.0 等の、
旧バージョンe.Typist シリーズをお持ちのお客様
(スペシャルパック・得々パック・インターナショナル・プラスファイリング含む)

<ご注意>
※2003年7月以降発売されe.Typistシリーズが付属されている製品も
アップグレード対象となります。
※アップグレードには、上記対象製品が必要です。
※Windows版のみが対象となります。
※体験版、評価版は対象外です。
※購入は次期バージョン発売まで可能です。
※付属版をお持ちでも、スキャナや環境によっては動作しない場合があります。
※上記対象製品1本につきアップグレード版1本が購入可能となります。

911名無しさん@お腹いっぱい。:04/05/05 01:18 ID:s0Oy9Bp5
よく分からない。。

スキャナ付属のバイリンガル2でもアップグレードは可能だが、
>※購入は次期バージョン発売まで可能です。
ということから、
バイリンガル2から一つ上へのバージョンへはアップグレード可能だが、
最新のVersion9へはアップグレードは無理ということでしょうか?
又、最新のVersion9へアップグレードできるとしても、
すでに購入は不可能で、だれかが買ったものをつかえば可能ということなのでしょうか?


912名無しさん@お腹いっぱい。:04/05/05 06:05 ID:HYSE7Ri5
>>911

>※購入は次期バージョン発売まで可能です。
 
 Version9(現在の最新版)はVersion10(次期バージョン)が出るまでしか購入できないよってこと。

バージョンアップの対象が

●e.Typist v.8.0・v.7.0 ・v.6.0 ・v.5.0 ・98 ・97 ・v.2.0 ・v.1.0 等の、
旧バージョンe.Typist シリーズをお持ちのお客様
(スペシャルパック・得々パック・インターナショナル・プラスファイリング含む)

ってことは、最初のバージョンから前回のバージョンまで
どれかを持ってればバージョンアップできるってこと。
あなたの持ってるバイリンガルも含むね。
それでも心配ならメーカーに確認すればよい。
913名無しさん@お腹いっぱい。:04/05/05 13:05 ID:s0Oy9Bp5
よく分かり申した。とんくす。
914名無しさん@お腹いっぱい。:04/05/12 08:47 ID:MZP0p4Vg
私のところも>>876さんと同じように、透明テキストの付加でファイルサイズが
A4原稿1ページあたり2MBくらい増えてたんだけど、Ver.10.00 → 10.01のアップデートで
改善されたよ。
915名無しさん@お腹いっぱい。:04/05/18 15:46 ID:PgTBxxIw
ほんとだ、Presto! OCR、aiSOFTから消えてるね、ひどいね
販売中止はしかたないにしても、発売元として責任もって
アップデータのパッチぐらい置いててしかるべきだよね

・・・と思ったけどそういえば4.1から4.1Plusに上げたときは
パッチじゃなくて新しいディスクがそのまま届いたような気もする
そのへんの事情かなあ

本家のサイトは4.0しかないし、いったい4.1とかいうのは
どういうバージョンだったんだろう
916名無しさん@お腹いっぱい。:04/05/18 15:50 ID:PgTBxxIw
で、ぐぐってみたら

http://uk.newsoft.eu.com/tech%20support/Patch/Presto!OCR%20Pro/prestoocr.htm

っていうのがある
自分では試していないので、正直何とも言えないけど
日本語OS想定してないかもしれないし、とか、いろいろ
不安もありますが、一応おしらせ
917名無しさん@お腹いっぱい。:04/05/19 16:32 ID:HMlNp/e4
FAXで送られてきた書類(少しFAXらしく潰れた感じの文字)
をスキャナで読み取ってソフトにかけて、しっかり認識してくれますか?

パソコンFAXできた書類をe.Typist体験版で試したところ、
新聞文字くらいのところは全然ダメでした。
もしスキャナを通して誤認が少ないようなら、スキャナの購入も考えています。

スキャナ購入候補ですが、
候補 エプソンのGT-9400UF
ソフト まだ迷ってますが、 e.Typistあたりを考えております。
918名無しさん@お腹いっぱい。:04/05/19 17:06 ID:vSCN4LeK
>>917
スキャナ通して改善するなんて考えられんが。そのパソコンFAXって何?
919917:04/05/19 17:50 ID:HMlNp/e4
>>918
書き方が悪くごめん

今、会社の書類をデータ化しようと思って
今までは書類を持って帰って
エクセルに手入力

まいと〜くFAXを購入して会社から自宅パソコンへ転送
FAXイメージのまま保存
文章の検索が出来ないから不便

ocrソフト投入
ただFAXイメージをbmpに変換。解像度がなさ過ぎるので
誤認だらけなのかと
↓スキャナ購入
会社から書類を持って帰る
スキャナで今のFAXの状態より解像度のある状態でスキャニング
e.Typistでウマー
を考えているんですけど
どうでしょ?
920名無しさん@お腹いっぱい。:04/05/19 18:30 ID:vSCN4LeK
つまり、
書類---(FAX)--->PC---(OCR)--->テキスト
だとうまくいかないから
書類---(スキャナ)--->PC---(OCR)--->テキスト
にしてみたいということかな?

書類がまともな印刷物なら、FAXをスーパーファインモード(可能ならさらに
上位のモード)にして送ってみると解像度が上がって結果がよくなる可能性は
ある。縦にして送るか横にして送るかでも変わりうる。

でも >>917 を読む限りでは、その書類自体がFAXの結果でしかもつぶれてると
いうことだから、それをさらにFAXで送ったりしたら悲惨になるかもね。
600dpiとかでいいからまともなスキャナで読んで、e.Typistの認識率に期待す
るしかない。解像度とか色とかがそれ以上性能よくてもあんまり意味ないので、
1万円ぐらいのスキャナでいいと思うけど。
ただ、数字とか記号とかは綴りから補正できないので厳しい可能性はあるよ。
921名無しさん@お腹いっぱい。:04/05/20 17:43 ID:HkhukARl
このソフト、どうよ?

『エキスパートPDF 2』
〜すばやくプレビュー/編集が出来るPDF作成ソフト〜
http://www.panda.co.jp/products/expdf/function.html
922名無しさん@お腹いっぱい。:04/05/20 17:46 ID:HkhukARl
923名無しさん@お腹いっぱい。:04/05/20 18:34 ID:HkhukARl
また発見。こんなのも、どうよ?

エプソン
http://www.epson.co.jp/osirase/2004/040517.htm
924名無しさん@お腹いっぱい。:04/05/20 21:50 ID:+fGuzFsl
オレの検証の結果:現在の最高峰

 「やさしくPDF OCR]
和文縦書(多文字多言語混在文で検証)の認識率がいい!!
特に新聞のスキャンの認識の良さに感動した。

体験版で試してみてくれ。スキャン画像からの読み込みも可能。
 説明:http://pac.mediadrive.jp/pocr/
 DL:http://pac.mediadrive.jp/pocr/dl.html
925名無しさん@お腹いっぱい。:04/05/23 22:33 ID:QFF0wpHq
Presto OCRを使っています。
見開きのコピーを読み込ませているのですが、
バッチで保存の際のファイル名に困っています。
例えば100頁からとかはできるのですが、単純連続でついてしまいます
これを100頁から偶数頁のファイル名(100, 102, 104 ...)をつけるということはできるんでしょうか?
教えていただけるとうれしいです
926名無しさん@お腹いっぱい。:04/05/30 23:44 ID:2qkmCp2X
プリンタ型のスキャナ(原稿移動型スキャナ)
ScanSnap!
で、PDFにしてから、
OCRソフトをかけたいのですが、現状ではどのソフトが優秀かな。
927名無しさん@お腹いっぱい。:04/05/31 16:04 ID:mGq3pFsg
>>926
漏れの個人的インプレでは
・ e.Typist:認識率◎ 図表◎ 処理速度× 一度に100ページまで×
(やさしくPDF OCRも基本的に同じ)
・読んでココ:認識率◎〜○ 図表× 処理速度◎ 枚数制限なし◎

どんな原稿が主なのかにもよるので、かならず体験版をDLして試すように。
928名無しさん@お腹いっぱい。:04/06/01 02:44 ID:vGBJhfNo
>>924>>927
図表や下線,注釈,ふりがな,英文,数字等が混在した文書の本文をテキスト化したい
(あくまで本文のみが対象)と思っていますが,認識率に定評があるe-typestのエンジンを
積んだ「やさしくPDF OCR」は値段から言って買いってことでよろしいでしょうか?
依然ナローなもんで体験版の70MB超はちょっと…なのでお願いします。
929名無しさん@お腹いっぱい。:04/06/01 15:18 ID:rZN/YAKk
処理速度は大差があるぞ。枚数が多い場合、我慢できるかどうか。
http://pc5.2ch.net/test/read.cgi/bsoft/996505150/155-157
俺は図表はほとんど扱わないんで、読んdeココ使ってる。

どっかの店頭でDLさせてもらってCD焼くなりUSBメモリに落とすなりさせてもらえば?
製品版はおたくで買うから、とか言ってさ。
930名無しさん@お腹いっぱい。:04/06/01 17:20 ID:TD2e6AlN
読んでココv10でPDFファイルを読み取らせるにはどうしたらいいの?

Q&AにはAcrobat のプラグインがどうこうというという説明が書いてありますが、Adobe Acrobatを別途購入しないといけないのでしょうか。

e-Typistだとデフォルトのまま読み込めるので、e-Typist を買おうかな……。
931名無しさん@お腹いっぱい。:04/06/01 17:46 ID:sUNMYWUU
>>930
ttp://www.aisoft.co.jp/japanese/qasystem/showans.asp?N=2102

使ってないけど、読んでココからはPDFは読めないみたい。
Acrobatがあれば、Acrobatに読んでココのプラグインが組み込まれて認識できる。
932名無しさん@お腹いっぱい。:04/06/01 18:57 ID:F1V5olIs
>>931
どうやら、Adbe Acrobatを購入する必要があって、Adobe Reader だけでは無理のようですね。
ありがとうございました。
933名無しさん@お腹いっぱい。:04/06/01 20:12 ID:rlUdn4Jo
>>929
レスありがとうございます。一度に処理するのは多分数十枚だけど,
それでも20分近い差か〜。処理時間を取るか,修正時間を取るか,微妙ですね。
> どっかの店頭でDLさせてもらってCD焼くなりUSBメモリに落とすなりさせてもらえば?
その手があったんですね。田舎だからベストくらいしかないけど,やってくれるかな?
934名無しさん@お腹いっぱい。:04/06/03 07:35 ID:0duTXiPv
今、e.Typist9 の体験版と、スキャナーについてきたOmniPageSE を
独日混合文を読み込ませてテストしてたんだけど、

e.TypistってUnicodeText で保存できないのかな・・??

せっかく認識している特殊文字が保存すると全滅してしまう。。
OmniPageSE はさすがに保存ダイアローグで選択できた。
935名無しさん@お腹いっぱい。:04/06/03 10:40 ID:RXTZ6dw2
次のような条件に当てはまるOCRソフトはありませんか。

1.用途は英語の読み取りのみ。
2.PDFファイルも読み取れること。
3.日本に代理店があること(経理処理の都合)。
4.価格は5万円以下。

OmniPageが良さそうなのですが、値段が……。

936名無しさん@お腹いっぱい。:04/06/03 12:15 ID:YFSxP6J+
Readiris
937934:04/06/03 17:30 ID:5tAv4hbC
>935
今しらべて初めて知ったんだけど、OmniPageProって・・・高いのね。。
確かにSEですら読み取り精度はかなり高く感じるから
業務用にはよいのかもね。

自分の環境ではドイツ語のみの実験しかしなかったけど
皆さんも言う通りe.Typist9 も結構よい結果だった。

速さもOmniPageSEよりは速く感じる。。
(もちろんOmniPageProはもっと速いんだろうけど)
938935:04/06/04 00:41 ID:BYosQvFV
>>937

レスをサンクスです。

日本語OCRソフトの英語認識でも、何とかなりそうなので、そっちで考えます。
読んでココv.10を持っているので、これにAdobe Acrobatを買い足すか、e.Typistか読取革命を買うかなんですが……。
読取革命は体験版ではPDFの認識ができない(バクらしいけど、パッチは製品版でないと当てられないとか)ので試せませんでした。
939933:04/06/05 18:38 ID:wk+VnOog
「やさしくPDF OCR」の体験版を使ってみました。
新聞のレイアウトや文字自体の認識率は高かったけど,大きさが違う図が複数あって
図の中に文字が含まれていたりすると(例えばグラフなんかの場合)
文字領域と勘違いして?とんでもないレイアウトになりました。
手動で図を囲っても何故か複数の認識枠ができてしまって,削除,修正が一苦労。
文書領域全体を手動で大きく枠指定した後で,その上に重ねて図表枠を指定できたり
不要な図表部分だけを認識除外するような機能はないんですね。
940名無しさん@お腹いっぱい。:04/06/09 00:13 ID:RedquFBe
>>939
>その上に重ねて図表枠を指定できたり
ツールバー右側の領域種別指定で図領域を選んでから範囲指定をする。

>不要な図表部分だけを認識除外する
画像ウィンドウのツールバーの削除範囲設定を選んで範囲指定する。

ではだめ?
941名無しさん@お腹いっぱい。:04/06/10 07:15 ID:iRwbqJWx
e.Typistでは、読んdecocoにあるような認識した文字を分離する、ということは出来ないんでしょうか
バージョンはエントリーR3aです
942名無しさん@お腹いっぱい。:04/06/11 09:22 ID:cu73tZfK
>>941
もう少し詳しくお願い。
943名無しさん@お腹いっぱい。:04/06/12 03:53 ID:nHoXSpx4
今、ここに出てるOCRの体験版をいくつか使ってみました(読んでココは以前使っていてかなりよかった)。
サンプルは古い「SFマガジン」に載った小説。これをデジタルテキストデータ化して一太郎ファイルにし、出版サービスで製本するのが夢です。
今日使った中では「読み取り革命」がダントツに使いやすくはかどる。
ただ、多機能な分操作が分かりにくい。
レイアウト認識すると、読み取り順序が勝手に表示されますがこれがまたよく間違う。
これを変更したいのですがどうしてもうまくいきません(右クリックすると順番変更とあるのですがこれをクリックすると「その順番にクリックしなさい」と出て終了してしまいます。
意味が分かりません。
また手動でエリアを指定すると勝手に横書き認識してしまいます。
いちいち属性変更で縦書きに変更するのが面倒なのでデフォルトで縦書きに設定したいのですがどこで設定すればよいのでしょうか?
よろしくお願いします。
944名無しさん@お腹いっぱい。:04/06/12 14:53 ID:JffkyoUr
その順番にクリックしなさい
945943:04/06/13 05:09 ID:mBloqA7d
>>944

そのとおりでした。
ポップアップの出た状態でやらないとだめなんですね。
でもこのソフト、編集が凄くしやすくて助かります。
「た」と「だ」の誤認が多すぎるけど、修正するとき、同時に他の同じ候補文字を
持つ部分もまとめて出てきてチェックできる。
今日1日で二段組で150ページ分ぐらいデジタルテキストデータ化できました。
もう100ページぐらいで出版できます。
946名無しさん@お腹いっぱい。:04/06/13 16:35 ID:mBloqA7d
ところでソースネクストの「本格読取」って評価版はないんでしょうか?
値段が安いから金を捨てるつもりで試しに買ってみてもよいですが、
OCRなんて、使えないのはとことん使えない(手入力のほうが速くて無意味、
ただのごみ)から、できればタダで機能を確認したいなあ。
947名無しさん@お腹いっぱい。:04/06/13 17:10 ID:mBloqA7d
一発!OCRPro for一太郎の体験版を使ってみたら、
一太郎返還機能限定の読取革命ですた。
948名無しさん@お腹いっぱい。:04/06/14 02:11 ID:lxiAjBSp
e.Typist 9は400dpi以上のPDFを読み込めないのか。
だめぽぉ・・・
949名無しさん@お腹いっぱい。:04/06/14 23:02 ID:z1YxIwde
>>946
自己レス。
購入して使ってみたら、読取革命の機能限定版でした。
自動文書変換はワード、エクセル、テクストの3種のみ。
しかし一番いたいのは、ハイパーチェッカーがないこと。
これがあるかないかで編集能率が倍は違う。

ただこれを持っていると読取革命を乗り換え版7000〜8000円の安価で
買えるので、読取革命購入することにしました。
正規に買うと17000〜18000円するので、
これ+乗り換え版で10000万円以内だからはっきり得。
読取革命買ったらこっちは友達にただであげよう。
950名無しさん@お腹いっぱい。:04/06/14 23:06 ID:z1YxIwde
>>865
最強は
「本格読取」購入→それを持参し乗り換え版「読取革命」購入
これで1万円以内に収まる。
ハイパーチェッカーが要らなければ、ほかの機能はほとんど同じな
「本格読取」で十分じゃろう。
951名無しさん@お腹いっぱい。:04/06/15 21:13 ID:Bsv2UO9u
読取名人ってWindowsXPみたいにネット認証が必要ですか?
952名無しさん@お腹いっぱい。:04/06/16 14:46 ID:PESmRZTy
>>949
いや、最近笑ってないとかいうことはないんだけど、
久々に壺にはまっちゃたアルヨ。

わたしの奥さんちゅごくじんあるね。スマヌ、止らん。
953名無しさん@お腹いっぱい。:04/06/17 04:27 ID:CPXvLBB0
>>952

え、そんなにおかしいあるか?

どこが? 説明キボヌ。
漏れの行動がおかしいあるか?
それとも読取革命の価格設定?
954名無しさん@お腹いっぱい。:04/06/17 11:22 ID:ldL5KzWa
( ´_ゝ`)
955名無しさん@お腹いっぱい。:04/06/20 00:08 ID:4OBOKtIG
EPSONについてきた、読んでココを使ってみました。ものすごく認識率が悪いです。
バージョンアップする気になりません。本当にいいのですか?ご指導お願いします。
956名無しさん@お腹いっぱい。:04/06/20 10:29 ID:LJeHHL6C
>>955
付録版とは比べものにならないほど紙資料については認識率はいい。
特徴や弱点などは過去レス参照。
というか、付録版なんて使用頻度が多い人は普通そのまま使わないと思うが。
957名無しさん@お腹いっぱい。:04/06/20 10:34 ID:LJeHHL6C
というわけで、最新版の読んdeココVer.10体験版を導入してみてから判断してください。
http://ai2you.com/ocr/guide/koko10dl00.asp?C=2
958名無しさん@お腹いっぱい。:04/06/20 11:22 ID:xSlzHO4e
和文と英文が混合されていると、認識率が悪かった。読んでココVer.10を導入すれば
改善されますか?値段的には、本格読取→読取革命に魅力を感じます。
読んでココは、26穴・図表に弱点ありというスレを見ました・・・
これらの点を踏まえて、アドバイスしてくれたら、助かります。お願いします。
959名無しさん@お腹いっぱい。:04/06/20 12:48 ID:B5kWBtFt
認識率はどんな原稿かによって変わるし、インターフェイス(操作しやすさ)もそれぞれなので、
結局は体験版を試して感触を掴んでくれと言うほかないのだが…
和英混在文では、l(L)と1、一とーと→、Jと↓、。とo(O)と0(0)などで誤認識が多いが、
製品版(体験版)は付録版に比べてかなりマシだといえる。
ついでにいうなら、最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。
960名無しさん@お腹いっぱい。:04/06/20 13:03 ID:VQqdHuLQ
>最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。
横レスで申し訳ないんだが、認識辞書を鍛えるって、具体的にはどういうことをいうのでしょうか
認識のたびにご認識を修正していくの?
さらには、鍛えた成果は他のPCにも移せますか
よろしく教えてください
961名無しさん@お腹いっぱい。:04/06/20 15:31 ID:jnuppIUd
>最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。

製品紹介をちゃんと読めば書いてあったと思うけど、今の読んdeは自動学習だったような。
日本語文書については認識率は不満なし。
また、誤認識の癖Ex.(1)(2)が正しく変換できない も使ってればわかるので簡単に対処できるし。
要は使いこなし次第。

読み取り革命は2000の時に使ってたけど、その後読んdeを使ってみてこっちの方がよかったので
それ以来ずっと読んdeです。バージョン重ねるごとに製品間の優劣とかは変わってるでしょうけど、
まああえて買い直すほど不便はないなと思ってそのまま同製品のバージョンアップを重ねています。

最後は、自分の用途ではどうか、を各製品の体験版で比較して一番いいのを選択するしかないと思います。
962名無しさん@お腹いっぱい。:04/06/21 22:24 ID:PwRAEobN
>>958
今日、読取革命の乗換え版を買いましたが、特に他社製品の提示は
求められませんでした(新宿ヨドバシ)。
本格読取買う必要はないかもしれません。
もしかして、これって常識?
952さんが笑ったのはこのことだったんでしょうか?
すいません、純朴なもので……
(それとも、店によっては、提示求めるところもあるのかな?)
963名無しさん@お腹いっぱい。:04/06/21 22:31 ID:v0fYkvU+
OCRはとにかくテキストのみならいいけど、図などが入ると使えない。
964名無しさん@お腹いっぱい。:04/06/21 23:25 ID:1tbBQotT
>961
レスさんくすです。
あくまで横レスなので、読んdeの取説も手元にないんですが、
一般にこうした学習した分というのは、転送可能なものなんでしょうか?
折角育てたのが、OS再インストでおじゃんではかなしんですが・・・
program fileのやつを上書きすれば良いのでしょうか?
965名無しさん@お腹いっぱい。:04/06/21 23:30 ID:qVlt3rlk
>>964
C:\Documents and Settings\ユーザー名\Application Data\Aisoft\Yonde\Usrdic
ってフォルダがあるよ。
966名無しさん@お腹いっぱい。:04/06/21 23:32 ID:qVlt3rlk
>>962
インストール時にチェックされなければいいのでは?
販売店ではチェックされません。
アップデート版も同様。
967名無しさん@お腹いっぱい。:04/06/22 00:08 ID:0wOAhrQA
>>965
サンクス!
しかし手作業でバックアップとるのも限界なのかな〜
何かしら漏れがあるような気がするし
まあApplication Data丸ごとバックアップして、丸ごと上書きすればいいのかも知れないけど
968名無しさん@お腹いっぱい。:04/06/22 12:51 ID:xko6xFie
このスレは、勉強になります。手書きの書類がたまっていて、適時修正をしながら入力を
しなければならないのですが、音声入力ソフトの使い勝手を知りたくなりました。
厳しいご指摘をさけ、ご指導をしてもらえたら、助かります。お願いします
969名無しさん@お腹いっぱい。:04/06/22 15:30 ID:PpY6iLP+
>>968
スレ違いだけど、私も知りたい。
970名無しさん@お腹いっぱい。:04/06/22 16:12 ID:8yAsl0j3
2、3年前の奴だけど、学習させれば結構な精度で入力できた。
でも、咳したりつまったりして、間違って入力されたものを修正する手間を考えると、
タイピングのスピードが結構なレベルの人にとっては、まだまだだったなぁ。

最新の製品については知らないけど。
971名無しさん@お腹いっぱい。:04/06/22 20:07 ID:4pwWYjLk
970さん、ありがとう。ところで、なんていうソフトですか?
こういうスレがないですよね・・・
972970:04/06/22 20:32 ID:l1qblHgF
>>971
IBMのやつだったと思う。今もあるのかな?
973名無しさん@お腹いっぱい。:04/06/22 20:52 ID:4pwWYjLk
966さん、ほかのソフトでも、いきなり乗り換え版を買っても、家でインストールするときに
不都合が生じてしまうのですか?ど素人なので、教えてください。
音声入力ソフトって高いんですが、乗り換え版を購入すれば半額になるようなので、そこのところを
知りたいのです・・・
974名無しさん@お腹いっぱい。:04/06/22 21:36 ID:53yVWTCF
ヨドバシカメラとかで調べてみればすぐわかるんじゃないの?
http://www.yodobashi.com/

あと、製品出してる会社のページいって製品紹介読めば終わりでしょ。
975962:04/06/23 00:16 ID:p7bl4B4h
>>966

インストール時のチェックもなし。
いちおう本格読取入った状態でしたが、たぶん関係ないと思います。
ただ、読取革命の試用版が入った状態ではインストールされないので、
これをアンインストールしてからインストール、でした。

早速使いまくっていますが、認識率は普通だと思いますが
とにかくハイパーチェッカーの使い勝手が最高です。
画像、図表の入った原稿には向かないと思うが、小説などの
長文テキストをメインに扱う文系ユーザーには最適なOCRだと思う。

ちなみにマニュアルによると、アップグレード版の場合は
インストール時に旧バージョンがないとだめなようです。
976名無しさん@お腹いっぱい。:04/06/30 22:56 ID:XAyNW3oo
読取革命の試用版を試した後、「コントロールパネル」の「プログラムの追加と削除」で削除したのですが、MS-WORDのメニューバーに現れた読取革命のアドイン表示が消えません。
どうすれば消えますでしょうか。
977962:04/07/01 06:37 ID:kqjgVCkK
>>976
wordのユーザー設定の一番下の読取革命を選択し、
右の削除ボタンで消えませんか?
ちなみに私は現に使っているため試せません。
978名無しさん@お腹いっぱい。:04/07/01 08:41 ID:Zrh6dlUU
>>977
ありがとうございます。

> wordのユーザー設定の一番下の読取革命を選択し、

ここにはそういう設定がありませんでした。ちなみにMS-WORD2003です。
「ユーザー設定」の「テンプレートとアドイン」の設定も外しましたし、「Documents and Settings」の「\Application Data\Microsoft\Word\STARTUP」にあったアドイン用ファイルを削除しても消えません。

WORDの設定に関するどこかにあるんだろうと思いますけど……。
979名無しさん@お腹いっぱい。:04/07/01 09:37 ID:lVoersTa
>>978
自己レスです。
解決しました。

「\Application Data\Microsoft\Templates」のテンプレートを削除したら消えました。

お騒がせしました。
980名無しさん@お腹いっぱい。:04/07/03 15:08 ID:xxEZgAJV
すいませぬ、e.typistと読んdeについてですが、
例えば、マイドキュメントにあるjpegやbmpなどのA4サイズの文章の画像を読み込んで
それから文字データとして変換みたいなことは出来るのですか?
981名無しさん@お腹いっぱい。:04/07/03 16:39 ID:y/Qf1y5F
自分で試してみろ
体験版もあるんだし
982名無しさん@お腹いっぱい。:04/07/03 21:50 ID:kM/MMzno
難なくできますよ
983名無しさん@お腹いっぱい。:04/07/04 22:31 ID:RgNTRRVJ
読んdeココ使ってるけど
表を読み込んでエクセルに送ったとき
レイアウトも再現してくれるのが便利
専用ソフトで作ってる表を「エクセルでくれ」
とか言われたとき重宝する

こんな意見も少しは参考になるかな?
984名無しさん@お腹いっぱい。
eタイピストを使っているんですが、
自動レイアウト解析を完全に遮断することってできますかね?
これだと目次などでページ数だけ別枠になって、コピペしたときに不便なんですよね。
prestoのようにある程度レイアウトも再現しつつ、べたにテキスト化するのが理想なんですが。
取説を見る限りでは、範囲指定も結局は自動レイアウト解析で認識枠をつくるだけですし・・・
どなたかご教示ください。