796 :
名無しさん@お腹いっぱい。 :
04/02/18 11:59 ID:AI/oDq+Q
>>796 和製OCRソフトの殆どはABBYYのエンジンを使ってる。
認識の設定で和英混在とか英文主体とか選択できるから(少なくとも読んdeココは可能)
ヘルプを参照してもう一度試してはいかが。
799 :
796 :04/02/19 00:47 ID:LllmSbCF
>798 あ、やっぱりそうですか・・・やってみます それと読取革命体験版ですが気になったのは、本がななめになってると 1行読めなかったりしましたが、これも設定の問題ですかね
八百(σ・∀・)σ ゲッツ !!
801 :
796 :04/02/19 22:56 ID:rhx8tQ1e
>798 スキャナー付属の読んdeココで読めました 認識パラメータを英語にしてもちょこちょこ漢字とか混ざってましたが スキャナーの画像取り込みの濃度をうすいにするとエラーなくなりました それとなぜか付属のソフトが読み込みも認識も圧倒的に速いです 本格読取1980エソ買ってしまって無駄ですた もう一つ買った本格翻訳はエキサイトよりはかなりいいです どうもお騒がせしました...
802 :
名無しさん@お腹いっぱい。 :04/02/20 14:48 ID:jqt28BDc
>797 あ、やっぱりそうですか・・
803 :
797 :04/02/21 17:57 ID:uM7dcJpi
>>802 読取革命での画像修正機能はないよりまし、くらいに考えて
先にvixででも目的の画像を一括で回転させておけばいいかもしれませんねー。
8ではできないのかな。。。
読取物語V4をもうちょっと使いやすくして 安くした(20000円ぐらい)新バージョンでねーかなあ。 はっきり言って読んでココやe.Typistなんか軽く 吹っ飛ぶと思うんだが・・・ オレはリコーは大っ嫌いなんだけど読取物語だけは全面支持する。
805 :
名無しさん@お腹いっぱい。 :04/02/22 22:17 ID:93EwQKfH
読み取り物語って、初めてきいたわ
新台入荷ですか?
808 :
名無しさん@お腹いっぱい。 :04/02/25 17:30 ID:jauiArzM
超初心者です。教えてくんで、すみません。 新聞記事のスクラップや写真入の雑誌記事のスクラップを したいんですけど、e.typist9.0 + やさしくファイリング5 を買いました。取り合えず、ばんばんスクラップをスキャンして CDに焼く(スクラップ)のが目的のときには、OCR処理しなくても 良いの? 後から必要なときに処理すればよいのかな。 「やさしくファイリング5」 の方で十分なのでしょうか。 スキャンした画像っていうのでしょうか、は印刷してみてもコピー撮ったみたいに鮮明です。 OCR処理を掛けるのは、後から編集するときですか? あと、そのときにはPDF形式で保存しておくのが良いの? それともスキャンしたままのJpeg。で良いのかな。 あんまり大きなファイルにしたくないのです。 アホ丸出しの質問で、すみません。
読取革命Ver.8の乗り換え版を買った。 製品版と乗り換え版はCDが共通だった。
>>808 > スキャンした画像っていうのでしょうか、は印刷してみてもコピー撮ったみたいに鮮明です。
うらやましい...
> OCR処理を掛けるのは、後から編集するときですか?
> あと、そのときにはPDF形式で保存しておくのが良いの?
> それともスキャンしたままのJpeg。で良いのかな。
画像より,文字情報として PDF にした方が,
ファイルサイズも小さく,閲覧にかかる処理も少なくなるでしょう.
はい.画像のままならば,jpeg にすべきです.
ところで,jpeg と png がどっちがいい?
>>810 スキャナで取り込んだものなら、高画質設定のJPEG。
>>809 乗り換え版って、通常版とどう違うの?
CDが同じなら、通常版を買う意味ないですよね。
>>804 「読取物語 EX V4」の試用版を試してみた。
確かに、認識性能は高いように感じるけど、
画面デザインがアレでは、他社と直接競合するのは無理っぽい。
>>804 には OKREADER2000 をお勧めする。
815 :
808 :04/02/25 22:19 ID:dWHd61q/
ありがとうございました〜 そっか、PDFは画像→文字なんですね。にゃるほど。
816 :
808 :04/02/25 22:28 ID:dWHd61q/
自己レスです。分かりました、Ctrl.+Altで反転してみたら 透明テキスト付きのPDFになってますた。どょうも〜
Ctrl.+Alt → Ctrl.+A
デジカメを利用した原稿入力には、書籍を分解せずに済むメリットがあると思います。 現在、主力と思われる3本のソフトについて検証してみました。 ・e.Typist v.9.0 :MEDIA DRIVE ・読んde!!ココ Ver.10 :A.I.soft ・読取革命 Ver.8 :Panasonic デジカメデータは、200万画素、1600*1200で、文庫本の片ページを1枚として撮影したものを使用。 その他、ISO感度、カラー/モノクロ、フラッシュ等、色々な条件で試しました。
・e.Typist v.9.0 :MEDIA DRIVE 体験版の機能制限項目に"デジカメ監視ツール"とある。 エクスプローラから画像をまとめてD&Dしたところ、無事に読み込んだ。 [ツール]>[操作設定]>[ファイル読込]で、 画像色:[白黒] DPI:[400] としたときに、一番きれいに取り込めているようだ。 認識力は非常に高く、なんでもかんでも文字に変換する。 また、ルビを分離する能力も高い。 反面、変換が手当たりしだいといった感じで、 括弧や、句読点の変換が弱いので、意味不明の文章になりやすい。 デジカメデータのOCRとしては、今一歩という感じ。
・読んde!!ココ Ver.10 :A.I.soft →注 :体験版はVer.9です。 画像をエクスプローラーからD&Dしたところ、暴走。原因不明。 メニューから読み込ませたところ、問題なし。 読み込み時の解像度変更に時間がかかるが、回転/傾き補正は完璧に近い。 [環境設定]>[その他]>[その他の設定]>認識前後の処理を自動化する>[設定] □画像のノイズ除去を行う の設定で、認識結果が格段によくなる場合があります。 認識力は充分で、比較的読みやすい結果が得られます。 ルビを分離する能力も高いです。 ただし、文字として認識できないものは、あっさり切り捨ててしまいます。 取りこぼしが多くなるので、デジカメでの利用は辛いと感じます。
・読取革命 Ver.8 :Panasonic デジカメ画像の認識がウリになっているソフト。 デジカメの接続を監視するツールが付属。 [オプション]>[環境設定]>[自動画像補正] の設定項目があるものの、自動での補正は最低限にとどめたほうがいい感じ。 自動での画像の取込/変換には首を傾げざるを得ない。 [画像]メニュー以下の、[減色][コントラスト][ガンマ補正]等を駆使して最適化する必要がある。 手動で最適化した画像の認識力は非常に高く、最も優れていると感じる。 ただし、ルビに関する設定が存在せず、あらかじめ手動で消しておく必要がある。 全体に、職人向けツールという感じで、手間をかけたくない人には向かない。 しかし、他のソフトが手も足も出ない画像であっても、手動で何とかできる点がいい。 デジカメデータのOCRには、一番向いているように感じる。 以下、問題点。 ・ルビに関する設定項目がなく、ルビを含む漢字は意味不明のものに変換されやすい。 ・画像の取込時に、DPIを上げる処理が欲しい。 ・画像補正ツールのプリビューが小さ過ぎて、結果が把握できない。 ・ツールが多いのに、アンドゥが1回限りなので、始めからやり直しになることが多い。 ・[傾斜][カラーフィルタ]等、一部のツールが、どう使っても結果を悪くするだけ。 ・とに角、オートが弱い。 オート任せで実用に耐えるのは、「e.Typist」だけでしょう。
823 :
名無しさん@お腹いっぱい。 :04/02/26 18:25 ID:5lxjsOkG
>>814 のお言葉に従ってOK READERを買ってみようかと思ったのだが
売ってねー。
>>811 やってみました.一長一短のようですが...
それでもファイルサイズは png の圧勝 (小さい) です.
文字の多い画像に適するのは jpeg か,png か.
理論的な根拠を知っている方,教えてください.
827 :
名無しさん@お腹いっぱい。 :04/02/26 23:21 ID:p7bgNrAx
>>826 jpgは、輪郭がぼやけるのに対し、
pngは、輪郭がシャープ
従って、文字の多い画像には、pngがおすすめ。
>>818-821 詳細レポ、参考になります。
単色の部分が多い場合はpngの方がいい。
でもスキャナで取り込んだ場合は、
背景の白の部分でも微妙に色が違ったりするから、
jpegの方がサイズ的に有利になる場合もある。
原稿やトーンカーブの設定などによって結果は違う。
色数が少ない、単色が多いもの→png
色数が多い、微妙な色があるもの→jpeg
gifとjpegとpngの比較(pngはgifとほぼ同様)
http://www.komakusa.net/internet/gazou.html
829 :
名無しさん@お腹いっぱい。 :04/02/27 15:59 ID:XPbXRsbu
趣味の競馬データを取り込んでいますが、四角記号(ロ)の中の数字、、 (角囲みの数字)が外字扱いのためまったく認識してくれず手入力しかありません。 外字登録しても認識されません。丸囲みは大丈夫なようです。 どなたか似たような処理でいい方法を知ってる方いませんか?
w
>>829 認識辞書に登録して外字にひもつけするのではダメなのか?
デジカメデータの認識。その後も、検証を続けております。 だんだん撮影テクニックの方が、上がってきました。(w 当たり前のことですが、撮影が最も重要です。 特に重要なのが、ページ全体にむらなく光を当てることです。 そのため、ズーム(3倍)をテレ端にし、フラッシュを使用した場合が最もよい感じです。 露出補正も、少し明るめにするといいでしょう。 ・e.Typist v.9.0 :MEDIA DRIVE [ツール]>[操作設定]>[ファイル読込]は、 画像色:[フルカラー] DPI:[400] の設定で問題ないようですね。 むらのない撮影を行えば、設定をいじってもほとんど変化はありませんでした。 端から端まで、手当たり次第に、文字に変換します。 [文字認識]>[認識字種設定]>[認識字種]>[□記号]に、チェックを入れることで、 括弧や句読点も認識してくれました。なぜ、デフォでOFFにする……。 後から気づいたのですが、非常に行儀の悪いソフトですね。 デスクトップのアイコン及び、コンテクストメニューを勝手に追加され、 マイドキュメントフォルダ内に、"e.Typist User Data"フォルダが作成されました。 起動時のもたつきも、少し気になります。
・読んde!!ココ Ver.10 :A.I.soft →注 :体験版はVer.9です。 撮影の上達で、取りこぼしが減ってはきたものの、根本的な解決は無理でした。 オートでどうにもならない場合、手の打ちようがないのが欠点です。 レイアウトの認識が悪い意味でものすごく、 文庫の1ページが極めて複雑なレイアウトに化けます。 認識された領域内で右クリック>[パラメータの設定]>[認識パラメータの設定]で、 認識のデフォルト設定を登録できることに気づきましたが、 レイアウトそのものには影響しないようです。 ・読取革命 Ver.8 :Panasonic とに角、画像のコントラストを高くすることです。 文字が薄くならないように、ガンマ補正も使います。 画像の補正が上手くいったときは、ほとんど完璧に変換できてしまいました。 行の傾きに弱いので、[画像]>[傾き補正]>[手動]で調整します。 傾いてさえいなければ、ある程度までは、ルビも自動で無視するようですが、 樽型、糸巻型のゆがみに弱いです。 オートではほとんど使えない点にも、注意が必要です。
・読取物語 EX V4 :リコーシステム開発 も試したのですが、 画像の変換が[編集]>[モノクロ変換]くらいしかありません。 しかも、プリビューがないので非常に調整しづらいのです。 なぜか、[設定]>[環境設定]>[カラー画像処理]のほうにはありますが……。 どうあれ、これを使いこなそうと思えるようなデザインではありません。 他のメジャーソフト3本が揃えられるほどの値段の割には、お粗末だと思います。 リコーの想定している市場が違うのでしょう。 全体の感想としては、「e.Typist」のお買い得感が高いです。 オートでも、そこそこ使えますし。 少々妙な認識結果でも、取りこぼしが少ないのは安心できます。 読込時の画像処理性能が上がれば、さらによくなりそう。 「読んde!!ココ」は、3本のなかでは、最もインテリジェントに処理していると感じられ、 それだけに、オートで対処できない部分が惜しまれます。 Ver.10に期待してますが、OCRソフトにコピー機能とか必要かな? 「読取革命」もなかなか捨てがたい能力なので、難しいところです。 でも、レタッチ職人を何百ページも行うとなると、実用的ではありません。 どのソフトも興味深く、なかなか短くまとめることができませんでした。 また何日も使っている間に、各ソフトの印象が二転三転したことも付け加えておきます。 読みにくいレビューにお付き合いいただき、ありがとうございました。
ホントに読みにくい上に何の役にもたたない自己満足の長文ご苦労さん と、読んdeココのバカさにむかついて半分八つ当たりしてみる。
837 :
名無しさん@お腹いっぱい。 :04/02/28 17:04 ID:v4Fq0Wgh
読んでココ!ver8 使用です。 英語の小説本を取り込んでテキスト変換してるんだけど、横一段組の文章な のに時々妙に単語間の空白が数行揃ってしまい、2段組のブロックと認識し て分割して読み取られてしまうことがあります。 これを手動で一段組みの文章として認識させるような機能はあるんでしょう か。
838 :
名無しさん@お腹いっぱい。 :04/02/28 17:47 ID:q4wu6rXP
やっぱ e.Typist かなぁ
>>832-834 乙。いろんな使用場面での得意不得意が浮き彫りになって興味深いね。
>>835 読んdeココに手を焼く所は同情の余地があるが、とりあえず氏ね。
>>837 その不具合の出るページだけ、認識枠の設定を手動で行ってみてはどうでしょう。
>>840 レスありがとうございます。
2段組に認識されてしまう部分(例えば10行)を手動で枠で囲い、
そこだけ別に認識させるということですよね。
それもトライしたんですが、同様に2段組と認識してしまうんです。ホントハラタツ…
1行ずつやるのも空しいし、打つ手ナシか〜……
でも認識結果の正確性を優先するなら、1行づつの枠設定もやむをえないかと。 あとは、Ver.10の体験版が出たらレイアウト認識の改善度を試してみるとか。
>>842 ですね〜。今は、ちょうど真ん中辺で分断された2段を1行ずつ左右繋ぎ合わ
せて対処してます。
ふと思ったけど、全体のレイアウト自動認識モードと、ひと枠は一行として
強制的に認識させる手動モードの2パターン切り替え機能を搭載するのって
難しいんでしょうか。これが出来ればずいぶん使い勝手が向上すると思う
んだけど…。
>>843 今、試してみたけど。
1. 2つの枠のうち片方をクリック
2. 選択された枠内で右クリックして、[枠の消去]を実行。
3. 残っているほうの枠をクリックした後、
ふちをドラッグして選択範囲を必要なだけ拡大。
4. アイコンメニューから認識を実行。
で、いけるみたい。
845 :
844 :04/02/28 22:06 ID:U6JPCAWO
ごめん。 "2."の[枠の消去]は、Deleteキーでいけたわ。 しかし、枠を自由に変形させても、認識範囲が改善されるわけじゃないのね……。
本の場合、毎回レイアウト認識させる必用ないんだよな。 枠情報保存、読み込みとかあるし 何を苦労してるんだか、さっぱりわからん。
>>846 えー!どうやるの?
「読んde!!ココ」の場合、設定した枠と実際の認識範囲が一致しないから問題なわけで。
見つけた。[ファイル]>[枠情報の保存]ですね。
これは、単票でないと、原稿がずれるから使えないのでは?
認識したい範囲を枠で囲って、右クリックから[認識]でも、
設定した枠内だけ認識しますね。気づかなかった。_| ̄|○
でも、レイアウトは改善されるけど、取りこぼしに関しては変化がないです。
「e.Typist」だと、枠で囲って[認識]アイコンクリックで絨毯爆撃してくれる。
デジカメでペーパーバックを撮影し、認識させてみました。
例によって、片側1ページを撮影してます。
ラフに撮影して、わずかに文字領域が台形になった画像を使いました。
→デジカメの小さな液晶でまっすぐ撮るのは、案外難しいです。
日本語の文庫に比べて、文字数が多いにもかかわらず、
印刷が太く、くっきりしているため、日本語より認識しやすいようです。
各ソフトとも、英語認識モードに切り替えて行いました。
・e.Typist v.9.0 :MEDIA DRIVE
ほぼ文句なし、ほとんど修正の必要も認められません。
英文だと、傾きなんか障害にならないようです。
また、誤認識部分の赤字での表示も正確でした。
・読んde!!ココ Ver.10 :A.I.soft
→Ver.9使ってます。
1行くらいしか、認識してくれませんでした。
文字領域が台形に変形しているせいでしょう。
別にレタッチソフトでもないとどうしようもありません。
・読取革命 Ver.8 :Panasonic
オートではどうにもなりません。
[画像]>[長方形化]で、テキストを水平にしてあげると、非常に良好に認識しました。
ペーパーバックの場合、コントラストの修正なしで済みました。
>>835 ウザくてごめんね。
現在、「読んde!!ココ Ver.10」体験版、 ナローバンドでダウンロード中……。_| ̄|○
自動領域抽出時に表領域を抽出しない(N) 自動領域抽出時にイメージ領域を抽出しない(I) 自動領域抽出後の領域は段組なしにする(P)
>>848 コテハンにするかトリップをつけていただくというわけには行きませんか?
段組み 文書に段組みがあるかどうかを指定します。 通常はデフォルトの[自動判別(L)]のままにしておけば システムが自動的に段組みの有無を判別します。 段組みにしたくないときは、[なし(N)]に変更します。 枠種別を[表(B)]に設定した場合は選択することはできません。 この場合、段組みは[なし(N)]になります。
>>850 全部チェックしてあるけど、
複雑なレイアウトの自動判定には影響してないです。
>>849 公式ページにはまだ体験版来てないじゃないか。
ワンタッチOCRのと勘違いしてない?
Vectorではもう落とせるのか。盲点だったな。thx
858 :
837 :04/02/29 18:25 ID:ev3S9u/7
>>852 !! ここに設定あったのか〜
ヘルプのキーワードで「段組み」入れても何もヒットしないんでてっきり…。
試したところ確かに一行として読み取りました。
どうもありがとう。
昨日レスくれた人達もありがとうございました。
どどど・どうしたんだ! しばらく来ないうちに、この一ヶ月ほどすごい良スレだったんだね!
860 :
名無しさん@お腹いっぱい。 :04/03/03 08:02 ID:68fvt6sD
どこがだ。
ココ10はだいぶインターフェイスがe.Typistに似てきたね。
重要なのはインターフェースや転送や印刷じゃなくて 認識能力なんだけどなあ。
863 :
名無しさん@お腹いっぱい。 :04/03/06 21:15 ID:kuZWW9fT
で、読んdeココ10の認識能力はどうですか。
びっくりするほど良いですね
読取革命の試用期間短すぎる _| ̄|○
866 :
名無しさん@お腹いっぱい。 :04/03/07 21:09 ID:Ux3Vu8vZ
厨な私に教えてください。
OCRソフト(e.Typist9.0)を用いて、スキャナで読み込んだ雑誌の原稿
(モノクロ。OCRを行うため、400dpiでスキャン)を、日本語OCR処理
をした上で透明テキスト付PDFファイルにして保存する際、OCR処理後
の画像ファイルは400dpiも要らないので、150〜200dpi程度に画質を
落とした上で、透明テキスト付PDFファイルとして保存したいのですが、
今いちやり方がよくわかりません。
>>698 には、リサンプルという方法が書かれているのですが、当方、
なにぶん厨なもので、マニュアル読んでもやり方がよくわからないの
です(Acrobatはマニュアルがわかりづらいし!)
e.Typist9.0とAcrobat5.0(Readerじゃない奴)を持ってます。
激しく既出であれば、ここ嫁とか教えてくれれば、すぐ逝きます。
>866 読んde!!ココには出力時の画像dpiを指定するところがあります。 [オプション]-[環境設定]-[画像領域の設定]-[画像の出力解像度]です。 72,96,150,200dpi、元のままの5つから選択できます。 読んde!!ココしか使ってないので、他のOCRではどうだかは知らないです。
868 :
名無しさん@お腹いっぱい。 :04/03/07 23:04 ID:Ux3Vu8vZ
読んde!!ココ には設定があるのですね。 e.Typistとは性能的に一長一短なようだけど、乗り換えも 検討しようかな。
短の部分の方が多いから後悔しないかな‥。
870 :
866 :04/03/08 21:52 ID:tBoc1Fkf
e.Typist9.0でも、
>>867 と同じ機能を発見しました。
「ツール」→「環境設定」→「読込・保存」→「認識結果の保存」
で、「図領域・背景の出力DPI」を変えることができます。
「72、96、120、144、168、192」の各dpiと、デフォルトのままの
都合7段階に可変です。大変失礼しまつた。
・・・でも、192dpiにして印刷すると、漏れ的には今イチなんだ
よね〜〜 雑誌の論文とかが多いんだけれど、192dpiだと、やや
文字がかすれ気味に印刷される。Acrobatでリサンプルできている
人はど〜なんでしょ。
>>869 やはりそーなんですか。もう少しe.Typist9.0で頑張ってみます。
すみません、e.Typist9で質問です。
複数の文字が1文字で認識されてしまうのですが、
読んでココの様に文字を分離して再認識させる機能は無いのでしょうか?
>>756 で既出の質問ですが、FAQにも無いのとサポセンが5時までしかやってないので、
今一度質問させて頂きました。
>>871 の自己レス
VwalkerのOCR比較特集見たら
「1文字に認識されたデータを複数の文字に分割する機能がない」
と書いてありました。うーーーーーん。
873 :
名無しさん@お腹いっぱい。 :04/03/14 13:11 ID:9EvBU3hH
質問です 読んで10を使用しています。 スキャンしたデータをPDF透明テキストで 保存しています。 PDFを開いた時に1ページ2ページと 複数のデータを表示できますよね。 私も複数のデータをまとめて 一つのPDFファイルにしたいと思いますが どうやったら出来るのでしょうか?
875 :
名無しさん@お腹いっぱい。 :04/03/14 14:00 ID:9EvBU3hH
>>874 サンクス
左側に画像リストが表示されていなっかた
のでわからなかった。
有りがトン
876 :
名無しさん@お腹いっぱい。 :04/03/17 00:46 ID:VGOdP+ko
他所のパソコンのAcrobatで作成した「透明テキスト無し」の PDFファイルを、自宅のパソコンのe.Typist9.0でOCRかけて 「透明テキスト付」PDFファイルに変換しようとした。 出来なくは無かったものの、最初のファイルの読み込みに 異様に時間がかかったYo。 また、当初は高々2〜300KBくらいのサイズだったのに、OCR して透明テキスト付きにして上書き保存したら、なんと10MB のファイルになっちった。 やり方まずったのかな〜 わかる人いたら教えて下さい菜。
PDFのOCRにやたら時間が掛かるのは8.0から変わってないようだね。 相変わらずダメダメだなー PDFは上書きするとサイズが大きくなるのは有名な話で 「名前を付けて保存」で別ファイルに書き出すとたいがい小さくなる。
上書きNGは既出だったのかぁ。ありがとん やたら時間がかかるのみならず、何十頁ものPDFだと メモリ不足だ、とか言ってエラーが出やんの。 ダメダメだなー Athlon XP 1900+ に512MBなんだけど。
スキャナにバンドルされてた読んで此処使ってるんですが ルビまで認識してくれるのはいいんですが本文の横に結果が出力されるので テキスト整形するのがとてもめんどくさいです。 ルビを漢字の後ろに表示する事は出来ないんでしょうか? ちなみにバージョンは 読んde!!ココ_パーソナル_Ver.3 です
読んdeココVer.9では 環境設定→認識 の中の 「ルビの処理」で「埋め込む」を選べばOK となっている。 パーソナルではどうなのか知らないが、見つからなければヘルプを探しな。
e.Typist9でExcel表を読ませてワンボタンでExcel転送した。 認識も修正も転送もほとんどシンプルにできて十分実用できる。 でも、Excelに送った表の数値を「=SUM(A0:A1)」とか集計させようとしても 「0」になる。セル属性を数値や標準にかえても「0」。なんでだろ? エラーとか「#VALUE」とかならまだ分かるけど、なんで「0」なんだろ。 マニュアル会社にあるからわかんないや。 でも住所録や顧客リストなんかを読み込ます分には十分べんりだよ、e.Typist9。
883 :
876 :04/03/21 00:23 ID:ff4YO4sC
>>879 ありがとうございます。読取革命と読んdeココ10を検討して
みます。
あと、
>>794 に出ていた、「やさしくPDF OCR」が既に発売
されてますね。
「PDF(透明テキスト無)」→「PDF(透明テキスト付)」の処理
スピードはどうなんだろう? 試した人います?
既にe.Typist9.0 持ってるので、処理スピードが速くなったの
なら、実売4000円前後だし買ってみようかな、と思うのです
が、実は単なるe.Typist9.0の機能制限版みたいな奴だった
りすると、 _| ̄|○ になってしまうので。
「やさしくPDF OCR」
http://pac.mediadrive.jp/topics/20040210_pocr.html
まず間違いなく機能制限版でしょう。 体験版がリリースされて試してからの方がよいかと。
885 :
名無しさん@お腹いっぱい。 :04/03/21 17:33 ID:GRhrlZuI
>>883 本格的にテキスト付きPDFにしたいなら、Mac版eTypistですよ。
一瞬といったらおおげさだけど、普通のTIFFファイル読み取りと同じスピードです。
ほほー、いいこと聞いた。 しかしそのためだけにMac買うわけにもいかんざき
887 :
名無しさん@お腹いっぱい。 :04/03/29 07:34 ID:y4741GyY
読んdeココ Ver10.0のバグと思うんだけど(汗)・・・ 画像ファイル(BMP・PNG等)を読み込んで(300個以上)これをそのままPDF方式 で保存するとき(複数ページファイル化)に129個?目を書き込んでいる所で 読んdeココが強制終了してしまいます。 一応、エーアイソフトのサポートにメール出したけど・・・まだ返事こない
OCRソフトでフリーでオススメはあるでしょうか?
すみません、フリーでは大したものは無いみたいですね、シェアにします 英語だけでいいので、認識率の高いソフトは何があるでしょうか?
891 :
名無しさん@お腹いっぱい。 :04/03/31 11:46 ID:/9INOszL
>>887 なんですが、エーアイソフトから、回答キターー!
やはりバグだった模様で・・・、PDF複数ページファイル化保存すると130個め
を書き込んでいるところで強制終了してしまう
修正モジュール「Mem_pdf.DLL」が送られてきたので読んdeココのフォルダに
上書きで入れたら正常になった。良かったーーー。
・・・これ目当てでVer10買ったからな(認識率は二の次で(汗))、もしだめなら
コレ買った意味なかったんでね・・・・
そのうち、エーアイソフトから自動アップデートで修正が入ると思う(この地点で
まだ上がってない)
読んdeココVer9.02を使っているんだがPNG形式の画像ファイルを読み込めなくなった。 確か最後にしたことが4色PNG画像をいくつか読み込もうとして強制終了したことだったと思う。 なにせ久々に使おうかと思ったからよくわからないけど。 後は強制終了した後にもう一回起動させたら変更したはずのツールバーもインストール時と同じに戻っていた。 これって再インストールするしかないんだろうか。 スキャナにバンドルされていたやつから乗り換えたから バンドル版→アップグレード版 といった順にインストールしかなきゃならないのだろうか?
age
UPGRADE対象のCDを持ってれば、いきなり9から再インストールしても大丈夫だよ。 途中でCD入れろとメッセージが出る。
895 :
名無しさん@お腹いっぱい。 :04/04/13 18:19 ID:ZaYV1iYp
e.Typist9.0にて、[環境設定]-[読込・保存]-[PDFファイル]で 読み込みDPIの設定が200dpiでグレー表示になって、変更できないのは何故? ヘルプには「PDFファイル読み込み時の解像度を設定します」とある。 PDFを読み込んで、透明テキストPDFにしてるのですが、 元ファイルに比べて結果のPDFの画像が荒くなるので 読み込み解像度で調整しようと思ったのですが。
896 :
名無しさん@お腹いっぱい。 :04/04/14 10:17 ID:lhR6SjVf
↑すみません。カン違いでした。 NT4.0はPDF読み込み未対応ですね。実際に作業で使っているWin2000では設定できます。
897 :
名無しさん@お腹いっぱい。 :04/04/20 23:54 ID:0sFjSJ6Q
pdfを読み込むのに時間がかなりかかっています。 MDC printerが勝手に立上りそこで何か印刷する素ぶりをしていまして この動作に時間がかかっています。 このMDC printerの立ち上げを停止する方法はないでしょうか?
おそらくPDFを画像情報としてeTypistに渡すための仮想印刷ドライバだろう。 それなしではPDFをOCRに掛けることが出来ないと思われ。
その値段でその程度の機能しかないならソースネクストの奴がマシだろ
マニアックな質問で申し訳ないのですが、 ドイツ語のひげ文字(German text, Fraktur)を読み取り可能な OCRソフトってありますでしょうか? スレ違いでしたら申し訳ありません。 他にOCRに関するスレが見あたりませんでしたので。
903 :
902 :04/04/25 13:13 ID:rbmefwBc
おっと、失礼。ドイツ語の「ひげ文字」だったか。 よく読まずに嫌みったらしいことを書いた。失礼。 Googleで「ドイツ語 ひげ文字 OCR」で検索すると Text Bridge PROというのがひげ文字認識ができたというサイトにぶつかり、 このソフトを調べるとeTypistのインターナショナル版に含まれるようだ。 とりあえず素のeTypist体験版でひげ文字が読めるかどうかやってみれば?
904 :
901 :04/04/25 13:18 ID:bSIMzEgc
>>902 さん
丁寧なお答えありがとうございます
ただ、私の質問の意図はちょっと違っていて、
ドイツ語はドイツ語でも通常のアルファベットではない(というと語弊がありますが)
ゴチック体を扱えるOCRはないだろうかということだったのです。
一応現行ログは読ませて頂き、ドイツ語・フランス語等についても語られていたので、
私のような質問でもOKかなと思い、質問させて頂きました。
ちなみに、私が言うひげ文字とは以下のURLで表示されているようなものです。
tp://www.tulips.tsukuba.ac.jp/misc/export/cat/goth/goth.html
また、Googleで「ひげ文字 OCR」で検索すると、「テキスト・ブリッジ・プロ」では可能である
との記述も見つけることができたのですが、
実際にメディアドライブに問い合わせてみると、少なくとも現行バージョンでは無理とのことでした。
途方にくれていたところ、このスレを見つけたというわけなのです。
ちなみに私はPresto OCRを使っているのですが、OSをXPに変えたところ、動かない。しかもXP対応バージョンは
もうofficialでは売ってないと、困っているところです…。しかたがないので、店頭在庫品を探してみようと思っています。
OmniPageも考えたのですが、よほどのメリットがないとさすがに難しいですね。
どなたか使っていらっしゃる方がおらられば、是非コメントお聞きしたいです。
905 :
901 :04/04/25 13:26 ID:bSIMzEgc
>>902 さん、
わっ、時間的にかぶってしまいましたね。失礼しました。
Text Bridge PROについては、↑に書いたとおりなんですよ。
OmniPageのページもみてみたのですが、German text, Frakturは可能言語に
含まれてませんでした。
やっぱり海外版で探すしかないんでしょうか…。
まだ探してもいないのに申し訳ないんですが、
ちなみに海外版の製品は皆さんどうやって入手されてます?
アマゾンでは買えないようですし、何か法律で禁止されているんでしょうか?
906 :
名無しさん@お腹いっぱい。 :04/05/03 14:06 ID:tctgkrud
読んdeココ10とe.typist9を試した。 エクセルの表を読みとった結果はe.typistの圧勝。 ボタン一発でほぼ再現した。 けっこうきれいに印刷されてたのに読んdeココは 認識できない文字がいくつかあった。 最初に設定しないと表の形で読み取ることができない? のもどうかと思った。 次に切り貼りしてある名簿に手書きの注釈がしてあるものを読み取った。 これもe.typistの圧勝。 こっちは比べものにならないほど差がついた。 e.typistはデフォルトのままで直感的に操作できたのに対して、 読んdeココは「こうかな」?と思っても違うことがあって戸惑った。 使用前は読んdeココを評価してたんだけど(まったくの先入観)、 思いっきり評価が変わりました。
>>906 普通のレジュメとか基本書とかだと、読んdeココ10はほとんど訂正入らないくらいで
満足していたんですが、驚きました。
e.typist9も試してみよう。
908 :
名無しさん@お腹いっぱい。 :04/05/04 01:46 ID:BKDaK4vM
質問なのですが、eTypist9のアップグレード版は、旧版からアップグレードできるそうですが、 かなり古いバージョンからでもアップグレードできるのでしょうか? それともバージョン8からのアップグレードとうことなのでしょうか? 自分が昔買ったスキャナに e.Typistバイリンガル2というソフトがついてきたのですが、 そんなに古いバージョンで、しかもスキャナに付属のものでは、 アップグレード版を買ってもアップグレードは無理なのでしょうか? バイリンガルというシリーズももうないようですし、アップグレードは無理っぽいかなあなどと思っておりますが、 一抹の期待をこめて質問してみますた。
たぶん大丈夫 心配ならメーカーに確認してから買うべし
910 :
名無しさん@お腹いっぱい。 :04/05/04 17:59 ID:BYthjB8M
なぜ公式ページに書いてあるようなことを聞くのだろうか。 最新e.Typistシリーズのアップグレード対象製品 (バイリンガル・プラスファイリング・インターナショナル全対象) ●下記メーカー製品に付属のe.Typist エントリー・バイリンガル2 ・LE2 ・LE 等の e.Typist シリーズをお持ちのお客様 ●e.Typist v.8.0・v.7.0 ・v.6.0 ・v.5.0 ・98 ・97 ・v.2.0 ・v.1.0 等の、 旧バージョンe.Typist シリーズをお持ちのお客様 (スペシャルパック・得々パック・インターナショナル・プラスファイリング含む) <ご注意> ※2003年7月以降発売されe.Typistシリーズが付属されている製品も アップグレード対象となります。 ※アップグレードには、上記対象製品が必要です。 ※Windows版のみが対象となります。 ※体験版、評価版は対象外です。 ※購入は次期バージョン発売まで可能です。 ※付属版をお持ちでも、スキャナや環境によっては動作しない場合があります。 ※上記対象製品1本につきアップグレード版1本が購入可能となります。
911 :
名無しさん@お腹いっぱい。 :04/05/05 01:18 ID:s0Oy9Bp5
よく分からない。。 スキャナ付属のバイリンガル2でもアップグレードは可能だが、 >※購入は次期バージョン発売まで可能です。 ということから、 バイリンガル2から一つ上へのバージョンへはアップグレード可能だが、 最新のVersion9へはアップグレードは無理ということでしょうか? 又、最新のVersion9へアップグレードできるとしても、 すでに購入は不可能で、だれかが買ったものをつかえば可能ということなのでしょうか?
912 :
名無しさん@お腹いっぱい。 :04/05/05 06:05 ID:HYSE7Ri5
>>911 >※購入は次期バージョン発売まで可能です。
Version9(現在の最新版)はVersion10(次期バージョン)が出るまでしか購入できないよってこと。
バージョンアップの対象が
●e.Typist v.8.0・v.7.0 ・v.6.0 ・v.5.0 ・98 ・97 ・v.2.0 ・v.1.0 等の、
旧バージョンe.Typist シリーズをお持ちのお客様
(スペシャルパック・得々パック・インターナショナル・プラスファイリング含む)
ってことは、最初のバージョンから前回のバージョンまで
どれかを持ってればバージョンアップできるってこと。
あなたの持ってるバイリンガルも含むね。
それでも心配ならメーカーに確認すればよい。
よく分かり申した。とんくす。
私のところも
>>876 さんと同じように、透明テキストの付加でファイルサイズが
A4原稿1ページあたり2MBくらい増えてたんだけど、Ver.10.00 → 10.01のアップデートで
改善されたよ。
ほんとだ、Presto! OCR、aiSOFTから消えてるね、ひどいね 販売中止はしかたないにしても、発売元として責任もって アップデータのパッチぐらい置いててしかるべきだよね ・・・と思ったけどそういえば4.1から4.1Plusに上げたときは パッチじゃなくて新しいディスクがそのまま届いたような気もする そのへんの事情かなあ 本家のサイトは4.0しかないし、いったい4.1とかいうのは どういうバージョンだったんだろう
916 :
名無しさん@お腹いっぱい。 :04/05/18 15:50 ID:PgTBxxIw
917 :
名無しさん@お腹いっぱい。 :04/05/19 16:32 ID:HMlNp/e4
FAXで送られてきた書類(少しFAXらしく潰れた感じの文字) をスキャナで読み取ってソフトにかけて、しっかり認識してくれますか? パソコンFAXできた書類をe.Typist体験版で試したところ、 新聞文字くらいのところは全然ダメでした。 もしスキャナを通して誤認が少ないようなら、スキャナの購入も考えています。 スキャナ購入候補ですが、 候補 エプソンのGT-9400UF ソフト まだ迷ってますが、 e.Typistあたりを考えております。
>>917 スキャナ通して改善するなんて考えられんが。そのパソコンFAXって何?
919 :
917 :04/05/19 17:50 ID:HMlNp/e4
>>918 書き方が悪くごめん
今、会社の書類をデータ化しようと思って
今までは書類を持って帰って
エクセルに手入力
↓
まいと〜くFAXを購入して会社から自宅パソコンへ転送
FAXイメージのまま保存
文章の検索が出来ないから不便
↓
ocrソフト投入
ただFAXイメージをbmpに変換。解像度がなさ過ぎるので
誤認だらけなのかと
↓スキャナ購入
会社から書類を持って帰る
スキャナで今のFAXの状態より解像度のある状態でスキャニング
e.Typistでウマー
を考えているんですけど
どうでしょ?
つまり、
書類---(FAX)--->PC---(OCR)--->テキスト
だとうまくいかないから
書類---(スキャナ)--->PC---(OCR)--->テキスト
にしてみたいということかな?
書類がまともな印刷物なら、FAXをスーパーファインモード(可能ならさらに
上位のモード)にして送ってみると解像度が上がって結果がよくなる可能性は
ある。縦にして送るか横にして送るかでも変わりうる。
でも
>>917 を読む限りでは、その書類自体がFAXの結果でしかもつぶれてると
いうことだから、それをさらにFAXで送ったりしたら悲惨になるかもね。
600dpiとかでいいからまともなスキャナで読んで、e.Typistの認識率に期待す
るしかない。解像度とか色とかがそれ以上性能よくてもあんまり意味ないので、
1万円ぐらいのスキャナでいいと思うけど。
ただ、数字とか記号とかは綴りから補正できないので厳しい可能性はあるよ。
921 :
名無しさん@お腹いっぱい。 :04/05/20 17:43 ID:HkhukARl
922 :
名無しさん@お腹いっぱい。 :04/05/20 17:46 ID:HkhukARl
923 :
名無しさん@お腹いっぱい。 :04/05/20 18:34 ID:HkhukARl
925 :
名無しさん@お腹いっぱい。 :04/05/23 22:33 ID:QFF0wpHq
Presto OCRを使っています。 見開きのコピーを読み込ませているのですが、 バッチで保存の際のファイル名に困っています。 例えば100頁からとかはできるのですが、単純連続でついてしまいます これを100頁から偶数頁のファイル名(100, 102, 104 ...)をつけるということはできるんでしょうか? 教えていただけるとうれしいです
プリンタ型のスキャナ(原稿移動型スキャナ) ScanSnap! で、PDFにしてから、 OCRソフトをかけたいのですが、現状ではどのソフトが優秀かな。
>>926 漏れの個人的インプレでは
・ e.Typist:認識率◎ 図表◎ 処理速度× 一度に100ページまで×
(やさしくPDF OCRも基本的に同じ)
・読んでココ:認識率◎〜○ 図表× 処理速度◎ 枚数制限なし◎
どんな原稿が主なのかにもよるので、かならず体験版をDLして試すように。
>>924 >>927 図表や下線,注釈,ふりがな,英文,数字等が混在した文書の本文をテキスト化したい
(あくまで本文のみが対象)と思っていますが,認識率に定評があるe-typestのエンジンを
積んだ「やさしくPDF OCR」は値段から言って買いってことでよろしいでしょうか?
依然ナローなもんで体験版の70MB超はちょっと…なのでお願いします。
読んでココv10でPDFファイルを読み取らせるにはどうしたらいいの? Q&AにはAcrobat のプラグインがどうこうというという説明が書いてありますが、Adobe Acrobatを別途購入しないといけないのでしょうか。 e-Typistだとデフォルトのまま読み込めるので、e-Typist を買おうかな……。
>>931 どうやら、Adbe Acrobatを購入する必要があって、Adobe Reader だけでは無理のようですね。
ありがとうございました。
>>929 レスありがとうございます。一度に処理するのは多分数十枚だけど,
それでも20分近い差か〜。処理時間を取るか,修正時間を取るか,微妙ですね。
> どっかの店頭でDLさせてもらってCD焼くなりUSBメモリに落とすなりさせてもらえば?
その手があったんですね。田舎だからベストくらいしかないけど,やってくれるかな?
今、e.Typist9 の体験版と、スキャナーについてきたOmniPageSE を 独日混合文を読み込ませてテストしてたんだけど、 e.TypistってUnicodeText で保存できないのかな・・?? せっかく認識している特殊文字が保存すると全滅してしまう。。 OmniPageSE はさすがに保存ダイアローグで選択できた。
935 :
名無しさん@お腹いっぱい。 :04/06/03 10:40 ID:RXTZ6dw2
次のような条件に当てはまるOCRソフトはありませんか。 1.用途は英語の読み取りのみ。 2.PDFファイルも読み取れること。 3.日本に代理店があること(経理処理の都合)。 4.価格は5万円以下。 OmniPageが良さそうなのですが、値段が……。
Readiris
937 :
934 :04/06/03 17:30 ID:5tAv4hbC
>935 今しらべて初めて知ったんだけど、OmniPageProって・・・高いのね。。 確かにSEですら読み取り精度はかなり高く感じるから 業務用にはよいのかもね。 自分の環境ではドイツ語のみの実験しかしなかったけど 皆さんも言う通りe.Typist9 も結構よい結果だった。 速さもOmniPageSEよりは速く感じる。。 (もちろんOmniPageProはもっと速いんだろうけど)
938 :
935 :04/06/04 00:41 ID:BYosQvFV
>>937 レスをサンクスです。
日本語OCRソフトの英語認識でも、何とかなりそうなので、そっちで考えます。
読んでココv.10を持っているので、これにAdobe Acrobatを買い足すか、e.Typistか読取革命を買うかなんですが……。
読取革命は体験版ではPDFの認識ができない(バクらしいけど、パッチは製品版でないと当てられないとか)ので試せませんでした。
939 :
933 :04/06/05 18:38 ID:wk+VnOog
「やさしくPDF OCR」の体験版を使ってみました。 新聞のレイアウトや文字自体の認識率は高かったけど,大きさが違う図が複数あって 図の中に文字が含まれていたりすると(例えばグラフなんかの場合) 文字領域と勘違いして?とんでもないレイアウトになりました。 手動で図を囲っても何故か複数の認識枠ができてしまって,削除,修正が一苦労。 文書領域全体を手動で大きく枠指定した後で,その上に重ねて図表枠を指定できたり 不要な図表部分だけを認識除外するような機能はないんですね。
>>939 >その上に重ねて図表枠を指定できたり
ツールバー右側の領域種別指定で図領域を選んでから範囲指定をする。
>不要な図表部分だけを認識除外する
画像ウィンドウのツールバーの削除範囲設定を選んで範囲指定する。
ではだめ?
e.Typistでは、読んdecocoにあるような認識した文字を分離する、ということは出来ないんでしょうか バージョンはエントリーR3aです
943 :
名無しさん@お腹いっぱい。 :04/06/12 03:53 ID:nHoXSpx4
今、ここに出てるOCRの体験版をいくつか使ってみました(読んでココは以前使っていてかなりよかった)。 サンプルは古い「SFマガジン」に載った小説。これをデジタルテキストデータ化して一太郎ファイルにし、出版サービスで製本するのが夢です。 今日使った中では「読み取り革命」がダントツに使いやすくはかどる。 ただ、多機能な分操作が分かりにくい。 レイアウト認識すると、読み取り順序が勝手に表示されますがこれがまたよく間違う。 これを変更したいのですがどうしてもうまくいきません(右クリックすると順番変更とあるのですがこれをクリックすると「その順番にクリックしなさい」と出て終了してしまいます。 意味が分かりません。 また手動でエリアを指定すると勝手に横書き認識してしまいます。 いちいち属性変更で縦書きに変更するのが面倒なのでデフォルトで縦書きに設定したいのですがどこで設定すればよいのでしょうか? よろしくお願いします。
その順番にクリックしなさい
945 :
943 :04/06/13 05:09 ID:mBloqA7d
>>944 そのとおりでした。
ポップアップの出た状態でやらないとだめなんですね。
でもこのソフト、編集が凄くしやすくて助かります。
「た」と「だ」の誤認が多すぎるけど、修正するとき、同時に他の同じ候補文字を
持つ部分もまとめて出てきてチェックできる。
今日1日で二段組で150ページ分ぐらいデジタルテキストデータ化できました。
もう100ページぐらいで出版できます。
946 :
名無しさん@お腹いっぱい。 :04/06/13 16:35 ID:mBloqA7d
ところでソースネクストの「本格読取」って評価版はないんでしょうか? 値段が安いから金を捨てるつもりで試しに買ってみてもよいですが、 OCRなんて、使えないのはとことん使えない(手入力のほうが速くて無意味、 ただのごみ)から、できればタダで機能を確認したいなあ。
947 :
名無しさん@お腹いっぱい。 :04/06/13 17:10 ID:mBloqA7d
一発!OCRPro for一太郎の体験版を使ってみたら、 一太郎返還機能限定の読取革命ですた。
e.Typist 9は400dpi以上のPDFを読み込めないのか。 だめぽぉ・・・
949 :
名無しさん@お腹いっぱい。 :04/06/14 23:02 ID:z1YxIwde
>>946 自己レス。
購入して使ってみたら、読取革命の機能限定版でした。
自動文書変換はワード、エクセル、テクストの3種のみ。
しかし一番いたいのは、ハイパーチェッカーがないこと。
これがあるかないかで編集能率が倍は違う。
ただこれを持っていると読取革命を乗り換え版7000〜8000円の安価で
買えるので、読取革命購入することにしました。
正規に買うと17000〜18000円するので、
これ+乗り換え版で10000万円以内だからはっきり得。
読取革命買ったらこっちは友達にただであげよう。
950 :
名無しさん@お腹いっぱい。 :04/06/14 23:06 ID:z1YxIwde
>>865 最強は
「本格読取」購入→それを持参し乗り換え版「読取革命」購入
これで1万円以内に収まる。
ハイパーチェッカーが要らなければ、ほかの機能はほとんど同じな
「本格読取」で十分じゃろう。
951 :
名無しさん@お腹いっぱい。 :04/06/15 21:13 ID:Bsv2UO9u
読取名人ってWindowsXPみたいにネット認証が必要ですか?
>>949 いや、最近笑ってないとかいうことはないんだけど、
久々に壺にはまっちゃたアルヨ。
わたしの奥さんちゅごくじんあるね。スマヌ、止らん。
953 :
名無しさん@お腹いっぱい。 :04/06/17 04:27 ID:CPXvLBB0
>>952 え、そんなにおかしいあるか?
どこが? 説明キボヌ。
漏れの行動がおかしいあるか?
それとも読取革命の価格設定?
( ´_ゝ`)
955 :
名無しさん@お腹いっぱい。 :04/06/20 00:08 ID:4OBOKtIG
EPSONについてきた、読んでココを使ってみました。ものすごく認識率が悪いです。 バージョンアップする気になりません。本当にいいのですか?ご指導お願いします。
>>955 付録版とは比べものにならないほど紙資料については認識率はいい。
特徴や弱点などは過去レス参照。
というか、付録版なんて使用頻度が多い人は普通そのまま使わないと思うが。
958 :
名無しさん@お腹いっぱい。 :04/06/20 11:22 ID:xSlzHO4e
和文と英文が混合されていると、認識率が悪かった。読んでココVer.10を導入すれば 改善されますか?値段的には、本格読取→読取革命に魅力を感じます。 読んでココは、26穴・図表に弱点ありというスレを見ました・・・ これらの点を踏まえて、アドバイスしてくれたら、助かります。お願いします。
認識率はどんな原稿かによって変わるし、インターフェイス(操作しやすさ)もそれぞれなので、 結局は体験版を試して感触を掴んでくれと言うほかないのだが… 和英混在文では、l(L)と1、一とーと→、Jと↓、。とo(O)と0(0)などで誤認識が多いが、 製品版(体験版)は付録版に比べてかなりマシだといえる。 ついでにいうなら、最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。
>最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。 横レスで申し訳ないんだが、認識辞書を鍛えるって、具体的にはどういうことをいうのでしょうか 認識のたびにご認識を修正していくの? さらには、鍛えた成果は他のPCにも移せますか よろしく教えてください
>最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。 製品紹介をちゃんと読めば書いてあったと思うけど、今の読んdeは自動学習だったような。 日本語文書については認識率は不満なし。 また、誤認識の癖Ex.(1)(2)が正しく変換できない も使ってればわかるので簡単に対処できるし。 要は使いこなし次第。 読み取り革命は2000の時に使ってたけど、その後読んdeを使ってみてこっちの方がよかったので それ以来ずっと読んdeです。バージョン重ねるごとに製品間の優劣とかは変わってるでしょうけど、 まああえて買い直すほど不便はないなと思ってそのまま同製品のバージョンアップを重ねています。 最後は、自分の用途ではどうか、を各製品の体験版で比較して一番いいのを選択するしかないと思います。
962 :
名無しさん@お腹いっぱい。 :04/06/21 22:24 ID:PwRAEobN
>>958 今日、読取革命の乗換え版を買いましたが、特に他社製品の提示は
求められませんでした(新宿ヨドバシ)。
本格読取買う必要はないかもしれません。
もしかして、これって常識?
952さんが笑ったのはこのことだったんでしょうか?
すいません、純朴なもので……
(それとも、店によっては、提示求めるところもあるのかな?)
963 :
名無しさん@お腹いっぱい。 :04/06/21 22:31 ID:v0fYkvU+
OCRはとにかくテキストのみならいいけど、図などが入ると使えない。
>961 レスさんくすです。 あくまで横レスなので、読んdeの取説も手元にないんですが、 一般にこうした学習した分というのは、転送可能なものなんでしょうか? 折角育てたのが、OS再インストでおじゃんではかなしんですが・・・ program fileのやつを上書きすれば良いのでしょうか?
>>964 C:\Documents and Settings\ユーザー名\Application Data\Aisoft\Yonde\Usrdic
ってフォルダがあるよ。
>>962 インストール時にチェックされなければいいのでは?
販売店ではチェックされません。
アップデート版も同様。
>>965 サンクス!
しかし手作業でバックアップとるのも限界なのかな〜
何かしら漏れがあるような気がするし
まあApplication Data丸ごとバックアップして、丸ごと上書きすればいいのかも知れないけど
968 :
名無しさん@お腹いっぱい。 :04/06/22 12:51 ID:xko6xFie
このスレは、勉強になります。手書きの書類がたまっていて、適時修正をしながら入力を しなければならないのですが、音声入力ソフトの使い勝手を知りたくなりました。 厳しいご指摘をさけ、ご指導をしてもらえたら、助かります。お願いします
2、3年前の奴だけど、学習させれば結構な精度で入力できた。 でも、咳したりつまったりして、間違って入力されたものを修正する手間を考えると、 タイピングのスピードが結構なレベルの人にとっては、まだまだだったなぁ。 最新の製品については知らないけど。
971 :
名無しさん@お腹いっぱい。 :04/06/22 20:07 ID:4pwWYjLk
970さん、ありがとう。ところで、なんていうソフトですか? こういうスレがないですよね・・・
972 :
970 :04/06/22 20:32 ID:l1qblHgF
>>971 IBMのやつだったと思う。今もあるのかな?
973 :
名無しさん@お腹いっぱい。 :04/06/22 20:52 ID:4pwWYjLk
966さん、ほかのソフトでも、いきなり乗り換え版を買っても、家でインストールするときに 不都合が生じてしまうのですか?ど素人なので、教えてください。 音声入力ソフトって高いんですが、乗り換え版を購入すれば半額になるようなので、そこのところを 知りたいのです・・・
975 :
962 :04/06/23 00:16 ID:p7bl4B4h
>>966 インストール時のチェックもなし。
いちおう本格読取入った状態でしたが、たぶん関係ないと思います。
ただ、読取革命の試用版が入った状態ではインストールされないので、
これをアンインストールしてからインストール、でした。
早速使いまくっていますが、認識率は普通だと思いますが
とにかくハイパーチェッカーの使い勝手が最高です。
画像、図表の入った原稿には向かないと思うが、小説などの
長文テキストをメインに扱う文系ユーザーには最適なOCRだと思う。
ちなみにマニュアルによると、アップグレード版の場合は
インストール時に旧バージョンがないとだめなようです。
976 :
名無しさん@お腹いっぱい。 :04/06/30 22:56 ID:XAyNW3oo
読取革命の試用版を試した後、「コントロールパネル」の「プログラムの追加と削除」で削除したのですが、MS-WORDのメニューバーに現れた読取革命のアドイン表示が消えません。 どうすれば消えますでしょうか。
977 :
962 :04/07/01 06:37 ID:kqjgVCkK
>>976 wordのユーザー設定の一番下の読取革命を選択し、
右の削除ボタンで消えませんか?
ちなみに私は現に使っているため試せません。
978 :
名無しさん@お腹いっぱい。 :04/07/01 08:41 ID:Zrh6dlUU
>>977 ありがとうございます。
> wordのユーザー設定の一番下の読取革命を選択し、
ここにはそういう設定がありませんでした。ちなみにMS-WORD2003です。
「ユーザー設定」の「テンプレートとアドイン」の設定も外しましたし、「Documents and Settings」の「\Application Data\Microsoft\Word\STARTUP」にあったアドイン用ファイルを削除しても消えません。
WORDの設定に関するどこかにあるんだろうと思いますけど……。
979 :
名無しさん@お腹いっぱい。 :04/07/01 09:37 ID:lVoersTa
>>978 自己レスです。
解決しました。
「\Application Data\Microsoft\Templates」のテンプレートを削除したら消えました。
お騒がせしました。
すいませぬ、e.typistと読んdeについてですが、 例えば、マイドキュメントにあるjpegやbmpなどのA4サイズの文章の画像を読み込んで それから文字データとして変換みたいなことは出来るのですか?
自分で試してみろ 体験版もあるんだし
難なくできますよ
読んdeココ使ってるけど 表を読み込んでエクセルに送ったとき レイアウトも再現してくれるのが便利 専用ソフトで作ってる表を「エクセルでくれ」 とか言われたとき重宝する こんな意見も少しは参考になるかな?
984 :
名無しさん@お腹いっぱい。 :
04/07/06 03:43 ID:zXeFZgkt eタイピストを使っているんですが、 自動レイアウト解析を完全に遮断することってできますかね? これだと目次などでページ数だけ別枠になって、コピペしたときに不便なんですよね。 prestoのようにある程度レイアウトも再現しつつ、べたにテキスト化するのが理想なんですが。 取説を見る限りでは、範囲指定も結局は自動レイアウト解析で認識枠をつくるだけですし・・・ どなたかご教示ください。