■OCRソフト、読んでココか、Eタイピストか■

このエントリーをはてなブックマークに追加
1名無しさん@お腹いっぱい。
OCRソフトは、どちらがよろしいのでしょうか?
@性能(読みとり精度、変換効率)
A使い勝手
2名無しさん@お腹いっぱい。:2001/08/22(水) 19:00 ID:Sc2qr6nI
自分はOK READERをおすすめするです。
3名無しさん@お腹いっぱい。:2001/08/22(水) 19:10 ID:Dl6vOqOI
ImageOFFICEってどうよ?
4名無しさん@お腹いっぱい。:2001/08/22(水) 20:07 ID:qbSLGr36
OK READERって、どういうソフトですか?
どういう点がおすすめなのですか?
5名無しさん@お腹いっぱい。:2001/08/22(水) 20:12 ID:ljxKedzc
性能で見るとe.typistだと思う。読んでココは余り使う気にならない。
OKリーダーとか読みとり革命とか進める人もいるけど、私が使っ
てみた限りではいまいちだった。
6名無しさん@お腹いっぱい。:2001/08/22(水) 20:30 ID:KAsSydF.
>性能で見るとe.typistだと思う。読んでココは余り使う気にならない。

エプソンのスキャナーを買ったら、読んでココがついてきますが、
Eタイピスト最新版を買う価値はありますか?
7名無しさん@お腹いっぱい。:2001/08/22(水) 20:36 ID:???
e.typistって昔なんかにバンドルされてて使ったけど
恐ろしく使えなかったよ。
昔ってもう5年ぐらい前なので参考にはならないね。
もちろん、sage
8名無しさん@お腹いっぱい。:2001/08/22(水) 21:05 ID:CKZHF6d.
私は「読んで、ココ」を使っていますが、26穴や図表などがあるとダメです。
e−typist はどうですか?
9名無しさん@お腹いっぱい。:2001/08/22(水) 23:29 ID:???
スキャナーに付属しているソフトは機能制限あり。
変換効率を向上させるためには、
最新版を買う価値あり。
10名無しさん@お腹いっぱい。:2001/08/23(木) 01:57 ID:ZM3QZqV.
e-typist持ってるけど、下線が入るともうめちゃくちゃ。
下線OKなのどこかで売ってない?
11名無しさん@お腹いっぱい。:2001/08/23(木) 22:00 ID:flc/bcu2
バージョンアップ版だと、線が入っても認識可能だと思います。
12名無しさん@お腹いっぱい。:2001/08/23(木) 22:55 ID:WvtfG53Y
えー、自分が持っているのはOK READERの99年版なんで今は違うかもしれませんが。
コイツの特徴は
・比較的安い
・その割に日本語の認識率はそこそこ良い
・英語の認識率は最強
自分は英文を主にスキャンするので、これがお気に入りです。
13名無しさん(14):2001/08/23(木) 23:28 ID:FbH0qG1E
>>10-11
それってバージョンいくつですか?
キャノンのCCD採用のスキャナを買おうと思ってるのですが、e−typistってそれに付いてるやつですよね?
14名無しさん@お腹いっぱい。:2001/08/23(木) 23:38 ID:???
>>13
スキャナに付属してるのは、e−typistのentryだったはず。
つまり体験版ね。
15名無しさん@お腹いっぱい。:2001/08/24(金) 00:13 ID:OpmRLb0A
OCRは体験版と製品版でびっくりするほど認識率違うよ。
認識率って1、2%違うだけで読んだ感じが全然変わるからね。
16名無しさん@お腹いっぱい。:2001/08/24(金) 01:03 ID:noGTYJOQ
最新版にバージョンアップすると、
例えば、問と間の区別が正確にできるようになりますね。

付属の体験版(機能制限版)を使って、認識率の悪さにがっかりする方
多いと思います。

OCRが主目的ならば、
スキャナより、OCRソフトに金をかけた方が
いいように思います。
17名無しさん@お腹いっぱい。:2001/08/24(金) 05:38 ID:Dho48mFA
e-Typistと同じベンダーのWinReaderがいいよ。
18名無しさん@お腹いっぱい。 :2001/08/24(金) 10:46 ID:Nc8hVZc2
e-Typistと読んde!!ココは、
それぞれキヤノンとエプソンのスキャナにバンドルされてるから
シェアとってるだけであって、
別に特に優れたOCRソフトだとは思わない。
他の市販のOCRソフトにも良いものがいろいろある。
私は読取革命を使ってる。
19名無しさん@お腹いっぱい。:2001/08/24(金) 13:37 ID:e4UWPyCo
スキャナに付属のOCRソフト、e.Typist LE2を使って、
新聞や雑誌のスクラップのテキスト化をしてみました。

けっこう誤認が多くて使おうという気にはなりませんでした。

アップグレードをすれば本当に大丈夫?
20名無しさん@お腹いっぱい。:2001/08/24(金) 16:06 ID:L1oxCWkw
OK READER をお勧めします
http://www.sesys.co.jp/product/ocr/
21名無しさん@お腹いっぱい。:2001/08/24(金) 17:12 ID:???
>>20
販売元さんですか?
22>>21:2001/08/24(金) 17:14 ID:???
いや、宣伝がいけないとかじゃなくて、自信がお有りだなって。
しょうもないタコ製品だと、ここでは無茶苦茶叩かれますから。
2320:2001/08/24(金) 17:31 ID:L1oxCWkw
単にユーザです。
以前 e.Typist のバンドル版に懲りて乗り換えました。
24名無しさん@お腹いっぱい。:2001/08/24(金) 19:41 ID:EMslsbgQ
>>18

でもバンドルされてるのは古いヴァージョンじゃないの。
かといって7もたいした事はないけど
25名無しさん@お腹いっぱい。:2001/08/24(金) 20:09 ID:CgDeJS3I
WinReader Pro Ver5 使っていたことある。定価19万8000円だっけ?

けど、e.TypistのVer7と比べたら対して認識率って変わらないんだけど
なぁ。
26名無しさん@お腹いっぱい。:2001/08/24(金) 23:15 ID:XHgvzIPg
定価19万8000円?
1万9800円じゃなくて。。。
すごく高いですね。
個人で購入されたのですか?
27名無しさん@お腹いっぱい。:2001/08/24(金) 23:31 ID:aqYRIwNM
ドキュワークス使ってる人いる?
便利そうなんだけど。。
OCRエンジンはe.Typistみたいですね。
2810:2001/08/25(土) 06:47 ID:UWjiC0ts
>>11 アップグレード版買った。
下線あると、めちゃくちゃ。
認識率大差なし。
29名無しさん@お腹いっぱい。:2001/08/25(土) 09:55 ID:C0GX4bMM
下線を消す機能があるらしいです。
線を消してから改めて認識させるそうです。
30名無しさん@お腹いっぱい。:2001/08/25(土) 19:04 ID:.fPzJFjk
●日経ゼロワン(2000 January号)

「入力にPNG、JPEG、GIFが選択でき、認識結果をHTML形式で保存できるなど
ホームページ作成も意識している。
今回の新聞読取テストでは576文字中、誤認識数は1文字と、もっとも認識率が高かった」

認識率の表 ※注:文字認識率テスト
サンプルは日本経済新聞コラム(300dpiでスキャン後、手動で領域を指定)。
※注:比較対象の他社OCRは、つぎのとおり
読んde!!ココVer.5、e.Typist V.5.0、読取革命2000、読取物語EX V3

OKREADER 99 99.8 %
読取物語EX V3 99.1 %
e.Typist 99 %
読取革命2000 99 %
読んde!!ココ 98 %

2001年の最新版は更に認識率がアップしているんでしょうね。
31名無しさん@お腹いっぱい。:2001/08/25(土) 20:05 ID:.fPzJFjk
メディアドライブ社のe-typistは、2万円以上もする高価なソフトだが、
誤差がとても少ない上に両面印刷の資料をスキャンした際にうすく浮かび上がる文字の陰をついでに消去してくれる優れものである。
「読んでココ」というソフトも候補にあったが、ほとんど認識しない上に操作性も悪かった。
どちらもWEB上から体験版をダウンロードができるので、スキャナをお持ちの方はためしては如何でしょうか。
「e-typist」は、http://www.mediadrive.co.jp/
「読んでココ!」は、http://www.aisoft.co.jp/
読んでココもつかえるよ、という方がいらっしゃるかもしれない。ぜひ情報を。
32名無しさん@お腹いっぱい。:2001/08/25(土) 20:44 ID:OmSLKJIA
で、何に使うの?
33名無しさん@お腹いっぱい。:2001/08/25(土) 21:05 ID:???
かちゅーしゃだと全部見えるけど、ブラウザからだと
このスレとあともう一つしか見えないのか。

それはさておき、OKREADERとか、読取革命、読取物語
って実際どうなの?

30が書いてあるように認識率が高いと評判だけど、実際
使っている人の話って余り聞かないけど・・・
34名無しさん@お腹いっぱい。:2001/08/26(日) 03:12 ID:4ccUoV7c
某大学文学部の学生です。
活版印刷の古い本を片っ端からスキャンしてリブレットに入れて持ち歩きたいのです。
活字をうまくスキャンしてくれるOCRソフトって有りますか?
35名無しさん@お腹いっぱい。:2001/08/26(日) 06:04 ID:zm5hWtdg
OCRを選ぶより、HDD増やして画像閲覧ソフト使ったほうがいいと思うよ。
用途間違ってると思う。

活字OCRエンジンに関わってた経験上からは、
リテールパッケージの識字率では東芝ExpressReaderか
メディアドライブのWinReaderしかないね。
このスレででてる他のソフトは、はっきりいって使用に耐えない。
あとそんな記事信じないほうがいいよ。認識のことしらなすぎ。
まず300dpiでってのもだめ。
それぞれにアルゴリズム違うから、最適な画像解像度がそれぞれ違うし、
10ポ程度の文字だと、400dpiは最低あるべき。

ちなみに、e.TypistのOCRエンジンは、WinReaderの世代前の
エンジンを使ってるらしい。そのくせ、別の筋からは、ものによっ
ては識字率がわずかにいい傾向があるとの事。
36名無しさん@お腹いっぱい。:2001/08/26(日) 06:22 ID:jyeMG1WE
言い忘れた。あと識字率の向上の事だけど、
研究レベルでもエンジニアリングレベルでも、当分大した向上はないよ。

特に研究レベルが、識字率そのものではなく、その周辺、
例えば雑誌とかの絵の中にある文字の認識とかにシフトしてるから。
人の目の認識に追いつくには、AIができるまで無理ってのがみんなわかってるんだ。
だから、一定の識字率が得られるようにスキャニングの工夫するとか、
その後の修正手続きの運用方法の仕組みづくりとか、
新聞とかの特定のフォント向けにカスタマイズするしか、今はない。
マルチフォントってのがだいたい、かなり無理があるんだ。
明朝のIとゴシックのIを考えたらわかるでしょ。
37名無しさん@お腹いっぱい。:2001/08/27(月) 04:09 ID:3gIE7urU
>>35-36
>OCRを選ぶより、HDD増やして画像閲覧ソフト使ったほうがいいと思うよ。
>用途間違ってると思う。
レスありがとうございますー。
私んとこでは、最近出た本の、写植による綺麗な印刷の字はとりあえずどーでもいいんです。
活版印刷の本をスキャンして、OCRして、手で一部修正しつつ「「検索」」に耐えるように仕上げたいんです〜〜。
38ふわ:01/08/27 07:05 ID:9v7IILNA
>>37
>「「検索」」に耐えるように仕上げたいんです〜
いまいち、言ってることがよく把握できていないんですけど、
>>35-36 さんの言うとおり、
OCRを選ぶより、HDD増やして画像閲覧ソフト使ったほうがいい!
普通の人は、
古い本を片っ端からスキャンしてOCRかけるなんて、
面倒でやってられないし、
そんな古い本の活版印刷の文字なんか、
OCRソフトが読みとれないでしょう、普通。
それに、
画像閲覧ソフトといっても、DocuWorksやPaperPortだったら、
キーワードを入力、簡単なOCR機能が付いていて、
それで、「「検索」」に耐えるように仕上げ」られますよ。
(多分)まさにあなたの望む用途向けのアプリでしょう。
3937ではないけれど:01/08/27 10:53 ID:GP1JYpcE
ドキュワークス、そんな機能があったのか・・・ほおほお。
自分の場合はテキストデータ保存&GREP検索のパターンができあがっているので
OCRは手放せませんが。
読ませるのが英文なので、識字率はきわめて優秀です。
40名無しさん@お腹いっぱい。:01/08/27 11:58 ID:rRs72h1Y
ドキュワークス…名前が嫌だ。
41名無しさん@お腹いっぱい。:01/08/27 15:55 ID:Zmfvvr8E
同意。そこの営業に紹介してもらったとき思った。
コピー機とネーミングの感覚をあわせたんだと思うんだけどさ。
その場で使ってみて、閲覧、検索はまぁ十分いいよ。
OCRは...やっぱソ足したいかな...
42名無しさん@お腹いっぱい。:01/08/28 22:22 ID:fcflm7lA
日経PC21 4月号でも取り上げられた画像管理ソフトの決定版

各種アプリケーションで作成した文書でも同じウィンドウ内で一括して扱うことができ、
紙の文書もスキャナーで読み込むことによって他の電子文書と同様に扱えます。
個人の文書管理からグループ、さらには企業レベルでの統合的な活用まで、

異なるアプリケーションで作成した電子文書や、さまざまな紙文書を一元管理。
わずらわしかったドキュメント作業が効率的に進みます。

■編集・整理・保管・検索
作成文書の保管・検索も素早く行なえます。
スキャナーで取り込んだ画像に対して自動的にOCRをかけることで、
画像データに対しても全文検索できます。

■アウトプット
数種類のアプリケーションで作成した文書でも、DocuWorks文書として一括出力。
配信先のアプリケーションを気にせず配信できます。

○対応OS
Windows(R) 95/98/Me
Windows NT(R) 4.0 (Service Pack 3以上)
Windows(R) 2000

標準価格:\13,200- → bStore販売価格:\11,880-
43名無しさん@お腹いっぱい。:01/08/29 05:45 ID:vznT9wKs
>>42
ソフト名を書いてくれ。
44名無しさん@お腹いっぱい。:01/08/29 14:18 ID:T6/rzJE6
ソフト名は、DocuWorksです。
45名無しさん@お腹いっぱい。:01/08/29 19:22 ID:1bA8pGUM
OCRの良いところは
加工が容易なテキスト形式にしてくれるってことじゃないの?
それともそのソフトは・・・以下略
46名無しさん@お腹いっぱい。:01/08/30 01:39 ID:soXnVBes
docuWorksの体験版使ってみたが、画質劣化なしでbmp読み込んだら、
画質劣化した。鬱だ詩嚢。
47名無しさん@お腹いっぱい。:01/08/30 11:10 ID:.RJ1Bem2
そうなんですか。
正規版も画質劣化するなら心配。。。
他に何か気になる点とかありました?
48名無しさん@お腹いっぱい。:01/08/30 17:07 ID:qo70.xXg
心配ばかりしてもねー。
結局自分が使わないとわからないよ。
どうせ1万ちょっとなんだし。
49名無しさん@お腹いっぱい。:01/08/30 18:17 ID:omBETPyU
そりゃあ、画質は劣化するさ。当たり前でしょ。
ドキュなんてスクラップしとくためのものなんだから。
50名無しさん@お腹いっぱい。:01/08/30 22:06 ID:et1OHFMc
DocuWorksに似たソフトとして「やさしくファイリング3」があります。
eTypistで有名なメディアドライブ社の文書管理ソフトです。
定価9800円です。
DocuWorksとどちらが優れているでしょうか?
5110:01/08/31 00:30 ID:pttmexXY
「やさしくファイリング」って「マイドキュメント」とほとんど同じ。
フォルダーの中にフォルダーやファイル入れるだけ。
俺には、文書管理ソフトの存在意義がわからない。
52名無しさん@お腹いっぱい。:01/08/31 03:01 ID:a7tqXj7.
>>37
読み取れない活字を片っ端から登録していけば、その内なんとかなる。
・・・・かもしれない。
とりあえず、メーカーがやってるOCRソフトの説明会にその本持って、
試してみな。
持ち出せないような、貴重な文献だったらどうしようもないが。

あと、USB2.0に対応してるスキャナを買え。
作業効率が違ってくる。
53初心者:01/08/31 11:42 ID:cAurreNA
>52
助言ありがとうございます。

USB2.0にすると、そんなに作業効率が違ってくるのですか?
ボトルネックは、スキャン速度でなく、転送速度?
54名無しさん@お腹いっぱい。:01/08/31 13:18 ID:ay.dZhC6
>52
あれ、USB2.0って今対応しているOSってあったっけ?
未対応のOSだと1.1扱いになるんだよね?

でも、やっぱりボトルネックはスキャン速度の方だと思う・・・
パラレル接続で無い限りはそんなに気にしなくて良いのでは。
55名無しさん@お腹いっぱい。:01/08/31 13:31 ID:TwqTOzdg
IEEE1394でつなげばいいじゃん
5655:01/08/31 13:50 ID:TwqTOzdg
>>54
2.0用のカード買う必要があるよ。
そうすればドライバも付いてるし。
でも、いまのところはIEEE1394にしといた方がいいよ。
ついてないなら、カード買う必要あるけど。
57名無しさん@お腹いっぱい。:01/08/31 16:43 ID:syMSlasA
2.0用のカード買うくらいならSCSIのスキャナ買ったらどうだ?
58名無しさん@お腹いっぱい。:01/08/31 17:00 ID:LUANGcFg
SCSIは終わってると思われ
>>56
いまのところはIEEEにしとけってのに同意
59名無しさん@お腹いっぱい。:01/09/01 00:01 ID:REDrbWro
OCR程度なら富士通のクソスキャナにADFが一番だろう。
エプやキャノンより断然速いぞ。
DPIが低いんで、ちと厳しいが、PFUのSnapScanも高速もいいな。
どっちも、Jpegインチキ圧縮な。
60名無しさん@お腹いっぱい。:01/09/01 11:31 ID:PO/VTa6Y
>>59
助言ありがとうございます。
富士通の業務用スキャナーのことでしょうか。
(fi-4010CU \59800→実売\41000〜44000)
【読取り速度 (A4縦) 】
モノクロ2値(200dpi) 10枚/分 ,カラー(150dpi) 3.3枚/分

エプソンのGT8700+ADFより、断然速いですか?
エプソンの方も、条件を同じ(200dpi)にすれば、速い感じがいたしますが。。。
どうなんでしょう?
6159:01/09/01 17:19 ID:wpijuquQ
>>60
PLUG-N-SCAN 1200DUF (実売8000円)
http://www.mustek.co.jp/products/1200duf_tit.html

ScanSnap(実売49800円)
http://www.pfu.fujitsu.com/sales/snap/

まあ、Windows2000で使えなかったり、
サポートがクソだったりするので、
GT-8700の方がいいと思うけどな。

PFUの方は、用途がはまれば、かなり良いと思うぞ。
6259:01/09/01 17:22 ID:wpijuquQ
どっちも、あくまでJpeg圧縮によるインチキ高速化なので、
それでも良いって奴だけな。
63名無しさん@お腹いっぱい。:01/09/01 22:15 ID:5bZcBCFw
59さん
どうもありがとうございました。
教えていただいたHPもわかりやすかったです。
64名無しさん@お腹いっぱい。:01/09/02 10:37 ID:GdC7ctWQ
司法試験板にもOCRの有益情報あり

勉強に役立つPC及び関連製品パート2

http://ebi.2ch.net/test/read.cgi?bbs=shihou&key=993153286&ls=50
65名無しさん@お腹いっぱい。:01/09/02 12:02 ID:JCaBqTVM
>>64
司法試験にはまったく興味ないけど、参考になったYO。
66名無しさん@お腹いっぱい。:01/09/04 01:23 ID:5JSlUoXU
キャノンのスキャナを買った。
eTypistがついてきた。
やはり認識率が悪かった。

1万円弱払って、eTypist7にバージョンアップするのがいいか。
2万円弱払って、読んdeココ7を買い直すべきか。
67fl:01/09/04 03:11 ID:hnpbwWk6
>>66
間違いなく、バージョンアップがお勧め
OCRソフトなんて、そんなに違いがあるものじゃない。
わざわざ1万円余分に出す価値はないでしょう。
 むしろ、
 >>30でも紹介されているように、
 読んdeココよりe.Typistの方が、読み取り精度は上といわれる事が多い
何か、そのソフトにしかない特殊な機能が欲しい場合は別だけど
 例)Acrobatとの連携機能
68名無しさん@お腹いっぱい。 :01/09/04 13:52 ID:DtoZe/XY
>>66
読んdeココ6は使ったことあるけどゴミだった。
RVSCOM2000に付いてきたOK Reader lite(バージョン忘れた)
の方がはるかにましだった。
読んdeココ7は知らないけど、激てきに精度が上がったとは思えないな。
69名無しさん@お腹いっぱい。:01/09/04 14:16 ID:X4lvAHHE
私は、66さんと逆に、エプソンのスキャナを買いました。
読んdeココforEPSON2がついてきました。
付属品は、やはり認識率が悪かったです。

7500円(実売価格はもっと安い)払って、読んdeココ7にアップするのがよいのか、
29800円(実売価格はもっと安い)払って、eTypist7を買い直すべきか、
他のソフト(OK READER、読取物語、読取革命)を買い直すべきか。
迷っています。

読んdeココ7で初めて付いた「30分野19万語専門用語辞書」というのが気になります。
これで劇的に精度が上がったんでしょうか。
7069:01/09/04 14:19 ID:X4lvAHHE
67のfl さんのアドバイスのとおり、
わざわざ1万円余分に出す必要はないような気もしており、
迷っています。
7169:01/09/04 14:22 ID:X4lvAHHE
そして、OK READER、評判良さそうですし。
1万ちょっとで比較的安いうえに、精度が高そう。
72名無しさん@お腹いっぱい。:01/09/05 01:37 ID:pldaHe4M
>>69
読んでココ7がいいよ。
特に、日本語と英単語が混じっている記事は、
イータイピストよりいい感じがする。
73名無しさん@お腹いっぱい。:01/09/05 09:31 ID:6G83q0t2
>>69
その辞書は読み込みに関係ないよ。修正用の辞書だからな。
読んでココは昔から辞書の単語は多いが、一度もetypistより読み込みが良かったことはない。
しかしまあ、>>67が正解だと思われ。
74名無しさん@お腹いっぱい。:01/09/05 19:15 ID:Hsnbgg7g
Acrobatとの連携機能があるのは、読んde!!ココ7。
e.Typist7にはついてない。

多少、認識率が良くたってねぇ、
わずか0.01%の差しかないからね。

Acrobatとの連携機能がついている点で、
読んde!!ココ7が絶対にいいよ。
75名無しさん@お腹いっぱい。:01/09/05 19:20 ID:YT0u9LEc
>>74
アクロバット買ってくれ(ワラ
76名無しさん@お腹いっぱい。:01/09/05 20:03 ID:2nFtbKRA
どうもエーアイソフトの社員が宣伝しているみたいだな(w
アクロバットなんて個人ユーザーには関係なし。

連係機能を強調するならアクロバットをおまけでつけてくれ (w
77名無しさん@お腹いっぱい。:01/09/05 20:35 ID:dVtk0LxA
読んde!!ココは、店頭販売実績が
2000年度も2001年度上半期も
NO1なんだな。

良いソフトだから、たくさんの人が買うんだな。
78ちに:01/09/06 07:45 ID:8/Jcjei2
HPのスキャナーに付いていたe-Typist Ver.2.0を今も使っています。
修飾文字、下線などがない小説のようなものだとほぼ満足できる程度の認識率で、
解析機能でたやすく誤字が訂正できます。
オート機能もあり大量の作業も楽でした。
Ver.7.0が、なぜか評価が低いですが、どこまでのことを望んでいるのでしょうか。
体験版をdownloadして、私も確かめようと思いますが、テレホで時間がなく
途中で切りました。
認識率が悪いとか、使い物にならないとか言っている人は、
スキャナーのdpiの設定が悪いのではないでしょうか。
私は、400dpiで使っています。このくらいがファイルの大きさ、識字率から
ちょうどくらいです。

読み取り革命2001の体験版を使いました。
5.6年前のe-Typistと比べて、格段に良くなっていますね。
特に英文混じり、文字の大小あり、の文書でも、ほぼ読み取っていました。
79名無しさん@お腹いっぱい。:01/09/06 08:04 ID:hYW3EHms
アクロバットとの連携って意味あるのか?
80名無しさん@お腹いっぱい。:01/09/06 11:22 ID:IUmFWzag
>>79
画像情報のみで構成されたPDFファイルを直接文字認識できる。

そして、認識結果(テキストデータ)を
元ファイルの文字部分に添付できる点がよい。

これで、文字情報+画像情報のPDFファイルとして保存
できる。

文字検索に威力を発揮する。

Acrobatの連携は、とても意味がある。
81名無しさん@お腹いっぱい。:01/09/06 11:39 ID:0I856nB.
>>75、76
なるほどな。そやな。
でもな、
最近のメーカー製のパソコンには、すでに
Acrobatがインストールされているものが多いけどな。

75、76は、持っておられんで残念やった。
AIソフト社は、持っておられん方に、割引購入券を配布したらいい。
82名無しさん@お腹いっぱい。:01/09/06 11:50 ID:hYW3EHms
>>81
それ、acrobat reader じゃねえの?
83名無しさん@お腹いっぱい。:01/09/06 12:18 ID:C9u7Wlnc
アクロバットと連携したいんだったらKonicaのファイリングにしろよ
84名無しさん@お腹いっぱい。:01/09/06 13:36 ID:a4YxB9tQ
PDFは、そのままで文字コピーできるだろ。
たまにロックされてるけど。
85名無しさん@お腹いっぱい。:01/09/06 15:14 ID:m1MZ04d6
エプソンだからそのまま読んでここにするのがいいんだろうけど、
エーアイ厨房みてたらイヤになってきたぞ
思い切ってオーケーにしてみようかな。
エーアイ厨房氏んでくれ
86名無しさん@お腹いっぱい。:01/09/06 16:02 ID:0ovzvbg.
>>85
OK READERにしろ。
そして、報告しろ。
できるだけ早くな。
87名無しさん@お腹いっぱい。:01/09/06 16:56 ID:eZ4poXyY
読取革命で印刷物をWordに変換してるんだけど、
Wordにはテキストボックスで落とすんだよねぇ。
他のソフトもそうなのかなぁ?
88名無しさん@お腹いっぱい。:01/09/08 21:51 ID:f6LqRi/g
あのテキストボックス化は使いにくい>>87
段落でインデントしてたりするとどうしようもなかった。
自分で作業したときは、
結局プレーンテキストで落としてもう一度体裁を整えなおした。

他のソフトの情報きぼーん。
89名無しさん@お腹いっぱい。:01/09/09 20:21 ID:Q2j7FnkA
windowsのデスクトップをprintscreenでクリップボードにコピー
画像softに落とした画像ファイルをOCRで取り込むにはどのsoftがいいですか。
最近PDFとか電子bookなど画像読めるけど再使用のための加工や保存ができないやつが
あるので。
90名無しさん@お腹いっぱい。:01/09/09 20:28 ID:wO6uncVs
>>89
PDFはAcrobatで加工できるだろ
91名無しさん@お腹いっぱい。:01/09/12 02:47 ID:Kj2aITps
読んでココの7はActobat(readerは除外)との連携がいいです。
連携は意味があります。

資料をスキャンしてPDFで管理していますが、
Acrobat 5だと透明オブジェクトというのが扱えるようになります。

Acrobat 5から読んでココを呼び出して認識させて、
認識後の文字列を、透明オブジェクトとして、文字イメージの上に
オーバーレイします。

文書イメージはそのままに検索だけをOCR後の文字で行う
ということが可能になります。

検索用だけと割り切れば、十分に使い物になるし、
元の文章はイメージで残るので、かなり便利です。

読んでココ7は、いいと思います。
92age:01/09/12 14:05 ID:5nfAjEYs
>>91
聞きたいんだけど、
PDFのスキャンは、アクロバットのコピー禁止みたいなのがかけられててもできるの?
93名無しさん@お腹いっぱい。:01/09/14 15:40 ID:GVlDeWFE
エプソンGT6700U使えん。
一発コピーボタンとか前面にあるボタンがほとんど
エプソンのプリンターじゃないと動作しない。
おまえのとこの くそプリンターなんか買うか!ぼけ!
94名無しさん@お腹いっぱい。:01/09/14 16:25 ID:KvC2YLHU
>>93
同感
95名無しさん@お腹いっぱい。:01/09/19 18:50 ID:GqouWVf6
認識率を上げるために、何か工夫してます?
96名無しさん@お腹いっぱい。:01/09/21 23:17 ID:PNFoMrls
>>92
できなかった。
97名無しさん@お腹いっぱい。:01/09/27 17:41 ID:???
>>96
クラックした奴もあるよ。プリント不可を可にできるやつとか。
98 :01/09/28 09:11 ID:???
どなかた>>87>>88に対する情報出してぇ
99名無しさん@お腹いっぱい。:01/09/28 11:39 ID:TXWomgE.
>>98
テキストボックス?
87、88で書かれていることがよくわからないから、
レスはつけにくい。
おそらく、他の人もそう。
100名無しさん@お腹いっぱい。:01/09/28 11:57 ID:4cZ8Sx62
>>99
Wordのテキストボックス使ったこと無い?
なにより読取革命使ってみたらわかるってば。
あの使いづらさは。
101名無しさん@お腹いっぱい。:01/09/28 21:47 ID:???
職場は、一太郎なので。。。
102名無しさん@お腹いっぱい。:01/10/02 16:19 ID:xjrMEbog
英文読み込むんで、国産に限らずお願いします。
103名無しさん@お腹いっぱい。:01/10/03 00:01 ID:Y86zmPeE
>102
TextBridge使うのは?
104日本酒:01/10/05 10:57 ID:t7f8.MS.
>>102
私はTextBridge Pro 2000使ってます。
他の英文OCRは使ったことないので比較できませんが、
わりと使い勝手のいいソフトかと思われ。

英文専門だと認識率はどのソフトでも普通なら99%超えるはずなので、
使い勝手で決めるのがよろしいかと。
105名無しさん@お腹いっぱい。:01/10/14 17:17 ID:oFa5ioJm
AIが売ってるPresto OCR PROはいい感じだった。ほんとに99%以上の精度がありそう。
106不明なデバイスさん:01/10/17 10:20 ID:0Qh4PCj8
フリーウェアでそこそこ性能がいいOCRってないもんでしょうかね?
何より日本語識字率の高いやつ。
107不明なデバイスさん:01/10/17 18:54 ID:0Qh4PCj8
突然ですが、MACで使えるOCR、ありませんか?
スキャナ付属のe.TypistLE2はOS9に対応していないそうで(HPより)、
そのせいか作業途中でエラーメッセージが出て中断してしまいます。
正規版を買うにもver7.0もWIN版しかないようですし…。
108名無しさん@お腹いっぱい。:01/10/17 22:15 ID:6Sm1b27S
e.Typist7の体験版落としてみましたが、読んdeココforEPSONと大差ない
感じがしますが、、、、

一回目は良い感じがしたんですけど、ちゃんと結果を比較したらどうもどちらも
そんなに認識率高くない感じで。

なので、値段の安さから読んココver7のアップグレード版にしようかと。
109 :01/10/17 22:35 ID:7lR2+FtL
>>106
>>107
てめーで探せやゴルァ(#゚Д゚)
110読んde!!ココ7:01/10/18 00:33 ID:+SgcFojg
>>108
最初のうちは、誤認識が1%くらいあるけど、
ユーザー辞書をこまめに入力していくと、誤認識がかなり減ってくるよ。
111名無しさん@お腹いっぱい。:01/10/29 11:58 ID:Bd5G1aWD
age
112名無しさん@お腹いっぱい。:01/11/04 15:43 ID:s8TJF2O2
e.Typist7の体験版CD入れてみましたが、誤字だらけでちっとも認識できません。
設定がどこかおかしいのでしょうか?

どなたか教えてください。
113名無しさん:01/11/04 16:30 ID:???
体験版はそんなもんです
114名無しさん@お腹いっぱい。:01/11/04 17:19 ID:6oK2xPJi
>>113
でも、体験版で判断してアップグレードするかどうか判断したいのですが。
115名無しさん@お腹いっぱい。:01/11/04 17:56 ID:IOLPqemL
1 読み取り制度を400dpiに設定する。
2 読み取り濃度に気を付ける。
  特に濃すぎて字が潰れてるとダメ。
3 読み取り枠設定を手動で行う。

特に2は見落としがち。
116名無しさん@お腹いっぱい。:01/11/04 19:26 ID:jj8Mk2wV
>>112
読んde!!ココ7の体験版(30日間使用可)と、
両方のレポートをお願いします。

他のOCRソフトの体験版もあれば、ぜひ。
117名無しさん:01/11/04 23:42 ID:???
118名無しさん@お腹いっぱい。:01/11/06 11:29 ID:a+JlbwaY
>>115
ありがとうございます。
トライしましたが、結局うまくいかないうちに期限切れとなりました。
エントリ版でもなんとか対応していますので、当面これでと思ってい
ますが、バージョン7との使い勝手はどの程度ことなるものなのでしょうか?

体験版のアンインストールしても問題ないでしょうか?(エントリ版に
影響はないでしょうか?)

>>116, 117
ということで、皆様、レポートできずにすみません・・・。
119名無しさん@お腹いっぱい。:01/11/09 23:49 ID:Vo3l3q5w
>>115
115さんは、何をお使いですか?
120115:01/11/11 11:33 ID:???
e.Typist6から読取革命2001に乗り換えた。
(だからver7はまだ使ったことがない。)
e.Typist6は読取革命よりも濃度設定にシビアだった。
やや薄めに読み込んだら認識率が格段に良くなった記憶がある。

各アプリの体験版を試して、
自分のPC環境で動作することを確認できたのを買うのがいいと思う。
スキャナのTWAINドライバーを最新のものに更新しておくこともお忘れなく。
121名無しさん@お腹いっぱい。:01/11/16 00:16 ID:O7jGGl8O
OKREADER愛用です。
自分の使ってた古ーいバージョンは(97かな?)保存時2ページ目が消えるというお茶目なバグがありましたが。
(すぐにサイトからパッチひろいました)
それにも関わらず気に入ってます。値段に対しての性能比はかなり良い方じゃないかと。
122名無しさん@お腹いっぱい。:01/11/28 18:30 ID:JC82LSGB
罫線つきの表の認識に向いているようなのある?
今まで、読んでココを使ってたけど、話にならん。
123名無しさん@お腹いっぱい。:01/11/28 18:45 ID:???
>>122
エクセルのがあるじゃん
124名無しさん@お腹いっぱい。:01/11/28 19:27 ID:???
>>122
7にしな
125名無しさん@お腹いっぱい。:01/12/02 00:56 ID:???
126名無しさん@お腹いっぱい。:01/12/15 00:16 ID:Ny8Nfj1h
そろそろ新しいバージョンが出るよ。
127名無しさん◎書き込み中:01/12/15 05:28 ID:???
やっぱり、OKReaderですね。
ヤフオクにもでてますよ。
128a:01/12/17 22:07 ID:???
e?
129名無しさん@お腹いっぱい。:01/12/19 10:10 ID:OgRrTmZl
初心者な質問ですみません。

OCRを使うためにスキャナーを買いたいのですが、
読取り精度を400dpiにするのがいい、ということは
600dpiの安物スキャナーを買えば十分だということですか?

パソコン初心者なもので、よくわからないのですが。
130名無しさん@お腹いっぱい。:01/12/19 12:27 ID:???
>>129
そうです。
写真をScanするときしか、1200dpiは使いません。
131129:01/12/19 14:50 ID:lTWBbuEE
そうですか。ありがとうございます。
ついでにもうひとついいでしょうか。
新聞よりもかなり小さな文字まで読み取る必要があるのですが、
それも400dpiで大丈夫でしょうか?
132 :01/12/19 15:13 ID:???
じゃあもっと解像度が必要
133名無しさん@お腹いっぱい。:01/12/25 21:45 ID:Wz4EeLxy
>>102
読んでココ6におまけでついてた、Prest!OCR4.2は、目茶目茶精度が高かった。
汚いコピーの論文でも、99%以上の精度で読み取れた。
 逆に、読んでココは、精度がクソひどい。読んでココがおまけなのではないか、
と思うくらい。
134名無しさん@お腹いっぱい。:02/01/22 13:43 ID:/nnYL7Uy
age
135名無しさん@お腹いっぱい。:02/01/23 00:37 ID:X/MSWFlS
で、結局どっちが善いのだろう。最新版を使い比べた人教えて。
136名無しさん@お腹いっぱい。:02/01/23 11:08 ID:???
>>135
昔は、eTypistが定評あったそうだが、
最新版どうしだと、精度は、変わらないな。
読んde!!ココの方がカスタマイズしたら、使いやすくなったので、おすすめかな。
137名無しさん@お腹いっぱい。:02/01/23 23:50 ID:???
e-TypistのPDF出力はどんなもんですか?
読んde!!ココの方がいいの?
138名無しさん@お腹いっぱい。:02/01/24 14:58 ID:MJ5qPNYc
質問、PDFをOCR(テキスト化)できるの。
139名無しさん@お腹いっぱい。:02/01/24 18:21 ID:???
>>138
読んde!!ココ7はできると、カタログには書いてあるね。
140名無しさん@お腹いっぱい。:02/01/25 00:39 ID:DORKm2pO

e-typistはできないのかな?
141たまご:02/01/25 00:43 ID:gCtoMZqz
142名無しさん@お腹いっぱい。:02/01/29 18:58 ID:QEejRns4
http://www.newsoft.co.jp/product/infopmge.html
に入ってるMaxReader Ver.4.0はどうなんだろ?
ネットワークスキャンが萌えなんで、出来ればコイツに統一したい
143名無しさん@お腹いっぱい。:02/01/29 22:47 ID:VkNV3Teg
ID:???
にする方法、教えて。
144名無しさん@お腹いっぱい。:02/02/06 12:49 ID:hSBQxSwU
145名無しさん@お腹いっぱい。:02/02/06 14:01 ID:???
>>143
名前欄の最後に「fusianasan」って書け
146名無しさん@お腹いっぱい。:02/02/06 16:41 ID:???
147名無しさん@お腹いっぱい。:02/02/06 18:39 ID:JPumRaFl
今週号の週刊アスキー見た?

富士通のOCRが認識率96%で最高だった。
パナソニックの読取り革命も
読んでココも良かった。
eTypistが一番悪かった(89%)のが、とても意外。

読取らせる原稿によって順位が入れ替わるかもしれないけどね。
一昔前のeTypist独走という時代は終わったようだ。
148名無しさん@お腹いっぱい。:02/02/06 20:26 ID:???
使ってみた感覚では、認識率は
読んdeココVer7>読取革命2000>e-TypistLEだった。
単純に新しいものほど認識率アップしてました。

今じゃあ、読取革命2002が出てるし、読んdeも8が出るらしいし。
どっちを買おうか迷い中。
149名無しさん@お腹いっぱい。:02/02/09 23:06 ID:???
読んでココ7を使ってます。使用は主に付属のPresto!
ロシア語・ポーランド語混合ページを読み込んでます。
非常に便利です。でもHDDが飛んで今までのScan済が全てあぼ〜ん!
しくしく。。。

処で、見開きページの処理で上手くいく方法知りませんか?
文と表が組み合わさっているので、手動で枠を作って認識してます。
しかし、最終段階で左右のページがごっちゃになってしまって困ってます。
入れ子でページ毎に更に枠で囲うと、今度は二重認識されてしまいます。
左右のページ枠だけ設けた場合、表がグチャグチャになって変です。
何か対策ありませんか?
150149:02/02/10 20:30 ID:???
>>149
ビジネスソフトに移動しました。
ココスレがなかったのでたてました。
お邪魔しました。
151名無しさん@お腹いっぱい。:02/02/21 02:02 ID:of9awubJ
四でここ8はどう?
152名無しさん@お腹いっぱい。:02/02/21 22:37 ID:UGlRMjmD
読んde!!の読み上げ機能って
使えるレベルですか?
試用バージョンには付いてないので…
153名無しさん@お腹いっぱい。:02/02/21 23:51 ID:W02wOCnm
横書きの住所録(日本語)なら
最強なのはどれですか?
154名無しさん@お腹いっぱい。:02/02/22 00:46 ID:???
>>152
日本人とか、米国人(英語)とか選べる。
男の声と女の声も選べる。
オクターブを変えることにより、高い子供の声と低い男の声もできる。
早口もゆっくりもできる。
誤変換の確認にけっこう使えるな。

ただ、ときどき音が出ない不具合が生じる。バグか。
155名無しさん@お腹いっぱい。:02/02/22 20:08 ID:zUvH2NUW
>154
情報ありがとう!!
とっても参考になりました。
156名無しさん@お腹いっぱい。:02/02/23 14:17 ID:9/6RfPRT
富士通のscansnapのスキャン(fi-4110EOX)ってTwain未対応だけど
Fj-4110CUのTwainドライバを使うことでTwainに対応できるんでしょうか?
だれかやったことある人います?
157名無しさん@お腹いっぱい。:02/02/23 19:26 ID:???
>>156
わざわざTwainドライバにする必要性がイメージできません。
ScanSnapの高速性簡易性が失われませんでしょうか?

158156:02/02/23 20:13 ID:9/6RfPRT
Fj-4110CUを使って大量の紙資料をOCRにかけたいのですが,
12万近くします.そして,使用中のOCRソフトがTWAINにしか対応
していません.ほぼ同等の機能を持つfi-4110EOXが5万ほどならば,
そっちの方が得かなと..そんな事情です.
159157:02/02/23 23:21 ID:???
>>158
ScanSnapで連続取込して、読んde!!ココでOCRにかけることはできますよ。
ただ、ScanSnapは200dpiなので、小さい文字だと誤変換が多いです。
160156:02/02/23 23:48 ID:???
なるほど,とりあえずなんらかの画像ファイルで取り込んでおいて,
画像ファイルとしてOCRに取り込みですね.ちょっと特殊なOCR
だったので,取り込めなかったらやだなぁと思ってました.参考になりました.
どうもありがとうございます.

お礼代わりに,これまでe-typist,読んde!!ココ,WinReader,OKreaderの
各ソフトを購入してきましたが,結局OKreaderを使ってます.主に翻訳用に
英文を取り込む作業をしてきました.認識率というか,その後の修正作業の
手間の違いはほとんど誤差の範囲内の気がしますが,OKreaderが一番手に
なじんだというところです.私の環境では,スキャナから取り込んだ後,
一度終了させてから認識をさせないとOKreaderがフリーズするクセがあり
ますが,その他の点は値段相応と満足して使っています.
161157:02/02/25 00:33 ID:???
>>160
ご丁寧にありがとうございます。

162量販店店員 ◆YAqU99pU :02/03/01 20:33 ID:xeFTnzX0
e-typistの体験版は
一個前の認識エンジンをつかっているため
製品版より、認識率悪いです

163量販店店員 ◆YAqU99pU :02/03/01 20:37 ID:xeFTnzX0
e-typistは、ウィンリーダープロVre7の認識エンジン
能力制限版orプロVer6改の認識エンジンらしいです

営業の方より聞きました
164名無しさん@お腹いっぱい。:02/03/02 12:26 ID:???
読んde!!ココバージョン8が、3月1日から発売開始。

使用感どうです?
165e-typist体験版:02/03/03 23:48 ID:Cbbq56tJ
こんにちは、とても参考になります
ありがとうございます。
e-typist体験版試してみましたけれど、
認識に関してはとても優秀だなと感じましたが
パターン登録に1文字しか使用できないところ、
登録パターンの位置、面積等を微調整できない
ところが致命的な気がします。
大量の文章を扱う時には読み上げ機能も
かなり便利ですので、それが実用に耐えない
のも残念だと思いました。
166名無しさん@お腹いっぱい。:02/03/04 02:14 ID:no62biR9
住友はOCRや認識関係を古くからやってた
で、OKREADERなんだが、読んde!!ココよりはマシといったところか
価格はやや高めだが体験版もあるし、期間制限外しパッチ情報も出回ってる(内緒だぞ)
まあビットマップでも何でも、要は画像から文字原稿を起こすツールがあれば、それで良いのだが
167名無しさん@お腹いっぱい。:02/03/04 02:23 ID:no62biR9
画像読ませてAA作れるか実験中
168165:02/03/05 00:22 ID:sh7iqLPy
読んde!!ココ7の使用感は、誤認識の高さを
豊富なカスタマイズ機能と読み上げ機能で
カバーするという感じです。
とにかく認識に難ありという気がしました。
8はどうでしょうね。
169アンインストール方法、教えて下さい:02/03/13 23:31 ID:8j6j9HUT
新しいのはどうだ
170名無しさん@お腹いっぱい。:02/03/22 16:06 ID:OP9g2sin
OCRって既存の画像ファイルからでも読み取りできますか?
キャプチャ画像から文章を拾い出すというような
171名無しさん@お腹いっぱい。:02/03/26 10:59 ID:eakFNUnL
>170
できるYO!
172名無しさん@お腹いっぱい。:02/04/09 05:47 ID:???
読んde!!ココはVer.8からABBYY社製OCRエンジンを新採用、
読取革命2002もABBYY社製 FineReader5.02 OCRエンジンを搭載
OKREADER2000もABBYY社製エンジンを使用
各社の試用版を使ってみたら、英語はもちろん日英混在もかなりよいです。
ただ発音記号はちょっと無理でした。

表は、読んde!!ココ、e.typist v7 が使いやすいです。
カラーは、読取革命2002がよいと思う。

全体的に使いやすい 「読んde!!ココ」をメイン、
重いけど性能がよい「読取革命2002」をサブとして使おうと思う。
173名無しさん@お腹いっぱい。:02/04/09 06:11 ID:???
e.typist の製品版とエントリー(バンドル版)の大きな違いは、
製品版は読み取り解像度、600dpiまで対応、
エントリー(バンドル版)は、400dpiまで対応ってことで、
実際は400dpiが標準で、よほど小さい字がなければ600dpiは必要ないね。
最新バージョンの体験版をダウンロードして、600dpiでやってみたけど、
ほとんど違いわないよ。(よくなる所と悪くなる所がある)
ダウンロードした体験版は、日数制限があるから、
わざと読み取り精度を落としてることはないでしょう。

小さい字は拡大コピーしてから読ませる手もあるし、
エントリーを製品版にするメリットは、最新バージョンになることぐらい?
174名無しさん@お腹いっぱい。:02/04/09 20:55 ID:???
>>173
最新バージョンだとADF対応になり、便利。
音声読み上げも便利。
175名無しさん@お腹いっぱい。:02/04/10 04:51 ID:hjXxJSC6
読んde!!の体験版、読み上げ機能が使えないって書いてあるけど、
ちゃんと読み上げ機能が使えるぞ。
MSエンカルタ百科事典体験版入れたら、読み上げがインストールされちゃったから、
それが動いてるんだろうか?
読んde!!の体験版、30日も使える!!
176名無しさん@お腹いっぱい。:02/04/13 17:48 ID:hM0o47Dg
OCRで空白を認識できるのってご存知ないですか?
たとえば、以下のような勝負表・・・↓ Excelに変換できると一番よいのだけれど。

4・15 ○貴乃花−舞ノ海
      小錦 −光法 ○
      琴光喜−武双山○
-----------------
ちなみにe.Typistエントリー(バンドル版)を使ってますが
字が小さいせいか、認識率がすごく悪いです。
製品版だとどのくらいよくなるものでしょうか。。。。
177名無しさん@お腹いっぱい。:02/04/13 21:08 ID:???
>>176
ちょっと高いが、
読んでココか、読取革命にされた方がいいと思うわ。
178 :02/04/13 23:22 ID:3iUr0nQN
英語のみの使用でフリーソフトのOCRってありますかねぇ?
179名無しさん@お腹いっぱい。:02/04/14 06:12 ID:???
>>176

簡単な表ならレイアウト属性を表にすればある程度自動でやってくれます。

http://ai2you.com/ocr/product/koko8s4.asp
>●高精度なレイアウト解析で複雑な表組みにも対応
> 罫線に文字が接触している、罫線がないような表組原稿も自動解析。
> レイアウトも的確に認識し、元原稿を忠実にExcel上で再現できます。

>●表罫線編集機能搭載
> 手動で罫線を編集(追加・変更・削除)できるだけでなく、
> セルの区切りを新たに設定したり、セル同士を結合・分割させることも自由自在。
> これにより、より表組みの再現性を高めることができます。
180176より:02/04/14 13:51 ID:P0jLXvXk
アドバイスありがとうございます!
「読んでココ」のホームページに体験版がありましたので
試しに使ってみます。
結果はまたここでご報告しますね。
181OmCR:02/04/14 15:44 ID:R3BjYByc
オムロンのver.3はクソですか?
182OmCR:02/04/14 23:25 ID:R3BjYByc
私はOmCRのver.3.2を使っているのですが,どうでしょうか?
183 :02/04/14 23:30 ID:/NHZeRsw
拾い物のWinReader PRO v.6.0を使ってるんですが、英文の際に単語と単語の間のスペースのせいでレイアウトが上手く行かないのですが。どうしましょ。
184名無しさん@お腹いっぱい。:02/04/15 06:33 ID:???
>>182
OmCRは体験版がないでしょ?
使ってみないとよくわからんよ。

>>183
レイアウトが上手く行かない時は、手で直すんじゃないかな?
185名無しさん@お腹いっぱい。:02/04/15 13:29 ID:Fk2p7/Jx
仕事でコピー原稿をOCRでテキストデータ化することを考えています。
・原稿は和文が主。英文もあり
・字の大きさはだいたい8〜10ポくらい
・基本的にモノクロ
・スキャナはキャノンの676U(USB接続の薄いやつ)

おすすめOCRソフトはどれでしょう?前にTextBridgeが良いと聞いたのですが、
HPを見てみたら、WinXPには対応していないような?
186176:02/04/16 00:22 ID:A6b7Xkxl
読んでココ8 体験版つかってみました。
認識率もなかなかで、多少の誤認識はあるけど許容範囲内。
表の読み込みではレイアウトがかなりくずれるので
専用のソフトを使ったほうがよいかもしれないですね。
187名無しさん@お腹いっぱい。:02/05/02 04:11 ID:???
Macだと種類が少ないけどどれがイイかな。
できれば自動処理できるヤツ。
188名無しさん@お腹いっぱい。:02/05/03 17:28 ID:4fX4EeBl
読んでココの体験板を使っているんですが、
90度回転→傾き自動補正→自動読みとり枠認識→OCR実行
という作業を、いちいちマウスでクリックしなければなりません。
この辺の作業を自動で行えるソフトってあるんでしょうか?
189名無しさん@お腹いっぱい。:02/05/03 19:07 ID:???
>>188
ん?自動でできるよ。
好みに設定した後、F2を押すだけで、らくちん。

ん?体験版だとできないのか?
190名無しさん@お腹いっぱい。:02/05/04 01:26 ID:???
ま、まじすか…
製品版買ってきます。
191名無しさん@お腹いっぱい。:02/05/04 18:41 ID:SvX8+QOY
富士通の「文書OCRforWord」を使っています。
認識率がいいのか悪いのかよくわかりませんが。
192名無しさん@お腹いっぱい。:02/05/05 02:53 ID:???
>>191
そうですか・・・・
何の役にも立たない情報をわざわざありがとう。。。
193名無しさん@お腹いっぱい。 :02/05/07 06:45 ID:xqj2fD1t
>192
ワロタ
194名無しさん@お腹いっぱい。:02/05/11 14:51 ID:LIpXio6i
e-typistと読んでココを両方使っています。
e-typistの認識率の方が良かった。
195名無しさん@お腹いっぱい。:02/05/24 00:24 ID:GFq3qBPI
読んde!!ココをVer.2から使ってきたけど,今日e.Typistの体験版を
使ってその差に愕然とした。

認識率はかろうじてまともになってきたけど全体的に投げやりな
作りだね,読んde!!ココは。いかにもEPSON系列だな〜って感じ。
196名無しさん@お腹いっぱい。:02/05/25 16:11 ID:???
EPSONのスキャナについていた読んde!!ココ(Mac版)パーソナルを使ってみたけど、英文の認識率はやたら悪い。
途中で止まったようになって、遅くなることも多い。よく言われていた、単語がつながってしまうという問題はないのだが。
日本語はけっこういいと思ったけどね。
普通の英語論文だが、たとえばbOoK(本)とかdaY(日)みたいにありえないはずの誤認が多い。fiとかThなんか、活字ではつながった文字も難しい。英語の辞書を持たないためか。
学習させれば良くなるようだが面倒。体験版も使ってみたが、ほぼ同様。バージョンアップしようと思っていのだけどねぇ〜(鬱)
英語ならやはりe.Typistだろうね。ずいぶん古いバージョンを使ったことがあったけど、英文に関してはずっと良かった。
197名無しさん@お腹いっぱい。:02/05/25 18:24 ID:???
読取革命いいよ。
198名無しさん@お腹いっぱい。:02/05/27 15:27 ID:???
>>197
他と比べてってこと?
199名無しさん@お腹いっぱい。:02/05/28 11:43 ID:???
>>197
体験版落として試してみたけど,そんなに良くなかったよ。
読んdeとあんま変わらない感じ。
ただ,個人的にメチャメチャ惹かれる,他にはないすごい特徴が1つあったけど。
うーん,惜しいな
200名無しさん@お腹いっぱい。:02/05/28 12:26 ID:6aGuI9pn
それ何?
スゲー聞きたい
201199:02/05/28 13:01 ID:???
>>200
聞いても仕方ないと思うよ。
ScannerをLinuxの機械につないでネットワーク経由で
Windowsから使うのにヒジョーに都合がいいっていう話。
202名無しさん@お腹いっぱい。:02/05/28 13:11 ID:JGLBm2Y2
( ´∀)・∀),,゚Д)http://diary.cgiboy.com/d01/tsugeikuhito/
203名無しさん@お腹いっぱい。:02/06/01 16:13 ID:hJ4k2Pqz
あの、e-typist使っている方に質問なんですが、
一つの文書枠内で段落ごとに改行を入れる設定にはできないのでしょうか。
読んでココと両方持っているのですが、
自動判別で改行してくれる読んでココを使っています。
ほかの点ではe-typistの方がいいかなと思うんですが。
204名無しさん@お腹いっぱい。:02/06/03 02:51 ID:???
205名無しさん@お腹いっぱい。:02/06/03 04:30 ID:???
読んdeココとe.Typistと読取革命を体験版で何度か試してみたけど,ホントーーーに一長一短。
純粋な認識は確かにe.Typistがいいのだけど,変なレイアウトが混じると意外に弱い。
読んdeは認識はいまいちだけど,コマンドがうまいこと使いやすくなってる。
ただし,強制終了したときはデータは何も残らない。e.Typistは何とか復旧できる。
しかし期間限定なんだから全機能試したかった。→リモートdeスキャンがどんな感じか気になる。
革命はちゃんとしてあるところはちゃんとしてるけど,手抜きのところがひどい。
認識枠の全消去が無いってのはどういうことだ?ヘルプのキーワード検索もおかしい。

どれも認識エンジンをどっかの買ってきてかぶせただけってのいい加減な作りだなあ。

・・・っていうわけでUpgradeで一番安く買える読んde!!ココVer.8にしよう。はぁ...
206名無しさん@お腹いっぱい。:02/06/03 09:50 ID:UyC4Sq48
OKReaderは試されました?
2ちゃんねらーの間では評判が高いっす。
207名無しさん@お腹いっぱい。:02/06/03 16:45 ID:???
>>206
ありがとう。試してみたけど,ほかのより格段に良いっていうわけでも
ないみたい。安いe.Typistっていう感じですね。でも乗り換えもUpgradeも
できないと却って高くなっちゃう。
208名無しさん@お腹いっぱい。:02/06/04 06:16 ID:BwhqLFCd
 ジャストシステム社の
一発OCR for一太郎を使ってみた方、いかがですか?
209名無しさん@お腹いっぱい。:02/06/04 10:26 ID:???
WinOCRとMacOCRしか使ったことないけど、
エプソンのCDについてくる読んでココって
使ったことないんだけどつかいやすいの? 
画像から文字抜き出せる?
210名無しさん@お腹いっぱい。:02/06/04 14:30 ID:???
>>209
ん?
画像から文字抜き出せないOCRソフトなんて、あるのか?
211名無しさん@お腹いっぱい。:02/06/06 23:13 ID:???
延々と悩んだ末,安い読んdeココVer.8を買ってきた。
これで辞書を育てていくのが結局一番いい気がする。
212名無しさん@お腹いっぱい。:02/06/07 03:42 ID:???
>e.Typist v.8.0 バイリンガル for Windows
>製品紹介ページ公開予定日 2002年6月28日(金)
>発売日 2002年7月12日(金)
>定価 19,800円(税別)
>JANコード 4946557013710
>店頭アップグレード版定価 7,500円(税別)
>店頭アップグレード版JANコード 4946557013727

アップグレード版の実売は6800円くらいか?
213名無しさん@お腹いっぱい。:02/06/07 10:09 ID:???
論予のテキストデータ化は読んでココが優れている。
214名無しさん@お腹いっぱい。:02/06/10 18:50 ID:+g+7Zec8
>213 参考になります。デジ優答だけでな参考答案もネットで配ってくれれば
なんの問題もないのですが。。
215名無しさん@お腹いっぱい。:02/06/10 22:44 ID:???
>>214
魔骨の公開答練は実施
216名無しさん@お腹いっぱい。:02/06/11 00:06 ID:???
>>213-215
表の部分とかどうしてますか?
217名無しさん@お腹いっぱい。:02/06/11 00:46 ID:???
論予、デジ優答、魔骨、答練ってなぁに?おせーて
218名無しさん@お腹いっぱい。:02/06/11 00:55 ID:???
219名無しさん@お腹いっぱい。:02/06/11 04:53 ID:???
司法試験板の方々だったのね。そういえばそっちにもスレありましたね。
220214:02/06/11 13:34 ID:WExz4MXK
>216 無視してとりこまない。てか答案シートしか取り込まない。
時間ないし。。
e.Typist(1)とか(2)の切り分けが、うまくできなくて鬱
読んdeココはその辺どうですか、
221名無しさん@お腹いっぱい。:02/06/12 05:55 ID:???
>>220
(1)とかは割とうまく行ってるかな。(1)がたまに (り になるけど。
しかし読んdeはそれ以前のところがかなりダメ。
外 → タト になるし,か → カ、 になるし。

バージョンアップで金取るためにわざとちょっとずつ性能向上させてる
ような気がしてならん。っていうか多分そうだろう。
ちなみに体験版はもう少しましだったような気もする。
222名無しさん@お腹いっぱい。:02/06/12 09:47 ID:???
>>206
OKReaderは古くないですか?
1999.12.25 OKREADER2000(ver6.0)発売開始。
発売から2年半ですよ
認識率の比較もあくまで2年半前の話です。
表の取り込みなど機能面は他社の製品と比べると明らかに見劣りします。
223名無しさん@お腹いっぱい。:02/06/12 15:00 ID:???
>>220
読んでココは、
(1)は、だいたい、うまくいく。
うまくいかないときは、「文字の分離」を使う。
便利。
いつも同じパターンなら、複数置換を使う。

>>221
外→タト(カタカナ2文字)となるときは、解像度を変更すれば、うまくいく。
うまくいかないときは、「文字の結合」を使う。
いつも同じパターンなら、複数置換を使う。

で、どうだ。

虫太郎氏がEタイピストを使っていたが、そろそろ
その呪縛を解いたらどうだ。
224221:02/06/12 16:43 ID:???
>>223
いや,もちろん文字の分離/結合は使っているのだけど,
毎度毎度同じ間違いをするバカさ加減がなんとも・・・
しかもそれをパターン学習する手が無いという救いようのなさ。

# 気にならない人は気にならないんだろうけど・・そういう人がうらやましい。
225名無しさん@お腹いっぱい。:02/06/13 04:01 ID:1HY/mzXg
etypist8はどうよ?
226名無しさん@お腹いっぱい。:02/06/13 04:51 ID:???
>虫太郎氏がEタイピストを使っていたが、そろそろ
>その呪縛を解いたらどうだ。
呪縛されてるのはオマエだっつ〜の(w
227名無しさん@お腹いっぱい。:02/06/13 08:16 ID:DnzOkuAa
e.Typistは丸ゴシックの見出しとか苦手なフォントが多い。
あと日本語と英語の混在も話にならない。
良いと思ったのは表にセル番号が出ることぐらいかな?
読んでココはどんなものでも平均的な認識率で使いやすいと思った。
ただ、人によって使い道が違うから単純に比較できないと思う。

228名無しさん@お腹いっぱい。:02/06/13 16:39 ID:???
ソフトによって長所短所はあるともいえるが,
どのソフトもまだ成熟していないと言った方がいいような気がする。
正直進歩のスピードが遅すぎるという気もするが。
229名無しさん@お腹いっぱい。:02/06/14 06:28 ID:B4p8uAoe
>>227
e.tyist8が出てからまとめてくれ(w
230名無しさん@お腹いっぱい。:02/06/15 22:51 ID:???
本問が本間になるのは何とかならんのか。ヨンデココ
231名無しさん@お腹いっぱい。:02/06/15 23:45 ID:???
読んでココは、ワセシのとは相性がいいようだ。誤認識が少ない。
232名無しさん@お腹いっぱい。:02/06/16 03:55 ID:???
相性がいい=誤認識に気がついていない
233名無しさん@お腹いっぱい。:02/06/17 17:42 ID:???
読んでココは使えば使うほどむかついてくるタイプのソフト。
234名無しさん@お腹いっぱい。:02/06/19 12:42 ID:X5Zz8eVY
数式などが載っている文章をOCRにかけたいのですが、
どのソフトが良いでしょうか?
235名無しさん@お腹いっぱい。:02/07/03 22:20 ID:RnQHiSok
etypist8は、どうよ?
236名無しさん@お腹いっぱい。:02/07/04 02:03 ID:???
>>235
なにが?
237名無しさん@お腹いっぱい。:02/07/14 10:03 ID:Wpy+HnD1
etypist8買ったよ。
PDF対応と第2水準対応が特に嬉しい。
読んでココはfor EPSONしか使ったことが無いので、
比べてどちらがいいかは分からないなぁ。
238名無しさん@お腹いっぱい。:02/07/14 12:29 ID:LdeZ6aIH
>>237
自動改行機能はどう?
>>203にあるようなことは可能なの?
239名無しさん@お腹いっぱい。:02/07/14 12:33 ID:YnBA+9xY
>>237
いくらで買えました?
バージョンアップなら、7000円程度でしょうが、
乗り換えなら、高いですよね。
240237:02/07/14 18:19 ID:DK1NCqFd
>>238
ヨドバシでアップグレード版を\7,120 + 消費税 で買ったよ。
ポイントが748円分ついたので実質はもうちょっと安い。

>>239
まだ、試してないけど、自然改行機能というのが追加されてるよ。
ヘルプの新機能説明から引用しておくね。
>テキスト出力モードには、従来の毎行改行、ブロック改行に加えて、自然改行が追加されました。自然改行モードを使うと、段落の情報を元にして、自然な位置に自動で改行コードを入れることができます。
241237:02/07/14 18:30 ID:???
>>239
>乗り換えなら、高いですよね。
私は、昔買ったスキャナにLEが入ってたから、これまで
アップグレード版しか買ったことないけど、
他社からの乗り換え版みたいなのは無いから、
フルパッケージ 定価\19800を買うことになっちゃいますね。
242名無しさん@お腹いっぱい。:02/07/14 19:15 ID:???
8の体験版はまだ出てないね
フォントと辞書の弱い点は改良されたのかな?
243名無しさん@お腹いっぱい。:02/07/14 20:51 ID:???
読んde!!ココのバグ報告をメーカーに送ったら
2日後にいきなり修正版をメールで送ってきた。
超素早い対応&平気で800KBの添付ファイルを送ってくる神経に
オドロイタ。

#バグが直ったのはとても嬉しいんだけどね。
244名無しさん@お腹いっぱい。:02/07/23 03:57 ID:BfFaqNvO
e.Typist v.8.0 for Windows 体験版公開されましたね。
245名無しさん@お腹いっぱい。:02/07/24 00:06 ID:MAvceznX
みんな使えや。
246名無しさん@お腹いっぱい。:02/07/24 01:40 ID:VFRAaXJu
表をエクセルに取り込みたいのだが、どっちが正確に取り込めますか。
247名無しさん@お腹いっぱい。:02/07/24 08:36 ID:???
>>246
人のいうこと鵜呑みにするの?
自分で体験版ダウソして確かめた方がいいよ
248名無しさん@お腹いっぱい。:02/07/24 18:01 ID:zIj/GuU3
118 名前:名無しさん@そうだ選挙にいこう 投稿日:02/07/24 01:12
表をエクセルに取り込みたいのですが、何のOCRソフトがいいでしょうか?


119 名前:名無しさん@そうだ選挙にいこう 投稿日:02/07/24 01:19
>>118
専用ではこんなのがある。
http://software.fujitsu.com/jp/ocr/hocr/index.html

表対応のだったら、いけるとは思うけどね。


120 名前:名無しさん@そうだ選挙にいこう 投稿日:02/07/24 02:55
>>118
新手の宣伝方法か?
249名無しさん@お腹いっぱい。:02/07/26 21:34 ID:fRUF8JAf
やっぱりe.Typist8 > 読んでココ7なのかな?
250名無しさん@お腹いっぱい。:02/07/26 23:15 ID:???
>249
スキャナのドライバとか読ませる文書とか人によって全然違うだろ
体験版があるから自分で確かめて結果を報告しる!
読んdeココの最新は8
251名無しさん@お腹いっぱい。:02/07/30 20:59 ID:???
スキャンする文書によって相性があるな。
背皆のデバイスには、読んdeココ8だな。
カスタマイズした結果、認識率がほぼ100%だな。
多罪の書物は、活字が独特だから、認識率が落ちるな。
252名無しさん@お腹いっぱい。:02/07/31 18:17 ID:???
確かに、多罪の書物の活字は、明朝体でもゴシック体でもないねぇ。
253名無しさん@お腹いっぱい。:02/08/01 04:47 ID:3kUg6hxJ
読んdeココって学習できないの?
e.Typistは全角文字の場合、認識失敗しても学習できるから
カスタマイズして賢くはできるよ。
254名無しさん@お腹いっぱい。:02/08/01 06:19 ID:2TSY8LNY
>>253
学習機能なんか珍しくもなんともないだろ
e.Typist はポップ体、丸文字は全然使い物にならないな
e.Typist に全部の文字を覚えさせてたら日が暮れるぞ
255名無しさん@お腹いっぱい。:02/08/01 08:33 ID:???
>>253
当然、読んdeココも学習(ユーザー登録)できる。
256名無しさん@お腹いっぱい。:02/08/01 09:02 ID:???
マコツで解決
257買い替え希望者:02/08/16 21:54 ID:2tLBquFN
私の使用目的は、毎回30ページ前後の英語の文献をスキャンして
テキストファイル化することです。これまではマック上でe.typist 5.0
を使ってきたのですが、パソコン本体がウインドウズパソコンに切り
替わるのを機にソフトの方も再検討することになりました。

これまでの皆さんの書き込みを読ませていただいた上、e.typist 、
Prest!OCR Pro、そして読んdeココのそれぞれの体験版を使ってみ
ましたが、e.typist は予想に反して一番なじめそうにありませんでし
た。マック版の5.0との間に操作が共通している部分が思ったほど
無かったことと画面デザインが猥雑に過ぎるように思いました。

長く使っていくのに一番なじめそうなのはPrest!OCR Proだったので
すが、私の印象に間違いは無いでしょうか?読んdeココは可も無く
不可も無くと言った感じだったのですが、これはe.typist と違って事前
に過大な期待をしてなかったからだと思います。皆さんの忌憚の無い
ご意見をいただけると幸いです。
258名無しさん@お腹いっぱい。:02/08/16 23:05 ID:???
>>257
半角フォントは癖があります。centuryなど平凡なフォントならどれもおなじでしょう。
書籍文献は独自フォントを使っていることが多いですから、なじみより何より
テキスト化の正確度で決めては。
259あぼーん:あぼーん
あぼーん
260名無しさん@お腹いっぱい。:02/08/17 14:18 ID:EYLut5pI
>258

テキスト化の正確度ですか?分かりました。もう少し体験版を
比較して決めたいと思います。ありがとうございました。
261260:02/08/21 21:38 ID:kTGqru2u
たびたびすみません。
私の目的は英文テキストの読み取りなのですが、「読んdeココ」も「e.typist」
も最新バージョンではアビー社というところの認識エンジンを使っている
ようです。そうするとテキスト化の正確度自体は同じになるのでしょうか?
英文認識の正確度が同じというなら他の要素を比べて決めたいと思います。
262260:02/08/23 14:03 ID:MT6R2CcC
 それぞれのメーカに英文認識率について電話で聞いてみましたので
参考にして下さい。

Textbridge > e.typist
読んdeココ > Prest OCR

Prest OCRの方が劣るとは意外でしたが「多言語処理しないで英文だけ読み取る
なら読んdeココの方が上です」とのことでした。
263名無しさん@お腹いっぱい。:02/08/24 23:36 ID:DePbIln1
紙情報のデジタル化◆ドキュメントスキャナ
http://pc3.2ch.net/test/read.cgi?bbs=hard&key=1030199319
264名無しさん@お腹いっぱい。:02/09/06 17:32 ID:EBP55wER
買ったけど全然わからん・・・鬱
265名無しさん@お腹いっぱい。:02/09/10 12:48 ID:xkgwBQc0
OS再インストール後、これまで問題なく使えていたe.Typistエントリーが使えなくなりました。
インストール後起動すると、認識パターン辞書がないっていう表示が出てだめ。
せっかくバイリンガルのアップグレード版買ったのに、全然使えません。
オンラインヘルプやHPじゃ何もこのことについて書かれてないし。
どうしたらいいんでしょ?
266名無しさん@お腹いっぱい。:02/09/11 01:08 ID:???
HPで質問する
267 :02/09/13 22:06 ID:+0RhDUKk
画像やグラフのレイアウトを原稿のままに取り入れられるOCRが欲しいけど。
スキャナ付属のOCRはぐちゃぐちゃでダメだ。
268名無しさん@お腹いっぱい。:02/09/15 14:36 ID:zwJZYe/l
結局どっちが買いや?
269名無しさん@お腹いっぱい。:02/09/16 21:43 ID:cCTdqX98
e.typistの最新版使っている。
日本語だけの文章だと精度よく認識するんだけど、結構な頻度でアルファベットが混ざってくると(PC雑誌のように)アルファベットの認識精度がかなり悪いです。

アルファベット混ざりの日本語文に、もっとも適しているソフトは何でしょう?
アドバイスお願いいたします。
270名無しさん@お腹いっぱい。:02/09/16 21:59 ID:cCTdqX98
>>267
最近の製品版OCRソフトなら大抵のモノは、目的にかなうと思うよ。
271名無しさん@お腹いっぱい。:02/09/16 23:01 ID:???
現行では、300dpiまでだが、
時期バージョンでは、低解像度200dpiにも対応してほしいな。
272名無しさん@お腹いっぱい。:02/09/17 00:33 ID:eY9c6Ss+
あのー、スキャナの代わりにデジカメの画像では駄目なのでしょうか?
また、デジカメでもいいOCRソフトってありますか?
273名無しさん@お腹いっぱい。:02/09/17 00:40 ID:KFRciEFU
デジカメなら松下の読取革命だが。
http://www.pit.panasonic.co.jp/yomikaku/index.htm
乗換版もあるので、結構お買い得。

デジカメでの精度はどうなんでしょうね。
274名無しさん@お腹いっぱい。:02/09/17 00:44 ID:eY9c6Ss+
レスありがとうございます。少し調べてきます。
275名無しさん@お腹いっぱい。:02/09/17 00:55 ID:???
>>273
半年ほど前か、PC雑誌で特集記事を見た記憶がある。
デジカメでもわりと精度(90%以上)が良かったので驚いた記憶がある。
276名無しさん@お腹いっぱい。:02/09/17 01:00 ID:KFRciEFU
>>275
読取革命、体験版があるんだね。
私も落としてテストするつもり。

それなりの精度だと、出張の際助かるなぁ。
277 :02/09/17 02:02 ID:YezE7vVd
しかし本になるとやっぱりバラすしかないのか。
ペン型スキャナはダメなのかねぇ。
278名無しさん@お腹いっぱい。:02/09/17 02:10 ID:???
>>277
確かに、本をバラすのはめんどいなぁ
279名無しさん@お腹いっぱい。:02/09/17 03:25 ID:KFRciEFU
>>269
読取革命テストした。
アルファベット混ざりの日本文でも、かなりの精度で認識する。
コピーのような少々あれた原稿でもオッケ。

ただ、コピーの場合はイタリック体の精度がやや落ちる(日本語と認識される部分がある)が、e.typist8よりは遙かに精度がいい。
ま、ご参考に。
280 :02/09/17 11:10 ID:+x0VzHlT
>269
グラフやイラストなどの位置情報、つまりレイアウトはどうだ?
いまんとこレイアウト専用ソフトで再配置させてテキストボックスに流し込み、って
2度手間やってるんだが、キチンとレイアウト取り込んでくれてるか?
281名無しさん@お腹いっぱい。:02/09/17 11:38 ID:JBAvorVg
性能だけなら 現在でもMacReader Pro
282269:02/09/18 17:48 ID:Nkx+hyTg
>>279
ありがとうございます、こちらでもテストしてみます。
>>280
e.typist8ほぼちゃんとレイアウト再現してくれますが。
保存形式は何ですか?

読んdeココ8って、日英混在モードって言うのがあるんだね。
私も試してみますが、実際アルファベット混在の認識率はどうでしょう?
283 :02/09/18 18:55 ID:???
OKReaderもよろしく。
もう、ヤフオクで売っぱらったけど。
http://www.sesys.co.jp/product/ocr/index_f.html
284名無しさん@お腹いっぱい。:02/09/27 12:39 ID:T4WBkoco
下がってるねぇ・・

誰かも書いていたけど、PDFにOCRかけるなら圧倒的に読んdeココ8が速い。
e.typist8も対応しているんだけど、いちいちPDF読み込むのに時間がかかるので実用的ではない。

とはいいながらメインの書籍の読み込みはe.typistの方が精度が高いので手放せず。
OCRもソフトによって得意不得意があるから、ヘビーに使おうと思うと結局複数本必要になるね・・
285名無しさん@お腹いっぱい。:02/09/29 19:12 ID:xNxzvYfj
Presto!PageManager
が(・∀・)イイ!!
フォトレタッチもできるよん
286名無しさん@お腹いっぱい。:02/10/04 11:50 ID:ie/udY9u
活字体文字じゃなくて手書き文字のOCRソフトってあります?
287名無しさん@お腹いっぱい。:02/10/04 13:12 ID:???
288名無しさん@お腹いっぱい。:02/10/04 13:43 ID:lt3eoG4K
マス目固定帳票みたいすね。

郵便局並みの住所認識機能はまだ市販では無いんですね。
289名無しさん@お腹いっぱい。:02/10/17 22:50 ID:M1G3PjpI
すみません。パソコン初心者です。
ひとつ質問させて下さい。
縦書きの本を横書きにテキスト化したいのですが、OCRソフトでできますか。
ちなみに私の持っているのは読んでここバンドル版です。
よろしくお願いします。
290名無しさん@お腹いっぱい。:02/10/18 00:17 ID:???
>>289
できます。by読んdeココ
291名無しさん@お腹いっぱい。:02/10/18 01:16 ID:LPCsYwY7
>>290
そうなんですか。
ありがとうございます。
ワードとかに移してから、ではなくOCRソフト自体でできるのですね。
292名無しさん@お腹いっぱい。:02/10/18 02:00 ID:???
>>291
そうです。
293名無しさん@お腹いっぱい。:02/10/21 10:41 ID:???
松下の読み取り革命体験版落とそうとしたらサーバー劇遅で落とせんやん
http://pc.2ch.net/test/read.cgi/bsoft/996505150/
に読み取り革命は、認識スピードが他の倍以上遅いという書き込みが
あったがサーバーまで遅いんかい
体験する前に使う気失せた
GT7300UとLiDE30ってどっちが早いのだろう
295294:02/11/03 02:52 ID:???
誤爆です
失礼しました
296名無しさん@お腹いっぱい。:02/11/26 09:39 ID:5BW/cmSM
スレ違いかもしれませんが 名刺管理ソフトに付属している
OCRを他のOCRに変更して文字認識させることは可能でしょ
うか? 社長が名刺管理ソフトを購入したのですがOCRが
弱すぎる(「会」と言う字を上下に分割して認識する程)ので
このままでは使い物にならない状況ですので…

ちなみに名刺管理ソフトはPresto!…なので OCRもPresto
だと思います
297名無しさん@お腹いっぱい。:02/11/26 12:00 ID:FHSyHraP
>PDFにOCRかけるなら圧倒的に読んdeココ8が速い。
>e.typist8も対応しているんだけど、いちいちPDF読み込むのに時間がかかるので実用的ではない。
でも、読んdeココはAcrobatがインストールされてないとダメなんだろ。
Acrobatいらないe.Typistの方が、素人には実用的じゃないかな。
298名無しさん@お腹いっぱい。:02/11/26 23:21 ID:Gsz8hbX/
>>296
OCRを他のOCRに変更して文字認識させることは可能。
読んでココを買うと一緒に付属してくる。

ただ、特殊なデザイン文字は、読んでココでも無理。
おそらく他のソフトでも無理。
299名無しさん@お腹いっぱい。:02/11/27 02:58 ID:WiPJK7LL
初めてOCRソフトを買おうかなと思っているので、
読んde!!ココVer8.02とe.Typist Ver8.0の体験版を使ってみました。

サンプルその1
スキャナで本を400dpiで読み込んでJPEGで保存。
分厚い本だったので、画像の端っこに黒い影ができてしまった。
認識結果は、あんまり変わらない。
黒い影のところの近くは、どちらも正しく認識できませんでした。

サンプルその2
コピーされた紙を200dpiで読み込んでJPEGで保存。
どっちもちょこっとだけ間違えている。変わりなし・・・。

サンプル3
サンプル2を400dpiでJPEGで。サンプル2より間違いが少ない。


総評:
・・・正直どっちもどっち。優劣つけがたい。どっちでもいいや(笑)
どっちにしろ多少修正は必要です。でも、かなり認識率高いですよ。
高い解像度(dpi)で取り込んだほうがよさそうだけど、
スキャナで高い解像度で取り込むと遅いんだよね〜
操作性は、画面的にはほぼ同じです。
読んdeココはボタンが多いがウィザードがあり。
e.Typistのほうはボタンが少ないがウィザードなし。

・・・そんなに変わらないし。どっち買おうかな?迷うなぁ。うむむ。
以上、役に立たないレビューでスマソ(w
300名無しさん@お腹いっぱい。:02/11/27 10:13 ID:PN5A93hp
結局のところ、本当に文章の精度を求めるときは
全文読み直してチェックする必要があるので
わずかな精度の差はあまり問題にならないと思うんだよね。

読んde!!ココとe.Typistでは迷うけど
スキャナは取り込みの早さに定評のあるエプソンを買うと決めたので
俺は読んde!!ココってことになるかな
ソフトでハードを選択するというのもどうかと思うし。
301名無しさん@お腹いっぱい。:02/11/27 12:19 ID:ETGD7g8N
>>299
本をOCRにかけてテキストデータにするなら、
スキャンの際、カラーjpgである必要はない。

モノクロtiffで取り込んでおいた方が
データが小さいので、スキャンが速い。

おすすめは、モノクロtiffで400dpiでスキャンする。
400dpiなので、200dpiより認識率が向上する。
302名無しさん@お腹いっぱい。:02/11/27 16:25 ID:CG928Zfd
>>301
OCRはじめてなのでアドバイスありがとうございます。
モノクロで取り込むとTIFFでもJPEGでもスキャンがはやいです。
解像度は400dpiのほうがよさそうですね。ほぼ間違いないですし。

本の影のできない取り込みかたもできたので問題ないっす。
OCRはすごく便利ですね〜!ソフト買います!
303名無しさん@お腹いっぱい。:02/11/27 23:39 ID:ETGD7g8N
>>302
モノクロでスキャンする場合
tiffの方はデータを小さくする際に劣化せず、文字の輪郭がぼけない。
jpgの方はデータを小さくする際に劣化して、文字の輪郭がぼける。
tiffの方が変換精度は良い。
最近のOCRは精度が良くなってきているから、大差ないかもしれないけどね。

OCR目的以外でカラーでスキャンする場合はjpgね。
304名無しさん@お腹いっぱい。:02/11/27 23:50 ID:uLsl7LPK
ココにしようかと思ったんだけど
ココは2月発売で
読取革命7は、ついこの前出たとこなので、
読取革命7買ってきた
ヨドバシで8千円ちょい
305名無しさん@お腹いっぱい。:02/11/28 01:43 ID:pfDwUhWS
>>304
で、どう?
306304 :02/11/28 02:12 ID:Y+9wCMI1
始めて買ったOCRなので比較は出来ないが、
いま民法のテキスト1ページ認識させたらパーフェクトだったよ。
法律辞書が標準装備されてるため精度が高いのかな。
「顧慮」なんて単語は読めないかと思ってたんだけど。
画像と認識結果を一行ずつ並べて確認できるハイパーチェッカーは使いやすそう。
前バージョンは認識が遅いと言われていて、それは覚悟の上で買ったんだけど
妙に早かった気がする。まぁ まだよく分からないから、しばらく遊んでみるよ
307304 :02/11/28 02:16 ID:Y+9wCMI1
ちなみにエプソンの8300UF
で400dpiだったと思う(入門ウイザードに従ったのでよくわからん)
308名無しさん@お腹いっぱい。:02/11/28 02:55 ID:pfDwUhWS
>>304
ひょっとして同業者?(w

それはさておき、スキャンしたのはテキストのコピーではなく原本ですか?
309304:02/11/28 03:04 ID:Y+9wCMI1
いや司法試験受験生じゃないよ(笑)
民法は勉強してるけど。

スキャンしたのはテキストそのまま置いてですね。
310名無しさん@お腹いっぱい。:02/11/29 19:24 ID:yoXCK+WI
なんかコピーのコピーのやつを
400dpiでも600dpiでも
読み込んでも、あまり認識してくれない・・・ショボンヌ
311名無しさん@お腹いっぱい。:02/11/30 23:27 ID:Nf7M+D/V
NECのMultiReaderでスキャンしてバンドルソフトの
e-Typistーエントリー版でOCRかけて文字認識した
ところ、A4版の原稿の左上隅しか認識しません(画像の
プレビューに表示される範囲)、設定誤りでもあるのでしょうか
312名無しさん@お腹いっぱい。:02/12/02 03:31 ID:w1bNmuEQ
>>311
領域を選ぶとか忘れてない?
313名無しさん@お腹いっぱい。:02/12/02 23:13 ID:4XVxM54s
>>312
教えてくんでスマソ
領域って、e-Typistのメニュウ画面から設定するの
314名無しさん@お腹いっぱい。:02/12/04 02:32 ID:HljsbbQx
文字認識する範囲を選択した?


本からのスキャンは完璧なんだけど、コピーはいまいち認識率高くないね。
315名無しさん@お腹いっぱい。:02/12/05 01:45 ID:IG2zbIPk
>>297
>でも、読んdeココはAcrobatがインストールされてないとダメなんだろ。
>Acrobatいらないe.Typistの方が、素人には実用的じゃないかな。
テキスト検索できないpdfファイルを検索が出来るようにしたいのです。
Acrobatの無い私にはe.Typistがいいってことかな
316名無しさん@お腹いっぱい。:02/12/05 03:25 ID:0+SSMuEY
>>315
いや、読んde!!ココはアクロバットがなければPDFやら認識は不可だったはずだが。
e.TypistはPDFがなくとも認識できる。

ともかく体験版で試してみなはれ。
317315:02/12/05 11:56 ID:PfKuJtZ5
e.Typistの体験版はPDF連携機能は無いみたいなんだよね
がっくし
318名無しさん@お腹いっぱい。:02/12/05 12:47 ID:n1kJjuVc
e-Typistってホンとに使ってる人いるのかな?
読んdeココは、まあまあなんですがちょっと問題があるような気がして
今は、読取革命7を使っています。
319名無しさん@お腹いっぱい。:02/12/05 22:39 ID:K6z+j6rp
320315:02/12/06 09:03 ID:oW03ezUf
>>319
わざわざありがとうございます。
仕事で使うのですが、会社では絶対にインストールしてもらえない(検証がどうとかうるさい)ので、家でやろうと思っていました。
悩んでしまいます。
321名無しさん@お腹いっぱい。:02/12/08 23:06 ID:Cqbu1jUF
読んdeココ Ver.8使っているのですが、英語の文章メインでOCRさせてます。
で、ヘルプなどを見てもよくわからないんですが
英語の「i」を「・」と「l」というように勝手に2行に分割して認識してしまっているようです。

例)

l

これを「i」というようにちゃんと認識させたいのですが、Presto! OCR Pro 4.1でないと
やはり根本的に認識率は上昇しませんか?
あと、なぜか英単語の間のスペースを認識してくれないことが多いです・・・

例)
原文:News for you
OCR:Newsforyou

どう設定すればいいものやらさっぱりわかりません・・・
やはり読んでココは日本語に特化しているから英語は無理なのでしょうか・・・
322名無しさん@お腹いっぱい。:02/12/08 23:24 ID:jsc4nnl+
画像を読み込んだ状態で「認識」→「パラメータの設定」
で認識モードを「英語」ないし「日英混在」にしてみてはどうかな。
その設定で固定したければ「デフォルトに登録」するとか…
323名無しさん@お腹いっぱい。:02/12/09 23:19 ID:8/yMoUaT
>>310
>コピーのコピーのやつを

対応策
・かすれ文字機能を使え(最新バージョンだけ)
・画像加工→ノイズ除去をする。

>>321
>英語の「i」を「・」と「l」というように勝手に2行に分割して認識

対応策
・傾き補正を使え
・認識文字の登録をせよ
・次善の策だが、置き換え機能を使え
324名無しさん@お腹いっぱい。:02/12/11 02:50 ID:nFr68HPJ
>>308
いえ、自分は医療系です。はぁ、この時間になってもレポート終わらない。
徹夜決定です・・・(悲)
325名無しさん@お腹いっぱい。:02/12/17 06:32 ID:a44dEnuJ
スキャナと一緒に読取革命7買おうと思ってるんですが、
一般に文庫本にあるような小さい文字も認識できるんでしょうか?
スキャナ導入の経験がないので検討つきません。
あとこのソフトはデジカメでも認識可能なタイプみたいですが、
やっぱりスキャナで取りこんだものには劣りますかね?
もしあまり変わらないのであればスキャナやめて
デジカメにしようかという淡い期待があるのですが。
どうかご助言いただけると幸いです。
326名無しさん@お腹いっぱい。:02/12/17 10:31 ID:OdTdsulq
> 一般に文庫本にあるような小さい文字も認識できるんでしょうか?

仕様的には問題なし
http://www.panasonic.co.jp/masol/yomikaku/siyo_m.html
日本語文字認識【文字サイズ】 6〜60ポイント(400dpiの画像)

> あとこのソフトはデジカメでも認識可能なタイプみたいですが、
> やっぱりスキャナで取りこんだものには劣りますかね?

カメラは1cm近いか遠いかだけでも撮影条件が違うでしょう。
手ぶれとか照明の問題もあるし
問題はマクロ撮影がきれいに取れるかどうかですね。
327名無しさん@お腹いっぱい。:02/12/17 20:11 ID:a44dEnuJ
325です。
文字の大きさは仕様に書いてあったんですね。すいません不注意でした。

主に文庫本のような小さい文献をデジタル化しようと考えているので、
デジカメではやはりむずかしそうですね。スキャナを買うことにします。
お返事ありがとうございました。
328名無しさん@お腹いっぱい。:02/12/17 21:23 ID:kqMVYeC2
>>325
デジカメだと、図書館などにある文献を取り込むのに便利ですよ。
スキャナを図書館に持っていくわけにはいきませんからね。
329名無しさん@お腹いっぱい。:02/12/18 00:07 ID:3FascDPS
325です。
デジカメをお使いですか? 確かにそれは便利だなあ。
OCRソフトはスキャナ取り込み前提のものが多いので、
デジカメ取り込みの情報が皆無に等しいんですよね。
使用感などを教えていただけると助かるのですが・・・。
330名無しさん@お腹いっぱい。:02/12/18 22:43 ID:mkKdMTXr
>>329
デジカメでも、OCRは一応可能ですよ。
読んでココは、カラーのjpgにも対応しているので、大丈夫ですね。

ただし、紙に対して、正確に平行にしなければなりません。
少しでも斜めから撮ると、文字が歪み、誤認識が多くなります。

これから購入するなら、
斜めに撮っても補正してくれる機能のある読取革命が
いいと思いますね。


331名無しさん@お腹いっぱい。:02/12/19 02:32 ID:vd54/SXQ
325です。なるほど貴重な情報をありがとうございます。
う〜ん、かなりデジカメに食指が動いてきました。
でも今現在主流の高画素デジカメはものすごく高いですね。
とても買えないので200万画素程度のものを購入しようと思うんですが、
やっぱりこの程度のものだと小さい字は読めないのだろうか。
差し支えなければ328さんのデジカメの画素をお教えいただけますか?
332名無しさん@お腹いっぱい。:02/12/19 08:59 ID:q31pDxF2
カメラの解像度が低い場合や文字が小さい場合は
近くに寄って狭い範囲を撮影すればいい。

http://www.panasonic.co.jp/masol/yomikaku2002/toku_m2.html
10.5ポイントの文字で書かれた原稿に対して、
A6版サイズの範囲を読み取るには130万画素の、
A5版の場合は230万画素のデジカメが目安です
(30万画素前後の解像度が低いデジカメは適しません)。
333名無しさん@お腹いっぱい。:02/12/20 02:03 ID:JLcnmUWR
A6といえば、文庫見開きですね・・・
ウチのデジカメは二〇〇万画素クラスなので、四六版をOCRにかけようと思うと、片ベージずつ撮るかになりますか・・

正直なところ、どの程度の認識率が期待できるものなのでしょうか?
334名無しさん@お腹いっぱい。:02/12/20 02:20 ID:5DcbWGRc
325です。情報ありがとうございます。
ということは200万画素程度でもまったく問題なさそうですね。
判が大きいものは何遍も撮らなくてはいけなくて大変ですが。
デジカメはOCRだけでなく様々な用途があると思うので、
とりあえずソフトと共に買ってみようかと思います。
揃ったら使用感を報告しますね。(役に立つかどうかわかりませんが)
335名無しさん@お腹いっぱい。:02/12/20 16:36 ID:ctMvRtAg
10.5ポイントってかなり大きな字だよ
スキャナって値段のわりにPhotoshopLEとかがバンドルされてたりして、
ソフトの値段引いたら、まるっきっりタダみたいなものだと思うんだが・・・
336名無しさん@お腹いっぱい。:02/12/20 20:59 ID:NS175WuF
>>331
334万画素
337名無しさん@お腹いっぱい。:02/12/21 20:14 ID:z1iG/2J2
PhotoshopLEなんていらん。
338名無しさん@お腹いっぱい。:02/12/30 02:14 ID:TIhLpPC6
Canonのスキャナのオマケの
CanoscanToolboxでスキャン→OCR→PDF出力できるんだけど,
認識精度は読んde!!ココ Ver.2よりは間違いなく上だなあ。
339名無しさん@お腹いっぱい。:02/12/30 08:17 ID:290X08Ik
6000円ぐらいのスキャナにAdobePhotoデラックスforファミリーがついてた。
インストールしたらプリンタの選択にAcrobat PDFwriterが出現
Photoデラックスは速攻捨てたが、PDFwriterは愛用中
340名無しさん@お腹いっぱい。:03/01/03 00:57 ID:vQdY0e42
皆さんはどれくらいの解像度で取り込んでいますか?
A4のファイルで解像度とファイル形式、ファイルサイズを教えてください。

いまだに認識率向上の為に400dpi BMPで取り込んでる漏れはイッテヨシ?
341名無しさん@お腹いっぱい。:03/01/03 02:33 ID:WJET6l2l
薄さに惹かれて Canoscan LiDE30 を買ったご縁で OCRに目覚め、
自然に e.Typist ユーザになりました。
自分の持ってるモノをよく思いたがるのは人の常で、なんとか e.Typist ver.8 を
よく思おうとしているところです。

e.Typist エントリー版と製品版の機能比較がありました。
ttp://www.mediadrive.co.jp/products/package/win/et80w/mark04.html

私はこれ(↑)を見てエントリー版すらインストしないうちにアップグレード版を
買ってきました(笑)。つまりエントリー版はアップグレード・パスポートとして
インストしただけで、一度も使ってません。
でも、両者は操作画面からしてまるで別物みたいにちがいます。

また、早くも(?) ver.8 のアップデートプログラムが公開されていました。
PDF の読みとりが遅いと言われていたのが、少しは改善されたのかな?
ttp://www.mediadrive.co.jp/download/updata/et80wup.html

このスレはライバル比較スレなので、私の書き込みはあんまり意味がないとは思いますが
とにかく何方かもおっしゃっておられたように、ライバル同士の認識率は
すでに差があってないようなレベルなので、ならば修正法などの操作性の点で
老舗に一日の長があるのだと思いたい(ココを使ったことはないけど)。

e.Typist ver.8 製品版を使ってみた実感としては、デフォルトのままベタ認識させただけでは
大してよくはない。やはり解像度はもちろん、認識設定や各ツールなどを使いこなせば
グッと良くなりそうな感じなので、このお休み中にマニュアル読破します。
342名無しさん@お腹いっぱい。:03/01/03 16:54 ID:eNPb5I0O
>>340
字の大きさによる。
極端に大きい字を高解像で取り込むと、かえって認識率が低下する場合もある。
読んだのを直接認識させて画像はファイルには保存しない。
343名無しさん@お腹いっぱい。:03/01/04 01:11 ID:QW6ez1CU
それは正論かも。>342

自分で試した結果、10.5〜12ポイントくらいのMS明朝orゴシックのWord or Excel
A4出力だと300dpiのbmpで99%の認識率は確かだったが、それでも直すのが
ちょっとかったるい感じなので400にしようかと思っている。
特にExcelだと罫線が干渉するので300dpiでは認識が辛そうだった。

また、雑誌の特集の活字は上記よりさらに小さいだろうからやはり300dpiでは
辛いのではと。

bmpよりもtifのほうが画質がよいように思うんですが、データサイズもでかい気がするのは
私のスキャニングが間違ってるんでしょうか?それともあたりまえのことなの?
344名無しさん@お腹いっぱい。:03/01/04 09:14 ID:/1PXB2gn
Windowsはいろんな画像フォーマットを
最終的にはすべてBMPに変換してから表示してるのでは?
tiffはマルチページが扱えたりBMPにない機能があるから
画像以外の付加情報が大きいかも
345341のe.Typist 8.0ユーザ:03/01/06 04:14 ID:F3BYGvQ7
お正月にマニュアル読んでいろいろ実験した。
やってみた結果、OCRとは読みとり率もさりながら、
いかに容易に誤字修正できるか、
いかに容易に「どこが誤字だと分かるか」がキモだなと。

「へ」「ヘ」「ぺ」「ペ」「べ」「ベ」←かな、カナの半濁音、濁音
「I」「l」「1」←アイ、エル、いち
「ー」「−」「ー」「-」←全角及び半角の長音、ハイフン
「.」「,」「.」「,」←全角及び半角のカンマ、ピリオド
「0」「O」←ゼロ、オー

これらを「私達が自分の目で」認識結果のテキスト中から容易に判別しうるか。
人間が読む分にはどうでも良いけど、システム的には別コードだから別の文字なわけで、
ソートや検索で問題が起こる。メアドやURLとしても別物でしょ。

e.Typist の場合は文字種毎に表示色を設定する機能でこれに対処していた。

漢字
ひらがな(普通、濁音、半濁音、促音拗音の4種)
カタカナ(普通、濁音、半濁音、促音拗音の4種)
英語(大文字、小文字の2種)
数字
記号

‥の13種各々に別の表示色を設定でき(全部別色にする必要はないと思うが)、
認識結果を「文字種別モード」で表示させればこれらが一目で分かる。
太字にした方がいっそうわかりやすい。

これはおそらく基本機能なので「読んde!!ココ」も多分同様なのであろう。
346名無しさん@お腹いっぱい。:03/01/06 08:10 ID:woQAGpcd
読んでココの
pdf認識には
アクロバットのライターが必要ってこと?
347名無しさん@お腹いっぱい。:03/01/06 08:36 ID:CYOC506x
>>346
PDFreaderから直接認識できないが
印刷するか画面キャプチャすれば可能
348IP記録実験:03/01/08 22:01 ID:FqkBryiM
IP記録実験
http://qb.2ch.net/test/read.cgi/accuse/1042013605/

1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。

27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?

38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。

73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
349名無しさん@お腹いっぱい。:03/01/09 01:33 ID:WrC0RZnT
ひろゆきは架空の人物ですよ。
350名無しさん@お腹いっぱい。:03/01/09 02:18 ID:fpyxq0db
わーいあたった
351名無しさん@お腹いっぱい。:03/01/09 03:11 ID:zcLVJlj3
さてと、馴れ合うか
352名無しさん@お腹いっぱい。:03/01/09 04:01 ID:dixks+6U
2ch、全スレのIP記録の方針
http://live2.2ch.net/test/read.cgi/news/1042014951/
353名無しさん@お腹いっぱい。:03/01/09 12:52 ID:DRCZXvcv
フシアナ標準にすればいいのに。
困るのは厨くらいだろ?
354名無しさん@お腹いっぱい。:03/01/09 13:11 ID:huAnrTIv
┌─────────┐
│.              |
│ スレ違い警報 !! |  
│.              |
└―――──――――┘
    ヽ(゚Д゚ )ノ
     (  へ)
     く

355名無しさん@お腹いっぱい。:03/01/09 17:58 ID:a+ML/DQ5
======2==C==H======================================================

         2ちゃんねるのお勧めな話題と
     ネットでの面白い出来事を配送したいと思ってます。。。

===============================読者数: 138720人 発行日:2003/1/9

年末年始ボケがそろそろ収まり始めた今日このごろのひろゆきです。

そんなわけで、年末に予告したIP記録ですが実験を開始しています。

「2ちゃんねる20030107」
こんな感じで各掲示板の最下部に日付が入ってるんですが、
20030107以降になってるところはログ記録実験中ですー。

んじゃ!

────────────────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
────────────────────────────
Keep your thread alive !
http://pc3.2ch.net/test/read.cgi/software/1041952901/l50
────────────────────────────
356名無しさん@お腹いっぱい。:03/01/10 11:51 ID:lI/eJaDE
シャア板が荒らされとる
357名無しさん@お腹いっぱい。:03/01/10 17:12 ID:Ht8i9LFW
スロ板 vs モ狼板   FIGHT!
358名無しさん@お腹いっぱい。:03/01/11 01:05 ID:UQ0+QVNN
ポイドゥン
359名無しさん@お腹いっぱい。:03/01/11 10:46 ID:6uIDhD5i
まあ、これからは祭りも選んでやれと。
360名無しさん@お腹いっぱい。:03/01/11 17:16 ID:49U5/ssP
鳴る歩道
361名無しさん@お腹いっぱい。:03/01/12 01:19 ID:WIKFlVgK
厨房板の荒らしは削除されたようだ
いつか全板で強制表示になるのだろうか?
スクリプトくめばどこの板だって荒らせるだろうし
362名無しさん@お腹いっぱい。:03/01/12 04:29 ID:9pu8hRDM
まんこ
363名無しさん@お腹いっぱい。:03/01/13 11:27 ID:qK8QJY52
結局どのソフトが一番ってな訳?
364名無しさん@お腹いっぱい。:03/01/13 12:29 ID:KK+E7Zrq
保守
365 :03/01/13 13:13 ID:FGkrRyVy
読んでココ!が操作性と汎用性で一番。
読み取り能力については、どれもこれも似たり寄ったりで信頼できん。
366名無しさん@お腹いっぱい。:03/01/13 14:52 ID:2TU74pN7
もうどこも似たようなもの。スキャナーについてきたのをバージョンアップすればいい。

# でも,読んde現バージョンもe.Typistエントリーもある俺は次にどっちを買えば・・・
367名無しさん@お腹いっぱい。:03/01/13 14:52 ID:QvaHGtCv
368名無しさん@お腹いっぱい。:03/01/13 22:22 ID:l0VKhRyj
ワラタ
369名無しさん@お腹いっぱい。:03/01/14 23:11 ID:oONScpyv
で、結局どれが一番イイ!の?
370名無しさん@お腹いっぱい。:03/01/15 18:12 ID:/TKPsv/I
自分が使いやすい物が一番(・∀・)イイ!ってことでショ。
371名無しさん@お腹いっぱい。:03/01/18 05:32 ID:4qWwoBSA
そろそろ、読んでココ9出るかな?
372名無しさん@お腹いっぱい。:03/01/19 00:20 ID:znk61h6G
読んdeは毎年3月ぐらい
2月下旬に出ると言って3月になることも
373341,345:03/01/19 03:49 ID:9zUGz8/D
正月からe.Typist8トライしてきたが、もう見限った。
英文を認識させる場合、自動レイアウト認識させると
その後 認識言語、解析辞書等を全て手で英語に修正して指定しても
どうあがいても日本語処理しかしない。
単語間のスペースを全部省いてタンゴがひとっ繋がりになる。
むしろ日本語領域として「文字間スペースを残す」にしたほうがマシ。

もちろん、あらかじめ文字領域だぞ、認識言語は英語だぞ、横一段だぞ、と
言って聞かせてからレイアウト解析させても日本語領域にしやがる。

手で認識領域を囲った場合のみ、英語設定が生きて英語認識する。

なにがバイリンガル版だタコ。
こんなつかえねーOCRにイソイソと製品版アップグレードして
正月にマニュアル熟読までしたおめでたい自分が腹が立つ。

設定の手順もあっちのメニューに飛び、こっちのツリーを開き、
あそこのダイアログでここを変え、とフローがデタラメだし。

メディアドライブ、返品だゴルァ!金返せ!
キヤノンもこんなとことは手を切れ!
374341,345:03/01/19 04:07 ID:9zUGz8/D
念のためにメディアドライブのサイトを見たら、をを、
やっとキヤノンスキャナ用のドライバがアップされてる。

キヤノンにバンドルされてるくせに、マニュアルの説明もエプソンの方に
熱心に書いてあるのはよっぽどキヤノンにイヤな思いをさせられてるのか。
それともよっぽどキヤノンがサードパーティに評価機を出さないのか、
SDKの提供が非協力的なのか(本末転倒)、それともLiDE50のドライバが治るのをまってたのか。

さて、373に書いた不具合でたった今一つ分かったことがある。
「その他」>「操作設定」>「レイアウト・タブ」>「自動レイアウト解析時のオプション」で
「認識言語の自動設定」のチェックを「外せば」、レイアウト解析後の手動変更が可能になる。
「認識言語の自動設定」のチェックがついたままだと、解析後に認識言語を手動変更しても
反映されない。

しかしこの「認識言語の自動設定」機能をチェックしておくと、
私の英語文書では100%日本語として認識される。よってこの機能はまるで役に立たない。
おそらく文頭が記号か数字だと、日本語だと認識するのではないか。

しかし英文に限らず、契約書なんてものは行頭はだいたい条文の数字が来るものに決まっている。
それにも対応できない「認識言語の自動設定」機能はまるで使い物にならないタコ機能である。
とっとと不具合修正してアップデータあげろ。
375名無しさん@お腹いっぱい。:03/01/19 14:36 ID:4WXuM1xG
>正月からe.Typist8トライしてきたが、もう見限った。

これは嘘?
376341,345:03/01/19 19:31 ID:Znluz+jg
メーカーのいう夢のようなメリットを享受してはっぴーになれる便利な製品としての希望は、あきらめた。
そんな製品じゃない。
機能の働きを真に受けてはいけないツールとして、不便な操作体系をがまんして逐一設定しながら
運用でだましだまし使っていくことにしますた。あーくそ面倒くさい。

どうやら、e.Typistで良いのは「エンジンだけ」なのだろう。
操作体系の整頓や各機能の相互の影響などは、作り込みが相当アマチュアっぽい。
フリーウェア作家の方がよっぽど洗練した使い勝手のセンスがあるよ。

認識領域は文字認識メニューか属性ツールバーで設定しながら、
解析辞書は解析メニューツリーで切り替えるというのは当たり前に見えるが、実際使うときには不便である。
同じところに並んどけ。つーか認識言語を英語にしたら解析辞書も自動で英語に連動せんかボケ。
自動解析した後で辞書を切り替えて手動解析させる二度手間じゃ、自動化とはいえんのじゃ。

また、操作設定ダイアログと環境設定ダイアログが統合してねーから不便なのだ。
「操作設定」の「ファイル保存」タブは「環境設定」の「データ転送」タブと統合しろ。
PDFの認識解像度設定は「環境設定」の「その他」にあるが、フツー「操作設定」の「ファイル読み込み」に
一緒にあるべきだろう。
「操作設定」の「認識」タブ内で属性ツールバーのパラメータもラジオボタンで選べるようにしとけ。
ダイアログが終わってからじゃないとツールバーが操作できんのだから、二度手間だ。

なんで「編集」メニューに「テキスト表示モード」「テキスト表示色の選択」「カーソル形状」があるんだ。
前二者は解析メニューにあるほうが使いやすいだろう。ツールバーがそうなっているくせに。
「カーソル形状」なんてそれこそ環境設定にいれとけ。

そーゆー操作体系のイモさと、件の「認識言語の自動設定」機能は実は
「日本語固定認識、あとから変更は受け付けません固定スイッチ」としてしか働かないところ、
ヘルプでリンクをクリックしてもリンク切れしてるところ(「スキャナの設定」の「TWAINドライバ」
「当社専用ドライバ」が共に死んでる)など、商用製品としてはまれにみる粗悪品といえよう。
377ぽうこう:03/01/19 20:05 ID:4WXuM1xG
いえよう。
378名無しさん@お腹いっぱい。:03/01/19 23:53 ID:AM1pyeq0
eTypistは、パソコン関係の雑誌では評判が良いから、
その記事を信頼して、実際、購入して使ってみると、だまされたという感が否めない。

だいたいこの業界で消費者が一番困るのは、
使えない商品を巧妙な宣伝(雑誌広告、店頭、テレビCM)で掴まされることだ。

パソコン関係の雑誌って、いくら商業誌だからといえども
役に立たない度っていうか、厳しいこと書かない度が高い。

379名無しさん@お腹いっぱい。:03/01/22 22:53 ID:QrKr7b+5
最近のIMEはあまり笑える誤変換をしてくれなくなったが
俺の「読んde!!ココ」ver.8は
よく「扉」を「尿」と読んでくれるのでとても嬉しい

みんなはどう?
380山崎渉:03/01/23 02:48 ID:Vsr33d1M
(^^)
381名無しさん@お腹いっぱい。:03/01/23 14:57 ID:5hUWdxVr
確かにocrソフトって高価なのに、ビジュアルがフリーソフトの延長のようなのが多すぎる
まだ洗練されてるのは読んdeココ8か読取革命7かな
現状では一番後発の読取革命7が性能面でも優れている気がする。
382名無しさん@お腹いっぱい。:03/01/23 21:02 ID:vsDUVS9O
>>379
>よく「扉」を「尿」と読んでくれるのでとても嬉しい
>みんなはどう?

真→骨

383名無しさん@お腹いっぱい。:03/01/23 22:07 ID:CWmaPqCW
英文の写真入資料をなるべく写真レイアウトそのままで取りこんで、英文の所だけ上書きで日本語に
翻訳して日本語取説作りたいんだけど。

パッケージ見る限りじゃどのメーカーが良いのか判らず、ずっと鬱だ。
JPEGで保存して一枚一枚翻訳したいんだが.....
384名無しさん@お腹いっぱい。:03/01/23 23:42 ID:DAt54/qR
教えて君で申し訳ないっす。
スキャナー買ったらe.Typistエントリーが付いてきました。
さっそくアップグレードしようと思うんですけど、
「プラスファイリング」っての使えますかね。
アップグレード版だとかなり安いので買っとこうかと。
同封の案内にはバージョン7が紹介されてますけど、
8にもアップグレードできるんでしょうか。

文書(新聞雑誌のスクラップなど)スキャンが中心です。
聞いてばかりですみません。
385名無しさん@お腹いっぱい。:03/01/24 01:46 ID:SEA9qw8V
>383

読取革命 2002 体験版
ttp://www.panasonic.co.jp/masol/yomikaku2002/tk_m.html

読んde!! ココ Ver. 8 体験版
ttp://ai2you.com/ocr/product/koko8dl00.asp

e.Typist v.8.0 体験版
ttp://www.mediadrive.co.jp/download/try/et80w_try.html

>384
最新版へのアップグレード。
ファイリングは試してみれ。

やさしくファイリング4 体験版
ttp://www.mediadrive.co.jp/download/try/yf4_try.html
386名無しさん@お腹いっぱい。:03/01/24 02:00 ID:xU34e/BP
======2==C==H======================================================

         2ちゃんねるのお勧めな話題と
     ネットでの面白い出来事を配送したいと思ってます。。。

===============================読者数: 139038人 発行日:2003/1/10

なにやら、連日メルマガだしてるひろゆきです。

そんなわけで、ログ記録実験ですが、いちいちサーバ指定するのが面倒なので、
全部のサーバに入れてみました。

重くなって落ちたりしてもご愛嬌ってことで。。。

んじゃ!

────────────────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
────────────────────────────
Keep your thread alive !
http://pc3.2ch.net/test/read.cgi/software/1041952901/l50
────────────────────────────
387341,345:03/01/24 03:56 ID:hAp18KgW
>>383

上ではe.Typistをぼろくそに言ったが、公正を期すために出来ることは出来ると書く。

「e.Typist ver.8 バイリンガル(\19,800)」
(キヤノンスキャナを買えばエントリー版がバンドルされてて、\7,500でこの製品版にアップグレードできる)
これには英日/日英双方向翻訳ソフトがオマケについてる。
バンドルソフトの多さは、e.Typistは「読んde!!ココ」を大きく引き離しているといえる。

この翻訳ソフト(NOVA製)の翻訳精度はよく知らない。
しばらくはそのドキュメントの訳しかたに辞書を鍛える必要があると思う。

「読んde!!ココ(\19,800)」には翻訳ソフトは付いてなかったと思う。<うろおぼえ
「読んde!!ココ マルチリンガル版(\29,800)」でも翻訳ソフトは無かったんじゃないか。

さて、e.Typistは認識結果のレイアウトを保持したままrtf形式で保存したり、
そのままWordにワンボタンで転送貼り付けできる。レイアウトの崩れなさ(?)は
たいしたものといえるレベルである。この機能そのものは「読んde!!ココ」にもある。

e.Typistは複数Jpegを個別に読んでも、Wordに吐き出すときは
「同じファイルの最後尾ページに追加」をチェックしておけば
どんどん1ファイルに追加していけるのであとでバラページを統合する手間はいらない。
「読んde!!ココ」にこの機能があるかどうかは知らない。
388名無しさん@お腹いっぱい。:03/01/27 04:57 ID:OUDyP36G
======2==C==H======================================================

         2ちゃんねるのお勧めな話題と
     ネットでの面白い出来事を配送したいと思ってます。。。

===============================読者数: 139038人 発行日:2003/1/10

なにやら、連日メルマガだしてるひろゆきです。

そんなわけで、ログ記録実験ですが、いちいちサーバ指定するのが面倒なので、
全部のサーバに入れてみました。

重くなって落ちたりしてもご愛嬌ってことで。。。

んじゃ!

────────────────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
────────────────────────────
Keep your thread alive !
http://pc3.2ch.net/test/read.cgi/software/1041952901/l50
────────────────────────────
389名無しさん@お腹いっぱい。:03/01/27 14:31 ID:eBxGYDeM
強制ふしあな位で勘弁してもらえねーかな。
書けないだけでも結構不便だ・・・
390e.Typer:03/01/28 09:02 ID:5fUMBy+x
e.Typist8.0を使っています。
感想を言いますので、参考にしてください。
・整然とした日本語本をきちっとスキャニングして、OCRすると
誤認識はかなり少ないです。
・使い勝手は、悪いほうだと思います。
つまり、説明書必読。
・初期状態は優秀ですが、辞書は鍛えにくいと思います。
391名無しさん@お腹いっぱい。:03/02/03 19:06 ID:aUrgKYh8
読んdeココ9登場age
http://pc.watch.impress.co.jp/docs/2003/0203/aisoft.htm

初回2万本限定でUPG版がなんと4900円ですよ奥さんw
392名無しさん@お腹いっぱい。:03/02/03 19:42 ID:XYesWZFm
>>391
つい最近、8のバージョンアップを7000円で買ったのに・・・
393名無しさん@お腹いっぱい。:03/02/04 01:21 ID:oahfW5Zw
>>392
おぬし>>371-372を読まんかったのか…

しかし記事が消えちゃったようだ。発売延期か?
394名無しさん@お腹いっぱい。:03/02/04 20:53 ID:94MWWIpd
昔は新バージョン出る直前に買うと無料バージョンアップだったけどな。
スゲー昔だけど。
395名無しさん@お腹いっぱい。:03/02/05 01:48 ID:Mpazj1q+
>>391
> 初回2万本限定でUPG版がなんと4900円ですよ奥さんw

安いね
初回で買うべきか
396名無しさん@お腹いっぱい。:03/02/05 01:58 ID:Mpazj1q+
>>379
そういうときは認識辞書に登録すると上手くいく?
誤りパターン辞書かな
397名無しさん@お腹いっぱい。:03/02/05 21:26 ID:Qu6W8aHC
テキスト化したら、次は読み上げさすっちゅーのも、いんじゃない?
(そういう機能がついてるocrソフトもあるようですが。)

テキスト読み上げソフトで、スレを音声で"聞こう"♪
http://pc2.2ch.net/test/read.cgi/software/1044447073/l50

1 :名無しさん@お腹いっぱい。 :03/02/05 21:11 ID:Qu6W8aHC
音声読み上げソフトは、革命的にメチャメチャ便利!!
2ちゃんねるのスレを、まるでラジオのように音声で聞いてみませんか?

パソコンに文章を読ませることで、目が疲れず
よりたくさんのネット上の情報をPCから引き出すことができます。

吉野家などのあのゴルゴのFLASHも読み上げソフトを利用しているそうです。
すでに利用している方や、知らない人の情報交換の場所にしたいと思います。
398名無しさん@お腹いっぱい。:03/02/06 01:18 ID:0FPcFaJp
e.Typist8は標準で音声読み上げしてくれる。日英とも。

なんでもOCRって昔から視覚障害者が読書するのに需要があるらしい。
でも誤認識修正は人にやってもらうのかな?
多少の誤認識はかまわず読ませるのかな?
39948:03/02/07 14:13 ID:7lNMYR9q
WinReader7.0を使っておる。
だれか、8.0くダサイ。
400名無しさん@お腹いっぱい。:03/02/07 21:01 ID:a7itCsOl
>>397
情報、サンクス。

でも、読んde!ココも、標準で音声読み上げしてくれる。日英とも。
早口も、ゆっくりも、調整可能。
低い声も、高い声も、調整可能。

だから、このまま、読んde!ココでいいです。
401名無しさん@お腹いっぱい。:03/02/07 22:32 ID:AS+nkByy
ちょいスレ違いなんだけど質問させてくださいな。
スキャナに付属以外のスキャンソフト使ってみたいんだけど
どんなのがあるのかもよく分かんなくて。
この板にスキャンソフトスレも無いみたいだし……。
何処で情報収集すればいいでしょう。
402名無しさん@お腹いっぱい。:03/02/07 22:41 ID:a7itCsOl
>>401
OCRソフトの仕組み
http://ai2you.com/ocr/struct/aboutocr.asp

「読んde!!ココ Ver.8 for Windows」の無償体験版を提供中
試用期間は30日。
http://ai2you.com/ocr/product/koko8dl00.asp

『読んde!!ココ』のカタログ
http://ai2you.com/ocr/product/koko8pdf.asp
403名無しさん@お腹いっぱい。:03/02/07 22:45 ID:Vol2/mLF
>>391
おととい8狩ったばかりなのに・・・。
404名無しさん@お腹いっぱい。:03/02/07 22:56 ID:a7itCsOl
>>401

読取革命Ver.7
http://www.panasonic.co.jp/masol/yomikaku/

「読取革命Ver.7」カタログ
http://www.panasonic.co.jp/masol/yomikaku/dload_m2.html

専門書をOCRするなら、ユーザー辞書のカスタマイズが容易な読んでココ。
デジカメでOCRするなら、読取革命。
がオススメかな。
405名無しさん@お腹いっぱい。:03/02/08 22:26 ID:qVf0gVIW
迷ったあげく、今日読み取り革命7を買った。
認識力などは、特に他と比べて優れているとは思わないものの、校正の時を考えてこれを選んだ。
元画像と、認識結果を1行ごとに、上下にならべて表示してくれるのはありがたい。
406名無しさん@お腹いっぱい。:03/02/08 23:37 ID:+OH3MluO
夜勤さんに聞いてけろりん。
もう戻らないようなことはないから大丈夫。

タブン(ボソッ
407341,345:03/02/09 00:12 ID:T/dh6vvj
>>405
>元画像と、認識結果を1行ごとに、上下にならべて表示してくれる

それはいまどきどの製品もそうだよ。

上の方でe.Typistに発狂したように噛みついた自分だが、他スレで
アップデータが出たのを知って(R1b)入れてみた。

自動認識後でも認識言語を変更できるようにはなっていたが、
それ以外は全く治っていなかった。

操作体系はメジャー・バージョンアップでもなきゃ直しようがないだろうが、
ヘルプのリンク切れぐらい直しとけ。

つーか依然として英語文書を自動認識させると日本語としてしか
認識しない点は相変わらずだ。がっかり。

前には書かなかったが、文字パターン学習させた後に
同じ文書に再チャレンジさせてもやっぱり同じ文字で全く同じ誤読をする
(つまり学習効果ナシ)のも使えないソフトの証左らしくて笑える。

まあ、定価でも\19,000位のソフトなら所詮おもちゃだもんな。
業務用とは違うだろうが、それにしてもカタログで見た夢を少しぐらいかなえてくれて、
投資した金の元が取れたような気にはさせて欲しかったよ。

次のメジャー・バージョンアップ(ver.9)で劇的に改善されてることを期待して
もう一回だけ付き合ってみようと思う。でも、クソ重いソフトになってたら
「ココ」に乗り換えようと思う。
408341,345:03/02/09 00:17 ID:T/dh6vvj
>>405さん、「読み取り革命7」にも、私が>>345で書いたような機能はあるの?
409名無しさん@お腹いっぱい。:03/02/09 03:28 ID:Pky6TbYn
(・3・) アルェーPC初心者板に書き込めないんだけどどうしたあるYO
410to 408さま:03/02/09 03:37 ID:pszFTM0b
今、一仕事終えて酒飲んでるところなので、マトモにご返事できないのがもうしわけありません。

遺憾ながらその機能はないようです。
未だマニュアルを読み切っていない(=機能全てに習熟していない)状態なので、確言出来ませんが。

こんな所でいいですか?また何かありましたらみなさまにご報告いたします。
411名無しさん@お腹いっぱい。:03/02/09 20:02 ID:YT5uO2Hq
読んでココも、Eタイピストもマルチリンガル版がありますが、
Presto! OCR と TextBridge PRO の比較はどうなんでしょう?
Presto! OCR や TextBridge PRO を使ってフランス語、ドイツ語の
読み取り比較をする人は少ないかも。私なり

  Presto! OCR > TextBridge PRO

という印象を持っています(ただし2年前)。

めんどうくさいですが、>>407 さんのようなケースの場合、
英語文書だけなら、最初から TextBridge を使うという手もあるのでは?
412341,345:03/02/10 02:36 ID:YzQWj4lS
>>410さん、お休みのところありがとうございました。

>>411さん、読ませるのは日英両方たっぷりあるんですよ。
同じコトをするのに、操作体系や設定方法を倍覚えるのって苦痛じゃないですか。
MS-WORDと一太郎と、両方習熟しなきゃならないとしたらイヤだもん〜。
413名無しさん@お腹いっぱい。:03/02/10 11:55 ID:Su9Itr6U
>>411
ドイツ語やフランス語を読み取ってくれるOCRソフトに興味あるのですが、
Presto! OCRとかの読み取り精度はどんな感じですか?

Presto! OCR Pro 4.0で、12000円ぐらい?
414名無しさん@お腹いっぱい。:03/02/10 15:23 ID:U1cnh3aM
>>412
両方ならしかたないですね。それに英語だけだったら、一本でいいと
思います。

>>413
当然ですが、日本語よりはかなりいいです。

Presto は100ドル、TextBridge は80ドルくらいのはず。この差額
20ドルぶんは、性能差があります(今のバージョンはわかりません)。
なぜか、国内価格は同じだったような(おい、メディアドライブ)。

なお、TextBridge 同様 Scansoft が作った OmniPage は個人レベルで
買える最高級の OCR ソフトで、値段は 500ドルもしくは10万(日本での
扱いはヒューリンクス)くらい。お金があればこちらでしょう。
415名無しさん@お腹いっぱい。:03/02/10 16:00 ID:b0tuCQjy
10万・・・・個人じゃ買えねえ
416名無しさん@お腹いっぱい。:03/02/11 01:16 ID:qtWr6pBe
たしかに、10万円は個人じゃ買えませんね。
翻訳家など職業にしている方ならともかく。

ところで、OCRソフトって、毎年バージョンアップするけど、
1年でそんなに認識率とか使い勝手とか向上しているの?
417名無しさん@お腹いっぱい。:03/02/11 01:44 ID:1EvNgsB9
どうでしょうね、eTypist は WinReader の古いバージョンの認識
エンジンと言われてますので、eTypist のバージョンがあがっても、
今の WinReader をうわまわる事はすぐにはないですから。

趣味じゃなくてある程度仕事で、「ドキュメントスキャナ+OCR+
翻訳ソフト」で、独仏本から英語というのを考えてます。日本語を
あきらめれば、OCR も翻訳もそこそこ使えるかと。
どうせ日本代理店はまともな仕事しないので、オンラインで直接
買えば価格も抑えられるし。
418名無しさん@お腹いっぱい。:03/02/11 12:35 ID:1TehPOBJ
英語もPrestoやTextBridgeの方が正確に読んでくれるの?
419名無しさん@お腹いっぱい。:03/02/12 15:34 ID:pVKft62G
>>418
申し訳ないですが、
PrestoやTextBridge、使ったことがないのでわかりません。

英文字に関しては、漢字と異なり、
早い時期から、認識率が高い。また、OCRソフトによって認識率の違いはあまりない
と聞いたことがあります。
420名無しさん@お腹いっぱい。:03/02/12 19:41 ID:3a1l/gM4
ラウンジと同じ場所に・・・
421名無しさん@お腹いっぱい。:03/02/13 11:52 ID:c8e1WC4y
>>419
昔の読んでココ使ってみたら、fとその隣の文字での誤認識が多かった。
どれも、あんなもんなのかな。
ソフトが古いからいかんのか。
422名無しさん@お腹いっぱい。:03/02/13 12:34 ID:r1eNnyXy
>
偽桜。さん、2ちゃんスレ紹介のサイトとかやってません?
別名で。
423名無しさん@お腹いっぱい。:03/02/14 02:13 ID:pDHp6Hi6
>>421
最新版は、けっこう大丈夫ですよ。

>fとその隣の文字での誤認識が多かった。

いつも同じ文字でご認識が多い場合
対策としては、
ユーザー認識辞書に登録するとか、
置き換え一括機能を使うとかして、
自分の使いやすいようにカスタマイズすれば便利です。
424名無しさん@お腹いっぱい。:03/02/14 18:47 ID:haTGenIA
>>423
なるほど。
製品版、どうしよっかなあ・・・
425名無しさん@お腹いっぱい。:03/02/14 19:08 ID:LDv99/89
>>421
「fとその隣の文字」って、ff や fi のことですか?
ff や fi を誤認識するようなら、英文字対応OCRとは
言えないと思うがなあ。
426名無しさん@お腹いっぱい。:03/02/15 00:14 ID:ffasoaJf
>>425
fi→Rという誤認識が多かった。
昔、買ったスキャナーに付いてた読んdeココ。
427名無しさん@お腹いっぱい。:03/02/15 06:39 ID:XRFedlTs
英語の領域設定してあれば日本語より認識率は、はるかに高いはず
単に領域設定してないだけだと思われ
428名無しさん@お腹いっぱい。:03/02/17 20:10 ID:I3XFx2dG
>>391
>読んdeココ9登場age
>http://pc.watch.impress.co.jp/docs/2003/0203/aisoft.htm
>
>初回2万本限定でUPG版がなんと4900円ですよ奥さんw

これって、ウソだったんですか?
429名無しさん@お腹いっぱい。:03/02/18 01:29 ID:0DIJqMiY
>>428
ウソつき呼ばわりは良くないな。
どーせとんでもねーバグで広報差し止めてんじゃネーノ?
作ってるのは外側だけなのになんでこうまともなものが作れないのかねえ
430名無しさん@お腹いっぱい。:03/02/18 15:53 ID:eTDyOklL
431名無しさん@お腹いっぱい。:03/02/19 20:35 ID:H4zEG5z4
英文っていうかアルファベットをやりたいなら
eとか読んdeとかじゃ話にならない。
領域指定しようが論外。
わるいことはいわないから
prestoとかのそっち向けのソフトを使うべき。
fとか文字の認識率もぜんぜんちがうけど
欧文のテキストの組のルール(記号とか)に対する
制作者の理解の差が激しすぎる。
432名無しさん@お腹いっぱい。:03/02/19 21:52 ID:JUrcWhuN
433名無しさん@お腹いっぱい。:03/02/20 09:44 ID:hilYuBNt
高いんだよなあ・・・・
434名無しさん@お腹いっぱい。:03/02/20 10:35 ID:e0r9WAbI
http://www.softwind.co.jp/sw2/swlst.php3?fin=47
ここによると読んdeココ9登場は3月14日みたいだね。
435名無しさん@お腹いっぱい。 :03/02/20 20:36 ID:08WI8256
>>433 禿同、高いっすよね・・読んでココもだし特にEタイピストも
    というか私も素人でエクセルのデータを消してしまい急遽OCRソフト買おうと思うんですが、
    富士通ミドルウエアのOCRforEXCELか、
    メディアドライブのEXCELOCRV4.0が同価格で良さそうですが調べたのですが
    決定的な違いは富士通ミドルウエアの方は色の文字も認識して読み込みメディアの方は
    白黒という事のようです。
436名無しさん@お腹いっぱい。:03/02/20 22:05 ID:RMLDvKRT
高いですよね。

読んでココ9にバージョンアップするか、
読み取り革命に乗り換えるか迷う。
437名無しさん@お腹いっぱい。:03/02/20 22:24 ID:UNTmSmHQ
>>435
わざわざ用途の狭い専用ソフトなんか買うと後悔するぞ。
読んdeもe.typeも表認識機能なんて標準で付いてる。
438名無しさん@お腹いっぱい。:03/02/21 01:29 ID:bYZeblRO
店頭販売実績No.1の実績を誇るOCRソフトのベストセラー
「読んde!!ココ」が、バージョンアップします。
文字認識については、「つぶれ・かすれ文字」の他、
新聞などでよく利用される見出し文字(白抜き文字)認識なども新たにサポート
、また、一度誤認識した文字を修整すれば、
自動的にユーザー辞書に登録され、さらに認識度が向上しました。
また、「スマートナビ」(メニュー)の搭載により、
読んde!!ココの各機能をユーザーの目的にあわせて、
より簡単に使いこなすことができるようになりました。

http://www.getplus.co.jp/product.asp?product=491397

やはり3/14発売予定
439名無しさん@お腹いっぱい。:03/02/21 02:19 ID:pSjD2V3B
>>438
情報、ありがと。

標準価格: \4,900
現金特価: \4,670 なんですね。

去年のバージョンアップ版は7000円くらいだったような気がしますが、
今回は、それより安くて嬉しい。
440435:03/02/22 14:30 ID:L7m8wN0V
>>437
すみません、昨日買ってしまいました、OCRforExcel!
 インストールが完了しましたが、なぜかスキャナの洗濯という
 所をクリックしても反応しない!何故?
 富士通今日休みなんです〜(泣)
 
441名無しさん@お腹いっぱい。:03/02/22 15:00 ID:juU2225J
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/

http://www5b.biglobe.ne.jp/~ryo-kyo/osu.html

_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
442名無しさん@お腹いっぱい。:03/02/22 15:07 ID:kq4s/FHk
>440
洗剤と漂白剤入れてないからじゃないの?
443名無しさん@お腹いっぱい。:03/02/22 17:03 ID:PljQjT6m
オチキタ ━━(゚ ∀ ゚)━━( ゚ ∀)━━(   ゚)━━(   )━━(゚  )━━(∀ ゚ )━━━(゚ ∀ ゚)━━ !!!!!
444名無しさん@お腹いっぱい。:03/02/23 21:50 ID:ohK0Zv8A
e.Typistもバージョンアップ7500円になったからなあ。
Canonのスキャナーにエントリーがついてきたから
Ver.9はe.Typistにしようかと思ってたけど,どーしよっかな。
445名無しさん@お腹いっぱい。:03/02/24 22:22 ID:XavTpPC8
ほれ来たど
http://pcweb.mycom.co.jp/news/2003/02/24/07.html

エー・アイ・ソフト、「読んde!!ココ Ver.9」を発表 - 目的別の新メニュー
2003/2/24

エー・アイ・ソフトは、日本語/英語活字OCRソフト「読んde!!ココ」新製品4バリエーシ
ョンを発表した。「読んde!!ココ Ver.9」(19,800円)のほか「同 アップグレード版」(7,
500円 旧製品ユーザ、スキャナバンドル版ユーザ)、「読んde!!ココ Ver.9 ファイリング
OCR Suite」(24,800円)と「同 アップグレード版」(12,800円 旧製品ユーザ、スキャナ
バンドル版ユーザ)が用意される。なおキャンペーンとして、読んde!!ココ Ver.9 アップ
グレード版は、初回限定2万本に限り7,500円のところ4,900円で販売される。3月14日より
販売開始される。

今回のバージョンアップ項目は、新ユーザインタフェース「スマートナビ」を採用し、
「Wordで活用」「Excelで活用」「PDFで活用」…と、原稿のスキャン→原稿の認識→目的
のアプリへ出力といった操作が自動化された点がまず大きな特徴。また「操作アシスト機
能」により、よく利用する機能(原稿向き判定、傾き補正、ノイズ除去、誤り文字列検出、
結果読み上げ、認識辞書登録など)を簡単操作で自動化できたり、認識機能もさらに向上
し、新聞や雑誌などでよく利用される「見出し文字」や「下線接触文字」「取消線文字」
に対応したほか、誤認識文字も修正を行うだけで自動的にユーザ認識辞書に登録されるよ
うになっている。そのほか、段組原稿や表組み原稿の認識なども向上し、好みのレイアウ
トで出力する「出力レイアウト機能」も搭載している。

読んde!!ココ Ver.9 ファイリング OCR Suiteは、クセロが開発したPDFドキュメント管理
支援ツール「クセロePware Lite」がセットとなった製品。OCR処理からPDF化、PDFファイ
ルによる文書管理までが可能となっている。

446名無しさん@お腹いっぱい。:03/02/24 22:35 ID:XavTpPC8
オフィシャルはこっち。
http://www.aisoft.co.jp/japanese/products/koko9/news/koko9.asp

>■ 認識処理作業をサポート“操作アシスト機能”搭載 New
>一連の認識作業の時に利用する「スキャン/ファイル」「認識」ボタンに認識精度を高め
>る際に利用する機能(原稿向き判別、傾き補正、ノイズ除去、領域抽出)、および、認識
>処理後に利用する機能(誤り文字列検出、文字列複数置換、結果読み上げ、認識辞書登
>録)を割り当てられるようになりました。これにより、従来、ユーザーが行っていた面倒
>なボタン操作を自動化できるようになり、認識処理の効率化を図ることができます。

うむ。自動実行時に複数置換を行えるようになるのはいいかも。
従来AcrobatアドインでPDFの自動OCRを行うと、複数置換を介在させられなかったのが不満だったし。
447名無しさん@お腹いっぱい。:03/02/25 08:06 ID:x/K4E3x5
しかしさ,Ver.9になってやっとこさ白抜き文字対応とか,
辞書学習とか,意図的に小出しにしてるの明らかだよな。
まあ,商売だから仕方ないけど。
448名無しさん@お腹いっぱい。:03/02/25 15:11 ID:DwXSZf2r
e.Typist8で表を認識てるんだけど
コピーして多色かすれがある表の罫線を
I、i、1、一、−などに大量に誤認してしまうんだけど
何とかならんものでしょうか?
449名無しさん@お腹いっぱい。:03/02/25 15:25 ID:Gz0vLa7J
>>448
表OCRを使う

またはスキャナで濃度を細かく指定、事前編集で領域を細かく指定。
450448:03/02/25 21:19 ID:DiJOtBiv
表OCRモードで既に使っているので
濃度濃くして試してみます。
領域を細かく指定するのはちょっと厳しい
(そこまでするなら手で打ったほうが早いので)
451名無しさん@お腹いっぱい。:03/02/27 00:56 ID:8FbM/xUB
>>448
罫線接触文字修正をオンにする(基本)。
画像修正機能の消しゴム機能で汚れを消す。
いっそ汚い罫線はきれいに消しちゃって補助線機能でスッパリと
きれいな線を引きなおすと驚異的に優秀に読めるようになる。

補助線を引くのはエクセルより簡単だが消しゴム機能で消すのは結構手間。
消すときは画像表示倍率をやや大きくした方がミスをせずラクだが、
そのかわり移動範囲が増える。
452名無しさん@お腹いっぱい。:03/02/27 07:59 ID:eo8ZgrOh
3月14日販売開始と書いてあるってことは3月21日に出るんだな。
453名無しさん@お腹いっぱい。:03/03/03 06:00 ID:27XgMCEU
>>452
そうなの?
454名無しさん@お腹いっぱい。:03/03/04 09:12 ID:RYnGJoSh
ADFスキャナで一気に取り込み&OCRをかけたいのですが、出来るだけ
高画質で出来るだけファイルサイズを小さくしようと思っています。
皆さんはどのようなファイル形式で取り込んでいますか?

あと、高画質OCR活用の解説サイトとかありましたら教えてください。
455名無しさん@お腹いっぱい。:03/03/04 20:02 ID:9jpBKjwN
スキャナに読んでココが付いてたんだけど、
読んでココ以外の、違うソフトでも使用できるの?
456名無しさん@お腹いっぱい。:03/03/04 22:23 ID:mIVGAZDx
>>454
300dpiのjpegで充分だと思うけど、ADFということは複数ページだろうから
マルチページpdfかマルチページPNGのほうが一括処理ができていいと思う。
マルチページpdfとマルチページPNGのどちらが小さいかは今わからない。

>>455
使えるよ。オマケOCRのユーザを自社OCR製品に乗り換えさせるために、
当然各社ともいろんなメーカのスキャナに対応させてる。
457名無しさん@お腹いっぱい。:03/03/09 13:35 ID:x900TNvq
そろそろ読んde!!ココの Ver.9 が出る age
458名無しさん@お腹いっぱい。:03/03/11 10:04 ID:9QvpBt3M
読んdeココが付いてるスキャナーを買った場合、
アップグレード版を購入すればVer.9がつかえるようになるの?
459名無しさん@お腹いっぱい。:03/03/12 00:59 ID:2Wj9g7sB
終了
460名無しさん@お腹いっぱい。:03/03/12 01:34 ID:F/wCdV3Z
>>458
そうだと思います
461名無しさん@お腹いっぱい。:03/03/12 02:38 ID:upwpr8I4
>>458
使えますよ。スキャナ付属のOCRとは劇的に認識率が違った。
だが、読取革命もいいみたいなんだよな。迷うぜ、まったく。
462sage:03/03/12 19:35 ID:mhXu/DX1
すっごい初心者なんですが、相談にのってもらえますか?
ここのスレッドを見てOCRソフトは読み取り革命にしようと思いました。
で、スキャナーなんですがどの商品がOCRにお勧めなんでしょうか?

OCRの使用用途は英文と日本語の索引を変換しようと思っています。
日本語のほうはそれほど難しい漢字は必要ないです。
以上のような条件で出きるだけ安い(ゴメンナサイ)スキャナーって
どんな商品がありますか?
相談に乗ってくれたら助かります。
宜しくお願いします。
463名無しさん@お腹いっぱい。:03/03/12 19:52 ID:eN4akVLY
>>462
スキャナにはCISスキャナとCCDスキャナがあります。
CISスキャナはコンパクトですが、
CCDの方が、性能が良いです。特に本をスキャンする際はCCDの方がよいです。
本の中央部分のへこみまできれいにピントが合います。
あと、CCDの方がスキャンの速度が速いです。
CCDスキャナの短所は大きくて場所をとる点です。
CCDスキャナでは、エプソンが人気があります。
464名無しさん@お腹いっぱい。:03/03/12 20:54 ID:Wqtd/LVv
読取革命って,キーボードだけで操作したい人には不便だと思うんだが?
文字の修正を候補文字をつかって行いたいときなど,
読んでココではCtrl+←or→,Ctrl+K
e-typistではCtrl+K
なんだけど,
読取革命(2002)は,マウスに持ちかえるしかなかった気がする。

最初は読んでココ使ってたんだけど,
問題発生→強制終了(ver8では先回り修正の時など)が頻発。
そこで,e-typistを試してみたところ,安定性は抜群。
しかし,1とI(アルファベット)とT(数)の誤認識が
いくら学習させても直らない。
学習させればさせるほど悪くなっていく。
また,読んでココに比べると重い感じがする。
その後,読んでココのアップデートで数々の不具合が修正され
軽快かつ安定した操作が可能となったので
現在は読んでココ使っている。
465名無しさん@お腹いっぱい。:03/03/13 08:17 ID:AAlHy7P7
結論としてはどれも大して変わらないと言うことで。
466山崎渉:03/03/13 16:34 ID:DnUIv7Ns
(^^)
467名無しさん@お腹いっぱい:03/03/14 21:55 ID:V3EuWaJg
読んでココ9は出てた?買った人いる?いたら報告しる!
468sage:03/03/15 00:30 ID:UzE/3H3V
>>463、464、465さんへ
462です。
みなさんレスありがとうございました。
みなさんのレスと価格comさんを参考にして、
エプソンのGT-7300U を買うことに決めました。
OCRは読んでココ にするつもりです。
早速明日ヨドバシカメラにでも行ってきます。
皆さんのおかげで本とに助かりました。 感謝です。
ところで山崎さんって誰なんですか?
いつも2ちゃんねるでみかけるんですが。(^^
469名無しさん@お腹いっぱい。:03/03/15 02:50 ID:MInrqfE8
>>467
OCRファクトリーや自動実行を使わない手動派の人には
操作アシストは非常に役立つ。
ていうか,今までなぜなかったのかという感じ。以下はヘルプから抜粋

@画像データ入力後
A文字認識終了後
B認識結果編集時
の3つのステップ間の処理を自動で行えます。
各ステップ間で自動で行える処理は、以下の通りです。

@画像データ入力時の自動処理
スキャナ等から画像データを入力後、以下のチェックした項目の処理が自動で行われます。
 原稿の向きを補正する(D)
 原稿の傾きを補正する(S)
 画像のノイズ除去を行う(N)
 領域抽出を行う(P)
 領域抽出時に、表枠に対して表罫線抽出を行う(Q)

A文字認識終了時の自動処理
文字認識終了後に自動で行う処理を指定します。
 誤り文字列の検出を行う(C)
 文字列の複数置換処理を行う(R)
 認識結果を読み上げる(T)

B認識結果編集時の自動処理
認識結果の編集時に自動で行う処理を指定します。
 選択された候補文字をユーザ認識辞書に自動で登録する(A)
 辞書登録時に確認を行う(V)
470名無しさん@お腹いっぱい。:03/03/15 12:08 ID:SZCAO8pH
>>467
読んでココver9、某淀橋に山済みされていて、アップグレード板で
4000円ぐらいだから、だまされてもいいやと思って衝動買い。

いままでエプソンスキャナに付いてたのを数回試したことしかなかったから、
ちゃんとした評価はできないけど、なかなか良いね。これ。

試しに手元にあった「トランジスタ技術」を2〜3ページスキャンしてみた。
修飾されていない本文記事中の文字は今のところ100%認識。誤認識ゼロ。
イメージもきちんとイメージとして認識してくれている。

ただし同じページ内にある、大きさが違う文字、修飾された文字に関しては
まったくだめ。認識領域の再設定と、テキスト−イメージの変更が、手作業には
なるけど比較的簡単にできるから、読み取り後、これらをきちんと設定する必要があるね。

雑誌等を大量に読み取りたい場合は、ちょと手間はかかりそうだけど、
なんといっても、ボタンひとつでPDFに変換して、保存できるのがイイ!

以上、マニュアル1頁も読んでない状態での評価でした。
471470:03/03/15 12:38 ID:SZCAO8pH
つづいて新聞をOCR。

ぱっとみて記事本文で認識率99%ぐらいかな。
「車」→「華」の誤認識、「メガ」とか「バレル」のような小さく
まとまった文字(「b」みたいな感じの文字。なんて言うの?)が
認識できず、その他数箇所。

やっぱり見出しの大きい文字はやっぱりきちんと認識してくれない。
きっと設定で大きさの違う文字も上手く認識してくれるように出来るのかな。
つーかマニュアル読めよ!って。
しかし今時こんな分厚いマニュアル付けられても・・・
472ひよこ名無しさん:03/03/15 12:40 ID:DjJguTyp
473名無しさん@お腹いっぱい。:03/03/15 22:14 ID:+TKL9et9
>今時こんな分厚いマニュアル付けられても・・・
今時だからこそ分厚いわけだが・・・。

474名無しさん@お腹いっぱい。:03/03/21 23:57 ID:i07L6p7O
読んdeココ Ver.9買ってきた。
....細かいところは多少良くなってるけど・・・

白抜き文字の認識は結局出来ないし,
強制終了すると設定がほとんど全部初期状態になるのは全く直ってないし,
傾き補正すると字がガタガタになって余計誤認識するのもそのままで,


はあ〜・・・・

まあ4000円だからかろうじて許せるかな(7000円だったら縁切り)。
475名無しさん@お腹いっぱい。:03/03/22 00:10 ID:ed/eMkJ3
>>474
強制終了って、例えばどういうときになる?
明らかにどこでなるか分かるのなら、メールなりフォームなりで送ったら直してくれると思うよ。

あと、設定が初期状態になるってのがよく分からない。
レジストリに設定持ってるから、そこまでは消えないと思うんだけど。
476名無しさん@お腹いっぱい。:03/03/22 00:45 ID:lWAj3XN/
477474:03/03/22 01:08 ID:MqZtPn+9
>>475
「このアプリケーションは・・・」のときとか,読んdeを終了しないで
いきなりWindowsを再起動したときとか。後者はともかく,前者はねえ。
(後者でも普通はならんけど)

> あと、設定が初期状態になるってのがよく分からない。
> レジストリに設定持ってるから、そこまでは消えないと思うんだけど。

ツールバーをドッキングを外して(浮かせて)置いておいたり,使わないのを
消したり,あと,表示を読み込み時○%/認識後○%とか,ウインドウを上下に
配置,とかを変えて,強制終了させてみたら分かると思う。
よく分からんのはフォントの設定なんかはちゃんと残ってるんだよな。

報告しようとも思ったけど,長くなるのでメンドイしそのうち直るだろう・・
と思ってもう5年だ・・・(Ver.4の頃からだよ)
478名無しさん@お腹いっぱい。:03/03/22 02:32 ID:ed/eMkJ3
>>477
> 「このアプリケーションは・・・」のときとか,読んdeを終了しないで
> いきなりWindowsを再起動したときとか。後者はともかく,前者はねえ。
> (後者でも普通はならんけど)

前者は状況がよく分からなかった。
後者はこっちでは落ちなかった(2000 SP3)

> > レジストリに設定持ってるから、そこまでは消えないと思うんだけど。
> ツールバーをドッキングを外して(浮かせて)置いておいたり,使わないのを
> 消したり,あと,表示を読み込み時○%/認識後○%とか,ウインドウを上下に
> 配置,とかを変えて,強制終了させてみたら分かると思う。
> よく分からんのはフォントの設定なんかはちゃんと残ってるんだよな。

基本的にこのソフトってアプリを終了させたときに設定を保存してるようだから、
この状況(強制終了)だと設定が残らないのもしょうがないと思う。
とりあえず作業する前に自分の好みの設定に全部変えておいて一旦終了。
作業はその後、ってやるしか思いつかないなあ。
毎回毎回変える部分についてはこの場合どうしようもないような気がするので、やっぱり
詳しい状況を伝えて直してもらった方がいいと思う。
特に環境依存のバグだとすると、放っておいてもずっと直らない可能性あるよ。
479474:03/03/22 16:11 ID:LZ6ihM5B
>>478
> とりあえず作業する前に自分の好みの設定に全部変えておいて一旦終了。
> 作業はその後、ってやるしか思いつかないなあ。

一度正常に終了してもそのあとは強制終了すると初期状態に戻る。
もうほとんどあきらめている。
何年も放置されているのはそういうことを
誰もクレームつけてない=修正の必要性低いと判断されているか,
「仕様です」の可能性が高いと思う。
正直,エーアイソフトの技術レベルの低さは身にしみて感じているので,
期待しない。
480名無しさん@お腹いっぱい。:03/03/22 17:58 ID:ed/eMkJ3
>>479
> もうほとんどあきらめている。
> 何年も放置されているのはそういうことを
> 誰もクレームつけてない=修正の必要性低いと判断されているか,
> 「仕様です」の可能性が高いと思う。

つまり、レジストリに保存されてるものまで無くなってしまうということ?
本当だとすると、それが「仕様です」になるわけないよ(笑
さっさと直してもらうが吉。
481名無しさん@お腹いっぱい。:03/03/22 18:30 ID:jfrtTMZe
> 本当だとすると、それが「仕様です」になるわけないよ(笑

AIソフトのレベルが分かってないね〜
482名無しさん@お腹いっぱい。:03/03/24 04:28 ID:sVrCa1Gu
>>474
読んでて思ったのだが、レジストリに保存してあったものが消えてるというのは確実なの?
だとすると、OS側の問題のような気もするが、OSは何を使用?
483名無しさん@お腹いっぱい。:03/03/24 21:34 ID:F70likjX
あ〜仕事疲れた・・・まったく,なんで世の中腐ったコードしかかけないC言語プログラマ
ばっかりなんだろうねっときたもんだ。

>>482
ん?OS?Windows95でも98でも2000でもxpでもなるよ。
ちなみに俺はレジストリに保存されてるなんて主張してないよ。
どこに保存してるか知らんけど,「正常に読んdeココを終了しないと元に戻る」
ことだけは確か。俺としてはこれはもうあきらめるんで,白抜きとか
網掛けを「本当に」認識できるようにして欲しい。(これが目当てでVer.Upしたのに・・・)
484名無しさん@お腹いっぱい:03/03/25 23:36 ID:A1tDR7c4
読んで8使用中なのだが、このスレ読んで9にバージョンうpする気が失せた
485名無しさん@お腹いっぱい。:03/03/26 07:40 ID:0qPBzhyC
んー、ばーじょんあっぷするかちはないこともないけどね。にんしきりつはほんのすこしだけどあがったってじっかんできるし。
しゅうせいをがくしゅうするようになったし。(いまごろ・・ってかんもあるが)
486名無しさん@お腹いっぱい。:03/03/27 02:18 ID:mVNf67XI
で、どうなん?読んde9とe.type8、結局のところ…。
現時点での結論(中間決定)やりましょ。
487名無しさん@お腹いっぱい。:03/03/27 07:20 ID:etNCNrCh
大雑把に言えば読んde9がほんのちょっと勝ち。まあe.Typist9でまたほぼ並ぶだろうけど。
結局,微妙に違う付加機能で選ぶのがよいかと。
488名無しさん@お腹いっぱい。:03/03/28 20:27 ID:MMudxEuV
読んでココの専門用語辞書って、どうですか?
489名無しさん@お腹いっぱい。:03/03/29 00:24 ID:hMzm43Dz
自分にとっては関係ない分野の専門辞書ばっかりですた
490名無しさん@お腹いっぱい。:03/04/03 12:21 ID:54l3YsPV
読んde!!ココ Ver.9、エプ製スキャナにくっついてきた試用版(?)のうpグレードに
4千何百円か払う分には大した不満も出ないレベルって理解でよろしいか。
491名無しさん@お腹いっぱい。:03/04/03 15:52 ID:ZK3I34W5
体験版をダウンロードして自分で判断汁。
492名無しさん@お腹いっぱい。:03/04/05 22:53 ID:2EhXLG2M
スキャンしてアクロバットでPDF化したファイルがかなりあるのですが,

PDFファイルを読みとって,認識したテキスト情報をそのPDFファイル
にオーバーレイしてくれそうなソフトウェアってありますか? 読んで
ココ!はPDF云々とあるから,そうしたtことができるのかな?
493名無しさん@お腹いっぱい。:03/04/06 17:15 ID:OQqco7Dj
e.typistできます。ココもたぶんok。
494名無しさん@お腹いっぱい。:03/04/06 23:31 ID:MqvvIYpa
読んde!!ココで出来ますよ。Adobe Acrobatをお持ちならお勧めです。
e.TypistはAcrobatReaderでもOKですが、処理時間がどえらいかかります。
http://pc2.2ch.net/test/read.cgi/bsoft/996505150/155-157
495名無しさん@お腹いっぱい。:03/04/08 00:43 ID:z+ir4B1h
>493 >494

ありがとうございました。
ココとかは体験版もあるようなので,色々試してから購入を検討してみます。
496読んde!!ココ9の認識度:03/04/08 09:49 ID:lm9YTntz
静  脈 197
4)大きな静脈 Large vein
図7-39 下大静脈などでは,中股は非常に貧弱になり,ところによっては全く欠けている。血
管壁は,薄い内膜と摩しゝ外勝とで構成され,外股には多量の縦走筋が含まれるo
このような太い静脈では,血管にかかる内圧よりも,体の運動に伴う伸縮の方が重要な意味を
もつと考え11れ,外股のよく発達した縦走筋は,体の運動によって一過性にかかってくる引っ張
りの力に対in.するものと考ヌられている{,
付1動静脈吻合 Arteriovenous anastomosis
一般に,動脈と静脈の間には毛細血管が介在するが,時には小さな動脈が直接静脈に連絡する
ことむある,このような連絡を動静脈吻合arteriovenous anastomosisとよんでいる。
このような吻合ほ,毛純血管を通る通常の経絡の分路shuntヒみなされるもので,この部分を
関節することで,毛細血管に送らatる血流をコントロールしていると考えられる。
動静脈吻合は耳・鼻・唇など,熱を放散しやすいところや,胃や腸の粘膜のように活動の盛ん
な時とそうでない時の真の大きい所に多いといわれるt.,また,陰茎海綿体の動静脈吻合は陰嘗の
勃起に関係する(,
図7-40 芋の指先l・こは,ホイヤー-グロツサー器官organ of Hoyer-Grosserとよばれる特殊
な動静脈吻合がみられる.} これは多数の継い動脈と静脈が厚い結合組織の被膜に包まれて,その
(l7てRjiv↑'一 J 、・・J上 JiてLる、
図7-41ホイヤーーグロツ1)一器官の動脈では,中膜の。1,:滑筋細胞の一部が,明るくみえる丸
い核をもった多角形の細胞に変化している。この細胞は上皮様細胞epitheloid cellとよばれる
fr,その働きほよくわか・-)ていないo
また,これらの血管の間には多数の撫髄神経線維があるが,この神経の役割も不明であるo
イヤーーグロツサー器官と同じような構造をもった動静脈吻命が,尾骨の先端の近くにも
2-3桝あり.尾骨小体glomus coccygeumとよばれるo
497名無しさん@お腹いっぱい。:03/04/13 00:59 ID:Etoum/03
すみません、質問です。
OCRソフトで大学の英文の教科書を読み取りたいのですが
スキャナーの解像度はどの程度あればいいのでしょうか。
キャノンの3000Fを考えているのですが、不足でしょうか?
498名無しさん@お腹いっぱい。:03/04/13 01:24 ID:42r4GBqN
>>497
通常は、300dpi
小さい文字なら400dpi

読んでココには600dpiという設定もあるけど、
600dpiを使うことは、今までなかったし、これからもないと思う。

ただ、教科書などの本をスキャンするときは、
真中の部分にピントが合わずぼける。スキャンした文字も少し歪む。
そのため認識率が悪くなる。

ピントの合う深さが長いCCD方式(エプソン)をすすめる。

プリントなど紙一枚ずつスキャンするなら、
コンパクトなCIS方式でもいい。
499名無しさん@お腹いっぱい。:03/04/13 01:56 ID:rtlhB8UG
>>498
わたしなんぞはコピーしてからADFで取り込むが。
500名無しさん@お腹いっぱい。:03/04/13 03:40 ID:Ji/navjY

   . 。 ゜  。゜。 .
  .  ゚  。゜ .゚ 。 :  .           ,.._
   ゚ °  . 。 . ο ゚゜          ( ゚ ∋
  . ゚ o ゚  o 。゜ : o。゚ ;         ノ ノ
  °  . 。  . 。 .゜. :。゚ ゚ο ,,ミ''"~""''( ゚Д゚)<今だ!500ゲットカモォォォォ!!
  ≡≡≡≡≡≡≡≡≡≡⊂;;,.,.,.,.,,,,;;;''つ;;;つ
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
                ズシャァァァアアアッ!!!
501497:03/04/13 19:04 ID:Etoum/03
>>498

即レス感謝です。ありがたいです。
初心者なんで、認識率を高くするには1200〜2400dpi程度必要なのかと
勝手に思ってました。
教えてクンでスマンが
スキャナメーカーにこだわりは無いのですが、キャノンのCCD方式は
エプソンと比較するとOCRに向いてないのですかね?
OCRソフトをe.Typist(アップグレード版)にしようかと考えていたので。

当初はHPのpsc1210複合機を考えていたのですが、添付OCRソフトがReadlris
というソフトなのでエプかキャノに方向転換したんです。
502名無しさん@お腹いっぱい。:03/04/13 21:12 ID:Ds3up9Q+
>>501
CCD方式であれば、
キャノンでもよいと思います。

ドロップアウトカラー機能があれば
蛍光ペンや色ペンでマークしたところを除外できるので、OCRに便利。

読んでココもイータイピストも一長一短なので、
体験版で試してからが良いと思います。
503名無しさん@お腹いっぱい。:03/04/13 23:54 ID:8Vcy+ypi
読んでここ と e.Typist
adobe acrobat writerもってイナイとどういう風に違うのか
教えていただけますか?

readerだけではダメなのかしら?
504497・501:03/04/14 02:42 ID:KyYvpcTE
>>502さん
レスサンクスです。
読んでココとe.Typistの体験版試してみます。
自分はOSがMeなので「読んでココはフリーズすると初期化する」のが不安ですが。

スキャナはキャノンでもOKとの事で、>>498さんの「600dpiを使う事は無い」
とのアドバイスも合わせキャノンの3000Fにしようかと思います。
読んでココは乗換え版がありますけど、e.Typistは乗換え版が無いので
e.Typistエントリーバンドルのキャノンを選択しました。
ドロップアウトカラー機能は、エプとキャノのHPをよく探してみましたが
どの機種が対応しているのかわかりませんでした(スマソ

今週末にでも近所のヤマダで買って来ようと思います。
>>498さん >>502さん ありがと。
505名無しさん@お腹いっぱい。:03/04/14 03:13 ID:QV37K5cB
>>504
> 自分はOSがMeなので「読んでココはフリーズすると初期化する」のが不安ですが。

うちで試した感じでは、必ずそうなるわけではない模様。
「不正な処理を」も出ないような落ち方したときには一度再現しましたが。
506名無しさん@お腹いっぱい。:03/04/14 22:47 ID:qV8TA8tB
ひそかにoasysのOCR機能で満足している自分がいる
507山崎渉:03/04/17 12:09 ID:NQuoCQto
(^^)
508名無しさん@お腹いっぱい。:03/04/19 08:52 ID:A4kRSIE0
『読んde!!ココ Ver.8 体験版』をダウンロードしたのですが、
スキャンスナップで読み込んでおいたPDFファイルを自動OCR認識させたいのですが
画像データとして読み込めるファイル形式がBMP、TIFF、PCX、JPEG、PNG、EasyFax
しかなくPDFを読み込めません。体験版だからでしょうか?
過去ログには自動OCR認識できるとあったのですが。
ひょっとしてPDFファイルを表示させてから「画面から取り込む」のでしょうか?
それともJPEG形式で保存してないとだめなのですか。教えてください。
509名無しさん@お腹いっぱい。:03/04/19 09:17 ID:C9l6/TW7
Acrobat(無償のReaderじゃなくて製品版)がいるのでは?
510名無しさん@お腹いっぱい。:03/04/19 12:19 ID:jTRsccnZ
>>508
本体で PDF を扱えるようになったのは Ver.9 からじゃないんだっけ?

ttp://ai2you.com/ocr/product/koko9dl00.asp
511名無しさん@お腹いっぱい。:03/04/19 15:46 ID:Bb1eu+Uh
PDFファイルのOCRは、読んdeココ本体だけではできません。
Adobe Acrobat 4.0/5.0のプラグインとして可能になります。
設定は、スタート→プログラム→読んdeココ→アプリケーション→アドインの追加と削除
で、Acrobatの所にチェックを付けます。
512508:03/04/19 22:49 ID:JRJEd/Im
>509
Acrobatは5.0が付属していました。
>510
Ver.9もダウンロードしてみました。
>511
アドインの追加でAcrobatにチェックつけました。

それでも読み込めませんでした。
513名無しさん@お腹いっぱい。:03/04/20 00:00 ID:ERt9xenj
>>512
ちゃんと Acrobat から使ってるよね?
514名無しさん@お腹いっぱい。:03/04/20 01:04 ID:SHqlBddN
体験版にもヘルプとマニュアルが付いているので、まずはそれを読んでくらはい
515読んde!!ココ9:03/04/20 03:16 ID:2BAuplZb
 ヒット曲・名曲を網羅。八神純子、究極のベストアルバム! デビュー当時に作った未発表曲「小さなさくら貝」は必聴!
八神純子ベスト
思い出は美しすぎて/雨の日のひとりごと/みずいろの雨/想い出のスグノーン/Mr.メトロポリス/ポーラースター/
パープルタウン/Be My Best Friend/Mr.ブルー/夢見る頃を過ぎても/T’mA Woman/サマーインサマー/LONELY GIRL/NATURALLY/FULLMOON/小さなさくら見(未発表曲)
「大都会」をはじめヒット曲を網羅。クリスタルキング、究極のベストアルバム!幻のシングル、「ナオミの夢」を含む大人のための16曲。
クリスタルキング
      ベスト大都会/廣気楼/処女航海/明日への旅立ち/PASSION■LADY/Church/セシル/3秒の誘惑/メモリー/愛情AGAIN/愛をとりもどせ!!/Mo0n Light/海南風/時流/LASTRUN/ナオミの夢(未発表曲)
「待つわ」をはじめシングル曲を網羅した
 あみん、究柘のベストアルバム!
あみんベスト
待つわ/塊泊色の想い出/ペパーミン
トの香り/ごめんね/おやすみ/届か
 ない心/心こめて愛をこめて/来夢来
人/冬/あの日の風景/Lover My
Love/つくり笑い/潮の香りの中で/
 白いページの中に/未知標/あなたへ‥
 世良公則&ツイスト、世良公則ソロを集大成。
 ヒット曲を網羅した究極のベストアルバム!
「夢想花」から90年代の近作までを網羅。
 円広志、究極のベストアルバム!未発表曲「虹をつかんで」を含む。
円広志ベスト
ハートスランプニ人ほっち/風のアルペ
ジオ/雪の降る人/着い終列車/ほろ
りと傾いた夜/お前を抱けない夜/大
阪 Broken Heart/無口なジュT)ア/
越冬つばめ/Never Mind/虹をつか
んで(未発表曲)/ギュツと抱きしめて/グ
ランプルーの指先/心が晴れたことある
か/夢想花/静かな戦士
516山崎渉:03/04/20 05:50 ID:0M7Sr/NO
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
517508:03/04/21 00:00 ID:po8vozf6
>513,514
できました。ありがとうございました。PDFファイルをAcrobatで開いてから
Acrobatのメニューバーのプラグインから読み込ませるんですね。
間違っておりました。
518名無しさん@お腹いっぱい。:03/04/23 05:18 ID:BbAqmM+f
本をpsc 750コピーしてscansnap ver.2で取り込んで読んde!!ココ Ver.9で
変換してレポート作成しようと思っているのですが、解読率はイイでしょうか?
519名無しさん@お腹いっぱい。:03/04/23 19:40 ID:OULTXEt7
>>518
psc750で直接PCに取り込んだ方が、文字潰れが減って認識率が低下しにくいと思うけど。
認識率は原稿の状態によってまちまちだから、体験版使って自分で把握した方がいいよ。

しかしレポートが本の丸写しではだめぽw
520名無しさん@お腹いっぱい。:03/04/23 20:09 ID:v0cnMP5H
>>518
ScanSnapのユーザーにもきいてみたら。

プリンタ型のスキャナが…002【ScanSnap!】
http://pc3.2ch.net/test/read.cgi/hard/1043343590/l50
521名無しさん@お腹いっぱい。:03/04/26 21:46 ID:Efjm1Wfg
e.Typistは次のバージョンアップはいつ頃ですかね。
522名無しさん@お腹いっぱい。:03/05/14 12:48 ID:YveZRpzQ
>>521
アクロバットにきちんと対応してくれなければ意味ない
523山崎渉:03/05/22 02:27 ID:Zm+cXUzt
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
524山崎渉:03/05/28 16:59 ID:OoiF6JG1
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
525名無しさん@お腹いっぱい。:03/06/13 23:35 ID:LnK5s31z
OCRで文字認識させる必要性ってあるのかね
PDFだけでいいんちゃうか
526名無しさん@お腹いっぱい。:03/06/13 23:52 ID:LnK5s31z
(リコー)読取物語EX V4
http://www.rsk-tokyo.co.jp/products/software/yomi_exv4/index.html

カラー画像に対応
カラードロップアウト機能で、指定した色を消去してOCRしやすい画像を作成
文字のサイズ・タイプ・スタイル・色・背景色を再現可能
文字認識エンジンを改良、FAXなどのかすれ文字の認識を強化
言語辞書を強化、業界トップクラスの21万語
新語“国土交通省”などや複合語を追加
従来のWord、Excel、一太郎に加え、XML出力を実現
結果の転送先を選ばず、転送先メニューのカスタマイズが可能
「ダイレクトペースト機能」を採用。翻訳ソフトをはじめ、カット&ペーストに
対応しているさまざまなアプリケーションに直接転送することができます。
また、ダイレクトペースト先はユーザーでカスタマイズが可能、
独自のメニューを作成する事が可能です。

どうよ
527名無しさん@お腹いっぱい。:03/06/14 01:09 ID:getU5F45
>>526
読んでココバージョン7ユーザーだが、
リコーの読取物語、良さそうだね。

カラードロップアウト機能は、スキャナについているから不要だけど、
スキャナにカラードロップアウト機能がついていない人は、重宝する機能だと思う。

読んでココの言語辞書は、馬鹿だし、しかも特定の分野に偏りすぎている。
読取物語がそうでないことを期待する。


528名無しさん@お腹いっぱい。:03/06/14 08:16 ID:SUV7UQ+E
バージョン7ですか。そうですか。わかりました。
529名無しさん@お腹いっぱい。:03/06/19 21:55 ID:Nt8URBlH
数式読み取って認識させるのはどうなんでしょう?体験版ではまったく無理でした。
530名無しさん@お腹いっぱい。:03/06/21 01:14 ID:Zs6BG5iC
 \ │ /                              稚内
  / ̄\   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄             札幌旭川
─( ゚ ∀ ゚ )< にっぽんにっぽん〜!            函館十勝根室
  \_/   \_________
 / │ \                             青森
                                  秋田岩手
                                  山形宮城
                                  新潟福島
                                富山群馬栃木
               島根鳥取兵京都福井石川長山( ゚ ∀ ゚ )茨城
      長佐福岡 山口広島岡山庫大奈滋賀岐阜野梨東京千葉
      崎賀熊大分          阪良三重愛知静岡神奈川
         本宮崎  愛媛香川  和歌山
         鹿児島  高知徳島

沖縄                       ∩ ∧ ∧ ∩/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\∩ ∧ ∧ ∩     \( ゚∀゚)< みんなみんなみんな!
 だいすき〜〜〜!   >( ゚∀゚ )/     |    / \__________
 ________/ |    〈      |   |
               / /\_」      / /\」
                ̄         / /
531名無しさん@お腹いっぱい。:03/06/21 02:32 ID:2Vt4dhGk
読取物語って新バージョン?
値段高いだけで全然使い物にならなくて、今まで話題になることもなかったけど・・・
なんかXPに対応しただけのような
532名無しさん@お腹いっぱい。:03/06/22 21:17 ID:fz5XZixF
そろそろ
e-typistの9が出る頃ではありませんか?
確か毎年7月だったように思いますが。
533名無しさん@お腹いっぱい。:03/06/22 21:46 ID:+P8kwMme
アップグレード版のインストールって
旧式を予めインストールした状態で
上書きするような形で行われるのですか?

それとも、Windowsのアップグレードのように
途中で旧式のCDを認識させるのですか?
534名無しさん@お腹いっぱい。:03/06/22 22:26 ID:hQV66736
>>529
文系なので、数式をOCRにかける機会はまったくありませんが、
体験版でダメなら、製品版でもダメだと思う。

>>531
読取物語の情報は不足してますね。

>>532
そうですね。
読んでココとは、半年違いにして、あえて同時期にはしてないようですね。

>>533
読んでココの場合ですが、
旧式を予めインストールした状態で
上書きするような形で行われます。
535名無しさん@お腹いっぱい。:03/06/22 23:04 ID:JGn0JqGn
読んdeココは予め旧式がインスコされてればそのままOKだし
予め入ってない場合は旧式のCDを要求してくる。
536名無しさん@お腹いっぱい。:03/06/23 14:55 ID:qZwmDBt8
実際どうだろう
読んdeココ!を使ったがなんかいまいちだった
はっきり言って認識率はかなり低い
かなり手直しが必要になる
単に画像として取り込む場合はいいのだろうけどね

OCRは使う人と使わない人に極端に分かれるような気がする



537名無しさん@お腹いっぱい。:03/06/23 15:47 ID:L1u0YyeE
>536
読んdeココ!は、まあまあのレベルと思うよ。
領域設定でも認識率はだいぶ変るし
538名無しさん@お腹いっぱい。:03/06/26 14:33 ID:+um7axpa
初めてOCRを導入することになっていろいろ調べていたら
こんなのがでるらしいです。
これはまだ話題になっていないですよね。
ttp://ai2you.com/ocr/product/onetouch.asp
当方の用途としては、紙の見積書をスキャンしてOCRにかけて
excelに出力して見積書の内容を編集します。
今までOCRを使ったことがないのでよく分からないのですが、
既存の製品(他社を含め)に比べて使いやすいものでしょうか?
発売まで待てば?と叩かれそうですが、急かされているので
既製品とさほど変わらなければそちらの方を使いますので。
539名無しさん@お腹いっぱい。:03/06/26 21:38 ID:qH4Sz19q
入手できないものの使いやすさなんて誰もコメントできないんだがな。

読んdeココは認識が高速だが、図表の認識があまり得意でない。
そこが改善されてるということに利点を感じるなら買いかもしれない。
まずは読んdeココやe.Typistの体験版を使ってみたらどうだね。1ヶ月はタダなんだから。
540名無しさん@お腹いっぱい。:03/06/27 01:47 ID:DAbPKbMD
OCRについては下記スレもご参照下さい。

「OCRのことなんですが… 」
http://pc2.2ch.net/test/read.cgi/bsoft/996505150/294-298

我ながらいぢわるだな〜
541名無しさん@お腹いっぱい。:03/06/27 02:17 ID:DAbPKbMD
いぢわるだけではアレなので、 >>539 さんのいうサイトを見てきた。
あの機能(というか用途限定製品)で\9,800.なら汎用品を奨めるよ。
PDF認識できないんなら致命傷だよ。
見積書って紙で来るか、さもなければメールでpdfでしょ?pdf認識は必須。よって汎用品が必要。

スキャナバンドル版からのアップグレードなら\7,500.で済むし。
汎用品も自動認識させてExcelに転送するだけならほとんどワンタッチだし。

‥と思ってメディアドライブのサイトを見てたら、わ〜い!
「e.Typist ver.9」が発表になってたよ!7月11日発売だってさ!

ttp://www.mediadrive.co.jp/topics/20030620_etypist90.html
542名無しさん@お腹いっぱい。:03/06/27 02:26 ID:DAbPKbMD
奇しくも(狙ってか?)e.Typist9と「ワンタッチOCR for Excel&Word」は
同じ7/11が発売日なんだな。

読んでココ9の初期バグがあまりにひどかったので
ttp://pc2.2ch.net/test/read.cgi/bsoft/996505150/342
e.Typist9の初期立ち上がりも叩こうってか?
543名無しさん@お腹いっぱい。:03/06/27 20:58 ID:Vm1PbCbu
初心者向けナビだとかは既存ユーザーには正直要らない。
PDFの処理スピードと連続処理100枚迄の制限が改善されなければ買う気しないな。
544540-542:03/06/27 23:25 ID:unR4Utp/
>>543

正直、賛成ですね。
自分は過去ログで発狂したようにメディアドライブ社にかみついたe.Typistユーザなのですが、
操作体系が不便すぎるという過去ログのクレームに対応した結果の
「初心者向けナビ」なのでは、とおもっています。

OCRは視覚障害者に固定ユーザが多い(音声読み上げ機能活用)と聞くので
メニューツリーの抜本的改変はできなかったのでしょう(目の悪い人はショートカットを指が覚えている)。
その結果の妥協策としての「初心者向けナビ」なのだとおもいます。

543さんのニーズではPDFの処理スピード(アレも確かに身もだえするほど遅いです)と
大量処理が大きいのですね。

私にとってはメニュー(操作)体系の整合性と英語自動認識のマトモさでした。
今回「13ヶ国語もいらねーよー」なのですが、これは英語エンジンを
別のものに入れ換えた結果の余録と言う事なのだと思います。

なんにせよ、メジャーバージョンアップによる抜本的使い勝手改善に期待していたので
私は今回バージョンアップしてみます。
でも機能向上に比べて動作の重さの苦痛の方が上回っていたら
スグにデグレードして、またぼろくそに言います。
545名無しさん@お腹いっぱい。:03/06/30 19:13 ID:8TStw6U2

―――GT−7000WINS&読んでココから4年余。

CanoScan5000&eTypistにしたのですが、スキャナの頭出し(?)が激遅でへこみました。
当時と比べCPU速度10倍、メモリは16倍になったというのに(´・ω・`)ノシ
何がキヤノンの最新ステッピングモーターじゃあああ
546名無しさん@お腹いっぱい。:03/07/01 19:56 ID:cnXIDh8y
OCRを使ってみた自分なりの感想
まず、その原稿をイメージとして保存しておくのか
テキスト化することを目的にするかによっても調整が違ってくる
特に大事なのが、濃度調整であり、濃度を調整することによって
認識がまったく違ってくるし、認識させる対象によっても当然違ってくる
「e.Typist」「読んde!ココ」「読取革命」も同じような機能であり
もちろん、濃度を数字で表していて手動で自分で決めることもできる
自動実行機能では読取→認識→保存などを自分で選択できる
アドイン機能がワード、エクセル、アクロバットが定番
ただ、文字・図形の認識はソフトによってかなり違う
ある場所では文字として認識するがある場所では画像として認識するなどである
これはやはり個性があるのでどれが良いともいえないだろう
ただ、基本的な機能としてはどれも同じように感じる
まあ自分としてはe.typistが良いように思った
英語であれば「OmniPage」がいいんだろうね[ちょっち高い!]
http://www.hulinks.co.jp/software/omnipagewin/index.html
547名無しさん@お腹いっぱい。:03/07/01 22:04 ID:eD63doMp
ねぇ、JUSTSYSTEMの一発OCRpro(だっけ?)ってどうなの?
体験版はかなり賢かったんだけど。
548名無しさん@お腹いっぱい。:03/07/02 08:55 ID:D5Yu0ktP
e.typistはアクロバットへの対応はまともになったんだろうか?
体験版も機能制限を付けて誤魔化さざるを得なかったPDFの処理スピードと連続処理100枚迄の制限!
まさか1年もかけて読んでココにはかないませんとは言えないよね。

549名無しさん@お腹いっぱい。:03/07/04 13:55 ID:wbdyG1y0
完全なOCRに成るまでは、アクロバットで保存することにした!
でも600dpiだとでかいわなー
読んでココ8買ったけど、結局いまいちでバージョンアップしても
大して変わらなかったら金のむだになるしなー
550名無しさん@お腹いっぱい。:03/07/04 19:40 ID:KamFImkc
>>547
一発OCRpro 読んde ver9 e.typist ver8 で比較してみた。
ちゃんとした書類の認識はどれも大差なかったんだけど
デジカメで撮った80万画素の画像に関しては、一発OCRproが一番認識が良かった。
画像のコントラストやら、明るさをソフト側で簡単に変えられるのがいい感じ。
その他辞書などは、読んdeの方が上と感じました。
用途によっては使い道もありそうでした。
551名無しさん@お腹いっぱい。:03/07/04 20:18 ID:LWPwHES2
>>550
デジカメで撮った画像をOCRにかけるなら、
パナの読取革命がいいらしい。

紙面と平行に撮らなくても、補正機能がついていて補正される。
これが読み取り制度を向上させる。
552名無しさん@お腹いっぱい。:03/07/04 21:10 ID:KamFImkc
>>551
教えて下さってどうもありがとうございます。
早速体験版を入れてみたのですが...。
比較しようと思い、一発OCRproを起動させた状態で読取革命を起動させようとすると
既に起動中です、というメッセージが。
終了させて、革命を起動させてみると、そっくりというか同じ物?。
細かな違いはあるものの、殆ど同じソフトでした。
読み取りが上がると思って喜び勇んでたのに。
店頭で買わなくって良かったと思う事にしました。
553名無しさん@お腹いっぱい。:03/07/05 10:46 ID:3nKC9E7q
どちらもパナソニック ソリューションテクノロジーが作ってるからでしょ
http://panasonic.co.jp/pss/pstc/
http://www.panasonic.co.jp/masol/iocrpro/index.html
554名無しさん@お腹いっぱい。:03/07/06 00:31 ID:6e8B7NnU
なるほど、そういうことなのか。
555名無しさん@お腹いっぱい。:03/07/13 21:57 ID:9u20bgE0
e.Typist9買いに行ったら7/25に発売延期だったのねん。
有楽町とアキバを巡って土日をむだにしちゃったのねん。
こんなことなら新宿ヨドバシでデモを見れば良かった。
556名無しさん@お腹いっぱい。:03/07/14 18:14 ID:65bcPWYD
こちらの方がアクティブだと聞いて、
http://pc2.2ch.net/test/read.cgi/bsoft/996505150/
から飛んできました。

通常の3倍の精度で認識する「シャア専用OCR」のようなものがあって、
限られた場所で使われていたりするのでしょうか?
557名無しさん@お腹いっぱい。:03/07/14 23:11 ID:awwjwS62
>>555
報告よろ

>>556
???意味不明
558名無しさん@お腹いっぱい。:03/07/14 23:22 ID:65bcPWYD
>>557
すみません。意味不明な上に板違いだったと思います。

こういうことです。
おそらく、まともな出版社などでは、
電子化されていなかった頃の書籍を、をOCRしてXML化、
とかやっているんじゃないかと思うわけです。
そういう所でも、読取革命とかの民生品が使われているのだろうか?
ということです。
559名無しさん@お腹いっぱい。:03/07/14 23:23 ID:/yLiU4tg
最高画質&無修正画像満載!!今すぐクリック!!
http://www3.free-city.net/home/espresso/au/sweety.html
560名無しさん@お腹いっぱい。:03/07/15 00:02 ID:UvDmf9jH
>>558
たぶん、市販品だと思います。

デフォルトでは、新聞の活字を正確に読めるようチューニングしてあるような
感じがしますが、
根気よく、カスタマイズすれば、ほぼ100%に近い認識率になります。

結局、カスタマイズが必要だと思います。
561558:03/07/15 00:40 ID:wVihC2/i
>>560
チューニングの話は、参考になりました。
業界の実態については、別板/スレで聞いて見ます。
それにしてもOCR系のスレは、英語板のものも、この板のスレも
非常に友好的ですね。
562名無しさん@お腹いっぱい。:03/07/15 02:31 ID:UvDmf9jH
出版社が、同じ活字を使っているなら、
いったんチューニング(カスタマイズ)をしてしまえば、楽でしょうな。

個人的な感想だけど、カスタマイズしやすいのは、読んでココかな。
ただ、専門辞書の精度はあまりよくないから、
使わないほうが認識率がかえってよかったりする(爆

OCRソフトのくせを知ることが認識率向上に役立つんでしょうな。
563山崎 渉:03/07/15 11:18 ID:2Qopm1E5

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
564名無しさん@お腹いっぱい。:03/07/15 20:13 ID:vdalT2bv
e.Typist9売ってなかったんだが
565名無しさん@お腹いっぱい。:03/07/24 01:13 ID:7x21ZpH/
>>564
発売日は25日に延期されてるよ
http://www.mediadrive.co.jp/whatsnew/index.html#20030707

体験版はもう落とせるよ
566名無しさん@お腹いっぱい。:03/07/24 19:47 ID:9BRRbiB+
LAOXにはもう置いてあった
567名無しさん@お腹いっぱい。:03/07/25 03:15 ID:GXWHgwR4
eTは、表のラインと
文字の上部が微妙にかぶっていると
正確な認識を行いません。

OKRなら、読み取れるだろうか。
とりあえず体験版でも試してみるか。
568名無しさん@お腹いっぱい。:03/07/25 06:16 ID:y8hrVXqp
今どきOKR使ってるヤシなんていないだろ
569名無しさん@お腹いっぱい。:03/07/25 18:58 ID:7TOPeGTK
読んでココは、半角英単語のユーザー辞書への登録が
裏技を使わなければできないのを何とかして欲しい。
(辞書登録モードではなく、置換モードの登録ボタンを使うと登録できる)
570名無しさん@お腹いっぱい。:03/07/25 20:15 ID:u1VJcNUt
>>526にあるところで体験版と修正版インストールしたら試用期限がなくなっちゃったんですけど
どうすればよいですか。
571名無しさん@お腹いっぱい。:03/07/26 09:16 ID:lAOwQf+N
揉んでここ
572名無しさん@お腹いっぱい。:03/07/26 16:01 ID:XgJVtueW
読んde バンドル版 v.s. e.Typist9体験版,徹底比較中
どっちが間違いが少ないか,シロクロつけたる

で,

●濃度調整
●辞書カスタマイズ
●解析力

カギはどれ?
573名無しさん@お腹いっぱい。:03/07/26 16:35 ID:LsX96gK3
ココのバンドル版は激しく機能少ないよ。
ココにも体験版無かったっけ?

574_:03/07/26 16:40 ID:kYKy6M2Y
575名無しさん@お腹いっぱい。:03/07/26 16:52 ID:XgJVtueW
>573

あった。
http://ai2you.com/ocr/product/koko8dl00.asp

さっそくためし樽
576名無しさん@お腹いっぱい。:03/07/26 16:55 ID:K57Jygwr
http://homepage3.nifty.com/coco-nut/
ヌーブラってエロくねーか?
577名無しさん@お腹いっぱい。:03/07/26 17:09 ID:XgJVtueW
>572

> ●濃度調整

プレビュー後に濃度調整できる点で,eTの勝ち?
(あと,ココは設定インターバルが荒いのもマイナス)
578名無しさん@お腹いっぱい。:03/07/26 18:35 ID:XgJVtueW
読んde 体験版 v.s. e.Typist9体験版

◆第1ラウンド結果

読んde 体験版・・・認識早いんだけど,頭悪い
e.Typist9体験版・・・頭そこそこだけど,ごちゃごちゃしている

甲乙つけがたいな。

579名無しさん@お腹いっぱい。:03/07/26 19:11 ID:Ph4VkH+2
時既に遅しだが、>>575のバージョンは旧い。最新版(読んdeココ9)のはココ
http://ai2you.com/ocr/guide/experience.asp
事後修正と同時に認識辞書へ自動登録できるので、使い込むほどいい感じになる
580名無しさん@お腹いっぱい。:03/07/26 21:03 ID:XgJVtueW
>579
情報ありがとうございます。

さっそく試しました。

「認識率100%」どうやらは無理のようなので,
いかに修正がしやすいかがカギといった感じでしょうか。

そうすると,

読んde 9体験版・・・テキストエディタが速くて使いやすい。
e.Typist9体験版・・・修正のためスキャン画面を見ながらやる場合,いろいろ工夫あり。
ただ,エディタの変換スピードが遅いぞ。。。なんかデフォルト設定があるのかな?

認識率はどっこいどっこいかなあ。
ちょっとだけ読んde 9が良いように感じるのは,
読み込みスピードが速いのでそうかじるのかもしれない。
581名無しさん@お腹いっぱい。:03/07/26 21:12 ID:LsX96gK3
読ん de!! ココのエディタ部分ってどう?
正直もうちょっと高機能にならないかなあと思うんだけど。
今 undo 1回でしょ?
足りる?
582名無しさん@お腹いっぱい。:03/07/26 21:20 ID:XgJVtueW
undoか。

確かに1回だけだ。
でも re-doがないぞ。
いいのかあぁ...


エディタは速いのが命。
583名無しさん@お腹いっぱい。:03/07/26 21:22 ID:XgJVtueW
と思ったら,e.Typist9にもre-doはなかった(獏)
584名無しさん@お腹いっぱい。:03/07/26 23:23 ID:HSlkpPaX
Acrobat6のOCR機能はどう?
Acrobat6Pro持ってるんだがスキャナが壊れたんだよね・・・
精度いまいちなら読取革命バージョンアップするかな。
585名無しさん@お腹いっぱい。:03/07/26 23:48 ID:XgJVtueW
読んde 体験版 v.s. e.Typist9体験版
◆第2ラウンド結果

う〜ん。分からん。
とりあえずの結論は,

・読んde は,エディタ派
・e.Typist9は,ビジュアル派

読んdeは使ってくるうちに味が出てきそう(な気がする)。
e.Typistは,あまり大量に作業しなければ,ビジュアル的に優れている(ような気がする)。

・・・・・

ただし,そんなことよりもはるかに大事なことが分かった。そもそも,
「スキャンする書類を増やさないこと」
が,当たり前のことだが,結局最も効率的である(とこれはちょっと自信がある)。

スキャンする前に,
「本当にスキャンするの?何のため?」
と3回ぐらい自問することにしよう。

#また,何日かしたら結論変わるかも...
586名無しさん@お腹いっぱい。:03/07/27 02:57 ID:2Uv8kQqA
まず,用途を分けることだな。

(1)あくまでテキスト化する
(2)イメージ化してそれまで

あと,量的に,

(A)大量にスキャニングする
(B)数枚しかスキャニングしない

(1)かつ(A)ならば,スペック的なものよりも,
スキャニングの要領,手際の問題だと思う。

(1)かつ(B),または(2)であれば,
はっきり言ってどこでも一緒じゃないの。
587名無しさん@お腹いっぱい。:03/07/28 01:57 ID:cHVgq55o
>>584
自己レスですが・・・

比較的単純なレイアウトならそこそこ認識しますが日本語の認識はおまけ程度のようです。
Acrobat6から追加されたインデックス作成を紙文書に対してお手軽にって感じでしょうか。
OCRそのものはAcrobat6が行っているのではなく、PaperCaptureサーバに送信して行ってるのかな?

読んde、e.Typist、読取革命どうすっかな〜
588名無しさん@お腹いっぱい。:03/07/28 11:10 ID:faeV2dIM
公式ページに比較サンプルがある>>584
http://www.adobe.co.jp/products/papercapture/pdfs/OCR_Sample.pdf

これを見る限り、Paper Caputure Plug-inを常用しようという気にはならないな。
Acrobat6.0に同梱されるようになったらしいが、あまり有り難みを感じない。
589名無しさん@お腹いっぱい。:03/07/28 19:46 ID:kDnxbndG
久しぶりに読んde!!ココ使ってみたけど,つくづくデタラメな作りだな。
「No.」なんか絶対正しく認識しないし,文末ってわかってるのに
「。」にならずに0とかoになるし。ホント,認識率向上を小出しにして
毎年バージョンアップさせようっていう意図が見え見えだ。
と,いってもe.Typistとかもおんなじなんだけど。
思い切ってちょっと高いのを買ったら認識率はストレス無くなるんだけど・・・うーむ。
590名無しさん@お腹いっぱい。:03/07/29 12:24 ID:v/BNXW29
>そういうグチはメーカーに家。
591名無しさん@お腹いっぱい。:03/07/30 11:54 ID:9J05g+mo
読んde 体験版 v.s. e.Typist9体験版
◆第3ラウンド結果

きれいな空気を吸って仕事しているのは読んでココか。

読んde 体験版・・・長野+別府
e.Typist9体験版・・・東京目黒区?

------------------------------------------------------
商号 エー・アイ・ソフト株式会社

代表取締役 北沢 昇
設立 1984年2月
資本金 4億9,900万円
社員数 115名(2001年1月末現在)
事業所 【本社】 〒390-0863 長野県松本市××
【東京事業所】151-0061 東京都渋谷区××××
【別府開発分室】〒874-0011 大分県別府市××××
関連会社 セイコーエプソン株式会社
取引銀行 みずほ銀行(松本支店、新宿新都心支店、新宿西口支店)

------------------------------------------------------
社名 メディアドライブ株式会社

代表者 代表取締役社長  松村 博
設立 平成3(1991年)年11月
資本金 4億円
従業員数  100名
所在地
本社・営業本部 東京都目黒区××
取引銀行 りそな銀行 渋谷支店   UFJ銀行 渋谷支店
592名無しさん@お腹いっぱい。:03/08/01 13:23 ID:ClxfqET9
e.Typist9体験版
pdfファイル100ページ認識した後、
何も出来なくなるのは?
どうやって使うの?
593名無しさん@お腹いっぱい。:03/08/01 14:05 ID:ULRzsUY8
>592
99ページごとに考えるべし。
594名無しさん@お腹いっぱい。:03/08/01 18:21 ID:F3Qu7s7G
100枚制限はver.9でも改善されなかったのか…
595名無しさん@お腹いっぱい。:03/08/02 12:15 ID:EHfjkJAM
英文限定でいいから
日本の製品じゃなくて世界全体で含めて
もっと制度が良いのってないのかな?
596名無しさん@お腹いっぱい。:03/08/03 11:43 ID:PEBPzpJP
>>593
99ページまで認識なんてことできるの?
597名無しさん@お腹いっぱい。:03/08/05 15:38 ID:4KA9Evtd
>>596
読んでココはできるが、
e.Typist9ではできないみたい。
598名無しさん@お腹いっぱい。:03/08/05 20:38 ID:6U3KufFd
表の罫線と文字がかぶっていてETYPISTでは読めないけどOKRなら読み取れるのか?
599名無しさん@お腹いっぱい。:03/08/10 15:44 ID:eIQnM+Nw
Eタイピストってのを買えば、スキャンしたjpgをテキストにできるんですか?
OCRとしてではなくグレースケール、150dpiとしてとりこんだ白黒文章です。
600名無しさん@お腹いっぱい。:03/08/10 19:32 ID:W2Qnxors
600(σ^▽^)σゲッツ!!
601名無しさん@お腹いっぱい。:03/08/10 21:31 ID:WjPZpfJ5
>599

スキャンする対象が写真集だったら、
それがtext化されるとなると、これはすぎいなぁ。。

新しい暗号化ですか?
602名無しさん@お腹いっぱい。:03/08/12 14:46 ID:3VtLyXtf
読んde 体験版 v.s. e.Typist9体験版
◆最終ラウンド結果

読んdeの勝ち。アップグレード版購入手続き完了。

決め手は...e.Typist9体験版の使用期限が先に切れたから(爆)。

能力的にはどっちでもいいと思う。
だからスペック比較に労力を使うよりは,
スキャニングのときどうやったら手が疲れないかとかを
考えた方がよっぽど生産性が上がるよ。

あと,ソフトの「見た目」は読んdeの方がシャビーだと思う人が多いと思う。
それだけに「実力は上」と見えるのかもしれない。
(どうでもいいことだが)

ということで,これからは読んdeココでガンガンスキャニングすることにしよう!
603名無しさん@お腹いっぱい。:03/08/13 03:05 ID:khqM+yD7
前にe.Typist 8 の日英自動判別がうんたらと文句を言った者だが、
e.Typist 9 を発売スグに買ってちびちび検証中。
v.8からの改善姿勢に真摯なものを感じて、メーカーに好感をもっているよ。
メニューツリーや環境設定も工夫して配慮してくれているし。

なおも私から提案があるけど、長ーくなりそうなのでゆっくり作文中。
また、日英自動判別は未だにナゾな挙動である。
メーカーサポートがメールを受け付けてくれたらテストに使った画像と
各パラメータ組み合わせでの挙動結果の表を送りたいところだけど。

逆に言うとe.Typistはメニューの整理と細部のチェックボックスの挙動以外は、
すなわち画像修正、領域設定、テキスト訂正といったメインのキモになる部分は
既にかゆいところに手が届くきめ細かなものになっててあんまり直すところがないとも思う。
いかにビギナー・フレンドリーにするかが今の主戦場のようで。

店頭で「名刺ファイリング・ソフト版」を見たので(なぜかWebには載ってない)
今度はこれも買おうかなーとも思ってる。\5000くらいで安かったし。
604名無しさん@お腹いっぱい。:03/08/13 22:05 ID:khqM+yD7
というわけで、ちびちびいじってるとまた不思議な現象を発見した。>e.Typist9
A3判のpdfを画像読込みさせると左下からA4判サイズ相当分の面積しか
読み込まない。
605名無しさん@お腹いっぱい。:03/08/13 22:18 ID:b2IaAfna
読んdeココ最強伝説
606名無しさん@お腹いっぱい。:03/08/13 22:24 ID:ZefQNn/0
ところでeTypis9でPDF処理は速くなったんでしょうか?
607名無しさん@お腹いっぱい。:03/08/14 20:14 ID:cxdTuGlC
>>606
その前に100ページのpdfファイルは
どうすればいいの?
早いとか遅いは動き出してからの話。
608名無しさん@お腹いっぱい。:03/08/14 23:26 ID:503Fd86x
50ページずつ半分こして、
認識結果のテキストになってからエディタやワードでくっつけたらいいじゃん。

あ、acrobat readerじゃページの削除できなかったっけ?
わたしはいつもAcrobat(製品版)なので‥。
でもそこまでのヘビーユーザなら製品版買った方が良いよ。
100ページなら軽量高圧縮化も効果はでかいと思うし。
609山崎 渉:03/08/15 22:20 ID:UXJlgIYb
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
610山崎 渉:03/08/15 22:26 ID:UXJlgIYb
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
611名無しさん@お腹いっぱい。:03/08/16 04:43 ID:eRZuBWK5




               結論。 手書きが一番













612名無しさん@お腹いっぱい。:03/08/16 14:33 ID:7Abuhn+B
現在この手のソフトは俺の書いた汚い字でも認識できるほど性能がいいでしょうか?
まあ汚い字とはどれぐらいかというと、一応読めるという程度の字です。
613名無しさん@お腹いっぱい。:03/08/16 14:41 ID:pV1YRoSq
>>612
>>612
ocrって活字認識なので手書きは難しいと思う。
その活字ですら誤認識するくらいだから。
ザウルスとかのデバイスは、文字の形状や画数、筆順などを用いて変換しているので
スキャンした文字の認識はコンシューマー製品ではあきらめた方がいいと思う
614名無しさん@お腹いっぱい。:03/08/16 14:44 ID:7Abuhn+B
>>613
なに?そうなのか?
なかなか難しいんだね・・。

まだまだ夢の技術か。
615名無しさん@お腹いっぱい。:03/08/16 15:19 ID:EU20IYQl
漏れの場合は,手書き文字を「意外に」読み取ってくれるのでびっくりしている。
別に,活字でないといけないわけではないのだろう。ただ,安定はしないけどね。

616abc:03/08/16 16:24 ID:lcwdfFuC
お気に入り集 ☆
http://beauty.h.fc2.com/
617名無しさん@お腹いっぱい。:03/08/18 23:57 ID:82mf4x3y
数字などは、けっこう正確に認識できるようですよ。
このつぎは、アルファベットの認識率の向上、
そのつぎは、カタカナの認識率の向上と…
技術の進歩は進んでいくのでしょうね。
618名無しさん@お腹いっぱい。:03/08/26 00:08 ID:WeYpkGOd
保守
619名無しさん@お腹いっぱい。:03/09/02 18:40 ID:J4Vjtm0L
2chの人は色々と悪いことを知っていそうなイメージです。
OKREADERの体験版有効期限15日を過ぎても
ソフトを生かす方法も知っていそうですね。
どう?わかる?
おれは、レジストリ内の何かを弄くると思うわけですが。
いかがですか?

あ、製品版購入とかOSのサイインスコとか無しね。(゚∀゚ )
620名無しさん@お腹いっぱい。:03/09/02 18:41 ID:w/LJvdEr
長瀬愛ちゃんがセーラー服姿で大奮闘!小さな身体にルーズソックスがよく似合います。
お得意の騎上位での腰振りは必見です!!今すぐサンプルムービーで確認だ!

http://66.40.59.77/index.html
621619:03/09/02 18:44 ID:J4Vjtm0L
なんであげるとこういう変な書き込みが来るんだろうね。
まったく。
622名無しさん@お腹いっぱい。:03/09/02 21:10 ID:ZLZS/sos
>619

ローカルルール:

アプリケーション・ソフトウェアについて、設定・使用方法などの情報交換をする板です。
違法コピーやシリアルナンバーを求める投稿は禁止です。関連の質問も控えてください。


通報しました
623名無しさん@お腹いっぱい。:03/09/02 22:10 ID:MomzfWyi
ワンタッチOCRではADF連続読みとりを使用することは出来ないようですね。
624名無しさん@お腹いっぱい。:03/09/12 10:35 ID:oEQAyE4g
機械図面画像をOCRソフトで読ませて
その画像の中に書いてある番号とその番号の座標を取得する機能を持ったソフトって有りますかね?
┌─@

上の図の1を認識してその座標を取得するって事なのですが・・・。
625名無しさん@お腹いっぱい。:03/09/12 11:27 ID:SnsZlTx/
>>624
番号と番号の座標(位置?)くらいなら、
どのOCRソフトでも大丈夫じゃない?

@を@と読まさずに、1と読ませたいなら、
認識文字フィルタそのものを修正設定してもよし、
置き換え機能を使ってもよし。

位置なら、pdf出力か、word出力すれば、原稿と同じ位置になる。
626624:03/09/12 13:00 ID:oEQAyE4g
>>625
なるほど、と言うことはCSV出力とか出来るソフトなら
認識した文字 , X座標 , Y座標
の用に作れそうですね。
ありがとうございました。
627名無しさん@お腹いっぱい。:03/09/13 16:29 ID:CpwLBpPg
座標を取得するって、「x行目x桁」を出力ってこと?
それは無理じゃないかなあ‥。

認識後にテキストエディタで「x行目x桁」を目視確認しかないのでは‥。
私が質問の意味を理解できてないのかな?
628名無しさん@お腹いっぱい。:03/09/13 16:32 ID:CpwLBpPg
図面画像を強引に文字領域として読ませると
恐ろしいテキストが生成されそうにも思える。

メディアドライブのHPで店頭デモやってる日時を調べて
実験させてもらってからのほうがいいかと。
629名無しさん@お腹いっぱい。:03/09/14 11:46 ID:t58KXLHW
とりあえず体験版でやってみそ
630名無しさん@お腹いっぱい:03/09/19 22:13 ID:UveTDpYY
どうでもいいが、
ソー糞ネクストから
OCR2種類(名刺のと普通の)でます
中身は松下の現行の奴です
1980円です
どーよ
631名無しさん@お腹いっぱい。:03/09/20 15:17 ID:arpvJjQE
安!
632名無しさん@お腹いっぱい。:03/09/20 15:36 ID:1RIc18HZ
>>630
安いけど、
認識精度はどうなん?

安かろう、悪かろうってことは
633名無しさん@お腹いっぱい。:03/09/20 15:48 ID:k4S9YOJv
>632

ソースネクストです
驚という単語が先頭に無いからフリー以上ではあると思います。

安い仕入れてみたら?
ただし不安定になっても知らないけど((((((;゚Д゚))))))ガクガクブルブル

634名無しさん@お腹いっぱい。:03/09/23 23:39 ID:+15HyemS
名刺だけOCRできてもねぇ
635名無しさん@お腹いっぱい:03/09/27 22:35 ID:bszkHOHM
ソー糞のソフトですが名刺のOCRも普通のOCRも発売されてます.
中身は松下の〜革命(読取革命,名刺読取革命)の現行バージョンのはず(未確認).
で,松下の〜革命って精度どうなんだろう?
636名無しさん@お腹いっぱい。:03/09/27 23:29 ID:ZPEvlpM7
>>635
半年ほど前の雑誌の比較実験記事によると、
松下の読取革命が認識精度1位だった(素材は新聞だった)。

OCRにかける素材(活字)によるから、
別の素材(名刺・雑誌・教科書)だったら、順位は入れ替わるでしょう。

だから、認識率の点からすれば、どの会社の製品を選んでも大差はない
と思う。

使い勝手の良さ、カスタマイズのしやすさ、独自機能などを見て
好みで選んでも大丈夫だと思う。
637sage:03/09/30 19:58 ID:QHono0hN
質問すます。
eTypistの辞書登録を次バージョンへ引き継ぐことはできるのでしょうか。
体験版を使用した限りではそのような機能を見つけられなかったのですが。
638sage:03/09/30 20:00 ID:QHono0hN
質問すます。
eTypistの辞書登録を次バージョンへ引き継ぐことはできるのでしょうか。
体験版を使用した限りではそのような機能を見つけられなかったのですが。
639sage:03/09/30 20:01 ID:QHono0hN
質問すます。
eTypistの辞書登録を次バージョンへ引き継ぐことはできるのでしょうか。
体験版を使用した限りではそのような機能を見つけられなかったのですが。
640sage:03/09/30 20:12 ID:QHono0hN
質問すます。
eTypistの辞書登録を次バージョンへ引き継ぐことはできるのでしょうか。
体験版を使用した限りではそのような機能を見つけられなかったのですが。
641名無しさん@お腹いっぱい。:03/09/30 20:16 ID:zSfqQ6rr
どこにでもいるような普通の女の子ですよ。
それでも下着なは多少のオシャレをしているのでしょうか。
四つん這いになって、ローターや指でオマンコを
責められてるシーンはいいですね。
あまり慣れてなさそうなフェラがまたイイ。
http://www.pinkschool.com/top.html
642名無しさん@お腹いっぱい。:03/09/30 20:22 ID:UMIGSoJj
>>640
eTypist持っていないから、実際のところはわからないけど、できるはず。
できないと今までの蓄積が無駄になって困る。

読んでココは、バックアップデータをとって、できます。
eTypistも、同様にできると思います。
643名無しさん@お腹いっぱい。:03/09/30 20:25 ID:UMIGSoJj
具体的には、
登録した辞書を、
保存して、
新バージョンをインストールした後、
その保存した辞書を読み込ませればいいはず。

そこまで手順をふまなくても自動でやってくれるはずだけど。
自動でやってくれなかったら、上記の手順で。
644sage:03/09/30 21:12 ID:QHono0hN
>>642,>>643
レスありがとうございました。安心しました。
もう少しいろいろ試してみたいと思います。
645名無しさん@お腹いっぱい。:03/09/30 22:03 ID:xIdfHGJ5
教科書のようにはっきりと書かれた字なら認識しやすい。
図などが入ったり、グラデーションがかかっている中に字があると読まない。
646名無しさん@お腹いっぱい。:03/10/05 05:49 ID:ek5V7nf9
あと、斜体字も誤読するよね。
Word文書なんかによく使われてるやつ。
647名無しさん@お腹いっぱい。:03/10/07 02:39 ID:8B8q1Ttq
読取革命がいいでつ。

安いし、読取精度も高いし、機能も豊富です。
648名無しさん@お腹いっぱい。:03/10/07 03:51 ID:JxWTkhsr
新聞の切り抜きをOCRソフトで読みとってPDFにしたいんだけど
どんなソフトがお勧めですか?
それから、A4サイズのスキャナーで読みとって
後でつなぎ合わせてA2サイズのPDFにするってこと出来ますか?
649名無しさん@お腹いっぱい。:03/10/07 22:27 ID:SF9pRYt7
>>648
前半の質問について
その程度なら、どのOCRソフトでも大丈夫。

後半の質問について
できないことはないけど、めんどう。

個人使用なら、重いPDFより、軽くて加工がいろいろできるDocuworksがおすすめ
650名無しさん@お腹いっぱい。:03/10/07 22:39 ID:rPHw4BPH
PDF作成対応のOCRじゃない場合はPDF作成ソフトが別途必用
651名無しさん@お腹いっぱい。:03/10/07 23:52 ID:3dgY7dDH
下記によると、Excelの認識は読取革命はマズそうだ。

http://academy2.2ch.net/test/read.cgi/english/1029756768/143
652648:03/10/09 06:47 ID:muMhguR2
>>649さん
>>650さん
どうもありがとうです!!
653こんにちは:03/10/17 19:22 ID:z6oNEtw2
スキャナから数ページを取り込んで、たとえば3ページとしましょう
この3ページを三つのPDFファイルに変換じゃなくて
3ページのある一つのPDFファイルに変換のできるOCRソフトってありますか?
教えてください
宜しくお願いします
654名無しさん@お腹いっぱい。:03/10/17 20:15 ID:/ndbp9wK
>>653
読んでココはできるよ。
イータイピストでもたぶんできるんじゃない。
655こんにちは:03/10/18 01:13 ID:YPTYViMa
早速のレスありがとう御座います
いろんなサイトで調べて読んでココとイータイピストがよくでてくるので
OCRソフトの中でこの二つのソフトがよく使われてると思いました
それで今メーカのサイトで調べてみたら体験版があったのでダウンロードしました
明日インストールして試してみます
では
656名無しさん@お腹いっぱい。:03/10/18 02:56 ID:jcGin6vs
>>653
読取革命も出来る。


657こんにちは:03/10/19 13:51 ID:baHUyYMY
読取革命(体験版)をダウンロードしてインストールしたけど
PDFファイルに出力するにはADOBE Acrobat(AcrobatReaderじゃない方)が
ないと出来ないみたいです
あとイータイピストの方は複数のページを一つのPDFファイルに出来ないみたいです
いろいろやってみたけど一ページしか出力できなかった
読んでココは複数のページを一つのPDFファイルに出来たが
ローマ字の認識に弱いみたいです(漢字やひらがななどは全然大丈夫だけど)
他に複数のページを一つのPDFファイルに出力の出来るOCRソフトありますか?
658名無しさん@お腹いっぱい。:03/10/19 14:49 ID:Kz09qX7L
Acrobat買ったら?凄く便利だよ。あらゆるソフトからPDFが出力可能になるよ。
659こんにちは:03/10/19 23:53 ID:baHUyYMY
値段が高すぎますよ!
http://store.adobe.co.jp/shopping.asp?acrobat

複数のページを一つのPDFファイルに出力の出来るソフトは読んでココしかないんですかね?
660名無しさん@お腹いっぱい。:03/10/20 00:13 ID:Yi6Wwe7A
>>659
この際、Docuworksを買ったら?

DocuならOCR機能もついているし
複数のページをひとつのXDWファイルに出力できるし
読んでココにはない機能として、付箋も貼れるし、マーカーで色分けもできる。

配布する相手には、無料のDocuworks閲覧ソフトをダウンロードしてもらえば。
閲覧ソフトっていうのは、アクロバットリーダーと同じよ。
661こんにちは:03/10/20 00:45 ID:oRo9M0V/
情報ありがとう!
体験版ダウンロードして試してみます
662名無しさん@お腹いっぱい。:03/10/20 21:47 ID:mPZLDlHV
>>659
高すぎるかなあ。
35000円くらいでしょ。

PhotoshopとかIllustratorとかとセットのやつを買えば殆どタダ同然だし。

フリーソフトとかでPDF作成できるやつも色々あるみたいだけど、
OCRソフトと組み合わせて使えるんだろうか。

663名無しさん@お腹いっぱい。:03/10/20 22:21 ID:2xCAP3Fm
やさしくファイリング3と大昔のバンドル版読んでココを使っていたが、このスレで、
最新版の変換効率の向上、認識後テキストの縦書き表示、元画像と変換テキストの比較表示
という進化を知ったので製品版を買うことにしました。

読取革命、eTypist、読んでココの体験版を1週間ほどを使って、ふつうの単行本を400ページほど
テキストファイルにしてみました。誤認識の仕方にはそれぞれ癖があるけど、認識能力はどれも賢い。
大差ない。むしろ、どのソフトも操作性に難があって迷った。

感動したのは、元画像と変換テキストの比較表示で、どのソフトにも同様の機能はあったけど、使いやすさは
読取革命(ハイパーチェッカー) > 読んでココ(部分画像) > eTypist(オーバーレイ機能) だった。

また、認識後のテキストを文字種で色分けする機能もすごく便利。ーと一を区別したいもんね。
こちらは  eTypist = 読んでココ >>>> 読取革命(できない?) だった。

結局、up版が使える「読んでココ」を買ったよ。当スレを参考にさせていただきました。
みんな書き込みありがとう。


664名無しさん@お腹いっぱい。:03/10/21 08:28 ID:dxuo/k5k
665名無しさん@お腹いっぱい。:03/10/21 18:52 ID:iWIkIXbh
金に糸目を付けないなら、どのソフトがベスト?
666名無しさん@お腹いっぱい。:03/10/21 22:55 ID:dxuo/k5k
667名無しさん@お腹いっぱい。:03/10/21 23:21 ID:L1JD1Nwl
>>666

糸目つけてるじゃないのw

>>665
> 金に糸目を付けないなら、どのソフトがベスト?

東芝の OCR-V1095 (1100万円〜) が高くていいんじゃない?
認識率とかは知らんが
668名無しさん@お腹いっぱい。:03/10/21 23:24 ID:dxuo/k5k
>>667

糸目をつけなければいいってもんでも(w
669名無しさん@お腹いっぱい。:03/10/21 23:38 ID:L1JD1Nwl
>>668

たしかに OCR-V1095 は郵便局などの業務用だけれども、
リコーシステム開発の 読取物語EX V4 (49,800円)はどうなんだろうね。
2001年発売なので、むしろ、
読取革命、eTypist、読んでココの最新版の
ほうが、よさげ。
670名無しさん@お腹いっぱい。:03/11/02 12:19 ID:dNGKRPj9
をいをい読取革命はアクロバットなくてもリーダーだけでも
PDFファイルに吐けますよ。
体験版だけで上司から借りた本をがんがんスキャンして
PDFにしちゃったもん漏れ。
個人的には長方形化(ゆがんでスキャンされたページを長方形に直せる)が
重宝してるけど、もしかしてeTypist、読んでココにも同じ機能、あるのかな
671名無しさん@お腹いっぱい。:03/11/02 20:11 ID:v+5ApZpO
>>670
確か、その機能は読み取り革命だけの独自機能だと思う。
(読んでココにはない)

デジカメで撮った本(スキャナと比べて画像がゆがむ)を
スキャンするのに威力を発揮するんだとか。
672名無しさん@お腹いっぱい。:03/11/03 00:18 ID:yTOdcjFS
PDFに吐けるのは読んdeココもeTypistも同じ(リーダーも不要)。
ちなみにこの2つはPDFファイルをOCR処理出来るが、読取革命はできない。
そのかわり長方形化は読取革命しかできない。
673名無しさん@お腹いっぱい。:03/11/03 11:52 ID:oHMcr8j3
なるほど。
そんな一長一短があったのか。
教えてくれてありがとう!
>>671、672
674神戸ソルジャー:03/11/04 23:19 ID:oLdSOpPo
手書きの文字をOCRソフトに読み込ませて実用に耐えられますか?
675名無しさん@お腹いっぱい。:03/11/04 23:39 ID:gDJ/V8yw
>>674
試してみたことがあるが、実用には耐えられなかった。
私の書いたカタカナや数字だと、認識率は、100文字中73字。
漢字は更に下がる。
676名無しさん@お腹いっぱい。:03/11/05 00:07 ID:lIoO4yOu
>>675
レスありがとうございます。
100文字中73字と言うのは確かに使えませんね。
677名無しさん@お腹いっぱい。:03/11/05 09:03 ID:y2d2ybfC
eTypist V8を使ってるけど、
EpsonGT8400Uには対応してくれないのか・・・
V9では対応してるが、そのためにアップグレードする気にもならない。
対応機種くらい無償でアップデートさせてほしい。
678名無しさん@お腹いっぱい。:03/11/05 11:48 ID:KaJLewwE
>>674
ttp://www.hammock.jp/teleform/
ttp://www.ctec.fujitsu.com/product/ocr/
「手き」と「OCR」で、ググれば結構ありますね。  試したことはないけど。。。  お試し版はないのかな?
679名無しさん@お腹いっぱい。:03/11/05 16:46 ID:M7Yqy/EV
>>677
対応表になくてもフラットベッドなTWAINスキャナなら普通対応してるよ。
世の中の全てのスキャナをいちいちチェックしてなんかいない。
シートフィード式になると、対応表に無ければ使えるかどうかは微妙だが。
680名無しさん@お腹いっぱい。:03/11/09 23:15 ID:yE2CqevP
小説の文庫本をスキャンして、読んでココ9でOCRしています。
以前お試し版で使った7より認識率はかなーり良くなってて、うまーなのですが、
認識領域の複数ページへの一括登録は出来ないのでしょうか?
たしか以前は出来たと思ったのですが。

タイトルだの、ページ数だのまでOCRしてしまうので、うざいのです
681名無しさん@お腹いっぱい。:03/11/10 01:27 ID:LEnN2Zwx
認識領域テンプレートつくれないのかな?
同じレイアウトの文書で領域指定の使い回しができる機能。
682680:03/11/10 22:33 ID:EOFZlhmR
それが、1枚につき1回ずつ読み込まなくてはいけないようで・・・
そんな作業を数百回繰り返すなんて、気が狂いそうです。
(なんで省力化のためのOCRソフトが、こんな仕様なんだ・・・)
683680:03/11/10 23:14 ID:EOFZlhmR
仕方ないので、藤 -Resizer- でトリミングして、ちょこっとツールを書いて
JPEGの解像度情報を強制的に 300dpi にセットしました。
(藤を通すと、72dpi になってしまうようなので。これも読んでココが、1枚1枚
dpi を聞いて来なければ・・・)

自己解決ですみません。
684名無しさん@お腹いっぱい。:03/11/11 03:53 ID:nmlJnVwe
解決したんならいいですが、
スキャン時に複数ページPDFにしたら全ページ
1テンプレートで行けるんじゃないかな、と
e.Typistの知識で答える私。
pdfじゃなくても jpegでもいいけど。
685名無しさん@お腹いっぱい。:03/11/11 04:19 ID:wE6zXSxP
まぁReadiris最強伝説
686名無しさん@お腹いっぱい。:03/11/12 00:48 ID:DiZ0J2Yx
読んdeココですが、自動実行で連続処理すると500枚で
「これ以上画像リストに登録できません」
とストップしてしまうのを避ける方法ないでしょうか
画像リストを非表示にしてもかわりませんでした。
687名無しさん@お腹いっぱい。:03/11/12 01:00 ID:AcUh7foG
クラックしる
688名無しさん@お腹いっぱい。:03/11/12 01:30 ID:C8q0dQZ9
>>686
それこそ仕様でしょう。ご観念なされよ。
689名無しさん@お腹いっぱい。:03/11/14 16:30 ID:TViPkW0o
読取革命ver.8発売(11/21)
ttp://panasonic.co.jp/pss/pstc/news/20031106.html
ver.7を使用している方、買いかどうかアドバイスキボン
690名無しさん@お腹いっぱい。:03/11/15 13:11 ID:vFgLjBi2
>689

買いです。買ってください
おねがい(;´д⊂ヽヒックヒック
691名無しさん@お腹いっぱい。:03/11/15 13:28 ID:h5ZTULEs
7でワードのオートシェイプに対応した奴だよね?
692名無しさん@お腹いっぱい。:03/11/15 16:06 ID:wtZ/KoX/
読んdeココが信用失墜している今がチャンスだ!戦略価格で売りまくれ!!
693名無しさん@お腹いっぱい。:03/11/16 22:59 ID:W0gTLRVQ
>>689
もってないけど、良さそうだね。
デジカメ対応している点
200dpiでもOCRできる点
辞書が豊富
読んでココから乗り換えようかな。
694名無しさん@お腹いっぱい。:03/11/16 23:43 ID:VtIDst7H
乗り換え版って何か少ないのかな?
695名無しさん@お腹いっぱい。:03/11/17 01:23 ID:5Htx8UZK
>>694
正規版と変わらないと思うよ。
そうじゃないと乗り換えようとは思わんでしょ?
696名無しさん@お腹いっぱい。:03/11/17 01:30 ID:gzqWBvUB
するってぇと正規版て売れるんか?って話になるんだけど。
697:03/11/17 16:33 ID:FBIUXTn5
メディアドライブのやさしく名刺ファイリングって,買った香具師いるか?
OCR機能と電子化機能両方を活用したいわけだが,
どこまで使い物になるのかを知りたい…。

ところで,新聞記事とかはわざわざOCR化させなくてもグレースケールの
イメージで保存しておけば劣化しないしウマーだと思った。
解像度も色々試してみたが,人が見るのなら150dpi程度だと丁度いい。

この機会に電子ファイリングをもっと活用してみたいなぁと。
698名無しさん@お腹いっぱい。:03/11/19 00:48 ID:ZfRTcVe9
>>689
今回は新機能メインと言うより、チューニングメインなんでしょうかね。
で、やっとPDFの入力が可能になりましたか。
しかも、入力ファイルとしてPDFを使う場合はAcrobatやAdobeReaderが
必要ってことはPDF1.5も読めそうな感じ。
果たして複数ページの一括認識はできるんだろうか。

Fax文書の読み込み強化は次バージョンかな?


>>697
OCRかけるのは、スキャン後の検索のためだと思う。
自分はちょっと手間だけど300pdiでスキャン、OCRを行い、PDF形式(透明文字)で保存。
その後リサンプリングを行い画像の解像度を落とす・・・(Acrobatが必要)
と言うことをやってます。
699名無しさん@お腹いっぱい。:03/11/22 02:56 ID:llqsk024
eタイピストエントリーから読取革命ver8に乗りかえってできるの?
乗り換えに必要なものって何?シリアル番号だけでいいの?
700名無しさん@お腹いっぱい。:03/11/22 03:05 ID:llqsk024
700げt
701名無しさん@お腹いっぱい。:03/11/22 15:05 ID:yQpEfzMd
>>699
他社のOCRソフトからの乗り換えはできるって書いてあるよ。
eタイピストエントリーは、eタイピストの初期のバージョン(バージョン2とか)のことだから、
当然乗り換えできるでしょ。

あと、乗り換えには何も必要ないかもね。ノートンのインターネットセキュリティの乗り換え版と同様に。
702名無しさん@お腹いっぱい。:03/11/22 21:22 ID:XBHu4/vQ
>>701
e.Typistエントリーは、スキャナバンドル版の、機能限定版でつ。 CanoScanは、これ(エントリー)が付いてくるよ〜。
703名無しさん@お腹いっぱい。:03/11/23 00:29 ID:XMIa42O2
パナの読取革命とソースの本格読取の違いのわかる方おられますか?
704名無しさん@お腹いっぱい。:03/11/23 04:14 ID:hqqNtI6d
AsianReaderが意外にスゴイ
705名無しさん@お腹いっぱい。:03/11/23 09:06 ID:MVFh83hk
readirisだろ
706名無しさん@お腹いっぱい。:03/11/23 11:53 ID:/EkEOSgU
OCRソフトの購入を考えています。
できればwebサイトをOCRしてテキストに変換してくれるようなOCRを探しています。
業務上日本語の文書がプリントされている画像ファイル(BMPやJPG形式)を複数枚入手、
それをhtmlファイルでレイアウトしながらぺたぺた貼っていく、という作業をふまえています。
そのレイアウト後の状態をそのままOCRで画像→テキストに変換したいと思っています。
こんな感じのOCRはありますでしょうか?
707名無しさん@お腹いっぱい。:03/11/23 12:07 ID:m/evVnxs
>>706
OCRソフトって、スキャンしたものやデジカメで撮ったもの、PDFファイルなどをテキスト変換するものだけど、webサイトをテキスト変換ってのは・・・。
画像をテキスト変換するって、どういうことでしょう?  視覚障害の方のためであれば、OCRって云うより読み上げソフトって感じだし、点字変換ソフトもあったと思ったけど?
708名無しさん@お腹いっぱい。:03/11/23 12:37 ID:QDAsUr95
もしかして「htmlをtxtにする」という用途なんじゃないの
それならOCRとは関係ないよ
709名無しさん@お腹いっぱい。:03/11/23 12:50 ID:Pww078da
画面キャプチャからテキスト変換、なら
読取革命がそううたってる
710名無しさん@お腹いっぱい。:03/11/23 15:24 ID:+pmhRUh4
デジカメ画像についてOCR認識率を向上させる技術
(台形→長方形補正機能、低dpi対応機能など)で、
画面キャプチャについても応用させたんだと思われ
711706:03/11/23 19:59 ID:/EkEOSgU
もう少し正確な用途を書いておくべきでした。
目的はDVDに格納されている字幕ファイルのテキスト化です。
ご存じの方もいらっしゃるとは思いますがDVDの字幕はほとんどが
画像ファイルで格納されています。

その画像ファイル(性格には一場面ごとに字幕ファイルがあるので画像集です)を
頭から順番にhtml化してくれるツールが既に存在しています。
上から順番にセリフがかかれている画像ファイルがずらーっと並べられている状態です。

で、OCRの出番はその後でその画像ファイルで構成されているhtmlファイルを
テキストになおしてほしいのです。そんなことができるOCRソフトってありますでしょうか?
712名無しさん@お腹いっぱい。:03/11/23 21:23 ID:eUkCCcme
>>711
そのHTMLが参照しているを直接ORCにかければいいんじゃないの?

レイアウトって言ったって、どうせサムネイルみたいな感じなんでしょ?
だったら、マクロとかで後から簡単に整形できるでしょ。
713名無しさん@お腹いっぱい。:03/11/23 21:24 ID:w7qwe08I
>>712
間違えた

HTMLが参照している画像を直接OCRに・・・

です
714名無しさん@お腹いっぱい。:03/11/23 23:41 ID:icBfZQtC
それだったら、HTMLを画像にする、キャプチャ系のソフトと組み合わせたらどうかな。
参照画像だと1行づつくらいなので面倒だろうし。

あと、HTML化ツール教えて。試してみたいし

映画の台詞を検索できるようになると面白いかも。
715名無しさん@お腹いっぱい。:03/11/24 00:07 ID:YoepY3YQ
読んdeココの場合は
読み込むファイルが完全に画像のみで構成されてないといけない
つまりその生成されるhtmlにtxtや表が混じらないのならできるはず
716名無しさん@お腹いっぱい。:03/11/24 01:50 ID:tas+J+S9
【提案;1】
<Alt>+<PrtSc>でアクティブウィンドウだけ画面ショット取れるから
それを「ペイント」かなんかにPasteしてbmpで保存、そこまで行けば
大抵のOCRで読める。でも手間が気が遠くなりそう。

【提案;2】
Acrobat(Readerじゃない製品版)を使えばWebページを印刷コマンドでPDF化できる。
そこまで行けば優秀なOCRで読める。
初期投資はかかるが、これが一番手間いらず。
717名無しさん@お腹いっぱい。:03/11/24 01:55 ID:tas+J+S9
【提案;3】
HTMLを印刷しちまえば普通にOCRで読める。
スキャナという投資が必要。

でも、以前DVD関連の掲示板でDVDからテキストで吸い出す
ツールの話があったような‥‥。著作権に触れる話なのですぐ立ち消えになったが。
718名無しさん@お腹いっぱい。:03/11/24 02:54 ID:YoepY3YQ
>>716
そのAcrobat使った場合でも、htmlにtxtが混じってれば
読んdeココ連携は効かないよ
タイピストとかはどうなのか知らないけど

それと吸い出し自体は著作権には触れないと思う
719名無しさん@お腹いっぱい。:03/11/24 04:09 ID:TZ7zIKLg
htmlからPSファイルを作って、bmpなりPDFなりに変換してOCRにかける。
…とか適当なことを言ってみるテスト
720名無しさん@お腹いっぱい。:03/11/24 13:50 ID:AST/A1H9
PDF形式をエクセルに起こせるソフトって?
TWAIN非対応のスキャナーなのでpdfからの読み込みオンリーなのですが
どなたかPDFファイル→エクセルってやってる人いませんか?
(現在アクロバットより新規保存で一枚ずつ TIF形式にて古いソフトに
て加工処理してます)よろしくレスおねがいです。
721名無しさん@お腹いっぱい。:03/11/24 17:49 ID:0aPaMJVX
字幕なんて、1画面せいぜい20文字ぐらいだろう?
OCR掛けるより、タイプしたほうが明らかにはやい
じゃなか!
722名無しさん@お腹いっぱい。:03/11/24 21:36 ID:7AEEyOKG
Eタイピストv9買ったけどやっぱ全然使い物にならん。糞PDF流行りで
余計な出費と時間の無駄が増えた。あんな使えないアドビなんて
とっとと店閉めろ。邪魔だ。手間の割りにデメリットばかり。
ETv9も以前のいい所だけ削除しやがってもうどれもこれも駄目駄目
ソフトのオンパレードじゃ。 アップグレードで 読んでココってか?
多分こいつも駄目だろうな。  もうpdf形式を一枚ずつ tiff形式に
変換して昔のOCRに活躍してもらうしかないな。
しょっちゅうヴァージョンアップばかりしてやがってそんなにてめえらの
ソフトは糞と子供騙しの種か!ボッタクリが!!!!! 
723711:03/11/24 21:39 ID:HjmwjTlL
>>714
SubRipというツールです
日本語の解説ページがあります↓
tp://www2.mt.tama.hosei.ac.jp/~miya_ken/computer/article2.htm

OCRの中にはPDFファイルを読み込んでその中にある
画像ファイルから日本語を起こすことができるものもあるんですか?
それだったら話は早いかもしれません。
Acrobatは所有していますので。
724名無しさん@お腹いっぱい。:03/11/24 23:27 ID:H5Cxi6J3
>>722
文書管理ソフトはアドビのpdfよりDocuworksの方がいいね。
OCRもかけられるし。

国産のDocuworksが流行すればありがたいな。軽快だし多機能だし安いから。
725名無しさん@お腹いっぱい。:03/11/24 23:50 ID:kiV+D0fb
>>724
PDFは文書管理ソフトじゃないし・・・
726714:03/11/25 00:22 ID:O24oYJi1
だめだ、解像度低すぎ+斜体なんてまともに認識しねー

やめやめ
727もう勘弁しlてちょ、 アドベさん。:03/11/25 11:36 ID:L3VrHQSU
どっかの掲示板で 作成したPDFファイルを一括で他のファイル形式(画像
ファイル?)にコンバートできるソフトがあるって書いてあったんだけど
だれか情報ないですか?できたらフリーウェアで。検索で唯一でたのは4〜50万円
くらいの法人向け、、、、なんじゃそりゃ。
728名無しさん@お腹いっぱい。:03/11/25 18:03 ID:+7d42pO4
DocuWorks5.0でプラグインとして使用できるOCRソフトを探しています。

前バージョンのDocuWorks Deskのプラグイン機能では、
複数のOCRソフトの動作が確認されているようですが、
どなたか、5.0で確認した方はおられないでしょうか?
729名無しさん@お腹いっぱい。:03/11/25 22:12 ID:/9IBBFOu
730名無しさん@お腹いっぱい。:03/11/26 00:22 ID:aFvFbbgg
>前バージョンのDocuWorks Deskのプラグイン機能では、
>複数のOCRソフトの動作が確認されているようですが、

?????????????????????????????????????????????????????????
731名無しさん@お腹いっぱい。:03/11/27 15:13 ID:UiZBr+xv
e.Typist8、読んde!!ココ9、読取革命7の3つ(いずれも製品版)を試したが、
読取革命7が一番良かった。

・英文まじりの場合、英字の誤認識が一桁少なかった。漢字の誤認識は3つとも同じレベル
・認識したテキストを元の画像と比較しやすい(>>663)
・認識した文字を、文字種ごとに半角変換・全角変換・自動認識を設定できる

それと、これは一般的にどの分野のソフトウェアでも試金石としてつかえるのだが、

・アプリケーションのインターフェースがまとも。変態的な半角カナ・全角英数をほとんど使っていない
732名無しさん@お腹いっぱい。:03/11/29 11:48 ID:Nj1bOkqv
↓いろんなソフトで訳してみてください。

NEW YORK (Reuters) - An unknown odor that put five New York subway workers in the hospital on Wednesday was not terrorism-related, said police,who have been on the highest security alert since the Sept. 11, 2001 attacks.
"The incident is not terrorism-related," said a police official who asked not to be identified. "No subway line has been shut down or evacuated."

Firefighters and other emergency services personnel were checking the southbound "F" subway line from the Chelsea neighborhood of Manhattan to Chinatown for the cause of the odor in a tunnel, the fire department said.
733名無しさん@お腹いっぱい。:03/11/29 12:52 ID:OHf9mj0S
>732

スレ違いだ馬鹿
734名無しさん@お腹いっぱい。:03/11/29 13:00 ID:yCXnxDA7
>>732
ネタか?(笑)   面白すぎるぞ。
735名無しさん@お腹いっぱい。:03/11/29 13:06 ID:hmXocixc
やべぇ俺のReadirisが誤認識しまくり。
736732:03/11/29 13:34 ID:Nj1bOkqv
しまった誤爆だ。
737名無しさん@お腹いっぱい。:03/11/29 13:50 ID:hmXocixc
そんな事言うなよ。
738名無しさん@お腹いっぱい。:03/11/29 23:05 ID:FRc7iXYs
結局PDFファイルの文字も画像中の文字も両方認識してくれる
OCRで優秀なのはどれ?
739名無しさん@お腹いっぱい。:03/11/30 02:39 ID:CVbWA5Rq
740738:03/11/30 23:31 ID:8ugHxXch
>>739
できれば日本語認識してくれる方がいい・・・
741名無しさん@お腹いっぱい。:03/11/30 23:34 ID:KrwBtnIL
もちろん日本語対応だけど。
微妙に使い勝手悪いんだよな。
しかも俺の使ってるのはhpの複合機にくっついてきた奴w

すまん、つまりネタだ。
でも認識力は想像以上に凄いよ。マルチランゲージ対応で幅が広い。
742新参者:03/12/03 20:22 ID:jTS6u3ZF
「一発!OCR Pro for 一太郎」を使っています。
雑誌の目次をOCRする目的で購入したのですが(スキャナもセットで)、
全くうまくいきません。写真やイラストの多いタイプがうまくいかないだけで
なく、文字の大きさが異なっていたり、段組があったりする白黒のものでも
「領域設定」が、とても細かく勝手に設定され、誘拐犯の犯行声明のような
文字の大きさや種類がめちゃくちゃな文章になってしまいます。
 そもそも、書類をOCRするのって、本でいうと、目次ではなく本文限定
でしていくことが前提なのでしょうか?
743名無しさん@お腹いっぱい。:03/12/03 22:24 ID:PVxMl4Mj
>>742
うん、そう。
文字が「デザイン文字」だと正確な認識は難しいね。
744名無しさん@お腹いっぱい。:03/12/04 18:28 ID://sA3HbW
>742
jpgで保存すれば?
どんな文字でも無問題
745新参者:03/12/10 00:42 ID:GiVT1OyT
結局メーカーの方に電話で相談したところ、「領域設定」の段階で修正せよ
とのことでした。まあ、「手動」でやっていかねばって話で、正直、タイプ
の方が早いことは、やる前から分かってます・・・・
746名無しさん@お腹いっぱい。:03/12/10 05:05 ID:R0WM4SZy
>>745
まー、ソフトウェアってヤシは、完璧ではないのね。  ヤパーリOCRに適したドキュとそうでないドキュがあるのは、しかたなかんべ。(w
747名無しさん@お腹いっぱい。:03/12/21 01:01 ID:N2rrKMTo
この手のソフトで手書きの文字の認識率高いのありますか?
手書きのを一発、OCR Pro for 一太郎 でしてみましたが全滅でした。
印刷物はほぼ間違いなく認識しましたが。
このソフトは優秀な方なのですか?
基本的に手書き認識はどのソフトも不可ですか?
748名無しさん@お腹いっぱい。:03/12/21 02:31 ID:0xEmLI8Q
ここで語っているのは活字OCRであり、
手書きOCRはそういうパッケージソフト・カテゴリがある。
e.Typistの会社が「e.HANDなんたら」という手書きOCRを出してる。
749名無しさん@お腹いっぱい。:03/12/22 15:16 ID:aUPTHrlm
720じゃないですけど、PDFでWeb上に公開されている表を引用したいので、PDFからExcelに変換する機能を持ったOCRソフトを探しています。
OCRソフトに限定しているわけでは無いのですが、他に方法が思い当たらないので、表OCRを使ってみようかと考えています。
表OCRforExcel以外で、PDFからExcelに変換できるソフトってあるのでしょうか?
750名無しさん@お腹いっぱい。:03/12/23 03:12 ID:PP8HkjJg
今時たいていできますよ。
751名無しさん@お腹いっぱい。:03/12/25 23:24 ID:K4YDFV0y
スキャナがボロで300dpiとその上の400dpiでは
読み取り速度がぜんぜん変わってしまうのですが、
認識率は変わりますか?
752名無しさん@お腹いっぱい。:03/12/26 02:24 ID:d7y6Nvtw
>>751
文字の大きさによる。

新聞の活字の大きさだと、
300dpiだとけっこう誤認識するが、400dpiで読み取るとほぼ100%になる。

社内文書の活字の大きさだと、
300dpi十分でもいける。
753名無しさん@お腹いっぱい。:03/12/26 02:28 ID:d7y6Nvtw
>>751
途中で送信してしまったので、もう一度。


文字の大きさによる。

小さい文字(例えば、新聞の活字の大きさ)だと、 認識率はけっこう変わる。
300dpiだとけっこう誤認識するが、400dpiで読み取るとほぼ100%になる。

大きい文字(例えば、社内文書の活字の大きさ、教科書の活字の大きさ)だと、
300dpiでも十分いける。300でも400でも認識率はほとんど変わらない。
754名無しさん@お腹いっぱい。:03/12/28 04:30 ID:iLLgPAk6
e.typist9使用中。
日本語ドイツ語混在の紙論文をワード形式にするため使用。

長所 認識率が高い。日本語もドイツ語もほぼ修正の必要なし。
  

短所 縦書きの文章に横倒しの欧文が混ざっていても、判別してくれない。
   自分で画像を回転させて、日本語とドイツ語を別々に認識させる必要がある。
   
   ドイツ語のüやöがワードに転送できない。ワードパットには転送できるので、
   e.typistのせいではないかもしれない。   
  
紙の活字をテキストに変換するというスタンダードな作業には必要充分だと思う。
755754:03/12/28 04:33 ID:iLLgPAk6
あと、注釈(ルビのような形式)も転送できない。
認識されてはいるものの、ワードに転送されない。
756e.typist:03/12/30 13:44 ID:Uy9jqNPM
複数の文字が一文字で認識されてしまうのですが、
読んdeココ の文字の分離に当たる機能は e.typist には無いのでしょうか?
757名無しさん@お腹いっぱい。:04/01/07 10:28 ID:7HzsU8aP
各社のサポートはどうですか?
メディアドライブは電話がいつも話中。
おまけに出たと思ったら「混んでます」のテープ。それも有料通話。
他もこんなもの?
758名無しさん@お腹いっぱい。:04/01/08 00:38 ID:QoOtIEwY
読んでココのユーザーだけど、
文字の分離機能が読んでココにしかない特殊機能とは思えないなぁ
文字の分離機能なんてOCRソフトの基本機能でしょ

サポートには、電話ではなく、メールにしている。
OCRソフトのメーカーではないけど、
メールだと1日以内に回答されてきたね(ラトック、アイオーデータ)。
759名無しさん@お腹いっぱい。:04/01/09 10:14 ID:+yf3syMo
読取革命7マンセー!ってヤツ、どんなドキュメントを読み込んだんだ!?
10pくらいの文字で「e.Typist8、読んde!!ココ9、読取革命7」の中では最低だったぞ。
760名無しさん@お腹いっぱい。:04/01/09 23:52 ID:ssb+m3W8
まあ図の多さとかフォントとか、紙質とか条件はまちまちだし
他人が評価した読み取り精度はあてにならんと思った方がいい。
だから俺は、体験版のないものは買って使ってみようという気にならない。
761名無しさん@お腹いっぱい。:04/01/14 19:51 ID:DhThjWWg
ScanSnapで読み込んだ本のPDFファイルをOCRでテキスト化したいのですが、
e.Typist9のAcrobatアドイン機能はどの程度のことができるのでしょうか?
e.Typist9体験版だと、アドインが使えないし、本体の方でのPDF読み込み機能は
重い&100P制限で使い物になりそうにありません。

読んde!!ココ9は持っているのですが、本体ではPDFファイルが読めない。アドイン
では、ページの制約はないようですし、スピードもそこそこなのですが、動作設定が
ほとんどできないオート読み込みに近いので、ページのレイアウトを誤判断すると
悲惨なテキストになってしまいます。

また、読取革命8でも、PDFファイルを本体で読めるみたいですが、これもどなた
か試したことのある方は、スピードとかページ制限があるか、教えていただけませ
んでしょうか?
762名無しさん@お腹いっぱい。:04/01/14 21:10 ID:DQpjQSFm
>>761
そういうことなら、新たにOCRソフトを買うよりも
Scansnapでjpg取り込みをして、それをDocuworks(実売11000円)に取り込むといいかもね。
選択すれば、自動でOCRをかけて透明テキストで画像ファイルにはりつけてくれる。
PDFファイルより、XDWファイルの方が、軽くて、小さい。付箋も貼れるし、マーカーで
線もひける。
763名無しさん@お腹いっぱい。:04/01/15 00:17 ID:EMcNNtFZ
DocuのOCR性能はイマイチだろ。
764名無しさん@お腹いっぱい。:04/01/17 14:21 ID:orEGvCW4
すんません、ちょっと質問です
新聞記事や小説のテキスト化という用途だったら
どのソフト使っても大差はないですか?
765名無しさん@お腹いっぱい。:04/01/17 18:13 ID:5+BAD+3d
>>764
毎年、PC雑誌で実験比較記事が載り、
それによると、新聞記事の場合、認識率にはほとんど差がないですね。
766名無しさん@お腹いっぱい。:04/01/17 18:49 ID:PTpFcAte
認識しやすい状態での認識率は飽和している
デザインされた文字や複数フォントの混在する文書、複雑なレイアウトを
どう扱うかがキモでしょうね
767名無しさん@お腹いっぱい。:04/01/18 00:59 ID:fPBKLYhw
winreaderPROのV6(最新版はv9)が中古屋に安く出てるんだけど、
etypistの最新版より認識率いいかな?
768764:04/01/18 11:33 ID:DAYpR6I2
>>765
>>766
遅くなりましたが レスさんくすです
769名無しさん@お腹いっぱい。:04/01/18 15:37 ID:ZfXTiihZ
>>767
何とも言えないなぁ、試してみないことには。

winreaderPROの方が、たとえ3代前でも良さそうな気もする。
で、いくらなの?
770名無しさん@お腹いっぱい。:04/01/18 23:23 ID:+5150ZGl
それ、ドングルはちゃんと付いてるんだろうな
771名無しさん@お腹いっぱい。:04/01/20 19:12 ID:UmrZzJoL
[質問]
e.typist を使っています。
日本語に認識が非常によくて驚いているのですが、
文中の途中に
「'」「-」「、」などの文章と関係ない文字がたびび
現れるのですが何か設定間違ってますでしょうか?
772名無しさん@お腹いっぱい。:04/01/20 21:30 ID:xz/vqK/f
コピーゴミみたいな汚れまで認識してるのでは?
解像度は300-400dpiもあればほぼ実用範囲かと。

認識率を上げようとして解像度を上げすぎると
却ってゴミまで認識してしまうのさ。
773名無しさん@お腹いっぱい。:04/01/23 16:07 ID:IgJ9qVvD
活字認識じゃなくて楽譜認識ソフトの話題は皆無だな。
楽譜認識ソフトのスコアメーカー3.0(KAWAI)は、
音符や音楽記号の認識率100%レベルになったと思う。
パソにとっては、活字より音符の方が簡単だろうし。
今はパソが楽譜を演奏する時代になったんだよ。
774名無しさん@お腹いっぱい。:04/01/23 16:46 ID:Sj4u+cxJ
>>771
画像処理でノイズを消せたハズ。
ただ、やりすぎるとサンズイの点が消えたりして(シ→ノ)認識率が低下するゾ。
775名無しさん@お腹いっぱい。:04/01/23 16:48 ID:wCbjDTLw
>>773
>今はパソが楽譜を演奏する時代になったんだよ。
オマイが今知ったってだけだろ。いまさら2年前に発売されたソフトを、ねぇ?
776名無しさん@お腹いっぱい。:04/01/23 22:03 ID:gI3uJpek
各社の試用版とか製品版とかを試してみたけど、
日本語オンリーの文章の認識率なら、
e.typist・ver9が頭一つ抜けてると感じた。
読んでココはレイアウトがやや複雑な文書や、括弧や矢印などの記号
が混じると認識率100%とは行かなくなってしまう様に感じた。
この分で行くと、e.typistの10倍高い兄貴分のWINREADER PROは
きっとすごい性能なのでは??

ただ、ここのスレ見ると、評価はとんとんのようだから、スキャナや読取設定に
よって優劣は変わってくるのかな。
777777:04/01/26 13:25 ID:O72EV9G1
777
778名無しさん@お腹いっぱい。:04/01/30 21:56 ID:u+jYCHAs
読んdeココ10マダー?チンチン(AA略
779こんにちは。:04/02/05 17:43 ID:aaUUTr3+
680さんなど皆さん、小説をocrにかけていますがちょっと質問があります。
僕もペーパーバックなどをocrにかけているんですが、本が分厚くて
スキャンするとページの真ん中が黒くなってしまいます。
この問題は、読み取り時の^濃さ^を薄くすればなんとか出来ます。
でもさらに問題があって、ページの真ん中あたりの文字になると、
文字がゆがんでスキャンされてしまって上手にocrで認識してくれません。
本が分厚くて、文字が中央に寄ってしまうわけですね。
小説をocrにかけている方がいらしたら、ぜひページの見開きの対処方法を
教えていただけませんか?
やっぱり本を解体して・・・という作業が入るのでしょうか?
よろしくお願いします。
780こんにちは。:04/02/05 18:22 ID:aaUUTr3+
680さんなど皆さん、小説をocrにかけていますがちょっと質問があります。
僕もペーパーバックなどをocrにかけているんですが、本が分厚くて
スキャンするとページの真ん中が黒くなってしまいます。
この問題は、読み取り時の^濃さ^を薄くすればなんとか出来ます。
でもさらに問題があって、ページの真ん中あたりの文字になると、
文字がゆがんでスキャンされてしまって上手にocrで認識してくれません。
本が分厚くて、文字が中央に寄ってしまうわけですね。
小説をocrにかけている方がいらしたら、ぜひページの見開きの対処方法を
教えていただけませんか?
やっぱり本を解体して・・・という作業が入るのでしょうか?
よろしくお願いします。
781こんにちは。:04/02/05 18:28 ID:aaUUTr3+
ぶっ! 二重カキコしてしまいました。
それに ^濃さ^  ってなってますね・・・。
”濃さ” に修正させてください。
キーボードが突然英語キーボードに認識されてしまってキー配置が
おかしくなってしまいました。
妙なミスすいません。 ペコリ
782名無しさん@お腹いっぱい。:04/02/05 23:53 ID:U9BSmxk5
>>780
>ページの真ん中あたりの文字になると、
>文字がゆがんでスキャンされてしまって上手にocrで認識してくれません。

お持ちのスキャナは、
フラットベット型のうちの、CISタイプでしょうか(キャノンの薄型)

考えられる対策としては、

・「ADFスキャナ」をお持ちの方は、解体してスキャンでしょうし、
・ハンディスキャナをお持ちの方は、本をなぞって読み取りでしょうし、
・デジカメをお持ちの方は、撮影
・フラットベット型でも、CCDタイプ(厚みのある機種)
だったら、ピントの合う奥行きが深いので、大丈夫でしょうね。
783名無しさん@お腹いっぱい。:04/02/06 19:59 ID:hCQ1xbni
>>780
読取革命の「長方形化」っちゅう機能を使うとか。
(画像のゆがみを補正する機能です)
多少厚めの雑誌をスキャンするのに重宝しました。
784名無しさん@お腹いっぱい。:04/02/07 17:45 ID:NGKOLbJv
e.Typist v.9.0で認識枠のテンプレートの登録ができません。文字認識→認識テンプレート
で読込はできても登録ができません。
785名無しさん@お腹いっぱい。:04/02/08 15:05 ID:l/1rn3Fd
>>756 がスルーされてません?

最近の OCR はどんなものかと思い e.typist の体験版を使ってみました.
科学な内容で,日本語の文章中にも英単語や下付き,上付きの添字が
頻繁にあるものをスキャンしました.

結果...修正が大変ですね...しかも,
「複数の文字が一文字で認識されてしまう」んです.
>>756 によると読んdeココはできるみたいですね.試してみます.
786名無しさん@お腹いっぱい。:04/02/14 18:45 ID:w2exdgq0
読んde!!ココ Ver.10
2004年2月27日(金)より順次販売開始
http://ai2you.com/ocr/news/koko10/koko10.asp?C=1
787名無しさん@お腹いっぱい。:04/02/14 19:21 ID:kdEXqN7w
>>786
今までと異なり、今回は
大幅に機能アップしたようですね。
788名無しさん@お腹いっぱい。:04/02/14 22:17 ID:nlDQOcq7
機能じゃなくて性能をアップして欲しいんだが。
789名無しさん@お腹いっぱい。:04/02/14 23:37 ID:kdEXqN7w
どのOCRソフトも、性能(変換精度)は頭打ちのような気がします。
790名無しさん@お腹いっぱい。:04/02/14 23:49 ID:KEhrqiUz
>>789
なんでやねん。
読んでココと、メディアリーダーproの性能は雲泥の差だぞ。
791名無しさん@お腹いっぱい。:04/02/15 00:34 ID:tzsASFEf
読取革命の体験版でも使ってみれば
読んdeやTypistがわざと認識率を下げているかわかる。
10年もやっていてあの程度なわけがない。
まあ商売だからね。
792名無しさん@お腹いっぱい。:04/02/15 01:01 ID:hYXxX8JB
PDF出力対応のOCRソフト5製品を比較する DOS/V magazine 2004/2/15号より(2004/02/14)
http://www.sbpnet.jp/vwalker/series/testlab/art.asp?newsid=6250
793名無しさん@お腹いっぱい。:04/02/15 02:15 ID:BibYN282
792氏のページ見たよ。やっぱ認識率ではe.typistがずば抜けてるって。


以下抜粋です。

OCRソフトは認識精度がまず第一だ。その点はe.Typist v.9.0がズバ抜けている。
雑誌,テキスト,FAX,新聞の手動/自動両方の認識で,認識率は常に90%以上をキ
ープし,レイアウトの取得精度は,下手に手動で設定すると精度が下がってしまう
ほどだ。また,文字の認識精度だけではなく,複雑な段組みの雑誌原稿も破綻なく
読み取る能力は,驚くべきものがある。
794名無しさん@お腹いっぱい。:04/02/15 03:22 ID:628tXSvn
こんなのが出るらしい。
「やさしくPDF OCR」
http://pac.mediadrive.jp/topics/20040210_pocr.html

でもやっぱり100枚制限はあるんだな。処理スピードがマシなら考えてもいいが
この様子ではe.Typistのサブセット版みたいなものか。
795名無しさん@お腹いっぱい。:04/02/17 15:33 ID:KNKaXq4r
読取革命7を使ってる人に教えて欲しいのですが、
読み込んだ画像の一括回転はどうやるのでしょうか?
もしかしてできないのでしょうか。ヘルプにも載ってませんし。
796名無しさん@お腹いっぱい。:04/02/18 11:59 ID:AI/oDq+Q
洋書(英文)を翻訳して読むのにスキャナー(GT9300UF)買ったんですが付属のソフトじゃだめで
本格読取買ってみてもダメ、読んでココ体験版でも読めなかったですが、ABBYYのファインリーダー体験版はエラーなく読めるようでした
あと読取革命体験版はちょっとエラー出ますが、使い方悪いのかもしれないですがここはABBYYのソフトを買うのがいいでしょうか?
ネットで海外製品買ったことないですが大変ですか?

http://www.amazon.com/exec/obidos/tg/detail/-/B00006AGQU/qid=1077072153/sr=1-2/ref=sr_1_2/103-5342626-7156647?v=glance&s=software
797名無しさん@お腹いっぱい。:04/02/18 18:27 ID:b+I+V/MC
>>795
試してみたけどだめっぽいね。。。
798名無しさん@お腹いっぱい。:04/02/18 22:06 ID:9G9rMBAZ
>>796
和製OCRソフトの殆どはABBYYのエンジンを使ってる。
認識の設定で和英混在とか英文主体とか選択できるから(少なくとも読んdeココは可能)
ヘルプを参照してもう一度試してはいかが。
799796:04/02/19 00:47 ID:LllmSbCF
>798
あ、やっぱりそうですか・・・やってみます

それと読取革命体験版ですが気になったのは、本がななめになってると
1行読めなかったりしましたが、これも設定の問題ですかね


800名無しさん@お腹いっぱい。:04/02/19 02:47 ID:sgwLgyPi
八百(σ・∀・)σ ゲッツ !!
801796:04/02/19 22:56 ID:rhx8tQ1e
>798
スキャナー付属の読んdeココで読めました
認識パラメータを英語にしてもちょこちょこ漢字とか混ざってましたが
スキャナーの画像取り込みの濃度をうすいにするとエラーなくなりました
それとなぜか付属のソフトが読み込みも認識も圧倒的に速いです

本格読取1980エソ買ってしまって無駄ですた
もう一つ買った本格翻訳はエキサイトよりはかなりいいです
どうもお騒がせしました...
802名無しさん@お腹いっぱい。:04/02/20 14:48 ID:jqt28BDc
>797
あ、やっぱりそうですか・・
803797:04/02/21 17:57 ID:uM7dcJpi
>>802
読取革命での画像修正機能はないよりまし、くらいに考えて
先にvixででも目的の画像を一括で回転させておけばいいかもしれませんねー。
8ではできないのかな。。。
804名無しさん@お腹いっぱい。:04/02/22 21:56 ID:k7QPJenZ
読取物語V4をもうちょっと使いやすくして
安くした(20000円ぐらい)新バージョンでねーかなあ。
はっきり言って読んでココやe.Typistなんか軽く
吹っ飛ぶと思うんだが・・・

オレはリコーは大っ嫌いなんだけど読取物語だけは全面支持する。
805名無しさん@お腹いっぱい。:04/02/22 22:17 ID:93EwQKfH
読み取り物語って、初めてきいたわ
806名無しさん@お腹いっぱい。:04/02/22 22:30 ID:ZD/aWwe/
新台入荷ですか?
807名無しさん@お腹いっぱい。:04/02/23 04:54 ID:LGCbJhV/
>>804
どこがいいの?
808名無しさん@お腹いっぱい。:04/02/25 17:30 ID:jauiArzM
超初心者です。教えてくんで、すみません。
新聞記事のスクラップや写真入の雑誌記事のスクラップを
したいんですけど、e.typist9.0 + やさしくファイリング5
を買いました。取り合えず、ばんばんスクラップをスキャンして
CDに焼く(スクラップ)のが目的のときには、OCR処理しなくても
良いの? 後から必要なときに処理すればよいのかな。
「やさしくファイリング5」 の方で十分なのでしょうか。
スキャンした画像っていうのでしょうか、は印刷してみてもコピー撮ったみたいに鮮明です。

OCR処理を掛けるのは、後から編集するときですか?
あと、そのときにはPDF形式で保存しておくのが良いの?
それともスキャンしたままのJpeg。で良いのかな。
あんまり大きなファイルにしたくないのです。
アホ丸出しの質問で、すみません。
809名無しさん@お腹いっぱい。:04/02/25 18:17 ID:DPC3j3To
読取革命Ver.8の乗り換え版を買った。

製品版と乗り換え版はCDが共通だった。
810名無しさん@お腹いっぱい。:04/02/25 18:50 ID:y3w5at0b
>>808
> スキャンした画像っていうのでしょうか、は印刷してみてもコピー撮ったみたいに鮮明です。

うらやましい...

> OCR処理を掛けるのは、後から編集するときですか?
> あと、そのときにはPDF形式で保存しておくのが良いの?
> それともスキャンしたままのJpeg。で良いのかな。

画像より,文字情報として PDF にした方が,
ファイルサイズも小さく,閲覧にかかる処理も少なくなるでしょう.
はい.画像のままならば,jpeg にすべきです.

ところで,jpeg と png がどっちがいい?
811名無しさん@お腹いっぱい。:04/02/25 18:59 ID:+a/pPrLR
>>810
スキャナで取り込んだものなら、高画質設定のJPEG。
812名無しさん@お腹いっぱい。:04/02/25 21:26 ID:+NLzAsKT
>>809
乗り換え版って、通常版とどう違うの?
CDが同じなら、通常版を買う意味ないですよね。
813名無しさん@お腹いっぱい。:04/02/25 21:58 ID:+NLzAsKT
>>804
「読取物語 EX V4」の試用版を試してみた。
確かに、認識性能は高いように感じるけど、
画面デザインがアレでは、他社と直接競合するのは無理っぽい。
814名無しさん@お腹いっぱい。:04/02/25 22:08 ID:RPxWtsb+
>>804 には OKREADER2000 をお勧めする。
815808:04/02/25 22:19 ID:dWHd61q/
ありがとうございました〜
そっか、PDFは画像→文字なんですね。にゃるほど。
816808:04/02/25 22:28 ID:dWHd61q/
自己レスです。分かりました、Ctrl.+Altで反転してみたら
透明テキスト付きのPDFになってますた。どょうも〜
817名無しさん@お腹いっぱい。 ::04/02/25 22:30 ID:dWHd61q/
Ctrl.+Alt → Ctrl.+A
818名無しさん@お腹いっぱい。:04/02/26 10:56 ID:n4/fs/aF
デジカメを利用した原稿入力には、書籍を分解せずに済むメリットがあると思います。
現在、主力と思われる3本のソフトについて検証してみました。
・e.Typist v.9.0 :MEDIA DRIVE
・読んde!!ココ Ver.10 :A.I.soft
・読取革命 Ver.8 :Panasonic
デジカメデータは、200万画素、1600*1200で、文庫本の片ページを1枚として撮影したものを使用。
その他、ISO感度、カラー/モノクロ、フラッシュ等、色々な条件で試しました。
819名無しさん@お腹いっぱい。:04/02/26 10:56 ID:n4/fs/aF
・e.Typist v.9.0 :MEDIA DRIVE
体験版の機能制限項目に"デジカメ監視ツール"とある。
エクスプローラから画像をまとめてD&Dしたところ、無事に読み込んだ。
[ツール]>[操作設定]>[ファイル読込]で、
画像色:[白黒] DPI:[400]
としたときに、一番きれいに取り込めているようだ。
認識力は非常に高く、なんでもかんでも文字に変換する。
また、ルビを分離する能力も高い。
反面、変換が手当たりしだいといった感じで、
括弧や、句読点の変換が弱いので、意味不明の文章になりやすい。
デジカメデータのOCRとしては、今一歩という感じ。
820名無しさん@お腹いっぱい。:04/02/26 10:58 ID:n4/fs/aF
・読んde!!ココ Ver.10 :A.I.soft
→注 :体験版はVer.9です。
画像をエクスプローラーからD&Dしたところ、暴走。原因不明。
メニューから読み込ませたところ、問題なし。
読み込み時の解像度変更に時間がかかるが、回転/傾き補正は完璧に近い。
[環境設定]>[その他]>[その他の設定]>認識前後の処理を自動化する>[設定]
□画像のノイズ除去を行う
の設定で、認識結果が格段によくなる場合があります。
認識力は充分で、比較的読みやすい結果が得られます。
ルビを分離する能力も高いです。
ただし、文字として認識できないものは、あっさり切り捨ててしまいます。
取りこぼしが多くなるので、デジカメでの利用は辛いと感じます。
821名無しさん@お腹いっぱい。:04/02/26 10:58 ID:n4/fs/aF
・読取革命 Ver.8 :Panasonic
デジカメ画像の認識がウリになっているソフト。
デジカメの接続を監視するツールが付属。
[オプション]>[環境設定]>[自動画像補正]
の設定項目があるものの、自動での補正は最低限にとどめたほうがいい感じ。
自動での画像の取込/変換には首を傾げざるを得ない。
[画像]メニュー以下の、[減色][コントラスト][ガンマ補正]等を駆使して最適化する必要がある。
手動で最適化した画像の認識力は非常に高く、最も優れていると感じる。
ただし、ルビに関する設定が存在せず、あらかじめ手動で消しておく必要がある。
全体に、職人向けツールという感じで、手間をかけたくない人には向かない。
しかし、他のソフトが手も足も出ない画像であっても、手動で何とかできる点がいい。
デジカメデータのOCRには、一番向いているように感じる。
以下、問題点。
・ルビに関する設定項目がなく、ルビを含む漢字は意味不明のものに変換されやすい。
・画像の取込時に、DPIを上げる処理が欲しい。
・画像補正ツールのプリビューが小さ過ぎて、結果が把握できない。
・ツールが多いのに、アンドゥが1回限りなので、始めからやり直しになることが多い。
・[傾斜][カラーフィルタ]等、一部のツールが、どう使っても結果を悪くするだけ。
・とに角、オートが弱い。

オート任せで実用に耐えるのは、「e.Typist」だけでしょう。
822名無しさん@お腹いっぱい。:04/02/26 12:49 ID:UEwGibKV
>>818-821
レポ乙
823名無しさん@お腹いっぱい。:04/02/26 18:25 ID:5lxjsOkG
読んDeココのテキストボックスについての解答を書いておくぞ。
(知っている人はスルーでお願いします。)

ttp://ai2you.com/ocr/user/guide05.asp
を見たら分かります。
以上。
824名無しさん@お腹いっぱい。:04/02/26 18:39 ID:I9Tm2Kzc
>>812
その通りです。
825名無しさん@お腹いっぱい。:04/02/26 20:24 ID:p29jEEZH
>>814のお言葉に従ってOK READERを買ってみようかと思ったのだが
売ってねー。
826名無しさん@お腹いっぱい。:04/02/26 21:17 ID:S2we82g9
>>811
やってみました.一長一短のようですが...
それでもファイルサイズは png の圧勝 (小さい) です.

文字の多い画像に適するのは jpeg か,png か.
理論的な根拠を知っている方,教えてください.
827名無しさん@お腹いっぱい。:04/02/26 23:21 ID:p7bgNrAx
>>826
jpgは、輪郭がぼやけるのに対し、
pngは、輪郭がシャープ

従って、文字の多い画像には、pngがおすすめ。

>>818-821
詳細レポ、参考になります。
828名無しさん@お腹いっぱい。:04/02/27 09:14 ID:mdnlIRDs
単色の部分が多い場合はpngの方がいい。
でもスキャナで取り込んだ場合は、
背景の白の部分でも微妙に色が違ったりするから、
jpegの方がサイズ的に有利になる場合もある。
原稿やトーンカーブの設定などによって結果は違う。

色数が少ない、単色が多いもの→png
色数が多い、微妙な色があるもの→jpeg

gifとjpegとpngの比較(pngはgifとほぼ同様)
http://www.komakusa.net/internet/gazou.html
829名無しさん@お腹いっぱい。:04/02/27 15:59 ID:XPbXRsbu
趣味の競馬データを取り込んでいますが、四角記号(ロ)の中の数字、、
(角囲みの数字)が外字扱いのためまったく認識してくれず手入力しかありません。
外字登録しても認識されません。丸囲みは大丈夫なようです。
どなたか似たような処理でいい方法を知ってる方いませんか?
830く ろ し ろ:04/02/27 16:03 ID:9ZgP8gni
w
831名無しさん@お腹いっぱい。:04/02/27 19:44 ID:8yhQg74a
>>829
認識辞書に登録して外字にひもつけするのではダメなのか?
832名無しさん@お腹いっぱい。:04/02/28 13:57 ID:eRFipMI2
デジカメデータの認識。その後も、検証を続けております。
だんだん撮影テクニックの方が、上がってきました。(w
当たり前のことですが、撮影が最も重要です。
特に重要なのが、ページ全体にむらなく光を当てることです。
そのため、ズーム(3倍)をテレ端にし、フラッシュを使用した場合が最もよい感じです。
露出補正も、少し明るめにするといいでしょう。

・e.Typist v.9.0 :MEDIA DRIVE
[ツール]>[操作設定]>[ファイル読込]は、
画像色:[フルカラー] DPI:[400]
の設定で問題ないようですね。
むらのない撮影を行えば、設定をいじってもほとんど変化はありませんでした。
端から端まで、手当たり次第に、文字に変換します。
[文字認識]>[認識字種設定]>[認識字種]>[□記号]に、チェックを入れることで、
括弧や句読点も認識してくれました。なぜ、デフォでOFFにする……。
後から気づいたのですが、非常に行儀の悪いソフトですね。
デスクトップのアイコン及び、コンテクストメニューを勝手に追加され、
マイドキュメントフォルダ内に、"e.Typist User Data"フォルダが作成されました。
起動時のもたつきも、少し気になります。
833名無しさん@お腹いっぱい。:04/02/28 13:57 ID:eRFipMI2
・読んde!!ココ Ver.10 :A.I.soft
→注 :体験版はVer.9です。
撮影の上達で、取りこぼしが減ってはきたものの、根本的な解決は無理でした。
オートでどうにもならない場合、手の打ちようがないのが欠点です。
レイアウトの認識が悪い意味でものすごく、
文庫の1ページが極めて複雑なレイアウトに化けます。
認識された領域内で右クリック>[パラメータの設定]>[認識パラメータの設定]で、
認識のデフォルト設定を登録できることに気づきましたが、
レイアウトそのものには影響しないようです。

・読取革命 Ver.8 :Panasonic
とに角、画像のコントラストを高くすることです。
文字が薄くならないように、ガンマ補正も使います。
画像の補正が上手くいったときは、ほとんど完璧に変換できてしまいました。
行の傾きに弱いので、[画像]>[傾き補正]>[手動]で調整します。
傾いてさえいなければ、ある程度までは、ルビも自動で無視するようですが、
樽型、糸巻型のゆがみに弱いです。
オートではほとんど使えない点にも、注意が必要です。
834名無しさん@お腹いっぱい。:04/02/28 13:58 ID:eRFipMI2
・読取物語 EX V4 :リコーシステム開発
も試したのですが、
画像の変換が[編集]>[モノクロ変換]くらいしかありません。
しかも、プリビューがないので非常に調整しづらいのです。
なぜか、[設定]>[環境設定]>[カラー画像処理]のほうにはありますが……。
どうあれ、これを使いこなそうと思えるようなデザインではありません。
他のメジャーソフト3本が揃えられるほどの値段の割には、お粗末だと思います。
リコーの想定している市場が違うのでしょう。

全体の感想としては、「e.Typist」のお買い得感が高いです。
オートでも、そこそこ使えますし。
少々妙な認識結果でも、取りこぼしが少ないのは安心できます。
読込時の画像処理性能が上がれば、さらによくなりそう。
「読んde!!ココ」は、3本のなかでは、最もインテリジェントに処理していると感じられ、
それだけに、オートで対処できない部分が惜しまれます。
Ver.10に期待してますが、OCRソフトにコピー機能とか必要かな?
「読取革命」もなかなか捨てがたい能力なので、難しいところです。
でも、レタッチ職人を何百ページも行うとなると、実用的ではありません。

どのソフトも興味深く、なかなか短くまとめることができませんでした。
また何日も使っている間に、各ソフトの印象が二転三転したことも付け加えておきます。
読みにくいレビューにお付き合いいただき、ありがとうございました。
835名無しさん@お腹いっぱい。:04/02/28 16:28 ID:ps5XnACv
ホントに読みにくい上に何の役にもたたない自己満足の長文ご苦労さん

と、読んdeココのバカさにむかついて半分八つ当たりしてみる。
836名無しさん@お腹いっぱい。:04/02/28 16:42 ID:Cgh0X90D
>>835
おまえ最悪だな。
>>832
レビューお疲れ様です。非常に参考になると思います。
837名無しさん@お腹いっぱい。:04/02/28 17:04 ID:v4Fq0Wgh
読んでココ!ver8 使用です。
英語の小説本を取り込んでテキスト変換してるんだけど、横一段組の文章な
のに時々妙に単語間の空白が数行揃ってしまい、2段組のブロックと認識し
て分割して読み取られてしまうことがあります。

これを手動で一段組みの文章として認識させるような機能はあるんでしょう
か。
838名無しさん@お腹いっぱい。:04/02/28 17:47 ID:q4wu6rXP
やっぱ e.Typist かなぁ
839名無しさん@お腹いっぱい。:04/02/28 19:04 ID:owmOa9Dk
>>832-834
乙。いろんな使用場面での得意不得意が浮き彫りになって興味深いね。

>>835
読んdeココに手を焼く所は同情の余地があるが、とりあえず氏ね。
840名無しさん@お腹いっぱい。:04/02/28 19:08 ID:owmOa9Dk
>>837
その不具合の出るページだけ、認識枠の設定を手動で行ってみてはどうでしょう。
841名無しさん@お腹いっぱい。:04/02/28 20:09 ID:v4Fq0Wgh
>>840
レスありがとうございます。
2段組に認識されてしまう部分(例えば10行)を手動で枠で囲い、
そこだけ別に認識させるということですよね。
それもトライしたんですが、同様に2段組と認識してしまうんです。ホントハラタツ…
1行ずつやるのも空しいし、打つ手ナシか〜……
842名無しさん@お腹いっぱい。:04/02/28 20:31 ID:J9JQZV+w
でも認識結果の正確性を優先するなら、1行づつの枠設定もやむをえないかと。

あとは、Ver.10の体験版が出たらレイアウト認識の改善度を試してみるとか。
843名無しさん@お腹いっぱい。:04/02/28 21:28 ID:v4Fq0Wgh
>>842
ですね〜。今は、ちょうど真ん中辺で分断された2段を1行ずつ左右繋ぎ合わ
せて対処してます。

ふと思ったけど、全体のレイアウト自動認識モードと、ひと枠は一行として
強制的に認識させる手動モードの2パターン切り替え機能を搭載するのって
難しいんでしょうか。これが出来ればずいぶん使い勝手が向上すると思う
んだけど…。
844名無しさん@お腹いっぱい。:04/02/28 21:59 ID:U6JPCAWO
>>843
今、試してみたけど。

1. 2つの枠のうち片方をクリック
2. 選択された枠内で右クリックして、[枠の消去]を実行。
3. 残っているほうの枠をクリックした後、
ふちをドラッグして選択範囲を必要なだけ拡大。
4. アイコンメニューから認識を実行。

で、いけるみたい。
845844:04/02/28 22:06 ID:U6JPCAWO
ごめん。
"2."の[枠の消去]は、Deleteキーでいけたわ。

しかし、枠を自由に変形させても、認識範囲が改善されるわけじゃないのね……。
846名無しさん@お腹いっぱい。:04/02/28 22:33 ID:EhyDRMSI
本の場合、毎回レイアウト認識させる必用ないんだよな。
枠情報保存、読み込みとかあるし

何を苦労してるんだか、さっぱりわからん。
847名無しさん@お腹いっぱい。:04/02/29 07:17 ID:CgFi9dVh
>>846
えー!どうやるの?
「読んde!!ココ」の場合、設定した枠と実際の認識範囲が一致しないから問題なわけで。
見つけた。[ファイル]>[枠情報の保存]ですね。
これは、単票でないと、原稿がずれるから使えないのでは?
認識したい範囲を枠で囲って、右クリックから[認識]でも、
設定した枠内だけ認識しますね。気づかなかった。_| ̄|○
でも、レイアウトは改善されるけど、取りこぼしに関しては変化がないです。

「e.Typist」だと、枠で囲って[認識]アイコンクリックで絨毯爆撃してくれる。
848名無しさん@お腹いっぱい。:04/02/29 10:09 ID:CgFi9dVh
デジカメでペーパーバックを撮影し、認識させてみました。
例によって、片側1ページを撮影してます。
ラフに撮影して、わずかに文字領域が台形になった画像を使いました。
→デジカメの小さな液晶でまっすぐ撮るのは、案外難しいです。
日本語の文庫に比べて、文字数が多いにもかかわらず、
印刷が太く、くっきりしているため、日本語より認識しやすいようです。
各ソフトとも、英語認識モードに切り替えて行いました。
・e.Typist v.9.0 :MEDIA DRIVE
ほぼ文句なし、ほとんど修正の必要も認められません。
英文だと、傾きなんか障害にならないようです。
また、誤認識部分の赤字での表示も正確でした。
・読んde!!ココ Ver.10 :A.I.soft
→Ver.9使ってます。
1行くらいしか、認識してくれませんでした。
文字領域が台形に変形しているせいでしょう。
別にレタッチソフトでもないとどうしようもありません。
・読取革命 Ver.8 :Panasonic
オートではどうにもなりません。
[画像]>[長方形化]で、テキストを水平にしてあげると、非常に良好に認識しました。
ペーパーバックの場合、コントラストの修正なしで済みました。

>>835
ウザくてごめんね。
849名無しさん@お腹いっぱい。:04/02/29 10:12 ID:CgFi9dVh
現在、「読んde!!ココ Ver.10」体験版、
ナローバンドでダウンロード中……。_| ̄|○
850名無しさん@お腹いっぱい。:04/02/29 11:01 ID:wD6dOWJa
自動領域抽出時に表領域を抽出しない(N)
自動領域抽出時にイメージ領域を抽出しない(I)
自動領域抽出後の領域は段組なしにする(P)
851名無しさん@お腹いっぱい。:04/02/29 11:02 ID:l3ejVJY3
>>848
コテハンにするかトリップをつけていただくというわけには行きませんか?
852名無しさん@お腹いっぱい。:04/02/29 11:11 ID:wD6dOWJa
段組み

文書に段組みがあるかどうかを指定します。
通常はデフォルトの[自動判別(L)]のままにしておけば
システムが自動的に段組みの有無を判別します。
段組みにしたくないときは、[なし(N)]に変更します。
枠種別を[表(B)]に設定した場合は選択することはできません。
この場合、段組みは[なし(N)]になります。
853名無しさん@お腹いっぱい。:04/02/29 15:29 ID:CgFi9dVh
>>850
全部チェックしてあるけど、
複雑なレイアウトの自動判定には影響してないです。
854名無しさん@お腹いっぱい。:04/02/29 16:55 ID:S9dE7KKE
>>849
公式ページにはまだ体験版来てないじゃないか。
ワンタッチOCRのと勘違いしてない?
855名無しさん@お腹いっぱい。:04/02/29 16:59 ID:CgFi9dVh
>>854
うん、勘違い。
856名無しさん@お腹いっぱい。:04/02/29 17:08 ID:JSl5zdy1
857名無しさん@お腹いっぱい。:04/02/29 17:12 ID:S9dE7KKE
Vectorではもう落とせるのか。盲点だったな。thx
858837:04/02/29 18:25 ID:ev3S9u/7
>>852
!! ここに設定あったのか〜
ヘルプのキーワードで「段組み」入れても何もヒットしないんでてっきり…。
試したところ確かに一行として読み取りました。
どうもありがとう。
昨日レスくれた人達もありがとうございました。
859名無しさん@お腹いっぱい。:04/03/02 22:16 ID:Gp1s1U/T
どどど・どうしたんだ!
しばらく来ないうちに、この一ヶ月ほどすごい良スレだったんだね!
860名無しさん@お腹いっぱい。:04/03/03 08:02 ID:68fvt6sD
どこがだ。
861名無しさん@お腹いっぱい。:04/03/04 21:08 ID:NEGp0nGO
ココ10はだいぶインターフェイスがe.Typistに似てきたね。
862名無しさん@お腹いっぱい。:04/03/04 21:28 ID:PMqNoyn3
重要なのはインターフェースや転送や印刷じゃなくて
認識能力なんだけどなあ。
863名無しさん@お腹いっぱい。:04/03/06 21:15 ID:kuZWW9fT
で、読んdeココ10の認識能力はどうですか。
864名無しさん@お腹いっぱい。:04/03/06 23:13 ID:iy+7odC/
びっくりするほど良いですね
865名無しさん@お腹いっぱい。:04/03/06 23:34 ID:JEm9WZyR
読取革命の試用期間短すぎる _| ̄|○
866名無しさん@お腹いっぱい。:04/03/07 21:09 ID:Ux3Vu8vZ
厨な私に教えてください。
OCRソフト(e.Typist9.0)を用いて、スキャナで読み込んだ雑誌の原稿
(モノクロ。OCRを行うため、400dpiでスキャン)を、日本語OCR処理
をした上で透明テキスト付PDFファイルにして保存する際、OCR処理後
の画像ファイルは400dpiも要らないので、150〜200dpi程度に画質を
落とした上で、透明テキスト付PDFファイルとして保存したいのですが、
今いちやり方がよくわかりません。
>>698 には、リサンプルという方法が書かれているのですが、当方、
なにぶん厨なもので、マニュアル読んでもやり方がよくわからないの
です(Acrobatはマニュアルがわかりづらいし!)

e.Typist9.0とAcrobat5.0(Readerじゃない奴)を持ってます。
激しく既出であれば、ここ嫁とか教えてくれれば、すぐ逝きます。
867名無しさん@お腹いっぱい。:04/03/07 21:24 ID:WFjiuZfr
>866
読んde!!ココには出力時の画像dpiを指定するところがあります。
[オプション]-[環境設定]-[画像領域の設定]-[画像の出力解像度]です。
72,96,150,200dpi、元のままの5つから選択できます。

読んde!!ココしか使ってないので、他のOCRではどうだかは知らないです。
868名無しさん@お腹いっぱい。:04/03/07 23:04 ID:Ux3Vu8vZ
読んde!!ココ には設定があるのですね。
e.Typistとは性能的に一長一短なようだけど、乗り換えも
検討しようかな。
869名無しさん@お腹いっぱい。:04/03/08 02:42 ID:SOQVxIGU
短の部分の方が多いから後悔しないかな‥。
870866:04/03/08 21:52 ID:tBoc1Fkf
e.Typist9.0でも、 >>867 と同じ機能を発見しました。
「ツール」→「環境設定」→「読込・保存」→「認識結果の保存」
で、「図領域・背景の出力DPI」を変えることができます。
「72、96、120、144、168、192」の各dpiと、デフォルトのままの
都合7段階に可変です。大変失礼しまつた。

・・・でも、192dpiにして印刷すると、漏れ的には今イチなんだ
よね〜〜 雑誌の論文とかが多いんだけれど、192dpiだと、やや
文字がかすれ気味に印刷される。Acrobatでリサンプルできている
人はど〜なんでしょ。

>>869
やはりそーなんですか。もう少しe.Typist9.0で頑張ってみます。
871名無しさん@お腹いっぱい。:04/03/09 17:30 ID:IhF7S1gl
すみません、e.Typist9で質問です。
複数の文字が1文字で認識されてしまうのですが、
読んでココの様に文字を分離して再認識させる機能は無いのでしょうか?
>>756で既出の質問ですが、FAQにも無いのとサポセンが5時までしかやってないので、
今一度質問させて頂きました。
872名無しさん@お腹いっぱい。:04/03/09 20:30 ID:4IScVx97
>>871の自己レス
VwalkerのOCR比較特集見たら
「1文字に認識されたデータを複数の文字に分割する機能がない」
と書いてありました。うーーーーーん。
873名無しさん@お腹いっぱい。:04/03/14 13:11 ID:9EvBU3hH
質問です
読んで10を使用しています。
スキャンしたデータをPDF透明テキストで
保存しています。

PDFを開いた時に1ページ2ページと
複数のデータを表示できますよね。

私も複数のデータをまとめて
一つのPDFファイルにしたいと思いますが
どうやったら出来るのでしょうか?

874名無しさん@お腹いっぱい。:04/03/14 13:20 ID:OuBHkuPy
>>873
左の画像を複数選択したまま保存。
875名無しさん@お腹いっぱい。:04/03/14 14:00 ID:9EvBU3hH
>>874
サンクス

左側に画像リストが表示されていなっかた
のでわからなかった。

有りがトン
876名無しさん@お腹いっぱい。:04/03/17 00:46 ID:VGOdP+ko
他所のパソコンのAcrobatで作成した「透明テキスト無し」の
PDFファイルを、自宅のパソコンのe.Typist9.0でOCRかけて
「透明テキスト付」PDFファイルに変換しようとした。
出来なくは無かったものの、最初のファイルの読み込みに
異様に時間がかかったYo。
また、当初は高々2〜300KBくらいのサイズだったのに、OCR
して透明テキスト付きにして上書き保存したら、なんと10MB
のファイルになっちった。
やり方まずったのかな〜 わかる人いたら教えて下さい菜。
877名無しさん@お腹いっぱい。:04/03/17 19:27 ID:x0NLRpT6
PDFのOCRにやたら時間が掛かるのは8.0から変わってないようだね。
相変わらずダメダメだなー

PDFは上書きするとサイズが大きくなるのは有名な話で
「名前を付けて保存」で別ファイルに書き出すとたいがい小さくなる。
878名無しさん@お腹いっぱい。:04/03/18 00:06 ID:s97fn9J3
上書きNGは既出だったのかぁ。ありがとん

やたら時間がかかるのみならず、何十頁ものPDFだと
メモリ不足だ、とか言ってエラーが出やんの。
ダメダメだなー
Athlon XP 1900+ に512MBなんだけど。
879名無しさん@お腹いっぱい。:04/03/18 01:20 ID:LkQwer2e
そのスペックならマシンには罪はないよ。
PDFファイルのOCRなら、読んdeココ+Acrobat(Readerに非ず)の組み合わせが良。
ただ読取革命もPDFからOCRできるようになったらしいので、ひとつ試してみてほしい。
http://panasonic.co.jp/pss/pstc/products/yomikaku/demo.html
880名無しさん@お腹いっぱい。:04/03/18 18:06 ID:kPydAEve
スキャナにバンドルされてた読んで此処使ってるんですが
ルビまで認識してくれるのはいいんですが本文の横に結果が出力されるので
テキスト整形するのがとてもめんどくさいです。
ルビを漢字の後ろに表示する事は出来ないんでしょうか?

ちなみにバージョンは

読んde!!ココ_パーソナル_Ver.3

です
881名無しさん@お腹いっぱい。:04/03/18 19:19 ID:xAWkD9cj
読んdeココVer.9では 環境設定→認識 の中の
「ルビの処理」で「埋め込む」を選べばOK となっている。
パーソナルではどうなのか知らないが、見つからなければヘルプを探しな。
882名無しさん@お腹いっぱい。:04/03/20 14:53 ID:ilLl3y/U
e.Typist9でExcel表を読ませてワンボタンでExcel転送した。
認識も修正も転送もほとんどシンプルにできて十分実用できる。

でも、Excelに送った表の数値を「=SUM(A0:A1)」とか集計させようとしても
「0」になる。セル属性を数値や標準にかえても「0」。なんでだろ?
エラーとか「#VALUE」とかならまだ分かるけど、なんで「0」なんだろ。

マニュアル会社にあるからわかんないや。
でも住所録や顧客リストなんかを読み込ます分には十分べんりだよ、e.Typist9。
883876:04/03/21 00:23 ID:ff4YO4sC
>>879
ありがとうございます。読取革命と読んdeココ10を検討して
みます。

あと、>>794 に出ていた、「やさしくPDF OCR」が既に発売
されてますね。
「PDF(透明テキスト無)」→「PDF(透明テキスト付)」の処理
スピードはどうなんだろう? 試した人います?

既にe.Typist9.0 持ってるので、処理スピードが速くなったの
なら、実売4000円前後だし買ってみようかな、と思うのです
が、実は単なるe.Typist9.0の機能制限版みたいな奴だった
りすると、 _| ̄|○ になってしまうので。


「やさしくPDF OCR」
http://pac.mediadrive.jp/topics/20040210_pocr.html
884名無しさん@お腹いっぱい。:04/03/21 00:42 ID:O0bbSnDS
まず間違いなく機能制限版でしょう。
体験版がリリースされて試してからの方がよいかと。
885名無しさん@お腹いっぱい。:04/03/21 17:33 ID:GRhrlZuI
>>883
本格的にテキスト付きPDFにしたいなら、Mac版eTypistですよ。
一瞬といったらおおげさだけど、普通のTIFFファイル読み取りと同じスピードです。
886名無しさん@お腹いっぱい。:04/03/24 00:55 ID:NVD8ZmFM
ほほー、いいこと聞いた。
しかしそのためだけにMac買うわけにもいかんざき
887名無しさん@お腹いっぱい。:04/03/29 07:34 ID:y4741GyY
読んdeココ Ver10.0のバグと思うんだけど(汗)・・・

画像ファイル(BMP・PNG等)を読み込んで(300個以上)これをそのままPDF方式
で保存するとき(複数ページファイル化)に129個?目を書き込んでいる所で
読んdeココが強制終了してしまいます。

一応、エーアイソフトのサポートにメール出したけど・・・まだ返事こない
888名無しさん@お腹いっぱい。:04/03/30 13:09 ID:Wo/CfPMV
889名無しさん@お腹いっぱい。:04/03/30 14:49 ID:wob826Ea
OCRソフトでフリーでオススメはあるでしょうか?
890名無しさん@お腹いっぱい。:04/03/30 16:12 ID:wob826Ea
すみません、フリーでは大したものは無いみたいですね、シェアにします
英語だけでいいので、認識率の高いソフトは何があるでしょうか?
891名無しさん@お腹いっぱい。:04/03/31 11:46 ID:/9INOszL
>>887なんですが、エーアイソフトから、回答キターー!

やはりバグだった模様で・・・、PDF複数ページファイル化保存すると130個め
を書き込んでいるところで強制終了してしまう

修正モジュール「Mem_pdf.DLL」が送られてきたので読んdeココのフォルダに
上書きで入れたら正常になった。良かったーーー。

・・・これ目当てでVer10買ったからな(認識率は二の次で(汗))、もしだめなら
コレ買った意味なかったんでね・・・・

そのうち、エーアイソフトから自動アップデートで修正が入ると思う(この地点で
まだ上がってない)
892名無しさん@お腹いっぱい。:04/04/03 07:41 ID:kuxNa9iu
読んdeココVer9.02を使っているんだがPNG形式の画像ファイルを読み込めなくなった。
確か最後にしたことが4色PNG画像をいくつか読み込もうとして強制終了したことだったと思う。
なにせ久々に使おうかと思ったからよくわからないけど。
後は強制終了した後にもう一回起動させたら変更したはずのツールバーもインストール時と同じに戻っていた。

これって再インストールするしかないんだろうか。
スキャナにバンドルされていたやつから乗り換えたから
バンドル版→アップグレード版
といった順にインストールしかなきゃならないのだろうか?
893名無しさん@お腹いっぱい。:04/04/12 07:35 ID:3/CZousJ
age
894名無しさん@お腹いっぱい。:04/04/13 00:48 ID:z4fvk2kY
UPGRADE対象のCDを持ってれば、いきなり9から再インストールしても大丈夫だよ。
途中でCD入れろとメッセージが出る。
895名無しさん@お腹いっぱい。:04/04/13 18:19 ID:ZaYV1iYp
e.Typist9.0にて、[環境設定]-[読込・保存]-[PDFファイル]で
読み込みDPIの設定が200dpiでグレー表示になって、変更できないのは何故?
ヘルプには「PDFファイル読み込み時の解像度を設定します」とある。
PDFを読み込んで、透明テキストPDFにしてるのですが、
元ファイルに比べて結果のPDFの画像が荒くなるので
読み込み解像度で調整しようと思ったのですが。
896名無しさん@お腹いっぱい。:04/04/14 10:17 ID:lhR6SjVf
↑すみません。カン違いでした。
NT4.0はPDF読み込み未対応ですね。実際に作業で使っているWin2000では設定できます。
897名無しさん@お腹いっぱい。:04/04/20 23:54 ID:0sFjSJ6Q
pdfを読み込むのに時間がかなりかかっています。

MDC printerが勝手に立上りそこで何か印刷する素ぶりをしていまして
この動作に時間がかかっています。

このMDC printerの立ち上げを停止する方法はないでしょうか?
898名無しさん@お腹いっぱい。:04/04/21 14:04 ID:1mMKnwrK
おそらくPDFを画像情報としてeTypistに渡すための仮想印刷ドライバだろう。
それなしではPDFをOCRに掛けることが出来ないと思われ。
899名無しさん@お腹いっぱい。:04/04/23 18:11 ID:RcbsEjNS
PC-Watchに紹介されていたブラザーのOCRソフト。
ttp://www.brother.co.jp/jp/honyaku/info/ocr/ocr_ove.html
900名無しさん@お腹いっぱい。:04/04/24 19:22 ID:dT+uYK2W
その値段でその程度の機能しかないならソースネクストの奴がマシだろ
901名無しさん@お腹いっぱい。:04/04/25 11:13 ID:bSIMzEgc
マニアックな質問で申し訳ないのですが、
ドイツ語のひげ文字(German text, Fraktur)を読み取り可能な
OCRソフトってありますでしょうか?
スレ違いでしたら申し訳ありません。
他にOCRに関するスレが見あたりませんでしたので。
902名無しさん@お腹いっぱい。:04/04/25 12:56 ID:rbmefwBc
>>901
このスレッドのログを「ドイツ」で検索すると >>413 >>754 の発言がヒットする。
そのうち >>754 の発言は日本語とドイツ語の混在論文をeTypistというソフトで取り込んでいて
「認識率が高い」という評だな。

んで、そのeTypistというソフトの発売元のページは
ttp://pac.mediadrive.jp/et/outline/index.html

ついでだ。
ttp://www.sbpnet.jp/vwalker/series/testlab/art.asp?newsid=6250
「PDF出力対応のOCRソフト5製品を比較する」
というタイトルで複数ソフトの比較記事もある。
ドイツ語とは関係ないし、PDFもどうでもいいだろうが、OCRソフトに関する知識にはなる。

まあ、スレッドログの検索くらい自力でやってから質問してみてもいいとは思うぞ。
903902:04/04/25 13:13 ID:rbmefwBc
おっと、失礼。ドイツ語の「ひげ文字」だったか。
よく読まずに嫌みったらしいことを書いた。失礼。

Googleで「ドイツ語 ひげ文字 OCR」で検索すると
Text Bridge PROというのがひげ文字認識ができたというサイトにぶつかり、
このソフトを調べるとeTypistのインターナショナル版に含まれるようだ。

とりあえず素のeTypist体験版でひげ文字が読めるかどうかやってみれば?
904901:04/04/25 13:18 ID:bSIMzEgc
>>902さん
丁寧なお答えありがとうございます
ただ、私の質問の意図はちょっと違っていて、
ドイツ語はドイツ語でも通常のアルファベットではない(というと語弊がありますが)
ゴチック体を扱えるOCRはないだろうかということだったのです。
一応現行ログは読ませて頂き、ドイツ語・フランス語等についても語られていたので、
私のような質問でもOKかなと思い、質問させて頂きました。

ちなみに、私が言うひげ文字とは以下のURLで表示されているようなものです。
tp://www.tulips.tsukuba.ac.jp/misc/export/cat/goth/goth.html
また、Googleで「ひげ文字 OCR」で検索すると、「テキスト・ブリッジ・プロ」では可能である
との記述も見つけることができたのですが、
実際にメディアドライブに問い合わせてみると、少なくとも現行バージョンでは無理とのことでした。
途方にくれていたところ、このスレを見つけたというわけなのです。

ちなみに私はPresto OCRを使っているのですが、OSをXPに変えたところ、動かない。しかもXP対応バージョンは
もうofficialでは売ってないと、困っているところです…。しかたがないので、店頭在庫品を探してみようと思っています。
OmniPageも考えたのですが、よほどのメリットがないとさすがに難しいですね。
どなたか使っていらっしゃる方がおらられば、是非コメントお聞きしたいです。
905901:04/04/25 13:26 ID:bSIMzEgc
>>902さん、
わっ、時間的にかぶってしまいましたね。失礼しました。
Text Bridge PROについては、↑に書いたとおりなんですよ。
OmniPageのページもみてみたのですが、German text, Frakturは可能言語に
含まれてませんでした。
やっぱり海外版で探すしかないんでしょうか…。
まだ探してもいないのに申し訳ないんですが、
ちなみに海外版の製品は皆さんどうやって入手されてます?
アマゾンでは買えないようですし、何か法律で禁止されているんでしょうか?
906名無しさん@お腹いっぱい。:04/05/03 14:06 ID:tctgkrud
読んdeココ10とe.typist9を試した。
エクセルの表を読みとった結果はe.typistの圧勝。
ボタン一発でほぼ再現した。
けっこうきれいに印刷されてたのに読んdeココは
認識できない文字がいくつかあった。
最初に設定しないと表の形で読み取ることができない?
のもどうかと思った。

次に切り貼りしてある名簿に手書きの注釈がしてあるものを読み取った。
これもe.typistの圧勝。
こっちは比べものにならないほど差がついた。

e.typistはデフォルトのままで直感的に操作できたのに対して、
読んdeココは「こうかな」?と思っても違うことがあって戸惑った。
使用前は読んdeココを評価してたんだけど(まったくの先入観)、
思いっきり評価が変わりました。




907名無しさん@お腹いっぱい。:04/05/03 17:31 ID:Kqy/Quml
>>906
普通のレジュメとか基本書とかだと、読んdeココ10はほとんど訂正入らないくらいで
満足していたんですが、驚きました。
e.typist9も試してみよう。
908名無しさん@お腹いっぱい。:04/05/04 01:46 ID:BKDaK4vM
質問なのですが、eTypist9のアップグレード版は、旧版からアップグレードできるそうですが、
かなり古いバージョンからでもアップグレードできるのでしょうか?
それともバージョン8からのアップグレードとうことなのでしょうか?

自分が昔買ったスキャナに
e.Typistバイリンガル2というソフトがついてきたのですが、
そんなに古いバージョンで、しかもスキャナに付属のものでは、
アップグレード版を買ってもアップグレードは無理なのでしょうか?
バイリンガルというシリーズももうないようですし、アップグレードは無理っぽいかなあなどと思っておりますが、
一抹の期待をこめて質問してみますた。
909名無しさん@お腹いっぱい。:04/05/04 13:09 ID:tLzt914i
たぶん大丈夫
心配ならメーカーに確認してから買うべし
910名無しさん@お腹いっぱい。:04/05/04 17:59 ID:BYthjB8M
なぜ公式ページに書いてあるようなことを聞くのだろうか。

最新e.Typistシリーズのアップグレード対象製品
(バイリンガル・プラスファイリング・インターナショナル全対象)
●下記メーカー製品に付属のe.Typist エントリー・バイリンガル2 ・LE2 ・LE 等の
e.Typist シリーズをお持ちのお客様

●e.Typist v.8.0・v.7.0 ・v.6.0 ・v.5.0 ・98 ・97 ・v.2.0 ・v.1.0 等の、
旧バージョンe.Typist シリーズをお持ちのお客様
(スペシャルパック・得々パック・インターナショナル・プラスファイリング含む)

<ご注意>
※2003年7月以降発売されe.Typistシリーズが付属されている製品も
アップグレード対象となります。
※アップグレードには、上記対象製品が必要です。
※Windows版のみが対象となります。
※体験版、評価版は対象外です。
※購入は次期バージョン発売まで可能です。
※付属版をお持ちでも、スキャナや環境によっては動作しない場合があります。
※上記対象製品1本につきアップグレード版1本が購入可能となります。

911名無しさん@お腹いっぱい。:04/05/05 01:18 ID:s0Oy9Bp5
よく分からない。。

スキャナ付属のバイリンガル2でもアップグレードは可能だが、
>※購入は次期バージョン発売まで可能です。
ということから、
バイリンガル2から一つ上へのバージョンへはアップグレード可能だが、
最新のVersion9へはアップグレードは無理ということでしょうか?
又、最新のVersion9へアップグレードできるとしても、
すでに購入は不可能で、だれかが買ったものをつかえば可能ということなのでしょうか?


912名無しさん@お腹いっぱい。:04/05/05 06:05 ID:HYSE7Ri5
>>911

>※購入は次期バージョン発売まで可能です。
 
 Version9(現在の最新版)はVersion10(次期バージョン)が出るまでしか購入できないよってこと。

バージョンアップの対象が

●e.Typist v.8.0・v.7.0 ・v.6.0 ・v.5.0 ・98 ・97 ・v.2.0 ・v.1.0 等の、
旧バージョンe.Typist シリーズをお持ちのお客様
(スペシャルパック・得々パック・インターナショナル・プラスファイリング含む)

ってことは、最初のバージョンから前回のバージョンまで
どれかを持ってればバージョンアップできるってこと。
あなたの持ってるバイリンガルも含むね。
それでも心配ならメーカーに確認すればよい。
913名無しさん@お腹いっぱい。:04/05/05 13:05 ID:s0Oy9Bp5
よく分かり申した。とんくす。
914名無しさん@お腹いっぱい。:04/05/12 08:47 ID:MZP0p4Vg
私のところも>>876さんと同じように、透明テキストの付加でファイルサイズが
A4原稿1ページあたり2MBくらい増えてたんだけど、Ver.10.00 → 10.01のアップデートで
改善されたよ。
915名無しさん@お腹いっぱい。:04/05/18 15:46 ID:PgTBxxIw
ほんとだ、Presto! OCR、aiSOFTから消えてるね、ひどいね
販売中止はしかたないにしても、発売元として責任もって
アップデータのパッチぐらい置いててしかるべきだよね

・・・と思ったけどそういえば4.1から4.1Plusに上げたときは
パッチじゃなくて新しいディスクがそのまま届いたような気もする
そのへんの事情かなあ

本家のサイトは4.0しかないし、いったい4.1とかいうのは
どういうバージョンだったんだろう
916名無しさん@お腹いっぱい。:04/05/18 15:50 ID:PgTBxxIw
で、ぐぐってみたら

http://uk.newsoft.eu.com/tech%20support/Patch/Presto!OCR%20Pro/prestoocr.htm

っていうのがある
自分では試していないので、正直何とも言えないけど
日本語OS想定してないかもしれないし、とか、いろいろ
不安もありますが、一応おしらせ
917名無しさん@お腹いっぱい。:04/05/19 16:32 ID:HMlNp/e4
FAXで送られてきた書類(少しFAXらしく潰れた感じの文字)
をスキャナで読み取ってソフトにかけて、しっかり認識してくれますか?

パソコンFAXできた書類をe.Typist体験版で試したところ、
新聞文字くらいのところは全然ダメでした。
もしスキャナを通して誤認が少ないようなら、スキャナの購入も考えています。

スキャナ購入候補ですが、
候補 エプソンのGT-9400UF
ソフト まだ迷ってますが、 e.Typistあたりを考えております。
918名無しさん@お腹いっぱい。:04/05/19 17:06 ID:vSCN4LeK
>>917
スキャナ通して改善するなんて考えられんが。そのパソコンFAXって何?
919917:04/05/19 17:50 ID:HMlNp/e4
>>918
書き方が悪くごめん

今、会社の書類をデータ化しようと思って
今までは書類を持って帰って
エクセルに手入力

まいと〜くFAXを購入して会社から自宅パソコンへ転送
FAXイメージのまま保存
文章の検索が出来ないから不便

ocrソフト投入
ただFAXイメージをbmpに変換。解像度がなさ過ぎるので
誤認だらけなのかと
↓スキャナ購入
会社から書類を持って帰る
スキャナで今のFAXの状態より解像度のある状態でスキャニング
e.Typistでウマー
を考えているんですけど
どうでしょ?
920名無しさん@お腹いっぱい。:04/05/19 18:30 ID:vSCN4LeK
つまり、
書類---(FAX)--->PC---(OCR)--->テキスト
だとうまくいかないから
書類---(スキャナ)--->PC---(OCR)--->テキスト
にしてみたいということかな?

書類がまともな印刷物なら、FAXをスーパーファインモード(可能ならさらに
上位のモード)にして送ってみると解像度が上がって結果がよくなる可能性は
ある。縦にして送るか横にして送るかでも変わりうる。

でも >>917 を読む限りでは、その書類自体がFAXの結果でしかもつぶれてると
いうことだから、それをさらにFAXで送ったりしたら悲惨になるかもね。
600dpiとかでいいからまともなスキャナで読んで、e.Typistの認識率に期待す
るしかない。解像度とか色とかがそれ以上性能よくてもあんまり意味ないので、
1万円ぐらいのスキャナでいいと思うけど。
ただ、数字とか記号とかは綴りから補正できないので厳しい可能性はあるよ。
921名無しさん@お腹いっぱい。:04/05/20 17:43 ID:HkhukARl
このソフト、どうよ?

『エキスパートPDF 2』
〜すばやくプレビュー/編集が出来るPDF作成ソフト〜
http://www.panda.co.jp/products/expdf/function.html
922名無しさん@お腹いっぱい。:04/05/20 17:46 ID:HkhukARl
923名無しさん@お腹いっぱい。:04/05/20 18:34 ID:HkhukARl
また発見。こんなのも、どうよ?

エプソン
http://www.epson.co.jp/osirase/2004/040517.htm
924名無しさん@お腹いっぱい。:04/05/20 21:50 ID:+fGuzFsl
オレの検証の結果:現在の最高峰

 「やさしくPDF OCR]
和文縦書(多文字多言語混在文で検証)の認識率がいい!!
特に新聞のスキャンの認識の良さに感動した。

体験版で試してみてくれ。スキャン画像からの読み込みも可能。
 説明:http://pac.mediadrive.jp/pocr/
 DL:http://pac.mediadrive.jp/pocr/dl.html
925名無しさん@お腹いっぱい。:04/05/23 22:33 ID:QFF0wpHq
Presto OCRを使っています。
見開きのコピーを読み込ませているのですが、
バッチで保存の際のファイル名に困っています。
例えば100頁からとかはできるのですが、単純連続でついてしまいます
これを100頁から偶数頁のファイル名(100, 102, 104 ...)をつけるということはできるんでしょうか?
教えていただけるとうれしいです
926名無しさん@お腹いっぱい。:04/05/30 23:44 ID:2qkmCp2X
プリンタ型のスキャナ(原稿移動型スキャナ)
ScanSnap!
で、PDFにしてから、
OCRソフトをかけたいのですが、現状ではどのソフトが優秀かな。
927名無しさん@お腹いっぱい。:04/05/31 16:04 ID:mGq3pFsg
>>926
漏れの個人的インプレでは
・ e.Typist:認識率◎ 図表◎ 処理速度× 一度に100ページまで×
(やさしくPDF OCRも基本的に同じ)
・読んでココ:認識率◎〜○ 図表× 処理速度◎ 枚数制限なし◎

どんな原稿が主なのかにもよるので、かならず体験版をDLして試すように。
928名無しさん@お腹いっぱい。:04/06/01 02:44 ID:vGBJhfNo
>>924>>927
図表や下線,注釈,ふりがな,英文,数字等が混在した文書の本文をテキスト化したい
(あくまで本文のみが対象)と思っていますが,認識率に定評があるe-typestのエンジンを
積んだ「やさしくPDF OCR」は値段から言って買いってことでよろしいでしょうか?
依然ナローなもんで体験版の70MB超はちょっと…なのでお願いします。
929名無しさん@お腹いっぱい。:04/06/01 15:18 ID:rZN/YAKk
処理速度は大差があるぞ。枚数が多い場合、我慢できるかどうか。
http://pc5.2ch.net/test/read.cgi/bsoft/996505150/155-157
俺は図表はほとんど扱わないんで、読んdeココ使ってる。

どっかの店頭でDLさせてもらってCD焼くなりUSBメモリに落とすなりさせてもらえば?
製品版はおたくで買うから、とか言ってさ。
930名無しさん@お腹いっぱい。:04/06/01 17:20 ID:TD2e6AlN
読んでココv10でPDFファイルを読み取らせるにはどうしたらいいの?

Q&AにはAcrobat のプラグインがどうこうというという説明が書いてありますが、Adobe Acrobatを別途購入しないといけないのでしょうか。

e-Typistだとデフォルトのまま読み込めるので、e-Typist を買おうかな……。
931名無しさん@お腹いっぱい。:04/06/01 17:46 ID:sUNMYWUU
>>930
ttp://www.aisoft.co.jp/japanese/qasystem/showans.asp?N=2102

使ってないけど、読んでココからはPDFは読めないみたい。
Acrobatがあれば、Acrobatに読んでココのプラグインが組み込まれて認識できる。
932名無しさん@お腹いっぱい。:04/06/01 18:57 ID:F1V5olIs
>>931
どうやら、Adbe Acrobatを購入する必要があって、Adobe Reader だけでは無理のようですね。
ありがとうございました。
933名無しさん@お腹いっぱい。:04/06/01 20:12 ID:rlUdn4Jo
>>929
レスありがとうございます。一度に処理するのは多分数十枚だけど,
それでも20分近い差か〜。処理時間を取るか,修正時間を取るか,微妙ですね。
> どっかの店頭でDLさせてもらってCD焼くなりUSBメモリに落とすなりさせてもらえば?
その手があったんですね。田舎だからベストくらいしかないけど,やってくれるかな?
934名無しさん@お腹いっぱい。:04/06/03 07:35 ID:0duTXiPv
今、e.Typist9 の体験版と、スキャナーについてきたOmniPageSE を
独日混合文を読み込ませてテストしてたんだけど、

e.TypistってUnicodeText で保存できないのかな・・??

せっかく認識している特殊文字が保存すると全滅してしまう。。
OmniPageSE はさすがに保存ダイアローグで選択できた。
935名無しさん@お腹いっぱい。:04/06/03 10:40 ID:RXTZ6dw2
次のような条件に当てはまるOCRソフトはありませんか。

1.用途は英語の読み取りのみ。
2.PDFファイルも読み取れること。
3.日本に代理店があること(経理処理の都合)。
4.価格は5万円以下。

OmniPageが良さそうなのですが、値段が……。

936名無しさん@お腹いっぱい。:04/06/03 12:15 ID:YFSxP6J+
Readiris
937934:04/06/03 17:30 ID:5tAv4hbC
>935
今しらべて初めて知ったんだけど、OmniPageProって・・・高いのね。。
確かにSEですら読み取り精度はかなり高く感じるから
業務用にはよいのかもね。

自分の環境ではドイツ語のみの実験しかしなかったけど
皆さんも言う通りe.Typist9 も結構よい結果だった。

速さもOmniPageSEよりは速く感じる。。
(もちろんOmniPageProはもっと速いんだろうけど)
938935:04/06/04 00:41 ID:BYosQvFV
>>937

レスをサンクスです。

日本語OCRソフトの英語認識でも、何とかなりそうなので、そっちで考えます。
読んでココv.10を持っているので、これにAdobe Acrobatを買い足すか、e.Typistか読取革命を買うかなんですが……。
読取革命は体験版ではPDFの認識ができない(バクらしいけど、パッチは製品版でないと当てられないとか)ので試せませんでした。
939933:04/06/05 18:38 ID:wk+VnOog
「やさしくPDF OCR」の体験版を使ってみました。
新聞のレイアウトや文字自体の認識率は高かったけど,大きさが違う図が複数あって
図の中に文字が含まれていたりすると(例えばグラフなんかの場合)
文字領域と勘違いして?とんでもないレイアウトになりました。
手動で図を囲っても何故か複数の認識枠ができてしまって,削除,修正が一苦労。
文書領域全体を手動で大きく枠指定した後で,その上に重ねて図表枠を指定できたり
不要な図表部分だけを認識除外するような機能はないんですね。
940名無しさん@お腹いっぱい。:04/06/09 00:13 ID:RedquFBe
>>939
>その上に重ねて図表枠を指定できたり
ツールバー右側の領域種別指定で図領域を選んでから範囲指定をする。

>不要な図表部分だけを認識除外する
画像ウィンドウのツールバーの削除範囲設定を選んで範囲指定する。

ではだめ?
941名無しさん@お腹いっぱい。:04/06/10 07:15 ID:iRwbqJWx
e.Typistでは、読んdecocoにあるような認識した文字を分離する、ということは出来ないんでしょうか
バージョンはエントリーR3aです
942名無しさん@お腹いっぱい。:04/06/11 09:22 ID:cu73tZfK
>>941
もう少し詳しくお願い。
943名無しさん@お腹いっぱい。:04/06/12 03:53 ID:nHoXSpx4
今、ここに出てるOCRの体験版をいくつか使ってみました(読んでココは以前使っていてかなりよかった)。
サンプルは古い「SFマガジン」に載った小説。これをデジタルテキストデータ化して一太郎ファイルにし、出版サービスで製本するのが夢です。
今日使った中では「読み取り革命」がダントツに使いやすくはかどる。
ただ、多機能な分操作が分かりにくい。
レイアウト認識すると、読み取り順序が勝手に表示されますがこれがまたよく間違う。
これを変更したいのですがどうしてもうまくいきません(右クリックすると順番変更とあるのですがこれをクリックすると「その順番にクリックしなさい」と出て終了してしまいます。
意味が分かりません。
また手動でエリアを指定すると勝手に横書き認識してしまいます。
いちいち属性変更で縦書きに変更するのが面倒なのでデフォルトで縦書きに設定したいのですがどこで設定すればよいのでしょうか?
よろしくお願いします。
944名無しさん@お腹いっぱい。:04/06/12 14:53 ID:JffkyoUr
その順番にクリックしなさい
945943:04/06/13 05:09 ID:mBloqA7d
>>944

そのとおりでした。
ポップアップの出た状態でやらないとだめなんですね。
でもこのソフト、編集が凄くしやすくて助かります。
「た」と「だ」の誤認が多すぎるけど、修正するとき、同時に他の同じ候補文字を
持つ部分もまとめて出てきてチェックできる。
今日1日で二段組で150ページ分ぐらいデジタルテキストデータ化できました。
もう100ページぐらいで出版できます。
946名無しさん@お腹いっぱい。:04/06/13 16:35 ID:mBloqA7d
ところでソースネクストの「本格読取」って評価版はないんでしょうか?
値段が安いから金を捨てるつもりで試しに買ってみてもよいですが、
OCRなんて、使えないのはとことん使えない(手入力のほうが速くて無意味、
ただのごみ)から、できればタダで機能を確認したいなあ。
947名無しさん@お腹いっぱい。:04/06/13 17:10 ID:mBloqA7d
一発!OCRPro for一太郎の体験版を使ってみたら、
一太郎返還機能限定の読取革命ですた。
948名無しさん@お腹いっぱい。:04/06/14 02:11 ID:lxiAjBSp
e.Typist 9は400dpi以上のPDFを読み込めないのか。
だめぽぉ・・・
949名無しさん@お腹いっぱい。:04/06/14 23:02 ID:z1YxIwde
>>946
自己レス。
購入して使ってみたら、読取革命の機能限定版でした。
自動文書変換はワード、エクセル、テクストの3種のみ。
しかし一番いたいのは、ハイパーチェッカーがないこと。
これがあるかないかで編集能率が倍は違う。

ただこれを持っていると読取革命を乗り換え版7000〜8000円の安価で
買えるので、読取革命購入することにしました。
正規に買うと17000〜18000円するので、
これ+乗り換え版で10000万円以内だからはっきり得。
読取革命買ったらこっちは友達にただであげよう。
950名無しさん@お腹いっぱい。:04/06/14 23:06 ID:z1YxIwde
>>865
最強は
「本格読取」購入→それを持参し乗り換え版「読取革命」購入
これで1万円以内に収まる。
ハイパーチェッカーが要らなければ、ほかの機能はほとんど同じな
「本格読取」で十分じゃろう。
951名無しさん@お腹いっぱい。:04/06/15 21:13 ID:Bsv2UO9u
読取名人ってWindowsXPみたいにネット認証が必要ですか?
952名無しさん@お腹いっぱい。:04/06/16 14:46 ID:PESmRZTy
>>949
いや、最近笑ってないとかいうことはないんだけど、
久々に壺にはまっちゃたアルヨ。

わたしの奥さんちゅごくじんあるね。スマヌ、止らん。
953名無しさん@お腹いっぱい。:04/06/17 04:27 ID:CPXvLBB0
>>952

え、そんなにおかしいあるか?

どこが? 説明キボヌ。
漏れの行動がおかしいあるか?
それとも読取革命の価格設定?
954名無しさん@お腹いっぱい。:04/06/17 11:22 ID:ldL5KzWa
( ´_ゝ`)
955名無しさん@お腹いっぱい。:04/06/20 00:08 ID:4OBOKtIG
EPSONについてきた、読んでココを使ってみました。ものすごく認識率が悪いです。
バージョンアップする気になりません。本当にいいのですか?ご指導お願いします。
956名無しさん@お腹いっぱい。:04/06/20 10:29 ID:LJeHHL6C
>>955
付録版とは比べものにならないほど紙資料については認識率はいい。
特徴や弱点などは過去レス参照。
というか、付録版なんて使用頻度が多い人は普通そのまま使わないと思うが。
957名無しさん@お腹いっぱい。:04/06/20 10:34 ID:LJeHHL6C
というわけで、最新版の読んdeココVer.10体験版を導入してみてから判断してください。
http://ai2you.com/ocr/guide/koko10dl00.asp?C=2
958名無しさん@お腹いっぱい。:04/06/20 11:22 ID:xSlzHO4e
和文と英文が混合されていると、認識率が悪かった。読んでココVer.10を導入すれば
改善されますか?値段的には、本格読取→読取革命に魅力を感じます。
読んでココは、26穴・図表に弱点ありというスレを見ました・・・
これらの点を踏まえて、アドバイスしてくれたら、助かります。お願いします。
959名無しさん@お腹いっぱい。:04/06/20 12:48 ID:B5kWBtFt
認識率はどんな原稿かによって変わるし、インターフェイス(操作しやすさ)もそれぞれなので、
結局は体験版を試して感触を掴んでくれと言うほかないのだが…
和英混在文では、l(L)と1、一とーと→、Jと↓、。とo(O)と0(0)などで誤認識が多いが、
製品版(体験版)は付録版に比べてかなりマシだといえる。
ついでにいうなら、最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。
960名無しさん@お腹いっぱい。:04/06/20 13:03 ID:VQqdHuLQ
>最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。
横レスで申し訳ないんだが、認識辞書を鍛えるって、具体的にはどういうことをいうのでしょうか
認識のたびにご認識を修正していくの?
さらには、鍛えた成果は他のPCにも移せますか
よろしく教えてください
961名無しさん@お腹いっぱい。:04/06/20 15:31 ID:jnuppIUd
>最初は認識率が今一つでも、使い込んで認識辞書を鍛えることで相当マシになる。

製品紹介をちゃんと読めば書いてあったと思うけど、今の読んdeは自動学習だったような。
日本語文書については認識率は不満なし。
また、誤認識の癖Ex.(1)(2)が正しく変換できない も使ってればわかるので簡単に対処できるし。
要は使いこなし次第。

読み取り革命は2000の時に使ってたけど、その後読んdeを使ってみてこっちの方がよかったので
それ以来ずっと読んdeです。バージョン重ねるごとに製品間の優劣とかは変わってるでしょうけど、
まああえて買い直すほど不便はないなと思ってそのまま同製品のバージョンアップを重ねています。

最後は、自分の用途ではどうか、を各製品の体験版で比較して一番いいのを選択するしかないと思います。
962名無しさん@お腹いっぱい。:04/06/21 22:24 ID:PwRAEobN
>>958
今日、読取革命の乗換え版を買いましたが、特に他社製品の提示は
求められませんでした(新宿ヨドバシ)。
本格読取買う必要はないかもしれません。
もしかして、これって常識?
952さんが笑ったのはこのことだったんでしょうか?
すいません、純朴なもので……
(それとも、店によっては、提示求めるところもあるのかな?)
963名無しさん@お腹いっぱい。:04/06/21 22:31 ID:v0fYkvU+
OCRはとにかくテキストのみならいいけど、図などが入ると使えない。
964名無しさん@お腹いっぱい。:04/06/21 23:25 ID:1tbBQotT
>961
レスさんくすです。
あくまで横レスなので、読んdeの取説も手元にないんですが、
一般にこうした学習した分というのは、転送可能なものなんでしょうか?
折角育てたのが、OS再インストでおじゃんではかなしんですが・・・
program fileのやつを上書きすれば良いのでしょうか?
965名無しさん@お腹いっぱい。:04/06/21 23:30 ID:qVlt3rlk
>>964
C:\Documents and Settings\ユーザー名\Application Data\Aisoft\Yonde\Usrdic
ってフォルダがあるよ。
966名無しさん@お腹いっぱい。:04/06/21 23:32 ID:qVlt3rlk
>>962
インストール時にチェックされなければいいのでは?
販売店ではチェックされません。
アップデート版も同様。
967名無しさん@お腹いっぱい。:04/06/22 00:08 ID:0wOAhrQA
>>965
サンクス!
しかし手作業でバックアップとるのも限界なのかな〜
何かしら漏れがあるような気がするし
まあApplication Data丸ごとバックアップして、丸ごと上書きすればいいのかも知れないけど
968名無しさん@お腹いっぱい。:04/06/22 12:51 ID:xko6xFie
このスレは、勉強になります。手書きの書類がたまっていて、適時修正をしながら入力を
しなければならないのですが、音声入力ソフトの使い勝手を知りたくなりました。
厳しいご指摘をさけ、ご指導をしてもらえたら、助かります。お願いします
969名無しさん@お腹いっぱい。:04/06/22 15:30 ID:PpY6iLP+
>>968
スレ違いだけど、私も知りたい。
970名無しさん@お腹いっぱい。:04/06/22 16:12 ID:8yAsl0j3
2、3年前の奴だけど、学習させれば結構な精度で入力できた。
でも、咳したりつまったりして、間違って入力されたものを修正する手間を考えると、
タイピングのスピードが結構なレベルの人にとっては、まだまだだったなぁ。

最新の製品については知らないけど。
971名無しさん@お腹いっぱい。:04/06/22 20:07 ID:4pwWYjLk
970さん、ありがとう。ところで、なんていうソフトですか?
こういうスレがないですよね・・・
972970:04/06/22 20:32 ID:l1qblHgF
>>971
IBMのやつだったと思う。今もあるのかな?
973名無しさん@お腹いっぱい。:04/06/22 20:52 ID:4pwWYjLk
966さん、ほかのソフトでも、いきなり乗り換え版を買っても、家でインストールするときに
不都合が生じてしまうのですか?ど素人なので、教えてください。
音声入力ソフトって高いんですが、乗り換え版を購入すれば半額になるようなので、そこのところを
知りたいのです・・・
974名無しさん@お腹いっぱい。:04/06/22 21:36 ID:53yVWTCF
ヨドバシカメラとかで調べてみればすぐわかるんじゃないの?
http://www.yodobashi.com/

あと、製品出してる会社のページいって製品紹介読めば終わりでしょ。
975962:04/06/23 00:16 ID:p7bl4B4h
>>966

インストール時のチェックもなし。
いちおう本格読取入った状態でしたが、たぶん関係ないと思います。
ただ、読取革命の試用版が入った状態ではインストールされないので、
これをアンインストールしてからインストール、でした。

早速使いまくっていますが、認識率は普通だと思いますが
とにかくハイパーチェッカーの使い勝手が最高です。
画像、図表の入った原稿には向かないと思うが、小説などの
長文テキストをメインに扱う文系ユーザーには最適なOCRだと思う。

ちなみにマニュアルによると、アップグレード版の場合は
インストール時に旧バージョンがないとだめなようです。
976名無しさん@お腹いっぱい。:04/06/30 22:56 ID:XAyNW3oo
読取革命の試用版を試した後、「コントロールパネル」の「プログラムの追加と削除」で削除したのですが、MS-WORDのメニューバーに現れた読取革命のアドイン表示が消えません。
どうすれば消えますでしょうか。
977962:04/07/01 06:37 ID:kqjgVCkK
>>976
wordのユーザー設定の一番下の読取革命を選択し、
右の削除ボタンで消えませんか?
ちなみに私は現に使っているため試せません。
978名無しさん@お腹いっぱい。:04/07/01 08:41 ID:Zrh6dlUU
>>977
ありがとうございます。

> wordのユーザー設定の一番下の読取革命を選択し、

ここにはそういう設定がありませんでした。ちなみにMS-WORD2003です。
「ユーザー設定」の「テンプレートとアドイン」の設定も外しましたし、「Documents and Settings」の「\Application Data\Microsoft\Word\STARTUP」にあったアドイン用ファイルを削除しても消えません。

WORDの設定に関するどこかにあるんだろうと思いますけど……。
979名無しさん@お腹いっぱい。:04/07/01 09:37 ID:lVoersTa
>>978
自己レスです。
解決しました。

「\Application Data\Microsoft\Templates」のテンプレートを削除したら消えました。

お騒がせしました。
980名無しさん@お腹いっぱい。:04/07/03 15:08 ID:xxEZgAJV
すいませぬ、e.typistと読んdeについてですが、
例えば、マイドキュメントにあるjpegやbmpなどのA4サイズの文章の画像を読み込んで
それから文字データとして変換みたいなことは出来るのですか?
981名無しさん@お腹いっぱい。:04/07/03 16:39 ID:y/Qf1y5F
自分で試してみろ
体験版もあるんだし
982名無しさん@お腹いっぱい。:04/07/03 21:50 ID:kM/MMzno
難なくできますよ
983名無しさん@お腹いっぱい。:04/07/04 22:31 ID:RgNTRRVJ
読んdeココ使ってるけど
表を読み込んでエクセルに送ったとき
レイアウトも再現してくれるのが便利
専用ソフトで作ってる表を「エクセルでくれ」
とか言われたとき重宝する

こんな意見も少しは参考になるかな?
984名無しさん@お腹いっぱい。
eタイピストを使っているんですが、
自動レイアウト解析を完全に遮断することってできますかね?
これだと目次などでページ数だけ別枠になって、コピペしたときに不便なんですよね。
prestoのようにある程度レイアウトも再現しつつ、べたにテキスト化するのが理想なんですが。
取説を見る限りでは、範囲指定も結局は自動レイアウト解析で認識枠をつくるだけですし・・・
どなたかご教示ください。