【ADF】スキャナで連続取り込み008.jpg【OCR】

このエントリーをはてなブックマークに追加
737723
>>724
やってみました。
とある古い雑誌の1ページをカラー300dpiで読み込みAcrobatStanderd7.0とScanSnap OrganizerV3.0とで
それぞれOCR。

OCR所要時間(1ページ  PC:ペンティアム3(1Ghz)+512M)
 AcrobatStanderd7.0   約55秒
 ScanSnap OrganizerV3.0 約35秒


OCR結果

まず記事本文(1文字の高さ3mm)でAcrobatが結構ドジってる部分の比較。テキストそのまま貼り付け。
(改行はこちらで入れました。スペースや半角全角は原テキストのまま)

 
AcrobatStanderd7.0

NAPTはさらに動的/静的の2つに分 けらぁる。動的NAPTは一般的なアドレ ス変換方式で、uN憎からリクエストが 発生した際の通信はできるが、
その逆、 つまりWAN側からUIN内へのサーバー にアクセスするような要求には対応でき ない。対して静的NAPTではあらかじめ WAN個噸ポート
に対する要求の転送 先を改定しておくことで、WAN側発のリ クエストに対応する。「WAN側ポート21 番への壊拭要求は、すべでU肌内のFTP
サーバーヘ転送する」というルールを設定 すれば、NAPTを使いながらサーバーを 公開で巻る。


ScanSnap OrganizerV3.0

NAPTはさらに動的/静的の2つに分けられる。動的NAPTは一般的なアドレス変換方式で、LAN側からリクエストが発生した際の通信はできるが、
その逆、つまりWAN側からLAN内へのサーバーにアクセスするような要求には対応できない。対して静的NAPTではあらかじめWAN側の特定ポートに
対する要求の転送先を設定しておくことで、WAN側発のリクエストに対応する。「WAN側ポート21番への接続要求は、すべてLAN内のFTPサーバーへ
転送する」というルールを設定すれば、NAPTを使いながらサーバーを公開できる。


Acrobatは結構がんばってる部分もあるんですが
図版の説明とかの小さい文字(1文字高さ2mm)になるとかなりヘボってきます。(以下図版の小さい文字の説明文)

AcrobatStanderd7.0

最も単純庵貯アドレス変雄串式である「B由NAT」,WAN側のグローバルIPアドレスと」AN例のプライベートIP アドレスを1対1で変換する。
この方式ではU肌側にある複数台のPCでインターネットにアクセスするには、グロ ーバルIPアドレスもPCの台数分必要となる。


ScanSnap OrganizerV3.0

最も単純なIPアドレス変換方式である「BasicNAT」。WAN側のグローバルlPアドレスとLAN側のプライベートlPアドレスを1対1で変換する。
この方式ではLAN側にある複数台のPCでインターネットにアクセスするには、グローバルIPアドレスもPCの台数分必要となる。


以上であります。
738723:2006/03/18(土) 03:36:46 ID:WWFKtsRw
↑かなり見にくくなってしまいました。すみません。

739724:2006/03/18(土) 10:13:08 ID:EDBQfTiL
>>723=737
あなたは神です。
夜遅くにありがとうございました。
大変参考になりました。
740723:2006/03/18(土) 10:21:08 ID:WWFKtsRw
>>724
>737 ではScanSnap OrganizerV3.0 があまりに優秀すぎるので自分でもホントか?と
という感じがあるので別の雑誌で追試をしてみました。

>737の原稿は太目のゴシック体で横書き3段組みでした。
今度は明朝体(細め 高さ3mm)の縦書き4段組みの原稿でやってみました。

するとそれぞれ文字として認識している領域が違って直接比較できる部分が抜き出せませんでした。
(片方がその部分を全部文字で認識してるのに、もう片方は一部しか文字として認識してない。その逆もあり。
 どっちかって言うとScanSnap OrganizerV3.0 の方が領域認識ミスが多いように思う)

そこで、同じ原稿をを 文字くっきり にして 再度読み取らせたところ一応は比較できる部分がぬきだせました。

OCR所要時間(1ページ)
 AcrobatStanderd7.0   約45秒
 ScanSnap OrganizerV3.0 約60秒


AcrobatStanderd7.0

マイクロソフトは二〇〇五年五 月「]64エディション」 と呼ぶ64 ピットウィンドウズの出荷を始め る。
]64は、既存の32ピットCP Uと完全な互換性を保ちながら、 糾ピット化されたCPUのハード ウエアの仕様。
]糾対応のパソコ ンで64ビットウィンドウズを使う と、大容量メモリーを利用できる ほか、データの処理
性能も格段に上がるなど、メリットは大きい。


ScanSnap OrganizerV3.0

マイクロソフトは二○○五年五月?“エディション」と呼ぶ“ピットウィンドウズの出荷を始める。
X脚は、既存の銘ビットCPUと完全な互換性を保ちながら、“ビット化されたCPUのハードウエアの仕様。
x“対応のパソコンで“ビットウィンドウズを使うと、大容量メモリーを利用できるほか、データの処理性能
も格段にkがるなど、メリットは大きい。


これはどう見ても時間・結果ともAcrobatの勝ちですね。
これはちょっとショック。(この雑誌、結構読み込んだのに・・)
ScanSnap Organizerは得意な原稿ではかなりスゴイですが、そうでないのは
普通のOCRソフト並みってことでしょうか。