OCRのことなんですが…

このエントリーをはてなブックマークに追加
2219
>>20
今、表示しているHPを、そのまま印刷した場合は、
画面上では10×10dotの文字でも、
ギザギザがとれて滑らかに印刷されてきますから、
それをOCRにかければ、認識してくれるかもしれません。
ま、もっとも、
今、表示しているHPなら、そんなことする必要は無いですが。

しかし、>>15 の書込みを見ると、あなたは、
HPをキャプチャーして、既に画像として保存してある、とありますから、
それを印刷した場合は、画面上で10×10dotだった文字だと、
印刷結果も10×10dotのギザギザ文字になって印刷されてくるでしょう。
だから、その紙をOCRにかけても結果は同じです。

試しに、文字サイズ(小)で表示してある このページをキャプチャーして、
15 のあなたの書込みをOCRにかけてみました。
して、その結果は・・・

やっぱりダメです。
認識率云々以前に、全く認識結果のテキストを吐き出してくれません。
ソッポ向いてる感じです。

因みに、使用ソフトは、
4・5年前の発売当時は、雑誌の評価でもコンスタントにベスト3に入っていた、
「超整理er (Ver1.0)」です。
このソフトは、もう今は店頭ではお目にかかれませんが、
今でも、週間文春・週間新潮の記事だと、99%認識してくれます。