OCRのことなんですが…

このエントリーをはてなブックマークに追加
19名無しさん@そうだ選挙にいこう
>>15
> 図や写真もある時は、キャプチャーで jpeg 保存してあるんだけど

文字も含めて全部ですか?
その画像になった文字を、OCRで再度拾う、ということですか?

それは多分ムリでしょう。
HPの本文の文字は、大体 10dot×10dot くらいで表示されていますから。
ニュースのタイトル文字でも、その倍くらいでしょうし。
一方、通常のOCRでは、
10point の文字を 400dpi で取り込むと、1文字は大体 50dot×50dot になります。
だから、どの OCR ソフトでも、解像度不足で認識できないんじゃないでしょうか。

カラーの背景に書かれた、カラーの文字なんかになると、なおさら・・・