■OCRソフト、読んでココか、Eタイピストか■

このエントリーをはてなブックマークに追加
35名無しさん@お腹いっぱい。
OCRを選ぶより、HDD増やして画像閲覧ソフト使ったほうがいいと思うよ。
用途間違ってると思う。

活字OCRエンジンに関わってた経験上からは、
リテールパッケージの識字率では東芝ExpressReaderか
メディアドライブのWinReaderしかないね。
このスレででてる他のソフトは、はっきりいって使用に耐えない。
あとそんな記事信じないほうがいいよ。認識のことしらなすぎ。
まず300dpiでってのもだめ。
それぞれにアルゴリズム違うから、最適な画像解像度がそれぞれ違うし、
10ポ程度の文字だと、400dpiは最低あるべき。

ちなみに、e.TypistのOCRエンジンは、WinReaderの世代前の
エンジンを使ってるらしい。そのくせ、別の筋からは、ものによっ
ては識字率がわずかにいい傾向があるとの事。
36名無しさん@お腹いっぱい。:2001/08/26(日) 06:22 ID:jyeMG1WE
言い忘れた。あと識字率の向上の事だけど、
研究レベルでもエンジニアリングレベルでも、当分大した向上はないよ。

特に研究レベルが、識字率そのものではなく、その周辺、
例えば雑誌とかの絵の中にある文字の認識とかにシフトしてるから。
人の目の認識に追いつくには、AIができるまで無理ってのがみんなわかってるんだ。
だから、一定の識字率が得られるようにスキャニングの工夫するとか、
その後の修正手続きの運用方法の仕組みづくりとか、
新聞とかの特定のフォント向けにカスタマイズするしか、今はない。
マルチフォントってのがだいたい、かなり無理があるんだ。
明朝のIとゴシックのIを考えたらわかるでしょ。