1 :
名無しさん@そうだ選挙にいこう :
2006/03/04(土) 01:20:09 小売業の事務やってますが、値引照合のマスター作成で重宝してます。 取引先が全部CSVでリストをくれれば、それほど必要はないのですが。 ソフト毎の認識率や珍読取を語ってくだされば。
2 :
名無しさん@そうだ選挙にいこう :2006/03/06(月) 00:27:34
OCR一般スレはすぐ落ちるのねorz
4 :
名無しさん@そうだ選挙にいこう :2006/03/07(火) 13:41:36
新聞や雑誌の記事を保存しておきたいときにOCRかけます。 スキャン画像も一応PDFで置いておくのですが、 気に入った記事は全部テキストとHTMLにしています。 使ってるソフトはe.Typist v9.0。 PDFを扱えるところが気に入ってます。 識字率はちょっと不満があるけれど、一括置換とかうまく使えば まあまあいい感じに使えますね。 レイアウトの再現などの機能は私には必要ありません。 富士通のScanSnapで本をまるごと取り込んで PDFをページごとに分割して、ぼちぼちと好きな本をテキストにして ためていくのが私の趣味です。 namazuで全文検索かけられるようにして、ひとりで喜んでいます。
htmlだとレイアウトが崩れてしまうので 私は透明PDFで管理してます
安いのってやっぱ使い物にならん? 値段がピンきりで幅広いな。
体験版つかってみれ ソースによって相性がかなりあるから 自分でやってみないと意味ない
数年前にいくつか買ってみたんだけど、 松下のは「国」を「玉」と認識する AISoftのは認識率がいまいちな感じ 使ってみた感じでは e.Typist が一番認識率良かったよ
読んでここは細かい字の認識が確か全滅な感じだった 体験版とかあると思うから試してみた方がいいと思う
AiSoftはエクセルのプリントアウト、滲み、罫線くっつきなしみたいな条件のいい素材でも 碌に認識してくれなかったよ。 カンマを「ー」と誤認識してばかりなのは参った。 手打ちのほうが余程早いさ。
文字のサイズによる影響もかなりある。 メーカーがテストに使ったでかい文字サイズなら認識率がいいのかもしれない。 でも、実際、書籍や新聞の文字サイズはそれよりもかなり小さい。 公表認識率はあまり信用しない方がいいと思う。
学習させていくと けっこうまともになるよ
>>12 e.Typistだと一つの置換リストに100個まで登録できる。
これがあれば、変な認識のクセをかなりカバーできるよ。
置換リストは複数作成できるので、新聞や雑誌など
対象ごとにリストを作れば、かなり変換精度が上がる。
e.Typistはバージョンアップごとに置換リストの登録数が
増えてくれたのが良いところだけど、どうせなら
登録数を無制限にしてほしかった。
あと、e.Typistはバージョンアップの後に
今まで普通に変換できた文字が誤変換されてたり
使い勝手のクセが微妙に変わったりする。
今のバージョンのクセが自分の体に覚えさせて
もう二度とバージョンアップしないつもり。
文字認識の基本性能には特に不満がないけれど、
細かい使い勝手はある程度妥協するしかないかな。
14 :
名無しさん@そうだ選挙にいこう :2006/03/13(月) 12:04:46
smartOCR使ってる人はいますか?
15 :
名無しさん@そうだ選挙にいこう :2006/03/14(火) 12:17:07
>>14 smartOCRLiteなら使ってる
タダだから...w
>>14 エディタを横書きにしてるとバグるのがなければいいのに
>>16 あと糞重い
それでも他ソフトよりは軽いから使うけど・・・
プロつかってるけど精度よくすると時間が3倍くらい時間かかるのもつらい だからといって低くすると使い物にならんしどうしろと
19 :
名無しさん@そうだ選挙にいこう :2006/03/16(木) 08:51:32
PDFをOCRしたいとおもってフリーのソフト探してみたが TWAINまたは画像入力ばっかりだった 仮想プリンタみたいな仮想TWAINってどっかに無い?
こんな過疎スレにもアフォはくるんだな
>>18 マルチディスプレイだと表示がバグるのはなおってる?
なおってるなら買おうかなとおもってるんだけど・・・
23 :
名無しさん@そうだ選挙にいこう :2006/03/18(土) 19:01:41
SmartOCR 1.0 Lite Edition 更新履歴 2006 年 3 月 17 日 Version 1.0.7 認識結果をクリップボードにコピーする際に落ちる場合があったので、修正しました。 エディタウインドウでのコピー及びペーストで、改行の処理に不備があったので、修正しました。 エディタの再現モードで、1 行しかないセルの次のセルの先頭文字の表示がおかしかったので修正しました。 文字種指定で「カスタム」を指定した際、指定が間違っていたので修正しました。 「画像編集領域指定」時に、指定領域内の右クリックメニューに「この領域を背景色で塗りつぶす」、「現在のカーソル位置の画像の色を背景色に設定」、「背景色を指定」を追加しました。 ファイルブラウザの保存種別選択メニューに「結果保存設定」を追加しました。 ファイルブラウザのリストの右クリックメニューに「リストから削除する」追加しました。 複数文字選択時の候補メニューに「検索」を追加しました。 エディタの検索と置換で、ダイアログを開くたびに検索文字列を取得しなおすよう変更しました。 「検索と置換」ダイアログの、検索文字列の入力欄に履歴を追加しました。 エディタで Shift + カーソルキーで選択を行った際に、候補メニューが更新されていなかったので、更新するよう修正しました。 エディタで F2 キー入力で、候補メニューを表示する機能を追加しました。 「DragDrop 登録に〜」で落ちる問題で、起動時の初期化失敗で終了するようにしました。
>>23 エディタを横書きにしてると左右キーで移動がおかしくなるバグは直った?
26 :
名無しさん@そうだ選挙にいこう :2006/03/20(月) 14:34:41
白己貴任 自己責任 フー!
>>24 うちも発生してたからだいぶ前にフォームで報告しといたけど
いまだになおってないんだよな・・・
10万だしたのは失敗だったんだろうか・・・
質問したときはすぐに返事きたよ
smartももう割れが出回ってるんだな・・・・ 買ったばかりだからショックTT
31 :
名無しさん@そうだ選挙にいこう :2006/03/24(金) 17:37:42
>>20 わびさびのわからんアフォが来たようですw
smartのエンジン部分だけつかって 好きなテキストエディタで編集できたら最高なんだがな
>>30 これからも似たようなことは起きるだろうから
ワレザーに落ちるのも手
35 :
名無しさん@そうだ選挙にいこう :2006/03/27(月) 16:58:34
smart以外でフリーのOCRはありますか?
まともに使えるのはないとおもう
自分でタイピングしたほうが早いし正確だからな・・・ 作る意欲がわかない・・・ >好きなテキストエディタで編集できたら最高なんだがな 画像ビューワとエディタで十分
38 :
名無しさん@そうだ選挙にいこう :2006/03/31(金) 19:11:48
smartも最初はフリーだけを宣伝につかって 結局はぼったくりだったよなw やることが汚すぎw
高すぎるわ
キャバクラにいくのを2,3回ひかえれば十分買えるだろ
普通の人には高くて手が出せないよ
値段みてきたら 俺のしおくり一ヶ月分だったよ・・・ これは、ぼったくりすぎだろ
44 :
名無しさん@そうだ選挙にいこう :2006/04/02(日) 11:10:19
10万のOCRソフト...
いいのは100万、200万する分野だから smartは安い方だよ その分しょぼいけどさ・・・
プロ版が試用したい 認識率次第では買うからさ
デフォルトの認識率よりも 学習させた結果の方がいいぞ
48 :
名無しさん@そうだ選挙にいこう :2006/04/04(火) 10:48:22
ベクターにOCR校正のソフトでてるけど
ググれ
ExcelのOCR校正のしか出てこなかったが
52 :
名無しさん@そうだ選挙にいこう :2006/04/05(水) 11:10:10
ジャストシステムには文章校正支援ソフト「Just Right!」 がある(9800円)んだが認識率が悪くともフォローできるの かが、わからん?? でも、補正でなおるのならもうそういう時代じゃなかろうか
>>52 校正ソフトは組み込むべきだと思うよ
OCRソフトはひらがなの「り」とカタカナの「リ」なんて区別してくれないし、
見出しの数字なんか、全角半角ごっちゃだし、
手作業で直さないといけない部分が多すぎる。
翻訳ソフトと同じで、そのままでは使い物にはならないことが多い。
まだまだ改良の余地がある
54 :
名無しさん@そうだ選挙にいこう :2006/04/09(日) 21:54:16
ocrスレほしかったんだよ。 やっぱ使ってる人も少ないのかね。 Smartocr Lite使ってみてるけど漢字は悪くないかも。 ひらがながたまにめちゃくちゃだけど。 あと読みココ11と違って一字づつかこってる枠が まあまあ合ってる。読みココはずれまくったりして困った。 操作はしやすいと思う。 この2つしか知らんけどね。
56 :
名無しさん@そうだ選挙にいこう :2006/04/13(木) 13:05:27
ほす。
パナソニ●クの「読取革命」駄目ですたorz。 DQN識字率でつ。
58 :
名無しさん@そうだ選挙にいこう :2006/04/14(金) 15:28:44
「やさしくpdf OCR」というのを使っている。そんなに悪くない。 英語モードで使うと、ピリオドとコンマは認識しにくいけれど。 あとOCRはみんなそうだが、なまじ難しい字は結構しっかり認識 するくせに、単純なところでミスって脱力。人間とはちがう からしょうがないとはいえ……
59 :
名無しさん@そうだ選挙にいこう :2006/04/14(金) 15:33:09
↑ ただしいまSmartOCR Lite を使ってみたら、明らかに負けてる。 ショック。
>>58 そうなんだよなー。しょうがないんだろうけど
「か」「ま」、とかの間違いが多い気がス。
あとたまに「。」がほんとに出ない。αとかが候補に出たり。
61 :
名無しさん@そうだ選挙にいこう :2006/04/15(土) 19:57:37
age
ほっ
63 :
名無しさん@そうだ選挙にいこう :2006/04/20(木) 16:12:46
スマートはプロ版じゃないと 使い物にならない 精度も速度も悪すぎ
>>63 そんなに違うのか?
フリーの方けっこういいと思ったけど
それよりいいなら使ってみたい。
65 :
名無しさん@そうだ選挙にいこう :2006/04/22(土) 07:40:28
smart
66 :
名無しさん@そうだ選挙にいこう :2006/04/22(土) 07:42:33
smartはエディタを横書きにしてるとカーソル移動がおかしくなったりするバグは直した?
67 :
名無しさん@そうだ選挙にいこう :2006/04/22(土) 11:38:27
値段分の価値はないよ 個人が手を出せる範囲だと 他に選択肢がないから使ってるが、、、
smart→本格読取→読めココ 英文を扱うことが多いから、読んでココで落ち着いた。
本格読取はTiffファイルの読み込み可能ですか? スキャナで読み取ったデータがTiffファイルで保存してあり、 それをOCRで文字認識させPDFにしたいと思っています。
70 :
69 :2006/04/23(日) 00:18:21
透明テキスト付きPDFなるものの存在を知りませんでした。 スレ汚し失礼しました。
>>66 それは直ってたけどあいかわらず
点滅してるカーソルがどこいったかわからんくなる(´・ω・`)
72 :
名無しさん@そうだ選挙にいこう :2006/04/23(日) 17:47:32
英文はいまだにオムニが一番?
73 :
名無しさん@そうだ選挙にいこう :2006/04/24(月) 17:16:55
文体による
スマートリーディング業務終了のお知らせ スマートリーディングでは、このたび、資金繰り悪化等の理由により、業務継続が困難な状況となりました。 つきましては、SmartOCR Lite Edition の配布及び、SmartOCR Professional Edition 及び SmartOCR Library SDK の販売を終了し、 残務整理がつき次第、スマートリーディングは解散させていただきます。 2006 年 4 月 25 日 スマートリーディング 享年0歳。合掌・・・。
享年は数え年で、「歳」もつけないのが望ましい。
享 平 洗 年 成 練 壱 拾 読 八 解 年 信 四 士 月 弐 拾 伍 日 没
うわ、マジだ。あーあ。 もっと安くしとけば売れたかも…ダメか。
出遅れた・・ SmartOCRLite107.zipください!!お願い!!!
どおりで読んでココと似てると思った
87 :
名無しさん@そうだ選挙にいこう :2006/04/28(金) 07:51:45
>>83 何故107?
前バージョンのほうがよくね?
乙
>>88 7z
っていう拡張子のファイルはどうやってあけるのでつか?
7zipでググれ 高圧縮アーカイバで、Win板で大人気。
94 :
名無しさん@そうだ選挙にいこう :2006/04/30(日) 07:32:17
こうやって甘やかされた人は これからも迷惑かけるんだろうね
95 :
名無しさん@そうだ選挙にいこう :2006/05/01(月) 15:08:56
このヤリトリを見た人もな!
96 :
名無しさん@そうだ選挙にいこう :2006/05/01(月) 20:16:52
OCRソフトは、「読み取り革命」と「読んdeココ」が売れてるようですね。 現在の最新verは 読み取り革命→10 読んdeココ→12 認識率98%と書いてありましたが。 新聞程度は98%くらいは読み取ってくれるのでしょうか? また、最近のスキャナにはじめから同封されている、 「読んdeココパーソナル」や「ファイル革命」などは認識率はどの程度でしょうか?
よんでここは、電気屋に行けばサンプルCDが置いてあるよ 読取革命は、微妙に変わってるけど本格読取が参考になる
バンドル版はだいたい使い物にならないって聞いたけど。 それだったらSmartOCRのがまし。
読んでココも読取革命も体験版ありますから、試してみては?
100 :
名無しさん@そうだ選挙にいこう :2006/05/01(月) 20:39:40
>>98 ググったら
スマートリーディング業務終了のお知らせ
スマートリーディングでは、このたび、資金繰り悪化等の理由により、業務継続が困難な状況となりました。
つきましては、SmartOCR Lite Edition の配布及び、SmartOCR Professional Edition 及び SmartOCR Library SDK の販売を終了し、残務整理がつき次第、スマートリーディングは解散させていただきます。
とでてきました(汗
どこの社員が持ち逃げして作ったの? 裏事情きぼんぬ
つUI比較
京都生まれ、京都育ちの晶ちゃんがズバリ。一言いっちゃいます ...作業効率を追求した直感的な 修正機能「スマートリーディング」により誤ったレイアウト や誤認識の修正の手間が格段に減りまし た。 ... トラックバックする(会員専用) [ヘルプ]. Commented by 名無しさん at 2006-04-18 21:49 x. e.Typistのパクリですよ ... zubaring.exblog.jp/3230398/ - 26k - キャッシュ - 関連ページ
>100 ググったのは褒めてやるが、過去ログを読むこともおぼえよう。 >75
105 :
名無しさん@そうだ選挙にいこう :2006/05/10(水) 20:38:34
SmartOCR Lite Edition 等を許可無く再配布しないよう、お願いいたします。 2006 年 5 月 10 日 スマートリーディング (C) 2006 スマートリーディング
パクったのがばれちゃうからね。
107 :
名無しさん@そうだ選挙にいこう :2006/05/10(水) 22:40:51
せめて今分かってるバグだけでも直せよ・・・ 責任ぐらいとってくれ ソース貰っても直せねーよ
パクったのがばれるから直せません
パクりって言ってる奴はなんだんだ? なんか恨みでもあるんかい?
商用製品をパクる ↓ 無料で配布する ↓ ばれたから逃げる 法的にも倫理的にも問題
販売もしてたから金取ってるよね パクられたのってどのソフト?
UIは本格読取に毛が生えた程度。 読んでココに似てるって言ってる奴もいる。
なるほど。サンクス
本格読取と同じところで落ちる
まるっきり一緒w
パクリがばれるので再配布止めてくださいと素直にお願いすりゃいいのに……
117 :
名無しさん@そうだ選挙にいこう :2006/05/11(木) 09:39:51
犯罪者の戯れ言 125 名前:56[sage] 投稿日:2006/05/11(木) 04:26:35 ID:jLp0dWRE0 とりあえずファイルへのリンクを削除しました。 オンラインヘルプのほうは、著作物として保護が 強く要請される(であろう)画像ファイルは使って いないこと、また、既存ユーザーが利用するため に必要な範囲の内容に限って掲載していることから、 そのまま存続させていただけるよう、お目こぼしを お願いします。 では、名無しに戻ります。ノシ
と、商用製品をパクった犯罪者が言ってますが何か?
>>117 画像だろうがテキストだろうがソースコードだろうが,著作物だし,
保護されるべきですよね。
犯罪者を殺しても犯罪にならないのと一緒
121 :
名無しさん@そうだ選挙にいこう :2006/05/12(金) 20:54:47
誰かSmartOCRの会社登記とか 社員の名前を晒してくれないか?
ヒント:一人芝居
一人H
おそかった。買うか。でもほしい。なにを買うかな。うpして。よんでここ買おうかな
本格読取でも買えばいいジャマイカ
47 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/04/29(土) 20:27:48 ID:f+6LR83n0
>>38 再うpお願いします。
48 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2006/04/29(土) 20:39:58 ID:MhA2Xxg/0
Axfc UpLoader Basic N13_2563に
pass=47のID
読んでも読み取りも糞だろ 宣伝か?
eTypistも十分クソだから。 コストパフォーマンス的に、本格読取はまあ納得。
128 :
名無しさん@そうだ選挙にいこう :2006/05/14(日) 18:53:16
OCRは無料ので十分
OCRは妹で十分
OCRが妹で十分
131 :
名無しさん@そうだ選挙にいこう :2006/05/27(土) 10:04:10
age
132 :
名無しさん@そうだ選挙にいこう :2006/05/31(水) 08:58:41
クソクソ言ってる奴は「何が良いか」を言ってないよね。 社民党?
SmartOCRがクソな理由は ・認識精度 ・安定性 ・倫理観の欠如(パクリ) の3つに尽きる。
ただ市販品よりましだから このまま使い続けるよ
市販品よりましって言ってる奴は、市販品も使ったことない奴
>>134 辞書を鍛えていけば使えるようになる
それはSmartも一緒だけど・・・
>>135 市販品つってもピンきりだろ。
ちょっと古いがそれでも性能がいいソフトがあるかも知れんが
そこらで数千円で売ってるようなのは10年前にはまるで使い物にならなかった。
だからといってまた数千円を出して、似たようなソフトの後継版を購入して
役に立つか立たないかから賭けてみるというほどのお人よしもいないはず。
OCRって宣伝文句ではなにをいっても、
結局、読み取り精度が使い物にならないレベルであれば全く意味無いから
今もってるのがそこそこの性能ならば、
それと妥協して付き合っていくしかないと思う。
よほど金が余ってる個人でその金を捨てるように
OCRソフトを買い換えられるならいいけどな。
法人とか貧乏とかだととてもじゃないけど無理。
OCRにしても、辞書代>>>>>エンジン代。 FEPもOfficeもみんなそう。
当たり前の話だな
>>137 買わなくても体験版をDLして使ってみればいい。読み取り性能は製品版と同一だ。
過去に一度懲りて以来市販品を食わず嫌いしてるようだが
この2,3年でかすれ文字認識やルビ処理などは相当向上している。
それから辞書を鍛えずに認識精度に文句言ってる奴は単なる怠慢。
出荷状態ではどんな原稿でもそこそこの精度を出す程度の中庸レベルに設定されてる。
OCRは読ませる原稿の状態や記述内容の分野・傾向が人によって千差万別なのだから、
本気でOCRを活用したければ認識辞書を鍛えるのは必修過程だ。
お前の発言はかなり苦しいものがあるな。 最後の2行は要するにSmartOCRも使い込めばよくなる可能性が あることにもなるんじゃないか? 加えて、体験版は実製品時の性能をフルに生かせないってことになる。 だって、体験期間で十分に学習が詰めるまで使えるのか? ヘビーなユーザだったらそうなるのかもしれんが、 無料でいいって香具師はそれだけ使用頻度が低いからそう言ってる訳だし。
体験版を試せば製品版のレベルくらい分かるだろ そのための体験版だし・・・ つまらないことにつっかかるのいくない
>>141 ハァ?
>>140 のどこにSmartOCRはさにあらずと書いてありますか?
>>136 が既に書いてるとおり、鍛えれば精度が上がるのは同じだ。
それから体験版のことは、市販品は数千円出して購入して役に立つか否か
賭けないとならない、などと実情に乖離したことを
>>137 が書いてるから
そんなことはないと指摘するためにその存在を紹介しただけだ。
いずれもSmartOCRを否定してるわけでもないし、そのつもりもない。
話を勝手に曲解する奴に「お前の発言はかなり苦しい」などと言われる筋合いはない。
痛い子発見 つかパクリソフトによく熱くなれるな
暑くなるのにパクリかどうか関係ないな
パクリソフトなんだから、フリーもへったくれもないってことだろ。
特許とってないコードはパクリにならんだろw
はいはい作者乙作者乙。 特許をとらなきゃ著作権侵害なんかにならないよなwww
特許侵害と著作権侵害は別物だぞ
皮肉と事実もわからん厨房は学校に行きなさい
事実、ソフトウェアはUIや動作を見よう見まねしてコーディングした 程度じゃ著作権侵害は適用されんぞ。 それこそソースコードを見てそのまんまとかで無ければな。 でなければ、現存しているソフトウェア業界の90%以上は著作権侵害ってことになる。 皮肉るにも突っ込みどころ満載の皮肉はやめようなw まあ、特許を取れば似ているってだけで訴訟の対象にすることは可能だがな。
>>151 何で某OCRソフトと同じバグがあるのか、説明してもらいたいもんだな。
それともパクリ作者にとってはそれが必死の弁解か?
UIが似てる時点で盗作ですw
つかPro版はウン十万で、パクリ疑惑が出た瞬間に公開停止・・・ これほど胡散臭いやり方もないだろ。自分でパクリを認めたようなもんだ。 元社員or関係者の持ち出しと見て正解だろうな。
“バグまで似せる”のが厨房クオリティ
じゃあ何であのタイミングに勝手に配布するななんて言ったんだろうな
胡散臭い点 (追加) ・あの対応からして何人かで開発したとも思えない ・明らかに売る気のない値段 ・あれだけの辞書を作るには、一人や二人でできるもんでもない ・認識ミスする箇所はある市販OCRソフトと一緒 開発に使ったソフトも割れもんかもな。
160 :
和田 :2006/06/04(日) 00:13:35
オマージュですよ、盗作ではありません、2つを並べてみていただければ分かります
バイトが常駐してます
時給いくらだろ? 2000円くらいならやってもいいな
オマーンですよ
2000じゃやりたくないw 毎日2ちゃんだぞ つらすぎるw
1000円でもやりたい ---ニート
意志はあっても無職ならニートだろw 2ちゃんは毎日2時間が限度だな〜 それ以上はヤダ
>>168 その意思が口だけなやつもいるからなあ。
本当に働く意思があるのなら、バイトでも何でもするはずだし、
今仕事無いからって仕事選ばなければ大抵の仕事は手に入るはず。
少なくとも、30歳未満は意思があるが仕事が無いって言い訳は通用しない。
30才以上でも同じだろ 3kの仕事ならいくらでも余ってるんだしさ・・・
171 :
松浦 :2006/06/05(月) 23:07:59
インスパイヤされて開発され、新たなオリジナリティを加えて商品化したものです
>>169 今はそうでもないぞ
採る方も結構選り好みする
足りないからといっても誰でも採る訳じゃない
・・・てなんだこのスレの流れはw
>>172 はいはい言い訳言い訳。
仕事は選ばなければ絶対ある。
俺の近所のガソリンスタンドなんていっつも人手不足だったし。
えり好みするのは人が余っている職場。
そういうとこしか面接行かないから採用が無い。
足りない場合はどんなのでも取る。
それでも、採用されないのは本人にやる気が無いから。
あまりに不潔だったりとか、面接で遅刻とか。
そういうぽまえらは会社から2chやってんの? それとも夜勤?
仕事が暇過ぎて仕事中に2ちゃん。 2ちゃんしてなくてもずっとネットサーフィン。 会社には毎日来てるけど1日30分ぐらいしか働いて無い。 親会社が傾いてるから営業しても駄目だし。 会社潰れそう。 現実逃避中。 多分超負け組み。 失業したら農家でもやりたいな。
>>176 自然に触れながら厳しい肉体労働をこなす。
健全で良いじゃないか。
ただ妻子がいやがりそうなのが微妙。
>>173 おいおい、取る側にも選ばせてくれよ…
足りないからってどんなのでも欲しい訳ないだろ。
確かに、
>あまりに不潔だったりとか、面接で遅刻とか。
なんてのははなから論外だが。
>>178 なんで選んじゃいけないなんて論法に持ってこようとするんだ?
自分がニートなのを自分じゃなく他者のせいにして現実逃避してるだけじゃない?
取る側だって選んでるよ。でも、人手足りない状況じゃあ選んでられないってのも事実。
端から見て怪しいのは流石に取らないけど、人手不足になると本当に
ぱっと見頼りなさそうでも、ある程度の礼儀で面接に臨めば即採用になる。
俺がバイトしてたスタンドがそうだったからな。
人が足りない場合はとりあえず、採用してみて、あまりに使えない場合以外は
大抵そのまま雇ってくれる。
>>177 毎朝早起きでハンパネーよ
天候に左右されちゃうし、機械化されてきてはいるが
その機械買う金もバカにならない上に
手作業だっていろいろあろだろうし。
腰痛くなりそう
>>180 俺の親も農家だからちょっとその気持ちわかるな。
夏場は昼間が糞暑くて仕事にならないからっていつも早朝に出て、昼間は家で休んでる。
収穫期は毎日12時近くまで収穫物の区分け作業。
マジで、農閑期は自由だけど、忙しい時期は鬼のように忙しい。
これが農家の現実。
農機高杉どうにかしる
>>180 今、俺毎朝5時起きしてる。
3時起きぐらいまでなら寝る時間を調整すりゃいける筈。
農業を舐めてるわけじゃないよ。
自然と触れ合って汗水流す仕事がやりたいんだよ。
農機が高いなのか。。
ほら農村とかで若い人募集してたりするとこあんじゃん。
あーゆーのって結構支援受けられるんじゃないの?
どうしても駄目なら屠殺人でもいいや。
食の根幹に関わることがやりたい。
まぁ会社が潰れたらの話だけどな。
>>178 高望みして無職なら
条件を低くして選ぶべきじゃない?
無職で何の問題もないなら別だけど・・・
今の時代
文盲、メクラ、手や足がなくても
出来る仕事はあるんだし・・・
盗みをしなければ生きられないって意見もあるけど 単に盗みが楽な仕事だから選んでるだけなんだよね
流石に、障害で仕事無い香具師は仕方ない部分もある。 学校行ってて特定曜日しか働けないとか、夜だけしかダメとか 夜でも、徹夜するような仕事だと学業に差し支えるとかで 仕事無いってのも仕方ない。 でも、五体満足のNEETで仕事無いとか言ってるのはタダの甘え。 てか、ここは何のスレだ?w
土木とかコンビニとか清掃とか 時間も自由に決めれる仕事くらいいくらでもあるな
188 :
名無しさん@そうだ選挙にいこう :2006/06/06(火) 22:14:25
どなたかSmartOCRうpまたは落とせるところお願いします
おフランスあたりのうpろーだをくまなく探してみれば見つかると思うよ。 まあ、いつ削除されるかは分からんが。
死ね
団栗の背比べ 五十歩百歩
>>191 というか、何故著作権幇助の罪に問われるようなこと
ボランティアでしなければならんのだ?
死ねとか言う前にとりあえず、著作権法について勉強しろ。
190のように中途半端に教えるのは 自慢したいだけだろw
そして、教えてもらえないからと
>>195 のような発言に至る
と言うか、過去ログも読まない厨房だから誰も教えないし、
>>190 のような中途半端な解答しか得られない。
アフォな質問者にはアフォな回答がお似合い
198 :
名無しさん@そうだ選挙にいこう :2006/06/10(土) 13:57:06
Smart以外にフリーのソフトはありますか?
>>198 FengOCR
中華製のすばらしく使えないOCRソフト
いくら試用版でもここまで使えないと製品版使いたがる香具師はいないだろw
OCRなんてパテントが山のようにありそう。 そうだとしたら研究してこなかった企業がソフト作るのはなかなか難しそう。
音声認識や合成音声と同じで 作るのに金ばっかりかかって たいして売れないから・・・
>>201 まあ、現存のOCRソフトの大半も自社のスキャナ製品の
OCR機能の副産物として出すくらいだからな。
CDやDVDのライティングソフトと一緒で大抵がスキャナに
付属としてバンドルされるから誰も買わない。
高い精度のOCRの開発はどうしても金と時間がものを言うから
少人数で小さい会社や日曜プログラマがちょちょいと作れるものでも
無いから、フリーや安くて高性能なものも出回りにくい。
まあ、今後フリーのOCRソフトを出すので一番期待できるのはSunかな。 SunのStarSuite陣営は次期バージョンでOCR機能の追加を謳っていたし。 当然、そのフリー版とも言えるOpenOfficeにも機能は実装されるはず。
普通はバンドルされてるからこそ売れると思うんだが・・・
他のスレでも書きましたが、平凡社世界大百科事典をOCRにかけています。 1冊500〜600ページx32冊をe.typistでtxtデータ化していますが、何だかんだで スタートしてから1年くらい経過しました。 今現在、32冊中の28冊分のOCRが終了しました。今月中には完了するでしょうが さすがに疲れました。 識字率については正確さはあきらめて、吐き出されたテキストをperlで修正しています。 とりあえずタイトルさえ正確に出来ていれば本来の百科事典的な使い方が出来るので 本文検索とか多くは望まないようにしています。
マルチいくない 違うなら他スレのリンクをかけ
操作に慣れてOCRに学習させていくと 8時間で文庫で2〜3冊くらいは出来るようになる PCを使ったことがない新入社員でも半年くらいでできるしね
>>207 今時、PC使ったことない新入社員なんてどこにいるのかと・・・
まあ、職種にもよるのかな。
全部の版が出てるわけじゃないからな 必要な人は自分でするか業者に頼んでる
211 :
205 :2006/06/14(水) 22:10:54
>>206 さん
スンマセン。以前書いたのはこのスレです(↓の215が私です)
【PDA】電子辞書として使おう
http://pc8.2ch.net/test/read.cgi/mobile/1102240007/ 1ヶ月以上動きが無いので、上記のスレでの情報取得は無理かと思い、こちらで書き込みました。
>>209 さん
上記スレにも書きましたが、デジタル版の平凡社大百科事典は所有しています。
70年代の版なので、昔の日本の状況が載ってて面白いです。
良い意味で(悪い意味でも)表現の規制が無いので…
>>210 さんの仰るとおり。
タイピストでの作業は、一生懸命やって100pあたり45分くらい掛かります(一冊あたり4〜5時間)
しんどいので、アルバイトでも頼もうかと思いましたが、自分がこの仕事に単価をつけると2000/h
くらいの自給になり、さすがに30万円以上も出せないな、と思い自分でシコシコやってます。
業者だと400文字で10〜30円くらい
213 :
名無しさん@そうだ選挙にいこう :2006/06/15(木) 15:59:06
大量にある書籍をテキスト化したいのですが、一日2時間程度の作業時間でコツコツ行っていくのに効率の良い方法はありませんか? 書籍のテキスト化は初めてなのと、一度に作業ができないので悩んでいます。 ScannerはEpsonのGT-7400UでOCRは読んで!!ココV12、Acrobat7.0です。 思いついたのは、 1.取り敢えずJPEG画像でPDF化しておく→時間があるときにOCRで修正しながら透明テキストPDFにする 2.無修正のままで取り敢えず透明テキストPDFを作成しておく→時間があるときにOCRで修正 何か良い方法はないでしょうか?
>>213 とりあえずブックスキャナを買ったら?
ピンきりだけど
GIMPとかで使用してるOCRソフトにあわせてスキャン画像のゴミとか取ってからじゃないと ご認識しまくって使い物になんな
216 :
名無しさん@そうだ選挙にいこう :2006/06/24(土) 17:28:30
age
217 :
名無しさん@そうだ選挙にいこう :2006/07/17(月) 23:25:05
ふと浸かってみて思ったのだが、アスキーアート作成の強力な武器になりそう。
ならねーよw
宣伝乙 それとも自演かな?
222 :
名無しさん@そうだ選挙にいこう :2006/08/06(日) 23:39:39
学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品 学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品 学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品
( ´,_ゝ`)プッ
224 :
名無しさん@そうだ選挙にいこう :2006/08/08(火) 11:44:18
1.07は糞
わざとだろw 224はアンチw
227 :
名無しさん@そうだ選挙にいこう :2006/08/09(水) 09:55:15
Smartは期待して使ったけど 全然ダメだった覚えがある 未学習と比べればいいんだけどさ・・・
無料だから信者がつきやすいだけ パクリ疑惑もあってアンチもついたし 知名度は抜群
230 :
名無しさん@そうだ選挙にいこう :2006/08/10(木) 14:01:49
SmartOCRのことで、教えてくれ。 どうして1.0.6の需要があるの? 最新版の1.0.7にはない機能があるとか。 教えて君で申し訳ない。
>>230 1.0.7が最高ですw
機能も豊富ですし
安定性も一番www
お友達にすすめるなら是非1.0.7をお願いしますw
個人的には104が一番バランスがいい 機能、安定性、軽さなどで どれを重視するかによってベストは変わる
1.07は糞でFA
でもプロじゃないと精度悪すぎなのがね・・・
それは当たり前 フリー版の精度高かったらプロ版売れないしw 今はプロ版買えなくなったけどさ・・ フリー版を使ってる人は操作性などで選んでるんじゃなかろうか フリー版は学習させてもあんまりよくならないし・・・
プロ版もnyで落とせばいいだけ フリー版よりも安定しててお勧め
洒落にはきてるのかな?
訴える会社がないんだから捕まらないっていうのは甘い?w
241 :
名無しさん@そうだ選挙にいこう :2006/08/23(水) 18:46:38
こちらでいいのか分かりませんが。。 ぜひ教えてください。 妹が妊娠初期で、勤め先でOCRスキャナを使っているそうです。 OCRスキャナは一般に母体への影響はなにかあるんでしょうか。 読ませるときに光をあてますよね。 あの光がレントゲンのようにすごく危ないものであったりとか。 東芝の製品で品番等問い合わせをしたら 「申し訳ありませんが、販売店にご相談ください」と言われたそうで。。。
>240 会社が無くなっても、権利者はいるだろ。 特殊な人が債権として取得している可能性があるので、会社存続時より却って危ないかもねw
>241 スキャナ(コピー機)の光源は発光ダイオードや冷陰極管(=蛍光灯)です。 光を直接浴びるならシミ・ソバカスの原因になるかもしれませんが、 通常の使い方ならブラウン管テレビの前にいるより被害は少ないでしょう。 つか、そんなネタをどこから吹き込まれたんだか・・・ そのうち妹さんが労組の利権争いに巻き込まれ、ストレスから霊感商法に引っかかって壺を買い いつの間にかソウルで集団結婚式を挙げているに666北朝鮮ヲン賭ける。
244 :
241 :2006/08/24(木) 00:30:23
>243さまありがとございました。 使っているスキャナっが旧型っぽいらしく、心配になったみたいです。 よく考えれば、レントゲンは体の中をと撮影するもので、OCRのように紙の表面を読むだけなら、コピー機と同じですね。 姉妹で無知だったもので。。 すみませんでした。
245 :
名無しさん@そうだ選挙にいこう :2006/08/31(木) 22:09:48
246 :
名無しさん@そうだ選挙にいこう :2006/09/09(土) 18:50:31
SmartOCR Lite 1.0.6 ってどこか流れてないかな?
そんな糞バージョンイラネ
>>246 お前は1つ前の投稿も読めないのかと(ry
246はネタだろ
どなたか優しい方、SmartOCRをうぷしてくださいな。
>>251 本当にないのです。245のサイトもリンクが外されています。
254はIP抜かれるから注意
>>254 文学版にあったよ
あとググっても見つかりますよ
>>255 IP抜かれるのですか?
>>256 文学板は初めての板なので適当なスレを見てみたのですが、
どこにあるのかわかりませんでした。
>>257 図書館で借りた本を携帯で読むためです。
手に入れることができました。ありがとうございました。
なんでスパイウェアを使うんだろう・・・
IP抜かれることも知らなかったようだし 無知なだけだろ
261 :
名無しさん@そうだ選挙にいこう :2006/10/26(木) 00:31:34
和文の中に英文が混ざったものをOCRする場合、何が 一番良いですか。 e.typistを使ったら全然ダメでした。 特に英文の斜体を全く認識してくれない。 何かやり方が間違っているのだろうか・・・
>>261 俺はetypistでやってるよ
photoshopで修正かけてからやればそこそこ使える
文句言ってる奴は 100%の認識じゃないのが不満か ソースが汚いんだろうな
>261 読み取りdpiを上げる&混合認識の設定しても駄目なら、面倒でも範囲指定。
266 :
名無しさん@そうだ選挙にいこう :2006/10/28(土) 08:52:50
261ですが、皆さん、ありがとうございます。 e.typistで普通に範囲指定したら、イタリックの部分を 和文としてめちゃくちゃな認識をしてしまうのです。 範囲指定をすれば、勝手な範囲を作ってしまって、 文章がつづきませんでした・・・ (1つの段落なのに、文の途中で範囲を分けて数行にわたって 縦に2つも3つも枠を作るので、使い物にならない状態) そこで今は読取革命のお試し版を使ってみたのですが、 こちらは範囲指定すれば、イタリックでも何とか 普通に認識してくれます。 ただ、和文中の間違いが多いけど・・・ とりあえずコレでやってみます。 (原稿は奇麗でノイズもほとんどありません。)
範囲指定が間違うことなんてないはずだけどな
268 :
名無しさん@そうだ選挙にいこう :2006/10/28(土) 22:34:10
読取革命はいいよ。松下関連会社社員の俺が保証する。 どのスキャナにもバンドルされてないのに、いまだに2強相手に バージョンアップをし続けている独立不羈のレコグニション・テクノロジーだよ
基本的なことが分かってないようだからいっとくけど ノイズが目に見えなくてもOCRにとってはノイズとなることもあるよ だから修正しないとだめ してないから範囲指定が間違うことになる。 修正するのが面倒ならソフト毎に原稿の得意不得意があるから 使い分けるといい
Smart最高ってことだな
272 :
名無しさん@そうだ選挙にいこう :2006/10/30(月) 23:08:50
手書き文字アンド罫線に適したOCRソフトとなると なにになりますか? 表に手書きで記入したものをデータ化したいのもので。
宣伝貝?
そうでもないか
276 :
名無しさん@そうだ選挙にいこう :2006/11/01(水) 18:38:34
エプソンのスキャナーGT9400UF やや美品 オートシーダー付き 付属品もある。 300枚ぐらい、PDFに変換したぐらい。 もちろん、きちんと動く。 藤沢まで取りに来れるなら、ぶつぶつ交換しないか? 当方バラの苗希望(品種問わず) また、夜の10時すぎに来ますので、レスあればこたえます。
ネタだよな? その機種は過去最悪の出来
薔薇って苗で育てるの?
え??? 今の子はそんなことも知らないの?
校庭の土以外触ったことがない子ばかりだよ
「種ではなく」 って意味じゃないの? >278 薔薇のように観賞用に改良された品種は種が出来にくい物がある。 また、発芽後しばらくは虚弱で世話が大変だったり 花の色が親と同じになるか判らない等の理由で挿し木などで増やすことが多い。 もちろん品種改良を意図する場合は別。
苗木と勘違いかもな
>>281 >花の色が親と同じになるか判らない等の理由で挿し木などで増やすことが多い。
バラって木なの?
木じゃなくても挿し木っていうよ。辞書引いてみな。
いじわるだなw
そういえば、朝鮮朝顔に茄子を接ぎ木して 実った茄子を食べて中毒した人がいたな。
紙原稿をOCR→PDFにする場合、どのOCRソフトが一番向いているでしょうか。 又、紙原稿→OCR→wordの場合はどうでしょうか。 どなたか詳しい方、教えてください。
つ Adobe Acrobat Standard ・定価で買っても一年で割れば一日100円。俺でも買える良心的価格。 ・ADFに付属のAcrobat Standardを使うなら、更にお得。 ・仮想プリンタで何でもかんでもPDF化できる素敵環境。 ・案外使えるOCR機能をなんと標準搭載。 ・Readerには無い「テーブルとしてコピー」機能を使えば、なんと表形式のOCRデータを Excelに直接コピペ可能。まさにビジネスマン垂涎の機能をこれもまた標準搭載。 電子帳票としてのPDF優位に疑う余地はない。今なら最新版のVer8が出たばかりだ。 さあポチッと押してこい!そしてレポよろ(・∀・)
人柱ワラタ まぁ、MS-Officeと同じで本家入れたPCが一台はあった方が便利。
<<価格に躊躇してる、私の背中を思い切り押して!>>
・・・・という、
>>287 の内なる声に答えてみました(・∀・)
なにせVer.8には、そのものズバリ「Word文書として保存」機能が付いてるからね。
今頃は背中をさすりつつ、クレジットナンバーを打ち込んでいるに違いないよ。
291 :
名無しさん@そうだ選挙にいこう :2006/11/20(月) 17:09:39
iCS ics 囚果 因果 原囚 原因 なつたがり なつながり 達動 運動 言危弁 詭弁 ベルグソソ ベルグソソ 力_ が、 lism lism soCial social ラソド ランド 惰報 情報
>>291 十分々々。そんだけ認識出来てりゃ文意は伝わるよ
> ベルグソソ ベルグソソ えーっと……
>>288 ありがとうございました。
Acrobatはver6を持っているのですが、OCRしても校正が
できなかったような気がします。(実は余り使っていない)
校正が大事なので、結局、読んでココと読取革命で試したのですが、
画像の修正は読んでココが便利、WORDに変換した場合は、
読取革命のほうがレイアウトを奇麗に保ちました。
結局一旦WORDに変換して校正し、PDFにすることにしました。
ここの名無しってなんで選挙なんだ? ビジネスsoftと関係ないジャン
>>294 http://pc7.2ch.net/test/read.cgi/software/1106824572/528 >
>>526 > つか
http://www.planetpdf.com/ で調べたら色々載ってたよ。
> 透明テキスト(Hidden Text) はTouch Up で追加された文字列でアルファブレンディング
> されてるだけだから、編集もTouch up Textで可能。
> 不可視属性については「Touch up Textツール→透明テキスト全選択→右クリック→プロパティ
> →テキストタブ→塗りつぶし」で好きな色(赤色など)を選べば解除できる。
> で、この状態なら修正もしやすいんで、なおし終えたら、また「プロパティ→カラーなし」にすれば
> 透明テキストになる。
> ちなみに透明テキストを新規に作成する場合は「Touch up Textツール→任意の位置で右クリック→
> 新規テキスト」でフォントと横書き/縦書きを選ぶ。あとは「右クリック→プロパティ」で「カラーなし」にすれば
> 透明テキストを好きな場所に挿入することが出来る。
この方法でもダメ?
>295 郵政選挙の時(だったかな?)に変更して、そのまま放置されているだけ。
>>297 いや、俺の記憶では2000年夏の参院選からこの名無しだ
300 :
298 :2006/11/24(金) 15:22:54
303 :
298 :2006/11/24(金) 22:49:17
>>301 2000年の選挙って言うとこまでははっきり覚えてたんだよ。
明石かどっかの花火大会で将棋倒しになる大事故があって
吉野屋コピペが乱立して、2ちゃんの鯖が停止しかけてみんなで
したらばへ大移動しようとか言ってた頃だよ。
>>300 そのサイトはあくまでも参考であって
情報源にならんよ
つうかOCRの話せいよ。
読んでココのヘタレアクチ、嫌でしょうがない。
そうでもないか。
え、読んde!!ココ ってアクチ付いたの?いつから?
昔からついてるだろ
アクチがついてないソフトを探すのが大変になってきたな
アクチに文句言ってる奴は割れなんだろ
313 :
NNN :2006/12/09(土) 01:48:34
読んでココで読ませてワードに出力すると必ずテキストボックスだらけに されて役立たん!!と思ったがなんでそんな仕様になってるの?
レイアウトを保持する設定になってるんじゃね?
313はマルチ
-‐- ,、 __〃 ヽ lv ! ヽ\ .ノノノ)ヘ))〉ヽ' / ̄ ̄ ̄ ̄ ̄ _!(0.)! (┃┃〈リ / < はいっ! /\ Vレリ、" lフ/ ./ \ \_____ / ./l ̄ ̄ ̄ ̄ ̄ ̄ ̄|ヽ \/l |―――――――! ヽ l | ○ み か ん | l l―――――――| . \l_______|
間われ 問われ 湖る 遡る 憐欄 憐憫 迫求 追求 恋意 恣意 演縄 演繹 拘東 拘束 なげればならない なければならない 避げ 避け 官分 自分 後喬 後裔 明蜥 明晰 社全 社会 おげる おける うげ入れ うけ入れ 立怯 立法 盲由 自由 制隈 制限 だげ だけ わげ わけ をうげ をうけ 範曙 範疇 明噺 明晰 間わ 問わ ウーン
手打ちの方が楽なんだよね 数こなす必要があるのなら、シコシコ学習させていくしかないかと。
問顧問題 官由自由 潮笑嘲笑 欺購欺瞞 おけぱおけば +分十分 精纈精緻 研鐙研鑽 ょってよって 吝薔吝嗇 勘酌斟酌 ウーン ウーン
対時対峙 役鵠役割 問顕問題 有由自由 紬細 説朗説明 演緯演繹 勘弁してください ウーン なまじ読むから困る
ただ、LightではPDF出力の場合、文字の平均の大きさで原稿サイズを調整してしまう。 106はデフォ?、107は選択できるようになっているがLightでは選択できない。 これさえなきゃ・・・・
324 :
名無しさん@そうだ選挙にいこう :2007/03/02(金) 12:39:01
ところで一番速いスキャナーってなんですか エプソンの8700は600dpiでA4 50秒これは痛い いまはもっと速いのが出てると思うのですが(5万円以下)
325 :
名無しさん@そうだ選挙にいこう :2007/03/23(金) 10:46:01
フォルダに放り込んだら常時監視のサーバが動き出して 勝手にOCRかけてくれるシステムって無いかな〜
いくつかある ググレカス
327 :
名無しさん@そうだ選挙にいこう :2007/04/04(水) 23:45:42
329 :
名無しさん@そうだ選挙にいこう :2007/04/05(木) 12:53:39
読取革命 と 読んでココ どっちが使い勝手がいいですか?
WinReaderPROの 中古版
329はどれを使っても同じ
333 :
名無しさん@そうだ選挙にいこう :2007/04/24(火) 20:53:50
Windows Genuine Advantage Notificationsをインストールして、 OCRに影響が出た人っていませんか? WinReader Hand S V2.0の認識が正常にできなくなったんですが・・・
なんでもかんでもWGANのせいにするのは、割れ厨の悪いクセだ……
割れは一切使っていません。 自動更新をインストールして急にOCRが使えなくなりました。 SP2抜いてもWGANがアンインストールできなくて困ってるんです。
336 :
名無しさん@そうだ選挙にいこう :2007/04/25(水) 09:55:12
スレ違い
いきなりSP2を抜くとは、また豪快ですなぁ。 SP2を入れたら使えなくなったとでも?
半角カナ主体の表(請求書の商品名が半角カナ)を
上手に読みとれて出力できるOCRはないですかね?
単語登録も半角文字が使えるOCR。
とりあえず体験版を3つほど試してみたのですが、
e-typist:半角カナ非対応ぽい
読取革命、読んde!!ココ:認識率が悪い
読んde!!ココなんか、
「プ」が「70」になったりしたけど、半角では単語登録できないみたいですし。
富士通の「表OCR/文書OCR for Excel&Word V5.0」
http://software.fujitsu.com/jp/ocr/socr/ はどうかな? と思ったのですが体験版がウェブサイトにないから試せないですし。
追記 e-typistは半角カナ出力は出来ませんが 半角カナ文字を読みとって全角文字として出力するのは 読取革命、読んde!!ココより上手でした。
340 :
338 :2007/05/30(水) 07:30:04
「表OCR/文書OCR for Excel&Word V5.0」を買って試してみました。 ちゃんと半角カナ出力が出来ました。 全角文字の認識率はe-typistの方が上でした。 ですので、半角カナを使う人はこのソフト、 使わない人はe-typistがオススメのようです。
なんで無料のを使わないんだろう・・・
342 :
名無しさん@そうだ選挙にいこう :2007/06/01(金) 12:41:15
ないから
半角はsmartOCRがいいかも
344 :
名無しさん@そうだ選挙にいこう :2007/06/14(木) 10:59:12
いい加減にsmartocr信仰を止めろ あれのエンジンはe.typistと同じだ ある社員がe.typistのソースと辞書データをごっそり持って辞めて 作ったのがsmartocrだ
それ信じてるんだw
真相知らないんだw
347 :
名無しさん@そうだ選挙にいこう :2007/06/21(木) 23:13:39
64ビット対応のOCRソフトを教えてください。
348 :
名無しさん@そうだ選挙にいこう :2007/06/22(金) 09:29:04
etypist
何で嘘付くの?
350 :
名無しさん@そうだ選挙にいこう :2007/06/29(金) 11:19:51
ごめん
公式発表がないだけで たいていのソフトは動くけどな
353 :
名無しさん@そうだ選挙にいこう :2007/07/03(火) 09:44:11
つぶれた
355 :
名無しさん@そうだ選挙にいこう :2007/08/01(水) 02:36:22
Ver12 age
356 :
名無しさん@そうだ選挙にいこう :2007/08/29(水) 02:07:06
ここ見て「やさしいpdf」体験版使ってみた。文字情報持ったpdfでも英字/日本語の誤認山ほど。 文字情報持たないpdfはほとんどゴミでした。これじゃ正規版買う気にはならないなあ・・・ 最近カキコ少ないみたいですが、どれがいいのかな。
文字情報の有無とOCRの精度はあんまり関係ないと思うが……
原稿の状態と相性はあるし 一概にこれならご認識少ないとは言えないんだよな
359 :
356 :2007/08/30(木) 11:29:45
>>357 文字情報持ってるpdfでもその情報使うわけじゃなくて画像から認識するみたいですね。
生SCANしただけのpdfは、字が小さい・ノイズが多い、で認識壊滅状態になったようです。
ぼくも生が好きです。
>>359 OCRのOって、なんの略だか知ってましたか?
Omanko の略です。
364 :
359 :2007/08/31(金) 08:05:28
>>361 OPTICALでいいの? 私が知ってたOCRは、専用のコーディングシートに文字を
手書きして読ませる機械でした。今回、pdfからかなり大きな表をエクセルに貼る必要ができて、
調べてみてOCR的な機能を持つソフトがあるのを知った次第です。
誤字脱字はあっても、全部手で入力するよりは早くできました。
>>364 こういうのは、自分のブログとかに書くといいよ。
366 :
名無しさん@そうだ選挙にいこう :2007/09/06(木) 18:09:17
現在の所、Docuworksがいい 縦書き認識にも対応 既存のjpgファイルの読み込み認識に効果あり。 「やさしくPDFへ文字入力」で読み込めない画像も読み込め認識も可
>>356 「やさしいpdf」って何? 「やさしくpdfへ〜」の事?
たった7文字の製品名すら正しく書けないおつむの奴に、
けなされるOCRソフトが不憫でならないw
けなしてはいないじゃん 過剰反応いくない
昔のOCRソフトで役に立たないのを捨てた。文字情報を抽出する奴だったが、文字情報として pdfが持っているものしか抽出しないみたいで、試しに生SCANしただけのpdf食わせたら、 *ページ番号だけ*抽出したtxtファイルができた(w
>>369 そうだよな
認識率のよくないやつは、結局手で打ち込むから
ウィンドウ並べて打ち込んだほうが速いくらいだw
>>369 どこのメーカーの製品だ
それはOCRとは言わないだろう常識的に考えて
372 :
369 :2007/10/16(火) 02:06:24
フリーソフトだったからしょうがないです。それにくらべるとやさしくOCRなんか、誤認はあっても ずいぶんましだとおもいました。「英文だけ」が選択できるといいんですけど、別のsoftで そういうのもありますか?
373 :
名無しさん@そうだ選挙にいこう :2007/10/17(水) 20:25:00
「ソースネクスト 本格読取2Deluxe」を購入しようとおもってます。 スキャナーで取り込んだ画像にテキストの挿入をしたいのですが 可能でしょうか?サイトやパッケージを見てもいまひとつわかりません。
374 :
名無しさん@そうだ選挙にいこう :2007/11/23(金) 00:33:43
textbridge使っています
>>372 英文だけならSofti Free OCRってフリーのものがある
日本語版は無いがね
弥生顧客を使っているのですが、 連動可能なOCRはありませんか? 紙印刷された名簿、名刺、ハガキを スキャナで読み込んで入力を省力化したいのですが……
377 :
名無しさん@そうだ選挙にいこう :2008/01/31(木) 18:50:10
質問です。 仕事で使いたいんですが、スキャナはあります。 TIFF、PDFに出来ます。 そこで、表をOCRしてExcelに出したいんですが、 良いのありましたら、お知恵をお貸しください。
>>377 ほかのソフトのことは知りませんが、e.Typist ver.12(Windows)でExcelへ転送できます。
私は英文、和文共に文章ものしかやったことがないので、表ものの精度はわかりかねます。
やってみてあげなよ、と後頭で声がするんだけど、ごめん、私には取りあえず必要がないんで。
379 :
名無しさん@そうだ選挙にいこう :2008/02/03(日) 22:08:48
イータイピスト バージョンアップしたら一枚の画像を読み取るときに 左隅のほうを二度も三度も読み取ってテキストがダブる。俺だけか。
>>379 傾きを修正したときに影のようなものができる、それとは違うの?
381 :
名無しさん@そうだ選挙にいこう :2008/02/04(月) 14:01:54
イータイピスト バージョンアップしたら一枚の画像を読み取るときに 左隅のほうを二度も三度も読み取ってテキストがダブる。俺だけか。 だと イータイピスト バージョンアップしたら一枚の画像を読み取るときに 左隅のほうを二度も三度も読み取ってテキストがダブる。俺だけか。 二度も三度も読み取ってテキストがダブる。俺だけか。 取ってテキストがダブる。俺だけか。 ってなるこれは困るアップする前は普通だったのに
だからあ、傾き修正をしたものかどうか、きいてんのぉ! 傾き修正したものなら、いちどファイルを捨てれば影はできないです。 もしくは、Photoshopなどで先に修正しておくとか。 でも〜、9から12にした私としては、やらなきゃ良かったw
383 :
名無しさん@そうだ選挙にいこう :2008/02/04(月) 16:39:26
ばかじゃない。傾き修正していようがしてまいが、二度認識している ということを書いてる。
認識と解析ではなくて、2度認識なのね? それは起きないけど。
デジカメで撮って、さっとテキスト化したい。 いいOCRソフトないかな? オープンソースでOCRソフト作ってみたいな。 アルゴリズムはどうなってるんだろ?
まずは無料の体験版で比較してから購入してみるか…。
PDFファイルにスキャンされた画像が含まれている。 Google デスクトップでは、これらの PDF ファイルの名前全体を検索した場合のみ結果が返され、 ドキュメント内のキーワードで検索することはできません。 Googleデスクトップを使ってて、OCRで画像をPDF化する人はお気をつけあそばせ
携帯で撮った本をOCRできるソフトってないですか? 人間の目では字が小さすぎて読めません。
本屋で撮ってないよな?
390 :
名無しさん@そうだ選挙にいこう :2008/02/24(日) 17:44:39
二度どころか三度読むは バージョン11
>>388 俺はスマートプロを使ってる
学習させるまえは使い物にならなかったけど
最近はだいたい認識してくれるようになった。
とった画像を原寸表示して小さくて読めないなら
上半分とか分割して撮影すればいいとおもう
結局このスレの一押しは何よ?
用途次第では?
しかしOCRの用途ってOCR。
OCR対象の形式のことでしょ。 Justsystemから出しているものは、ATOKの手書き文字認識があるから期待したけど、 縦組みに不対応なので諦めた、というような。
原稿の内容や状態にもよるし これがベストってのはないからな・・・ でもたいていはフリーので問題ない
397 :
名無しさん@そうだ選挙にいこう :2008/03/15(土) 10:22:52
★ ベクターにて【期間限定】【特価】販売! ★ 『e.Typist v.12.0 for Windows ダウンロード版』 通常価格 : 13,440円(税込) → 4,515円(税込) ※特別価格での販売は2008年3月30日までの期間限定です。 まともに買ってユーザ登録した人にこんな腹の立つメールを送ってくるとはふざけるな!
投げ売りするほどクソなのか?
e.Typist の会社は小出しが大好き、完成度の高いOCRソフトを持っていながら, ちょこちょことバージョンアップして金を集めている、乗るのがアホなのか 乗せるのが馬鹿なのか、踊ってください。
>>397 これ買ったらまたすぐバージョンアップが待ってるのか?
つまらん機能追加でバージョンアップする必要もないし 適当なタイミングでアップグレード版買うためにも 今買っておいて損はない
ベクターをチェックしてみたら4515円はアップグレード版だったぞ ちなみに発売当初のアップグレードダウンロード版はもっと安かった オレは4064円でダウンロード版を購入したよ
403 :
名無しさん@そうだ選挙にいこう :2008/03/18(火) 00:56:06
アップグレード版の税込み定価は6,042円。 13,440円というのは間違いなくアップグレードではないダウンロード版。 メディアドライブからこのメールが届いた人だけメール記載のURLから買えるんじゃないか。 でも、繰り返し言うが、まともに買ってユーザ登録した人に送るメールじゃないだろ!
404 :
名無しさん@そうだ選挙にいこう :2008/03/18(火) 02:33:24
ocrって普通の寝カフェとかにも入ってるのかな? スキャナがあるとこだと。
そんなメールが届いてたなんて気づかなかった ほとんど読まずに捨ててるもんなあ
私も気付かなかったわ。
バージョンアップしてからユーザー登録していなかったので、
登録してみたけど、何も来ませんね。
バージョンアップだからかな。
>>403 のお怒り、ごもっともです。
まじか、いつベクターの価格が改定されるのか楽しみに待ってたのに。 Docuworkとの連携で都合がいいので e.Typist欲しかったんだがな
408 :
名無しさん@そうだ選挙にいこう :2008/03/18(火) 22:39:05
バーコードを認識するOCRソフトってないでしょうか DR-2510Cについていたe.Typistエントリー2で受領書をスキャンしているのですが キーになるコードとバーコードが近くにありキーの認識率が低下します。 キーとバーコードは同じ情報なので そのままバーコードを認識できればと思うのですがそういうソフトはないでしょうか? バーコードの結果はlogで吐き出すという形でもかまいません。 買った後に気づいたのですが別の機種ではハードでバーコード認識するものがあるのですね。
>>408 ググると出てきますが、バーコード認識の専用ソフトは皆、値段が高いみたいですね。
自分もDR-2510Cですが、バンドル版じゃなく、e.Typist V12を使ってます。
これだと認識テンプレートというのを作れば、認識させる領域を指定できるので、
多分キーの部分を認識領域にしておけば、バーコードのパターンの干渉を受けずに
キー文字を認識できると思うんですが。
バンドル版にはないですか?
ただし、キーの場所が毎回変わるようじゃ使えません。
410 :
408 :2008/03/20(木) 20:59:07
>>409 回答ありがとうございます。
認識テンプレートを確認します。
411 :
名無しさん@そうだ選挙にいこう :2008/03/25(火) 00:25:25
412 :
408 :2008/03/25(火) 20:36:37
>>409 認識テンプレートは見つけられませんでした。
情報ありがとうございます。
414 :
名無しさん@そうだ選挙にいこう :2008/04/13(日) 14:56:24
OCRのことを おしりって言っていいですか?
お尻orz お知りocr
そんなこと言うから、 OCR が、腰に手を当てて体を曲げる運動をしている人に見えてきたw
417 :
名無しさん@そうだ選挙にいこう :2008/04/18(金) 17:03:43
>>416 どういうこと?
ocrのoは頭だとして、
cの上側は腹が空を向いている部分、左側は首とつながっている腕、
下側は腰に手をあてている部分だとして、
rの左側は胴体につながってる足で、右側の突起物は何なの?
それはともかく、
e.Typist>SmartOCRLite106>SmartOCRLite107>読取革命>>読んでここ
ってことでおk?
418 :
名無しさん@そうだ選挙にいこう :2008/04/18(金) 17:30:22
smartocrと読取革命の順序が???だけど etypistのトップは変わらないな
OCR ocr ん〜言われてみると 足を上げているように見える・メタボになった人が 運動してるのかもよ
(
>>416 )
Oが頭で、Cが腰にてを当てた胴体で、
それがRの下半身から、横にころっと落ちたというのか曲がったというのか……
こんなネタで盛り上がらないでよ〜
かなり薄ら寒い空気だと思ったのはオレだけのなのか・・・
423 :
名無しさん@そうだ選挙にいこう :2008/06/13(金) 17:29:38
翻訳ソフトについてきたCROSS OCRって奴、精度悪すぎる
424 :
名無しさん@そうだ選挙にいこう :2008/06/27(金) 12:06:41
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ カスタマサポートサービス終了について ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 【サポートサービス終了製品】は以下のとおりです。 ◆e.Typist v.11.0 Windows版 ん? 1回おきにしかVerUpできない貧乏人は無視かよ。 V12が出てからだいぶ経つし、今頃VerUpするくらいならV13を待ちたいよ。
サポート終了しても実害はほとんど無いけどな
426 :
名無しさん@そうだ選挙にいこう :2008/06/30(月) 17:17:48
427 :
名無しさん@そうだ選挙にいこう :2008/07/04(金) 11:22:26
数字のみ、日本語のみでの単認識は、読んで!!ココが一番だよ。 ただ、自動実行とかソフト任せにしちゃうと、 このソフトはとたんに糞になるんだが。
428 :
名無しさん@そうだ選挙にいこう :2008/07/04(金) 18:06:57
ココにはアクチがある。 大変に鬱陶しい。
429 :
名無しさん@そうだ選挙にいこう :2008/07/04(金) 18:08:29
OC=
etypistがベスト 読み取り革命でもいい あとは糞
431 :
名無しさん@そうだ選挙にいこう :2008/08/01(金) 09:35:23
会社での業務だったらwinreaderがいい
432 :
名無しさん@そうだ選挙にいこう :2008/08/01(金) 19:34:33
A4のスキャナ・プリンタの複合機を考えてますが OCRを使うならスキャナとプリンタは別々のほうが良いでしょうか?
433 :
名無しさん@そうだ選挙にいこう :2008/08/01(金) 20:55:58
一緒でも良いんじゃない?
434 :
名無しさん@そうだ選挙にいこう :2008/08/02(土) 11:27:31
パナソニックのOCRよりも2万円以下で良いのありますか?
436 :
434 :2008/08/03(日) 21:56:31
>>435 レスどうもです。
アマゾンでetypistを見てみたらレビューにてボロカスに叩かれていましたが
あの投稿は無視して「読んde!!ココ」というのと二つに搾って考えてみます。
>>436 eTypist11を使ってます。
Amazonの評価読んだけど、これがホントで、かつヘビーユーザーなら買わないほうが
良いと思います。
自分もアップグレード考えてたけど、止めました。
ユーザー離れ必至ですね。
認識能力はピカイチだけに、馬鹿な仕様変更をしてしまったものだと思います。
438 :
名無しさん@そうだ選挙にいこう :2008/08/04(月) 09:36:07
キヤノン製じゃなくてエプソン製スキャナを使えばいいのでは?
439 :
434 :2008/08/04(月) 10:55:25
>>437 オーダーするつもりで気持ちを決めてたのですが、
レスをいただいてまたグラグラと気持ちが揺れてしまいました。
どっちにしても買うことは決めているのでもう少し考えてみます。
アドアイスをありがとうございました。
440 :
名無しさん@そうだ選挙にいこう :2008/08/04(月) 21:39:54
e.typistじゃなくてwinreaderにすれば?
442 :
名無しさん@そうだ選挙にいこう :2008/11/16(日) 16:28:08
age
読んでココv13の質問なんですが、 認識結果を修正するとき、候補文字から選択するとどんどんユーザー辞書に追加されていきます。 初期状態は、追加するかどうか、確認画面が出てたのですが、確認しないをチェックしてしまいました。 これを元に戻したい(確認画面が出て、不必要な辞書登録をしない)のですが、どこにその設定があるのか分かりません。 かなり探したのですが・・・何処に隠れてるのでしょう?ご存知の方教えてください。
よく見たら一ヶ月に1カキコの過疎スレか・・・ レス期待できないから移動するわ
>444 バージョンアップする必要性を全く感じないので、v11のままなので、 v13のことはよくわからないけど、v11では (1)「オプション」−「環境設定」メニューで「環境設定」ウィンドウを開く。 (2)「環境設定」ウィンドウの「その他」タブを選択する。 (3)「その他の設定」の「設定」ボタンで「操作アシスタントの設定」ウィンドウを開く。 (4)「操作アシスタントの設定」ウィンドウで、認識結果編集時の自動処理の 「辞書登録時に確認を行う」チェックボックスを選択する。 でユーザ辞書登録時に確認操作が必要になる。 もう見てないかも知れないけど。
446 :
名無しさん@そうだ選挙にいこう :2009/01/26(月) 16:27:00
>>445 V13 でも似たような手順で設定できる。
447 :
名無し変更議論中@詳しくは自治スレへ :2009/03/27(金) 15:25:39
なんだか人が居ないみたいだけど・・・・ eTypistのオーバーレイ機能ってどうですか? 元の原稿と重なってるって見難くないですか? 今は読んでココ使ってるけど、ココは一行上に別窓で表示する方法に慣れてるんだけど。 でもココはunicode文字に対応してないし、unicode対応ってeTypistだけですかね? eTypistって体験版無いんですかね?HP見たけど見つかりませんでした。
>>447 体験版あるよ。オレ試してから買ったもん。
449 :
名無し変更議論中@詳しくは自治スレへ :2009/03/27(金) 22:21:26
なくなったみたいだよ
450 :
名無し変更議論中@詳しくは自治スレへ :2009/03/27(金) 22:34:01
ごめん。あったorz
>>450 え?どこに?
俺はWinReaderの体験版を試した後にeTypistの体験版を探したけど、見つからなくて買っちゃった。
感想。
WinReaderとeTypistは兄弟だね。操作が全く同じ。
小さい字の認識はWinReaderの勝ち。
認識エリアの設定も認識力もWinRederの勝ち。eTypistはわけわかめ状態になることが多い。
「西村ひろゆき」が巨大な「一」と認識されたり、全く認識されずに画像扱いになったりする。
エリアも意味不明に巨大化したり、全く認識されなかったりとか。
winreader使ってシステム組んだことある人いる?
>>451 メーカーHPの体験版リストには載ってないけど、
「eTypist 体験版」でググルと出てくる。
WinReaderてeTypistより一桁高いじゃん。
>>453 買うつもり満々でした。価格COMで一番安いところにも発注しました。18万円くらいだったかな?
でも、買うまでの手続きが凄く大変でした。販売店もそのあたりを把握していなくて、教育機関勤務じゃないと買えないとか言われて、
それが後でひっくり返ったりとかで面倒でした。結局、2週間たっても入荷しないのでキャンセルしましたね。
ヨドバシで聞いたら、通販は不可で、申込書を書かないと売ってくれないうえに、初年度は強制的に年間サポート4万円が必須とのため、
面倒になってeTypistをダウンロードで買いました。いったんは入金したのに、アホな会社ですよね。
>>453 現状ではそれファイル自体が鯖から消されてるからダウンロード出来ないよ。
いつダウンしたんだ?
>>455 ああ、そうなんだ。いや、まだダウンロードしてないんだ。
期限が2週間ってあったから、今の作業がひと段落してからと想ってたんだ。
じゃあ、体験版は無いんだね?
サーバーに削除したページのカスが残ってただけって事か。
確認してから書き込めよ、うぜえなあ
WinReaderのエンタープライズ版使ってる?
>>457 HPの管理ができてないメーカーに言えよ。
普通ダウンロード画面見つけたら、できると思うだろが。
このメーカーなんかイマイチだな。
読んでココがunicode対応してくれないかなー
>>459 自分の早合点をメーカーのせいにすんなよw
461 :
名無しさん@そうだ選挙にいこう :2009/04/07(火) 00:31:56
e.TypistってCUIで使えますか?
出来ないと思うよ。ヘルプにも載ってないし。
欧文のスキャンができるフリーのOCRソフト、Softi FreeOCRについて質問。
以前は
http://softi.co.uk/freeocr.htmからダウンロードできたようなんだけど 、
このサイトを見ると
>FreeOCR Notice
>FreeOCR has new owners and can be found at www.freeocr.co.uk
>We no longer have any downloads for FreeOCR so please do not email us.
とあって、どうやら持ち主が変わったらしい。
そしてリンク先のページ
http://www.freeocr.co.uk/を見ると >FreeOCR V3 - Coming soon
とあって、最新版はまだダウンロードできないとこのこと。
以前のバージョンでいいからダウンロードしたくて、「download」でページ内検索かけるなどして
サイト内を探してみてもそれらしいリンクが見つからない。
いったいこれはどういう事情なんでしょうか。
464 :
名無しさん@そうだ選挙にいこう :2009/04/14(火) 01:55:23
質問させて下さい。 週刊誌の目次をスキャンで取り込み、文字検索できるようなデータベースに したいと考えています。 OCRというのはこのような用途に利用できるものと考えて間違いないでしょうか?
465 :
名無しさん@そうだ選挙にいこう :2009/04/14(火) 08:16:27
間違いない
>>464 簡単にできるかもしれないし、できないかもしれない。
なぜならそれは目次のレイアウト次第。
最悪、がんばって手修正しまくれば大丈夫だよ。
>>466 有難うございます。
以前、知人が英語等の外国語文書をスキャンして "word" だかに
とりこみ、データベース化したといった話をしていましたので、
もしかしたらできるかも、と期待したのですが、読み取り精度が甘い点など
難しい問題が残っているようですね。
スキャンしてPDFする商品がネット上でよく挙がっていますが、
それと文字検索などできるデータ化というのは別の話なのですね。
>>467 試しにAcrobat Reader(バカ高いAcrobatではない)でPDF(スキャンした目次)を
テキスト化してみてはどうかな。
「なんでそんな順序に並べるの?バカなの?死ぬの?」という感じのところもあるけど、
そのPDFがテキスト化できるかどうかの目安にはなると思う。
その後のデータベース化については、また別の問題。
データーベース化って難しそう。 単純に全文検索のほうが時間対効果が高そう。
目次程度ならOCRかけて修正するより、一から直に打ち直した方が早くないか
修正する手間があるから OCRって使いどころが難しい
473 :
467 :2009/04/14(火) 23:27:50
>>473 全文検索ソフトは何を使っているの?
つーか、画像はPDFとかxdwにしてないの?
JPGとかのまま?
>>459 見づらいとは思わないし
お前の確認不足だとおもうぞ
476 :
467 :2009/04/15(水) 09:23:07
>>474 ・全文検索ソフトは何を使っているの?
まだ何も使っていません。「全文検索」という言葉の意味もよく分かってないレベルです
・画像はPDFとかxdwにしてないの?
ネットのフェチ写真と同じ状態で拡大縮小ができるだけです(嘆)
JPGとかのまま?
>>476 JPGのままじゃどうにもならないでしょう。
>>473 官庁が配るような超シンプルな感じの文書型の目次だったらOCRほぼ効くよ。
ファッション雑誌みたいな懲りまくったレイアウトとか背景色や背景に画像があると苦手だけど。
検索はOSにもよるけどSpotlight知らないようだからWindowsかな?
Google Desktop使えばいいんじゃね?
479 :
467 :2009/04/15(水) 10:38:11
http://yfrog.com/3xapr1401j スキャンした結果、パソコンの中には上のような写真として保管されています。
これをどうしたら文字検索できるようになるか、って問題なのですが。
>検索はOSにもよるけどSpotlight知らないようだからWindowsかな?
Google Desktop使えばいいんじゃね?
ぐぐって見ます
>>479 縦組みとか、怪しげなフォントを使ってるとか想像していたけど、
これならOCRで楽勝(たぶん)。
テキストの順番で死んでもいいなら、Adobe Readerでも。
482 :
479 :2009/04/16(木) 23:21:01
482に観月ありさという称号を与えたたえたいと思う
Windows用eTypist12.0で、なーんも考えずに解析させテキストに書き出してみた。 (年に数回使うだけなので辞書が鍛えられてないです) PhotoshpやeTypistでノイズを取ったり、シャープにしたりすると多少は変わるけど、 そんな手間をかけて(ry 事痔愛特爆一轡事鮒’嘩 第69回皐月賞2 データカプセル(この10年の成績と傾向)6 東西スタッフの狙い馬8 出走予定馬の厩舎レポート10 クラシック血統アカデミー14 有力馬の考課表と完全データ15 ..中出特溺、;i 京葉S卯月S鹿野山特別袖ヶ浦特別23 第11回中山グランドジャンプ 総武S鹿島特別山藤賞1 今週の狙い馬46 ...眠神特別1 魏葛撫『カップ塗娼 淀屋橋S山陽特別はなみずき賞 今週の狙い馬67 福島特別}… ラジオ福島賞米沢特別雪うさぎ賞70 奥の細道特別医王寺特別桑折特別 読物。_?「「一、、一.。.、.li 八方破れVol・719かなざわいっせい94 おもひでの名勝負・皐月賞阿部珠樹96 競走馬の心技体第66回平賀敦98 競馬ことのはVol・60島田明宏『’100 ---------------------[End of Page 1]---------------------
486 :
479 :2009/04/17(金) 10:54:29
みなさん いろいろ有難うございます
>>485 こちらの成果を拝見して思いますに、わたくしの場合は
目次の中の全項目が必要ではないので、チェックと修正の手間を
考えますと、やはり毎週の手入力にてデータ化するのが良さそうです。
それについても、思いますに、ネットで様々な文書資料をサーフィン
しておりますが、あれらも、みな どなたかが最初に手入力して下さった
恩恵なのですね。
OCRの更なる向上が待たれます
>>486 まさかと思うが、その雑誌、Webに毎号の目次だけでも掲載されてないか?
だったらそれをそのままPDF化して(ry
488 :
486 :2009/04/19(日) 00:40:15
489 :
486 :2009/04/19(日) 22:34:08
>>487 ありましたよ〜! ただ大分大まかな記載なので自分で足すことに
なりますが、それでも大変作業が軽減されました。感謝です!
OCRじゃないけどpdftotext惜しい・・ adobeはなぜコマンド提供しないのか
OCRって誤認識あるから 使いどころが難しいな。。。 なんかいい使い道ない?
OMR
494 :
名無しさん@そうだ選挙にいこう :2009/06/02(火) 23:26:46
キャノンの複合機 MP-610 に付属の 読取革命 Lite から、製品版にアップグレードできるみたいなので、読取革命 Ver.13 のバージョンアップ版を買おうと思う。 今は、読んdeココ Ver.13 を使ってて特に問題ないんだが、エーアイソフトを吸収したエプソンは読んdeココをバージョンアップする気はないみたいだから、これからのことも考えてね。 5千円ちょっとで買えるしね。
予言しとくと まちがいなく後悔する!!
496 :
名無しさん@そうだ選挙にいこう :2009/06/07(日) 08:00:13
読み取り革命って悪くないよ
>>494 同じ事を考えて最新の体験版をインストールしてみたが、
64bitのOSには対応してないので使えなかった。今時64未対応てw
同梱版のLiteのほうだと64bitでも普通に使えるんだな、これが。
安いLiteで対応してるなら当然製品版も大丈夫だろうと思いきや、危ない危ない。買わなくて良かった。
WinReaderPROの体験版を使ったあとにe-typistを買った。 認識率に差がないんだけど…
499 :
名無しさん@そうだ選挙にいこう :2009/06/27(土) 16:02:33
>>498 同じメーカーだし全く同じかは知らないけど似たような傾向になるのは
当然。
501 :
名無しさん@そうだ選挙にいこう :2009/06/27(土) 16:34:03
>>500 そりゃ、高い方はそれで商売だ出来る機能を持ってる。でも認識率が
20倍ってわけじゃないのはわかってるはず。特にそんな個人が使わな
いような業務向けのソフトを買うような人や会社は。
認識率が50%Upなら20万円だしてもいいんだけどね。 e-typistは下線が巨大な「一」になったりして困ってるし。
503 :
名無しさん@そうだ選挙にいこう :2009/06/27(土) 17:15:19
>>502 一般に売ってる e.Typist 読んde!!ココ 読取革命 は体験版があるから
他のを試したらどうですか。
505 :
名無しさん@そうだ選挙にいこう :2009/06/30(火) 14:56:42
現在は読取革命13ですが近々アップデートする可能性はあるでしょうか。 Windows 7 も出るようですし購入のタイミングに迷ってます。
>>503 e-typistが使いやすいし、文句をいいつつも認識力はなかなかのものですよ。
>>504 原本をいじりたくない事情がありまして。
PCを新調したらまたWinReaderの体験版を使ってみますよ。
で、OCR精度チェック用のファイルとかあると嬉しいのですが、どうでしょうか?
みんなでテンプレートを作って、主観によらない精度ランキングをしたいですね。
507 :
名無しさん@そうだ選挙にいこう :2009/06/30(火) 15:11:39
>>506 e-typist を使ってますか?体験版を落として使ってみたんだけどスキャナーで 600dpi で読んで
PDF を作ると何か文字が汚い。よく調べてみたら 200dpi になっていたんですが、どこの設定を
触ったら解像度を変えられるかわかりませんでした。もしよろしければお教えください。
>>507 俺もあれには驚いた。とてつもなく汚いんだもんね。
でも、俺はDocuWorks使いだから深く追求しなかったから、知らないんだ。
誰か、わかる人がいるといいね。
509 :
名無しさん@そうだ選挙にいこう :2009/06/30(火) 15:37:50
>>508 DocuWorks って e-typist の OCR エンジンと似たようなのが積んであると思いますが
ファイリングソフトだから範囲指定しての OCR とかスキャナで読んだ書類のゴミを除い
たりとかゆうような機能は付いてますか。
>>509 できるよ。エンジンはこれ。
DocuWorks6.0のOCRエンジンはたしか↓だったと思う。いま調べたけど資料が見つからないから間違っていたらごめん。
活字文書OCRライブラリ v.6.0
http://mediadrive.jp/products/library/katsuji/index.html 性能は今一。それでも以前のVerはもっと酷かったw
で、いまVer7を調べたら『OCRエンジンは、「WinReader PRO v.12.0」、または「WinReader エンタープライズ」
(メディアドライブ株式会社製、別売)のいずれかを切り替えて使用可能。』だって。
あやうく、WinRederPROを買うところだったw Ver7へUpするわ。
511 :
名無しさん@そうだ選挙にいこう :2009/06/30(火) 16:12:58
>>510 という事は OCR ソフトに近い操作ができるんですね。自分はスキャナで読んで紙の周りの黒いところや
ゴミを取り除いて OCR と共に PDF にしてます。もしかしたら値段からいっても DocuWorks も購入対
象になりますね。
>>511 PDFよりはDocuworksの方が使い勝手がいいと思うよ。でも、普及していないのが難点。
そして出来ないこともたくさんあるはずだから良く検討してくれよ。
俺が恨まれても困るからね。あくまでも自己責任でどうぞ。
513 :
名無しさん@そうだ選挙にいこう :2009/06/30(火) 22:31:49
読取革命13のバージョンアップ版を買ってインストールするには複合機についていた読取革命 Lite を実際にインストールしないとバージョンアップ出来ないようですが、Lite 版じゃないように実際にパソ コンにインストールしないで認識させる方法はないのでしょうか。例えば仮のPCにインストールして その実行ファイルがあるフォルダをCDに焼きそれを認識させるとか。
英字に強いOCRソフトってないでしょうか? 本格読取ではあんまりでした。
全部英文なのか、混在しているのかで変わってくると思うが
アメリカの製品は英字に強そうだけど、どうだろうか?
>>515 全部、英字です。
アメリカの教科書なんですが。
518 :
名無しさん@そうだ選挙にいこう :2009/07/16(木) 11:56:42
abby finereader omnipage つかググレ
PDF文書内を検索しようとしたら、日本語環境で作ったPDFじゃないようで透明テキストが日本語じゃない。 仕方ないのでOCR(読んでココ)に取り込んでPDFで出力したら、目次からのページリンクが消えてる・・・ リンクとかは残したまま、透明テキストだけ日本語にOCRできないだろうか?
520 :
名無しさん@そうだ選挙にいこう :2009/08/04(火) 09:21:30
読取革命13の体験版使ってみた・・・エロイ人に質問。 認識後の表示倍率が数%になってしまい、必ず表示倍率を上げないと結果がろくに見えない。 数枚なら問題はないが、大量に処理する場合手間がかかってしょうがない。 認識直後の表示倍率を設定・固定する方法はないだろうか? B5(縦長)・360dpi・横に分割して表示・の条件で、6%になる・・・・読めない。 (縦に分割でも14%。) 読取革命12体験版を使った記憶では、認識直後の表示倍率は結構大きかった記憶があり、通常はそのまま認識結果のチェックが出来た。
521 :
520 :2009/08/04(火) 09:27:19
>>520 自己解決・・・・設定項目発見・・・・・。
こういうなんでもないようなところでも、前と変われば使いにくくなる。
変える必然性がほとんどないところなんだから、バージョンアップしてもそのままでいいのに・・・・。
522 :
520 :2009/08/04(火) 09:52:04
見出し認識も、12と比べ使い物にならん。 (同じ色の無地の白抜き文字に限りだが・・・。残してあった同じ原稿で確認。) 今回は大量に処理するので、使い勝手がよさそうなら買うつもりだったんだが・・・・。
523 :
名無しさん@そうだ選挙にいこう :2009/08/05(水) 00:22:04
複数の画像ファイルを一括してOCRできるソフトってないですか?
ふつうに売ってるOCRのほとんどがその仕様のはずだけど?
むしろできないソフトがあれば教えて欲しい
526 :
名無しさん@そうだ選挙にいこう :2009/09/15(火) 00:44:06
自炊スレから誘導されてきました。
新聞を画像ファイルとして取り込み、OCRさせたいのですが、
1面すべて取り込もうとすると手持ちのA3スキャナでも入りきりません。
大量にあるのでできるだけ時間をかけない方法を探しているのですが、
よい方法がありましたら教えてください。
試しに縮刷版を600dpiで取り込んだり、1200万画素のデジタル一眼レフで
撮影して読んでココに認識させたのですが、認識率はあまり高くありませんでした。
サンプル画像置いておきます。
http://www.dotup.org/uploda/www.dotup.org139794.zip.html
発行元に「データください」と言う。
528 :
名無しさん@そうだ選挙にいこう :2009/09/15(火) 18:15:08
A4サイズでスキャンして後で合成するか 段ごとにOCRかければ?
>>526 >縮刷版
もあるってことは現代の新聞ですよね?
大量だとどうやっても認識エラーの絶対量が多くなり、作業の手間が
馬鹿になりません。新聞はもともと印刷もクリアじゃないのでOCR
に向いた素材じゃないと思います。
>>527 さんの言うように、デジタルでの契約を
する方がいいんじゃないでしょうか。但し、記事毎の販売になってる
ところが多いので10年分の1面の全記事とかなると今度は費用が現実
的じゃなくなるけど。
>>527 1年契約で236万円します・・・
>>528 それだと1ページで3分以上かかってしまうんですよ。
もっと短時間でやりたいのですが。
531 :
名無しさん@そうだ選挙にいこう :2009/09/18(金) 01:07:05
読取革命の体験版がをインストールすると、プロテクトキットが作動していませんとなります。 32ビットのビスタです。 なぜでしょうか?ご存知の方お教えくださいm(__)m
>>530 それがやっていいことかどうか非常に気に掛かるんだが、目的は何だ?
目的次第では236万円払ったほうが、256倍得かもしれんぞ。
訴訟用ならむしろ縮刷版のコピーのママのほうが良さそうに思うが、 まあ、テキストが必要というなら必要なんだろうな。 俺はもう降りるわ。何かしらんが頑張れ
537 :
名無しさん@そうだ選挙にいこう :2009/09/18(金) 15:31:56
(^^)/
気の毒に……
最近質問者が聞いてないような余計なことを書いときながら 情報小出しって言うやつ多いよな。
分かりやすい質問者乙
サンプル画像が2時間以内に削除されたのは無視ですか、そうですか。
訴訟なら勝訴すれば236万円は必要経費として認められるということはないの?
544 :
名無しさん@そうだ選挙にいこう :2009/10/15(木) 12:48:28
そうしよう
読んdeココ13の体験版を使ってみて文字の認識率もいい感じなのですが、 「はばぱほぼぽ」を認識するときによく間違えられたり、「つ」と「っ」などの大文字と小文字の認識があやふやだったりすることが多いのです。 これは製品版になるとアップデート等で精度が向上していたりするのでしょうか? もしそうならば購入を考えたいと思います。 どうかお持ちの方がいらしたら教えてください。
546 :
名無しさん@そうだ選挙にいこう :2009/10/22(木) 05:12:40
持ってないけど 体験版と製品版の精度が違うのはsmartocrくらい
すいません、教えてください。 フォルダの中におよそ200枚のファイルが入ってまして、 これをOCRにかけてそのままワードへ転写したいんです。 古い本でもはや絶版なのですが、P2Pで手に入れて喜んでいたのですがこれを、 横書きのワードで読みたいのです。 市販のソフトで、ファイルを一括で把握、中身の200枚のJPGを認識してくれるソフトは ありませんか? いちいち手作業でやってたらとてもとても・・・。 よろしくお願いします。
548 :
名無しさん@そうだ選挙にいこう :2009/10/27(火) 05:02:38
ファイル一括登録、出力形式をワードにすればいいので etypistでできる ほかのocrでもできると思う
文書を本格読取2で読んでワード化したのはいいですが,変なレイアウトまで認識してしまい, それを消去したり,編集したりできないのが不便。 何で,普通に編集できないんですか?
ワードだからでしょう。嫌がらせしか考えてないからなofficeの開発陣は。
>>550 ご教示ありがとうございます。
ということは,ワードの操作を幾らしてもこの枠は消せないということでしょうか?
ちなみに,ワードで保存を辞めてテキストで保存にしてもレイアウトは残ってしまうようです...
以前やっていたパワーバインダーではこんなことはなかったのですが...
>>549 「変なレイアウト」とは、例えばどういうことですか。
>>552 元の文書に「表題」 「署名欄」「日付」
などが,あると,その位置にレイアウトの枠が出来て,文字のテキストデータがその中に入ります。
長い文章はまとまって大きな枠に入るからまあその中で編集できるのですが,相手の書面部分など
は流用しないので,その枠自体を削除したいと思ってもどうしても削除できないのです。
その頁自体を削除しようと思ってもできないし,長い文章部分だけをコピーして他の文書データに
張り付けようとしても出来ない。
結局全部使えないのです。
中国語に強いOCR教えて
>>555 山奥に住んでる16歳くらいのかわいい女の子の中国人を買ってくるといいよ
558 :
名無しさん@そうだ選挙にいこう :2009/12/13(日) 12:01:04
読み取り革命13と読んでココの価格差は大きいがどちらがよいか、誰か教えてください。読んでココは最新版はいつでるかも教えてください。
>>558 前者はこのスレの上の方にあったよ。後者はメーカーに聞くべし。
OCR読んでココについて質問させてください。 200枚のJPGファイルを一括して認識、その後で全ての認識文字を 一枚のワードかテキストで出力させたいのですがこのようなことは可能でしょうか? 通常ですと一枚ごとに一ページの出力で、合計200枚になります。 これでは200枚を全て手作業でペーストする必要があり大変です。 一つにまとめて出力できる仕様でしょうか? 利用しているソフトは読んでココです。 宜しくお願いします。 、
>>560 普段word転送はしないけど、試しにやってみたらできた。
200枚でできるかは試していないけど、複数枚(一応10枚ぐらい)一度に選択してやったら、一つにまとめて出力された。
>>560 eTypistは出来ると思うよ。テキスト形式で保存できた気がする。
ワード転送ボタンもあるから、直接ワード形式にも出来るんじゃないかな?
>>556 山奥に住んでる16歳くらいのかわいい女の子
自体の識字率が怪しい
564 :
562 :2009/12/19(土) 02:19:06
>>560 今やってみたら、Wordに転送するときにレイアウト転送とテキスト転送の2つのモードが選べた。
読んでココ13を使用してるんですが、ファイルを読み込むときに DPI値が足りないって出ます。 いちいち400×400に設定を戻すのですが、そのほかに自動で DPI値を規定値にするやり方はありませんか? 100枚をいちいち手作業でするのはあまりにもしんどくて・・・。 お願いします。
解像度変更君というツールで便利に使ってる。 「解像度 変更」で検索すると一番に出てくるけど。 読んdeココなら「解像度情報がないときは自動的に***dpiにする」みたいな設定なかったっけ。
>566さま それやってみたんですけど、やっぱり前と変わらずDPI値の変換を聞いてくるんですよね。 解像度変換君を探してみます。 もうひとついいですか? 段落とページ番号を認識からはずす機能はついてますか? ページ番号が誤認識、段落とせりふの部分はタブでひとつ下がって認識しています。 不便です。 削除できるやり方があったら教えてもらえませんか? お願いします。 早速探してみます。 ありがとうございました。
やり方はあるし567さんはたぶんすでにドキュメントスキャナスレであらかじめ答えを得てる。 即座のお礼よりも試してからうまくいった/いかなかった経緯を報告してくれた方が 同じことで躓いている人の役に立つかもしれない。
569 :
名無しさん@そうだ選挙にいこう :2009/12/29(火) 17:59:56
567ではないですがドキュメントスキャナスレってどこにあるんですか? 「ドキュメントスキャナ」で検索しても見あたりません
571 :
名無しさん@そうだ選挙にいこう :2009/12/31(木) 12:03:48
e.Typistで透明テキスト付PDFを作成すると、 画質がかなり落ちるんだけど 調整する方法ある? 文字の認識はこのソフトが一番いいんだけど・・・
572 :
名無しさん@そうだ選挙にいこう :2009/12/31(木) 12:39:06
507を見るとやっぱりみんな同じこと思うんだな そしてクオリティーのコントロールは出来ないようだ なんともいたしかゆしですなー
あの機能は何のためにあるのだろう? PDFに対するアンチキャンペーンの一環かな?
>> 558 エーアイソフトに聞いてみた。 > <問合せ内容> > 読んde!!ココ は2007年2月にVer.13になって以降、 > 次のバージョンが出ていませんし、他のソフトも > 3年以上新製品がでていませんが、エプソン販売と合併した後は > もうソフトウェアの開発は行っていないのでしょうか? > 読んde!!ココはもう開発終了で次期バージョンは出ない > ということでよろしいのでしょうか? > > <回答> > この度は弊社製品についてお問い合わせを頂き、ありがとう > ございます。 > お問い合わせですが、「読んde!!ココ」シリーズの新バージョン > については、今のところ発売予定はございません。 > 簡単ではございますが、回答とさせて頂きます。 > よろしくお願い致します。 だってさ。
577 :
名無しさん@そうだ選挙にいこう :2010/01/22(金) 22:19:07
複合機で読み込んだTIFファイルを直接マウスドラッグで選択範囲を選んで 右クリックで文字か画像で読み取れるOCRソフトってあるんでしょうか? 職場異動で使っているパソコンで急に使えなくなったので ショックを受けています。
今までの部署で使えてんならそのソフトを新しい部署で 買ってもらって使えばいいじゃない
しかし、マークセンスとかの OCRソフトは簡単に作れないのかな
>>577 >急に使えなくなった
のは何がですか?
e.Typist12ですがスキャナの解像度を600から400以下くらいに落とした方が 認識の精度があがりました。表示される画像に違いは無いように感じられるのですが みなさんはどうですか?
読取革命liteが手元にあるから、新バージョンにバージョンアップしようと思ってるんだけど liteの認識精度がいまいちだ。読ませたデータの場合、e.typist12の体験版のがいい。 でも、安いし買うしかないかな。
584 :
名無しさん@そうだ選挙にいこう :2010/02/07(日) 08:48:44
>>581 本来は解像度が高い方が認識率はよくなるんだけど、高くなるとゴミも拾うのでね。
結局適度な解像度ってのが、たいがい400ぐらいになっちゃう。
>>584 なるほど。一見綺麗に印刷されていてもゴミを拾うんですね。
586 :
名無しさん@そうだ選挙にいこう :2010/02/07(日) 15:56:04
もう少しいうと、目に見えないほこりの影を拾うのでしょう。 モノクロコピーすると、黒い斑点が結構ついたりしますよね。 蛍光管の光が埃の蔭を際だたせるのです。 プロの印刷屋がモップみたいなので原稿を拭くのはそのためです。
>>586 なるほど。
あと、裏写りも無視できないですよね。
ハードカバーの小説でも透けて見えるのに
紙の薄い雑誌なんかてきめんですから。
本日180ページくらいの小説を一冊スキャンしました。
e.typst12は本当にビックリするくらい認識してくれるんですけど
ルビの処理ってどうやってますか?
私はテキストを普通に表示できる携帯音楽プレイヤーで読むつもりなんですけど
できれば青空文庫形式みたいに「漢字(かんじ)」みたいな形式にしたいんですけど
うまい方法が見つかりません。
588 :
名無しさん@そうだ選挙にいこう :2010/02/07(日) 17:40:44
>あと、裏写りも無視できないですよね。 >ハードカバーの小説でも透けて見えるのに >紙の薄い雑誌なんかてきめんですから。 裏側に、黒い紙(自分は百円ショップで買った黒の画用紙を使用)を乗せてスキャンすると、裏写りはかなり減少する。
589 :
名無しさん@そうだ選挙にいこう :2010/02/07(日) 19:18:59
>>587 えっ?ルビ挿入できませんか?
確かメニューバーにルビの項目があるんだけど。
>>588 なんと!
>>589 おお、そうでしたか。悪い癖でマニュアルやヘルプなど一切読まず
直感のみで色んなものを使うので。
早速チェックしてみます。
> 悪い癖でマニュアルやヘルプなど一切読まず > 直感のみで色んなものを使うので。 ×悪い癖で ○馬鹿だから
592 :
名無しさん@そうだ選挙にいこう :2010/02/09(火) 09:46:21
>>591 し、失敬な!ヽ(`Д´)ノプンプン
「情弱」と呼んでくださいヽ(°▽、°)ノエヘヘヘヘ
593 :
名無しさん@そうだ選挙にいこう :2010/02/10(水) 17:33:58
読取革命14楽しみ。
早く体験版を使いたいなー
ちん
596 :
名無しさん@そうだ選挙にいこう :2010/02/12(金) 18:59:40
複数台にインストールできるの?
>>594 体験版着てた。
OCR前のツール類でOCR専用データを作って読ませれば、精度に不満はなさげ。
自分は検索用PDFを作りたいだけなので。updateすれば4500円くらいだし。
英語の認識は、さすがにabby完璧だった。日英混同文とかレイアウトが複雑なのは試してない。
一括画像処理で、トリミングとかをやってほしいんだけど出来ないんかな
598 :
名無しさん@そうだ選挙にいこう :2010/02/13(土) 01:13:07
デジカメで文庫本を撮影し読取革命で取り込んだのだが、せいぜい60%しか認識しない。
599 :
名無しさん@そうだ選挙にいこう :2010/02/13(土) 03:23:40
デジカメ取り込みは難しいね
>>598 6割ってことはない。レイアウト認識が崩れてるんでね?
きちっと撮った奴なら、ほぼ完璧になるよ。
複数画像を読ませたときのページ選択ウィンドウのXをおしたら
ウィンドウが消えたのは良いんだけど、表示させる方法がわからない。
ヘルプ見てもわからん。
わかった。解決。 F9押して、小説ってのがあるからそれでやるといいかも。 レイアウト認識を自動にすると、横書きで判断して結果がボロボロになる。
きちんとしたスキャナで程度の良い本をスキャンすると 認識率はデジカメよりずっと上がるよ。 本をテキスト化するならそれでも間違いだらけで厳しいと思うのだが。
603 :
名無しさん@そうだ選挙にいこう :2010/02/13(土) 14:07:15
e.Typistを超えたかもね
体験版入れてみた。 横書きの認識はすごいね。 縦書きだとちょっと化けるけど 凄いと思う。
「読取革命」のMac用はないんだね(泣)
e.Typist12なんだけど、画像がちょっと斜めになってると途端に読み取りが悪く ならない?普通の厚みの単行本のある程度ページめくった部分をスキャンしたら 斜めになるのは仕方ないんだけど。このソフトの画像修正だとそういう微妙な 画像の回転とか汚れの除去(ページの真ん中の黒くなってしまう部分とか)が やりずらいから、いったんフォトショップとかで連続スキャンして画像を修正してから e.Typistに読み込ませた方がいいのかな?
607 :
名無しさん@そうだ選挙にいこう :2010/02/15(月) 16:18:44
傾き補正って自動でできなかった?
608 :
名無しさん@そうだ選挙にいこう :2010/02/15(月) 21:41:03
e.Typistって厚みのある原稿には弱いよね 一番いいのは本をバラス
和文縦書きの書籍で、所々に英文が(90度回転して)挿入されている 文章を自動的に認識してくれるOCRソフトってありますか。 現在使っているe.Typist10の和英混合の認識設定ではできません。 (文章が横書きの場合のみ認識可) 精度はともかく、現在そういう機能のOCRソフトはあるでしょうか。
>>607 あーなんていうか、見開きでスキャンして片方だけが微妙に斜めになってる
場合あるでしょ。まっすぐな方は問題無く認識するんだけど、ちょっと
斜めになってるだけでほとんど認識しなくなるんだよね。
普通の厚みの本でも多少はななめっちゃう。
あとノンブルも消したいんだけど二百枚とかの画像をなるべく手軽に
修正できるソフトってないのかな。
scan tailor。クロップとか傾き補正とか ページ分割とかdpi変更とか出きるよ。日本語メニューじゃないけど。 元画像とは別に加工した画像を作る。
読取14使って罫線、英語、数字だらけの報告書読み取ってみたが、 識字能力はまあまあ、、表識別能力もまあまあ、 ハイパーチェッカーの使い勝手は良し 数字入力箇所だけのセル再現は、表編集モードで らくちんでギリ合格 10800円ならこんなもんだろ。
613 :
名無しさん@そうだ選挙にいこう :2010/02/17(水) 13:16:48
scan tailorって知らなかった 教えてくれてサンクス
読取革命の体験版、おおむね満足なんだけど 縦書きで書かれた > 14 ← > 日 こういう半角数字の読み取り力が弱い 文字の分離、辞書等もうまくいかない ●14を1文字として認識させ「14」を登録しようとしたが2文字はダメと蹴られた) ●左右分割が出来ず。(「14」の上半分と下半分を分割しようとする) ・・・と思ったが、ヘルプ見てみるとCtrlキーで縦横切り替わったw 恥かくところだった とはいえ、分離画面で常時表示するようにした方がいい気がするなあ チラ裏スマン まあ、縦書き半角数弱いのは確か 今後に期待
scan tailorすごい。 ところでページ分割すると順番が入れ替わってしまうよね。 これってちゃんと元の順番にする設定ないの? ググっても全然情報ないし、そもそもヘルプファイルが無いよね。
>> 615 右綴じの本こと? Project作成ダイアログで、"Right to left layout (for Hebrew and Arabic)" にチェック。
>>616 なんとそうだったのか
早速試してみます
それにしても読取革命14すごい。eTypist12でだめだったのがガンガン認識できる。
スキャン画像と認識文字の比較もこっちの方が見やすい。
618 :
名無しさん@そうだ選挙にいこう :2010/02/24(水) 07:10:58
どえらい革命だな
>>616 バッチグーでした。ScanTailorものすごいソフト。
ところで読取革命レイアウト認識が1ページ丸ごと認識してくれればいいのに
ちょっと文字が離れてると別の四角で囲まれて、認識結果も別れてしまうので
いちいち「認識」→「結合」をしないといけないので面倒くさくない?
ヘルプ読んでもうまいことレイアウトを設定する方法が分からない。
数ページ程度ならなんてことないんだけど普通の小説一冊でも四百ページとか
あるからそうとうかったるい。
apiか何かで操作できればね
読取革命。e.Typistでごく普通にできた、本文中へのルビ挿入。 「漢字《かんじ》」みたいなの。ができないみたい。そもそもヘルプで「ルビ」 で検索してもなんも出てこない。俺の最終目的は音声読み上げソフトで録音して mp3プレイヤーで聞く。ことだからルビあったほうが都合がいいんだよね。
>>621 e.Typist最強神話が崩れたか、じゃあ「読取革命」を試してみるか、
と思った矢先の不具合報告。(ありがとう)
ルビが出ないとなると、DTPには致命的と言えるかもしれない。
あと読取革命は「ッ」が全く認識できないね。 e.Typistだと楽勝なのに。 やっぱまだまだe.Typistの方が認識においては上だね。 校正画面とかは読取の方が使い易いと思ったんだけど。
名刺読取革命の方はだめだめっす
625 :
名無しさん@そうだ選挙にいこう :2010/03/11(木) 05:19:11
私は問題集などをテキスト化して利用してるのですが今のところ文字の全体的な 認識は読取革命が高いと思っています。上でルビの話が出ていましたがやはり 利用目的によっては向き不向きがあるのかもしれません。 ちなみに音声化はソフトとか使ってるのですか。音声化ソフトって使えますか。
やっぱ読取革命14だめだわ。 現時点ではeTypist12の方が総合的に勝ってる。 体験版でダメな点がわかってよかった。 音声化ソフトは「棒読みちゃん」が個人的には好きだな。 eTypist12の読み上げ機能でもいいかもしれないけど。
627 :
名無しさん@そうだ選挙にいこう :2010/03/11(木) 11:22:31
総合的・・・? 結局どういう革命だったのよ
628 :
名無しさん@そうだ選挙にいこう :2010/03/11(木) 11:36:43
>>627 例えば普通の小説なのにレイアウトが細かく別れてしまって、いちいちレイアウトを設定しなおさないといけないとか
ルビに対応してないとか。
629 :
名無しさん@そうだ選挙にいこう :2010/03/11(木) 11:45:26
小説向け、雑誌向け、新聞向けとかに調整してあるのが デフォルトであるといいのにねえ
630 :
名無しさん@そうだ選挙にいこう :2010/03/11(木) 17:40:56
デフォルトであるんだけどねぇ
631 :
名無しさん@そうだ選挙にいこう :2010/03/12(金) 10:06:09
へえそうなんだ
632 :
名無しさん@そうだ選挙にいこう :2010/03/13(土) 16:08:08
スキャンして紙の縁が汚れたりする事があるけど これを綺麗にするのは読取革命が一番やりやすかった。 PDF にする場合ね。
>>632 詳しく
しかし画像修正ならOCRソフトじゃなくてグラフィックソフトの分野じゃないか。
634 :
名無しさん@そうだ選挙にいこう :2010/03/13(土) 17:01:46
635 :
632 :2010/03/13(土) 21:05:07
>>632 OCRの認識とは別の話になりますが上に書いたとおりの事です。
文書をスキャンしてPDFにする時、よく紙の縁が微妙に黒く
なったりするのを消すのに画像編集モードとかにしなくても囲って
消すボタンを4辺分するだけです。グラフィックソフトとか大げ
さな話じゃないレベルの話ですが。
>>635 トリミングのこと?
それならソフト以前にスキャンの時に指定すべきことじゃない?
637 :
名無しさん@そうだ選挙にいこう :2010/03/14(日) 09:05:30
>>636 普通のトリミングでは原本とサイズが大きく違ってくるのでトリミングは
使いません。
638 :
名無しさん@そうだ選挙にいこう :2010/03/14(日) 17:13:40
>>637 ていうか、スキャンの時にページによってサイズ変えてスキャンなんかしないでしょ?
639 :
名無しさん@そうだ選挙にいこう :2010/03/14(日) 20:00:36
640 :
名無しさん@そうだ選挙にいこう :2010/03/14(日) 20:02:18
切れてしまった。637が書いたと思われる一連の言いたいことはなんとなく 理解できるけどそれに答えてるヤツのピントのずれ具合が意味不明
641 :
名無しさん@そうだ選挙にいこう :2010/03/14(日) 20:04:17
>>640 そうだな。お前が分かりやすく解説してやれよ
画像編集作業するなら認識領域指定のテンプレート使う方が百倍楽だ。
>>642 認識領域とは別の話です。認識は別として PDF にする場合の
編集について書いただけです。
画像のままPDFにするんでしょ? それって普通にスキャンしてそのままPDFに変換すればいいんじゃないの?
もういいじゃない。もっと有意義な話しようぜ。 なんでスキャナーに陰毛が入り込むんだ?
646 :
名無しさん@そうだ選挙にいこう :2010/03/14(日) 23:05:40
つまり、スキャンした画像のゴミ取りが、ほかの例えばe-Typistなどと比べて 「読取革命」だと楽チンってことだよね?
649 :
名無しさん@そうだ選挙にいこう :2010/03/18(木) 07:12:42
>>648 似たような機能はどのソフトにもあるけど読取革命が
画像編集へのアクセスが簡単で操作もわかりやすいと思う
650 :
名無しさん@そうだ選挙にいこう :2010/05/05(水) 00:43:49
「e.typist 12」も「読んde!!ココ 13」もVista発売初期のままで小手先だけ 修正しているから、7だけであっても64bit版Windowsへの対応という面では、 「読取革命 14」に軍配が上がる。複合機バンドルのLite版からのUPGはUPG版を 買えばいいという点もありがたい。買った複合機にLite版が入っていれば即 最新のVerにUPGするのに5,000円でおつりが来ることもある (最近のUPG版は発売後に値上がり傾向にあるが…)。
上で散々言われているが、ルビが扱えない読取革命14はかなり不利。 e.Typist12で当たり前にできる機能なのにちょっと残念。 あと認識領域が変な形になって、いちいち領域設定を手でしないといけないでしょ 読取革命。あれも何とかしてくれないと使い物にならない。
e.Typist12も認識領域はひどいよ。 下線付きの文章が巨大な「一」と認識されることが多い。
e.Typist12は傾いた画像の認識に弱かったけどScanTailor使えば無問題。 「ー」の認識はしょうがないだろうな。これが解決できてるOCRソフトがあったら 逆に教えて欲しい。 読取革命よりはマシだと思う。全体的に手間が少なくてすむよ。 ま、体験版で試してみて、自分の目的にあってる方を選べばいいんじゃない。
読取革命はバージョンアップされた(=まだ開発が継続されてる)点だけでも十分に評価対象だわ。 どうにも見捨てられたっぽい読んde!!ココ使いとしては。
読取革命は工作員がいるだけでも評価対象外だな
656 :
名無しさん@そうだ選挙にいこう :2010/05/10(月) 07:03:02
>>655 >読取革命は工作員
だまされとところだった。ありがとう。
e.Typist12が作る透明テキストpdfが破損しまくりなんだけどなんなの?
658 :
名無しさん@そうだ選挙にいこう :2010/05/15(土) 12:56:50
メディアドライブに聞け
OCRで、ついでにPDFに目次とか自動で付いてくれるようなのない?
むちゃ言うなよ
読取革命って 手描きでも認識しますか? 数字しか読む必要ないのですが。 それと、iPhoneなんかで数字だけQRコードみたいに読めるアブリってあるでしょうか?
664 :
名無しさん@そうだ選挙にいこう :2010/06/02(水) 16:51:13
しない
665 :
名無しさん@そうだ選挙にいこう :2010/06/05(土) 11:25:41
>663一行だけなら。
> 読取革命って > 手描きでも認識しますか? 体験版で試す
667 :
名無しさん@そうだ選挙にいこう :2010/06/05(土) 23:37:21
>>661 3は出ないまま開発中止っぽいな。
ワープロ専用機とFDの時代が去ったコンバータ20もしかり。
64bit版WindowsとかWindows 7に非対応では話にならない。
>>571 ツール→環境設定→認識結果の保存 で「きれい」にすると
普通に見える。
ただ、もとが文庫1ページ取り込んだtif画像1枚(110KB)+テキスト
なのにPDFが1.5MBになってるのが気になるが…… コンパクトだと71KB。
せっかく白黒にしてるのにjpgかなにかで格納してるっぽい。
669 :
名無しさん@そうだ選挙にいこう :2010/06/11(金) 11:13:30
1.5MBで何がいけないんだ?
文庫1冊400MBでも気にしないのなら別にいいんじゃない。 でかいとメモリーカードに入れたりするときに あまり入らないし時間かかるのでなるべく小さいほうがうれしい。
なんだバカか
672 :
名無しさん@そうだ選挙にいこう :2010/06/12(土) 14:47:50
手書きで書いた自分の名前を認識させたら、ちゃんと読んでしまった。 オレの手書きすげえ。
675 :
名無しさん@そうだ選挙にいこう :2010/06/12(土) 17:43:45
>673>674 読取革命で、TSUTAYAのカードの裏の氏名欄を読ませたんだけど、条件が合ったのかねw
読取革命か。docuworksで使えたかな DocuworksのOCRもだいぶマシになったけど使えるレベルじゃないんだよな
DocuworksのOCRってエンジンはe.typistと基本同じじゃ?
678 :
名無しさん@そうだ選挙にいこう :2010/06/14(月) 21:54:38
それはまだまだOCRは糞ということ?
679 :
名無しさん@そうだ選挙にいこう :2010/06/17(木) 23:33:00
>>676-678 DocuworksのOCR機能だが、OCRソフトそのものではないので、
最新のエンジンを積んだOCRソフトが別途いるはず。
読取革命はDocuworksにも対応しているので安心。
両者ともに「Windows 7 x64」に正式対応してるので。
>>679 OCRエンジンは、「WinReader PRO v.12.0」、または「WinReader エンタープライズ」(メディアドライブ株式会社製、別売)
のいずれかを切り替えて使用可能。
Docuworksの紹介に上の記述がある。
681 :
678 :2010/06/22(火) 20:54:35
読取革命とe.typist体験版使ってみたけど精度はDocuWorksの内蔵OCRと大して違わなかった ファイルに変換できたりするのが便利なんだね。あれは
>>680 内蔵OCRの代わりにはならないんだよね。一応読取りは出来た。保存が出来るかどうかは試さずに消したけど
あとe.typistの名刺読取はちょっとよかった(読取革命の名刺ソフトは糞) 角度がグチャグチャの複数枚を水平に読み取ってくれる上に会社名、名前がそれぞれの項目に割り振られる 肝心の管理ソフトが洗練されてなかった。 たかが名刺探すのに画面占有して欲しくないわ。 で、検索も糞。今時項目決めて検索とかね
684 :
名無しさん@そうだ選挙にいこう :2010/06/24(木) 16:30:28
でもOCRって、取り込むときのテクニックや経験が必要だと思わない? 写真なんかもそうだけど、原稿置いてパタンではよい結果は生まれないよ。
685 :
名無しさん@そうだ選挙にいこう :2010/06/24(木) 22:13:50
単に機械がいまだ発展途上で不便だから補わないといけないだけじゃん 原稿おいてパタンで読み取ってノイズ除去から傾き補正、同時にOCRまで完璧にかけてください 趣味じゃないんでね
686 :
名無しさん@そうだ選挙にいこう :2010/06/24(木) 22:16:42
OCRが糞なのは文字の種類が多いからか 英語なんか楽そうだもんな
FUJITSU ScanSnap S1500 FI-S1500
688 :
名無しさん@そうだ選挙にいこう :2010/07/08(木) 03:08:25
PDFを透明文字付き(読み取り文字の誤字を正したもの)で保存したデータを PDF画像データと文字とに展開しながら読み取ってくれるソフトはありませんでしょうか 読取革命は再度画像データとして認識してしまうようですorz
689 :
名無しさん@そうだ選挙に行こう :2010/07/10(土) 19:32:37
何を言ってるのかよく分からないが、以後中間形式を保存しておくようにすりゃいいんじゃね。
SmartOCR lite = RealReader liteなのか? GUIがそっくりだが
692 :
名無しさん@そうだ選挙にいこう :2010/08/04(水) 15:26:46
やらしく名詞ファイリングが、Ver10からアクチ付きになったじゃねーかよ。 メディアドライブ、お前もか!
今更だが 読んde!!ココ Ver.13.02 へのアップデートモジュール が8月9日付けで公開されてた
694 :
名無しさん@そうだ選挙にいこう :2010/09/08(水) 11:21:39
SmartOCR使ってダメダメだった・・。「時間」→「時問」や、 何故か色々な文字を「犬」と読み間違うことが多い 字が小さかったのかな 読み取り革命は小さくてもかなりいい感じで読んでくれるけど、製品版高すぎだな 大量の古い資料を一日で全部データ化したい、って場合ならこれ使えば正解だと思う
一万八千円だっけ?
未だにe.Typistを上回るソフトを見たことない。 斜め画像に弱いけど、Scan Tailor使えば無問題だし。 読取革命と違ってルビにも対応してるし。 バージョンアップしないのは、読み取り精度以外の部分はもう完成してるからじゃないかな。 読み取り精度をあげるのにすごい開発費かかるだろうし、OCRソフトなんてそんなに 売れるもんじゃないし。というバランスだと思う。
このところの自炊ブームなんかがうまく転がってくれたらいいんだけどな。 しかしタイミング悪いよね。各社がOCRにパイなしと判断して、 開発費削って切り捨てモードへの移行がほぼ完了したころに、 電子書籍が注目を集め始めるってのは。
>>697 自炊っても画像で閲覧してるでしょ。iPadやらiPadもどきの中華やら。
>>697 透明テキスト付きで画像固めたPDFが凄く便利らしいね。
質問前にググると幸せになれる気がするが自分のうろ覚え知識を書き込み 透明テキストつきPDF スキャンした画像にOCRかけて、 ・スキャンした画像 ・抽出したテキストデータ を一つのPDFファイルにまとめたもの(1ページごとにそのページから抽出したテキストを埋め込む) 透明テキスト付きPDFを表示すると @表示されるのはスキャンした画像(スキャンなので見た目は紙と一緒) A画像のみの詰め合わせPDFでは無理だった検索機能が使える (ページごとにOCR抽出したテキストが埋め込まれているため) (※ただし、OCRで抽出したテキストデータなので当然 誤認識はある。) 程度の認識かな(OCR認識したテキストを修正できるかは持ってないので知らない) 読取革命の体験版使ってみたんだが、縦書きの小説とかの領域認識がうまくいかなくて諦めた… e.Typist v12を買おうと思ってたらv13が10月発売、ということで 発売まで買うのを我慢中(無料アップデート、といっても手続き面倒だし)
702 :
名無しさん@そうだ選挙にいこう :2010/09/15(水) 01:12:24
>>701 今のうちに買っておけ、どうせV13にはアクチが入るぞ!!!
703 :
ほれアクチが来た :2010/09/15(水) 01:17:55
704 :
701 :2010/09/15(水) 09:59:31
アクチ情報ありがと 自分の環境的に58言語もいらね、e.Typist NEO V12 でいいや→NEOはアクチあり v13にはアクチあるけどNEOと一緒だなー、とスルーしてた(e.Typist v12見てなかった) 利用予定は1台のみインターネット環境あり、なので問題ないと思うんだけど e.Typist NEO v12 のアクチでPC乗り換えとかで面倒だった、なんて体験の人いたら教えてほしいです
705 :
名無しさん@そうだ選挙にいこう :2010/09/17(金) 22:14:51
scansnap用にOCR情報を集めたくてこのスレ読んでみたんだが、読取革命かなぁ? etypistの「認識結果と原稿画像を同時に表示して修正できる」機能は魅力的だけど、 scansnapで大量に読み込む場合、こんな手作業での修正なんか出来ない むしろ量をこなすなら読取革命の「フォルダウオッチャー」が魅力的 透明文字付きでないPDFもこのフォルダに置いておけば程度の差はあれ透明文字つきPDFを 作ってくれるんだろ? scansnapはmacで使うことも多いからこの機能で文字認識を向上させたいなぁ
>>705 そこまで結論出てるなら、その通りにすればどうだ?
そんなこんなのやりとりを見ていると、誰が言ったか 「テキストデータは永遠に不滅です!」という言葉を思い出す。
やたら読取革命の宣伝書き込み見るんだけど、俺の気のせいかな…
709 :
705 :2010/09/18(土) 11:17:49
scansnapのマニュアル見てたらscansnapOrganizerに同じ機能\があった>>フォルダウオッチャー PDFのメタデータにscansnap用のキーワードが要るみたいだけどautomatorで追加したらちゃんと認識してくれた。 買わずにすみそう、ラッキー
>>708 工作員だのなんだのって、読んde!!ココのユーザーの自分から言わせてもらえば「書くネタがない」これだけだよ。
せいぜい
>>693 ぐらいで、ずっと変化ないんだもん、読んde!!ココ。
>>710 そのなんとかっていうのが何だかしらないけど、俺は「読取革命」をやたら
ヨイショする書き込みが多いな。と感じているだけ。
713 :
名無しさん@そうだ選挙にいこう :2010/09/20(月) 14:43:46
>705 ScanSnap1500をつい先日買ったばかりでまだ使いこなせてないけど アクロバットの9がバンドルされてたよ きちんと計測したわけじゃないのでアバウトだけど 380ページの文庫本をスキャンして58メガpdfにするのに20分くらい そのあと全ページ文字認識させて透明テキスト付きにするのに1時間くらいだったかな? 認識率はこんな感じ 風の音は二様に鳴っていた。富士山頂の厳頭に衝突して起こす轟音と、観測所の遥か上空の あたりで作り出させる鞭をふるような音である。風の呼吸と呼吸との間にしばらく続く間隙 があると、その後に必ず襲って来る突風が、瞬間的にその付近の空気を引攫って行く。 ※改行は原文まま 上記文章でルビが付いてるのは 厳頭 がんとう 轟音 ごうおん 遥か はるか 鞭 むち 間隙 かんげき 引攫 ひきさら ↓上記を認識させた透明テキストをそのままコピペ がん・とうごうおんはる 風の音は二様に鳴っていた。富士山頂の巌頭に衝突して起す轟音と、観測所の遥か上空の huちかんげきあたりで作り出される鞭をふるような音である。風の呼吸と呼吸との聞にしばらく続く間隙 ひきさら があると、その後に必ず襲って来る突風が、瞬間的にその付近の空気を引擦って行く。
風の音は二様に鳴っていた。富士山頂の厳頭に衝突して起こす轟音と、観測所の遥か上空の 風の音は二様に鳴っていた。富士山頂の巌頭に衝突して起す轟音と、観測所の遥か上空の あたりで作り出させる鞭をふるような音である。風の呼吸と呼吸との間にしばらく続く間隙 あたりで作り出される鞭をふるような音である。風の呼吸と呼吸との聞にしばらく続く間隙 があると、その後に必ず襲って来る突風が、瞬間的にその付近の空気を引攫って行く。 があると、その後に必ず襲って来る突風が、瞬間的にその付近の空気を引擦って行く。 すごいね。「引擦って」が違うだけだ。1行目は入力ミスかい?
ごめん、二か所は俺の入力ミスだわ 「起す」「出される」も合ってて、最後の「引擦」は違って認識されてた どうもルビのあたりで改行が変になる箇所が多々あるんで 今、ルビのない100円文庫をブックオフで買ってきて試してる それとスキャンが20分?と遅いのは性能の低いネットブックでやったから途中でペースダウンした ましな方のPCでスキャンしたら330ページを65メガのPDFに変換するのは5分で終了 今からOCR認識やるけど アクロバットのアクティベーションをその遅いネットブックでやっちゃった… そのせいでOCR認識が遅いのかもしれない
716 :
715 :2010/09/20(月) 21:35:40
アクロバット、やっぱ時間かかる
328ページのOCR認識の透明テキスト化に1時間20分かかった
朝日文庫「日航ジャンボ機墜落」の14ページ目をOCR認識させて、比較してみた
ttp://www1.axfc.net/uploader/Sc/so/155207.jpg&key=123 上から順に
・原文
・Adobe Acrobat 9 Standard
・JUST PDF データ変換
12日午後6時4分 東京・羽田空港18番スポットで乗客を乗せた日航123便(機体番
ロ日午後6時4分東京・羽田空港問番スポットで乗客を乗せた日航123使(機体番
12日午後6時4分 東京・羽田空港18番スポットで乗客を乗せた日航123便(機体番
号JA8119)は、前輪にとりついた牽引車に押されて後退を始めた。車輪が動き始め
号JA8119〉は、前輪にとりついた筆引車に押されて後退を始めた。車輸が動き始め
号JA8119)は、前輪にとりついた華引車に押されて後退を始めた。車輪が動き始め
た時刻が出発時刻と決められているから、同機の出発は定刻の六時より四分遅れだった。
た時刻が出発時刻と決められているから、問機の出発は定刻の六時より四分遅れだった。
た時刻が出発時刻と決められているから、同機の出発は定刻の六時より四分遅れだった。
どの航空会社も十五分以上になって初めて「遅れ」とみなすので、日航123便はこの日
どの航空会社も十五分以上になって初めて「遅れ」とみなすので、日航123便はこの日
どの航空会社も十五分以上になって初めて一'遅れ」とみなすので、日航123便はこの日
「定時出発」したことになる。6時11分20秒離陸許可。三時間十五分ぶんの燃料を積んだ
「定時出発L したことになる。6時U分初秒離陸許可。三時間十五分ぶんの燃料を積んだ
「定時出発」したことになる。6時11分20秒離陸許可。三時間十五分ぶんの燃料を撒んだ
717 :
715 :2010/09/20(月) 21:43:28
総重量二百三十九・一九三トンのジャンボ機は、長さ三千百五十メートルのC滑走路を走 総重量二百三十九・一九三トンのジャンボ機は、長さ三千百五十メートルのC滑走路を走 総重:'-l'二百三十九・一九三トンのジャンボ機は、長さ三千百五十メートルのc滑走路を走 り、時速約百六十ノット(約三百キロ)で離陸した。離陸時刻午後6時12分20秒。同機に り、時速約百六十ノット(約三百キロ)で離陸した。離陸時刻午後6時ロ分m秒。問機に り、時速約百六十ノット(約三百キロ)で離陸した。離陸時刻午後6時i2分20秒。同機に とって一万八千八百三十六回目の離陸だった。好天、気温二九度。南西の風約八メートル。 とって一万八千八百三十六回目の離陸だった。好天、気温二九度。南西の風約八メートル。 とって一万八千八百三十六回目の離陸だった。好天、気温二九度。南西の風約ハメートル。 航空管制は離陸までが空港ビル屋上の管制塔(タワー)が担当し、離陸すると七階のI 航空管制は離陸までが空港ビル屋上の管制塔(タワ|)が担当し、離陸すると七階のI 航空管制は離陸までが空港ビル屋上の管制塔(タワー)が担当し、離陸すると七階のI FRルーム(レーダー室)に引き継がれる。そして、飛行機が巡航高度に達すると、所沢 FRルlム(レーダー室)に引き継がれる。そして、飛行機が巡航高度に達すると、所沢 FRルーム(レーダー室)に引き継がれる。そして、飛行機が巡航高度に達すると、所沢 にある運輸省東京航空交通管制部(ACC)が受け持つことになっている。日航123便 にある運輸省東京航空交通管制部(ACC)が受け持つことになっている。日航l23便 にある運輸省東京航空交通管制部(ACC)が受け持つことになっている。日航123便 上記みたいに文庫小説みたいな単調な文はほぼイケるみたいだけど 新聞やカタログの様に文字の大きさがバラバラで 記事が各所に配置されたりするのは とても使い物にならなかった 変な記号に変換されまくりで認識できたのは半分くらい
これ、原本は両方とも縦組み?
大昔の、戸籍の誤記、活版や写植の誤植のような問題が再燃するね。 うかうかしていられないぞ。
>718
縦です
>>716 に変換した画像あげときました
>>720 原本ではアルファベットや丸括弧、1桁や3桁以上の連続数字は全角文字なんだね。2桁数字だけが半角。
重箱の隅を突くようなことを言ってすまん。
716,717 おおお斜めに見える
>>693 あら、最近のOCR事情はどうなってるかと思って情報収集に来て見たら、
読んでココはまだ地味に開発続けてくれてたのかw
まあ、文字認識の精度を上げるのは当然なんだが、
結局どのOCRだって誤認識はするわけで、最終的にはその修正編集作業がやりやすいか?ってことになって、
使い慣れたものがいいや・・・ってことになるんだよな。
ところで読んでココの中間ファイルでの保存なんだけど、
これって取り込んだ画像1枚単位でしか保存できないのかな?
複数ページ取り込んでも、1枚ずつしか保存できないから面倒なんだよね。
エーアイソフト頑張れよ。
ところでPDFの透明テキストを修正編集(誤変換や貼り付け位置まで)できるフリーソフトない? 見当たらなかったんで、OCRのPDF作成機能を使ってるんだが、 直接いじれたほうが便利なときあるんだよな。
QRコードが記載されたPDFファイルを指定すると、 ファイル内のQRコードを読んで、テキストに出力する OCRソフトって無いですか??
読み取り革命は、かなり使える。
e.Typist13、評判どうなのでしょう? 12に比べて、使い勝手とか向上したのでしょうか?
>>730 使い勝手はほぼ同じ
OCRエンジン部分だけを向上させたようですが、
使った感じでは、ほとんど変わりは無いようです
>>732 追加です
個人的に期待していたレイアウト枠の自動設定もほとんど同じでした
734 :
名無しさん@そうだ選挙にいこう :2010/11/01(月) 04:09:11
読んでココで、透明テキストpdfのフォント指定ってできる? 検索かけると明朝になってるのが気になる。
読み取り革命より、Adobeに付いてるOCRのほうが性能がイイ。
なんだかな。 eTypist Neo v13買ったんだが、 なんか笑うしかねーわ。 PDF入力、PDF出力で最終ページだけ認識して全ページを出力できないしさ。 だいたい保管のところでフリーズしまくりだよ。 もっとちゃんとしたソフトにして出してくれ。 Acrobat標準のほうが使いやすいわ。ハゲ! 返品したい気分だ。
「返品したいんですが」とメーカーに言ってみるのはどう? 返品は無理でも、バグ修正アップデートに繋がるかもしれない。 人柱さん、ありがとう。
少し使い方がわかって来た。 これ、認識ロジックは海外のものをそのまま移植してるだけだね。
しかし、透明テキスト付きで保管しようとすると、暴走するのはなぁ。 なんだこりゃ… あと、pdfの読み込み遅過ぎ…。
読んdeココ試用版のDLが何度も中断される間に読取革命は試用テストまで終わった。 DL終わらないけどもう読取革命でいいや。
一応松下製なんだし よんでここよりはいいと思うけど。。。
742 :
名無しさん@そうだ選挙にいこう :2010/11/10(水) 10:02:34
743 :
名無しさん@そうだ選挙にいこう :2010/11/10(水) 11:23:14
ソフトじゃないかもしれませんが質問です。 WindowsやOfficeに付いているプロダクトキーのバーコードを読み取りたいのですが、 このバーコードの規格は何になるのでしょうか? と言うのも、手元にあるバーコードではいくらやっても読み取れないので、特別な規格を 使われているのかなと思った次第です。 (プロダクトキーとは別に付いているバーコードの方は読み取れます。) もしくは、このバーコードスキャナなら読み取れたとか、画像に取り込んでからデコードでも構いませんので 読み取る情報を持っている方教えてください。
はやく、ルビー付文字をOCRで文字化けしないで正確に再現できるソフトつくってくれ!!!!
たぶん無理。
読取革命Lite ウィン7の64ビットで動くけど ver.14のお試し版エラーが出て動かん・・ 64ビットバージョンでも動くってパンフレットに書いてんのにw
> と言うのも、手元にあるバーコードではいくらやっても読み取れないので、特別な規格を > 使われているのかなと思った次第です。 > (プロダクトキーとは別に付いているバーコードの方は読み取れます。) 単に海外の規格だから、あなたの手元の日本向けの機械では認識できないだけじゃないかな。
プロダクトキーのバーコードを読み取って何するの?
>>745 無理かも知れないが、分野によってはルビだらけだっりするし、ゆとりの増大でルビは
増える一方だから、対応できなかったらOCRソフトの未来は暗い。
できればそれに越したことはないのだけど、 表示するアプリケーションごとにルビの仕様が異なるのだから、 そこまでOCRソフトに要求はできないのではないかな。 ルビ文字をすっとばさないで「漢字(かんじ)」としてくれるだけで御の字だと想うよ。 その先はユーザーがエディタなり何なりでHTMLやXMLなどにして それぞれのアプリケーションに読み込むしかないかな、と。
さみすいすれ
じゃあ、保守だけやってないで、ネタもってこいw
754 :
名無しさん@そうだ選挙にいこう :2010/12/18(土) 20:35:23
RealReader復活記念あげ
なにこれsmartocrのパクリ?
OCRって横文字しかスキャンしたことないのよね。 しかも大学の研究室でドイツ語の本20数冊全文やったから、数人がかりで何日もかかった。 日本語の識字率は悪いだろうけど、横文字なら案外いけますよ。 ただし数年前のソフトだからドイツ語のウムラウトを認識してくれなかったけど。
辞書も使えるしな
勢いでABBYY FineReader を買ったんだけど フォントの設定がうまくできず、日本語OCRはほぼ完璧なのに pdfに書き出しても、検索できない。orz 1ページず手作業でフォントを日本語に設定しなおせば良いんだけど 600ページの辞典と1500ページの医学辞書なので萎えている。 そんな人いませんか?いませんか。
続き)eTypist Neo v13のお試し版も落として試したけど 500ページ制限、変換精度は許せるとしても、ABBYY FineReaderより遅い。 それに完成したものをpdf書き出ししようとしたら落ちた。
それって手が後ろに回るようなことなのではないの?(今は手錠を掛けるのは前だけど)
そんな悶々としているより電子辞書買えばいいじゃない。6、7万でしょ。
>>760 意味不明。書籍の電子化サービスに頼んで、自宅でOCRを
かける、これのどこが違法なのか聞こうか?
>>761 電子化されていない辞典・辞書なんだけどな。
>>762 すまん。考え過ぎた。マジで謝る。
「フォントを日本語に設定」するアプリに「自動化」とか「マクロ」とかは無いのか?
JavaScriptで可能かどうかも検討してみては?
>>764 おそらく、アプリケーションのことではなく、「辞書を複製する」のを問題にしているのだろう。
ひたすら亀ですが、
>>568 さんの示唆するやり方がすごく気になります。
よろしければ教えていただけないでしょうか。
久しぶりにスキャンテイラー落として使ってみたら、日本語化されてて、 使い方が分からなくなってた。
>>746 最近ダウンロードペ−ジに
「体験版は、64ビットOSでは動作しません。 」と追加記入されてる・・・
PFU S1500+AC9STDを使っています。 AC10 の OCR性能が上がっているらしいのでUPGしようと思ったのですが、 UPG対象外でした。 AC10 は高いので別途OCRソフトを買おうかと考えています。 どこの製品がいいのでしょうか。 読取革命 Ver.14はでてそろそろ1年経つので 15 がでないかなぁ... 読んでココ は見捨てられている雰囲気がありましたが、最近の 自炊ブームで新バージョン出たらいいなぁ...
別にOCRが目的ではないんで使い込んではいないが、AcrobatXってそんなにいいかなあ 誤認識も結構あるし。 それはそうと、9STDからXはアップグレードの対象外なの?
772 :
名無しさん@そうだ選挙にいこう :2011/01/17(月) 23:15:55
>>771 9 Std →X Std ならアップグレード版でアドビストアのみならずネットショップ・量販店等でも購入可能
9 Std →X Pro or X Suite なら特別優待版でアップグレードすることになり、アドビストアでのみの取り扱い。
773 :
770 :2011/01/18(火) 09:21:40
PFU の S1500のセットに入っている 9STD はOEM製品らしく XへのUPG対象外だそうです。
RealReader liteなんてものがあったんだねぇ いくつか試用したけれど、SmartOCRliteが一番合っていたので、これはうれしい
ロゴビスタからのメールは季節の挨拶がちょっと素敵。そんだけ
ジャストシステムから出た新しいやつはどうなのかね。
縦組みに対応した?
縦書きにも対応してるみたい
京都大のカンニング君がつかってる携帯OCRはすげーな
>>780 いや、あれはこういうのもあるよという参考として見せたもので、
彼の使っていたものではなさそうだよ。
わからないけどね、修正したのかもしれないし。
それにしても、明朝系書体は誤認識が少ないとはいえ、
ケータイであれは凄いね。
読取革命の新バージョンはまだか
783 :
名無しさん@そうだ選挙にいこう :2011/03/21(月) 08:40:08.03
>>782 俺はだいぶ待っていたが、しびれを切らして14購入。
785 :
名無しさん@そうだ選挙にいこう :2011/04/19(火) 19:20:04.37
読取革命は使えない
786 :
名無しさん@そうだ選挙にいこう :2011/04/20(水) 21:45:21.69
アクロバのocrを一太郎で補正する方が早いな
あれ補正できたのか…
沢口が好きな奴へ。 そういえばツタヤに沢口靖子が表紙のチラシが有ったから拾ってきなさい。
789 :
名無しさん@そうだ選挙にいこう :2011/05/11(水) 21:39:27.58
RealReader lite がまた消えている件w
読取革命15まだかよ
d3
認識率のええ、活字OCR出てけえへんかな・・
e.Typistで我慢しとけ。
日本語だとetypist、読んdeココ、読取革命(、あとAcrobat?) が有名みたいだけど、外国だとどんなソフトがあるんだろうか?
e.Typistは、レイアウト認識が× あととんでもない文字化けもある
文句ばっかり言っていてはいけません。 欲しがりません勝つまでは。
RealReader Lite 6.*.*ってSmartOCR Liteみたいに どこかにないの?今ある7からはシェアウェア化… 機能制限ありでいいからフリー版が欲しいのにぐぬぬ
新たに出る「一発!OCR Pro7」って 開発:パナソニック ソリューションテクノロジー株式会社 開発協力・販売:株式会社ジャストシステム って言うことは、実質「読取革命」の後継ソフトなんかな・・・
MacでOCR Xと言うソフト使っている人はいますか? 話題が出ていないのであまりよくないとか?
>>802 こう言う世界ではMacを使う事は少ないわけですね。
ありがとうございます。勉強になりました。
だってMacなんて使うメリット無いでしょ。無駄にバカ高いし。 単なるApple信者のためのお布施マシンでしょ。
>>801 日本語を読み取るのに使うには使えない。英語なら十分に使える。
>>805 ありがとうございます。
今OCR Xをいれて早速そこにドラッグしてみたのですが、一瞬でconversion completeの表記が出ます。
次に実際にOCRが掛かったのか試してみると全く掛かっていません。
何か設定がおかしいのでしょうか?
>>806 テキストをスキャンして中に納めたPDFや画像データ(写真の中の文字)を読み取る場合は、ドラックではダメみたい。コピペすれば読み取る。
もし、英語の読み取りに使うならOCR Xよりも、Prismoが使い勝手が良くておすすめ。
>>807 英語を読み取るのに使うのでは無くてPDFに透明テキストをつけたいんですよね。
Prismoはそれが出来るのでしょうか?
>>808 話の流れから日本語のテキストを対象にしていないと感じたんでPrismoを挙げてみたんだけど、日本語には対応していないからそちらの要望の対象外みたいね。
透明テキストを付けるならAcrobatでいいでしょ。
>>795 どういう外国語か知らないけど、英語なら
>>798 が挙げたAbbyy一択だと思う。
とにかく素早く正確。
もっと幅広くいろんな言語ならReadiris一択。何せ100か国語以上に対応してるから
読み取れない言語はほとんどない。
どのソフト使うにせよ試用版で試してるのが賢明だけどね。
一発!OCR Pro7は読取革命14と比べてどうなんでしょう? 時期的には読取革命15が出てもおかしくない時期で 日本語メインならeTypist 外国語メインならAbbyyなのかな
814 :
811 :2012/02/20(月) 16:55:38.94
JUSTPDF2(Nuance)を使っていて、一発!OCR Pro7と読取革命14の比較できないです・・・
要するに、機能も何もかも足りなすぎるからグレードアップ望んでるのだろ
819 :
818 :2012/02/21(火) 18:56:49.14
レイアウト認識おいといて、 認識率もノーマルのままでは、たいして進歩していない模様
820 :
818 :2012/02/22(水) 17:55:27.13
2・3回400Dpiの文庫本、やってみたけど ノーマルでは、読み取り革命とほぼ同じ結果 結論としては読み取り革命持ってたら、買っても意味は無いかと・・
逆に考えれば、読み取り革命は不要ってこと? そうはイカのキ○タマ?
822 :
811 :2012/02/22(水) 18:44:10.03
貼っておいてなんですが、適当に見繕った物が現代語辞書使うタイプは苦手な文章でした。 話題の、一発!OCR Pro7と読取革命14はほぼ同じ物でした。
824 :
818 :2012/02/23(木) 14:54:11.53
>>823 僕もそう言う印象です
読み取り革命の誤読場所と、
一発!OCR Pro7の誤読場所が全く同じだったのもあると思いますが
scansnap
途中でかきこんじゃったよ。 scansnapで文字中心をpdfに変換して、全文検索に適してるソフトは どれですかね?
828 :
名無しさん@そうだ選挙にいこう :2012/03/05(月) 10:09:18.98
無料のPDF変換ソフトPDFMate Lite FreeでTE]T、HtML化などがほぼ完ぺき 軽いし有料の某A○○YY○○R製だと立ち上げ読み込み変換も遅く 複数言語入ってるといちいち設定しないと文字化けするけど このソフトだと何の設定もせずに対応言語ならちゃんと文字が一瞬で抜き出せる
なんだ PDFMate Lite Free ってのは、Optical Character Recognition してくれるのか?
831 :
名無しさん@そうだ選挙にいこう :2012/04/01(日) 21:04:25.37
画像からじゃなくPDFの透明文字からだけ PDFリーダーだとコピペが面倒だし OCRソフトを立ち上げたりするより読み面倒じゃなくコピペするより早い 画像から文字列を抜き出すことは無理 透明文字の抜出は今まで面倒だったけどこれのおかげで作業がはかどるようになった
ウハッ マジレスサレタ
>>832 ちょと期待したじゃないか。バカバカバカ四月バカ〜
ABBYYはアルファベット外の言語は弱いぞ ABBYYも載ってるPanasonicの買った方が無難に見える それかTypist
「Scan Tailor」をお使いの方に質問です。 黒白モードの時はG4Fax圧縮とありましたがどうなっていますでしょうか。 どのパターンでもLZW圧縮になってしまい困っています。
グレースケールモードにしたらどうだろうか
>>836 結局は「ScanTailorPlus」の方で出力(G4Fax圧縮)できました。
その他に「scantailor-enhanced」というのもありましたが何がなんだか。
lzw, deflate, packbits, jpeg が可能なようなことも書いてありましたが
どうにも妙な動作で使いこなせません。
jpeg圧縮のTIFが出来たほうが助かるのですが・・・。
839 :
名無しさん@そうだ選挙にいこう :2012/06/02(土) 18:28:54.63
e.Typistてコマンドラインとかオブジェクトとかで操作できないんですかね。 MAC版はオブジェクトが載ってるんですが・・・・・・……
Panasonicのエンジンの様ですし本家推奨
読取革命ver.15まーだー?
OCRは値段高い方が精度が良いと思てまうw
>>840
ライセンスの都合でそうなりますよね 読取革命のABBYY e-TypistのNuance それと、もう暫くしたらWin8が出ますし、それを見越しe-Typistは精度向上の無いVerUPを行い、Win8対応と謳った精度向上VerUP行うのでしょうね
一般的にOCRソフトって、日本語と英語ミックスドキュメントの場合、どちらかしかテキスト化できないものなのでしょうか。 ScanSnapやAcrobatはどちらかしか変換できませんでした…
できますん
>>846 ありがとうございます。
一番のおすすめ製品ってありますか?
旅行雑誌の自炊を考えてて、あんな感じの文字情報を検索できるPDFに変換できるなら嬉しいのですが…
読取革命かe-Typistのどちらかとしか答えられないかな、何故かというと、スキャン精度や方法・内容でベターが変わるので
日英混載でコスト度外視ならWinReader PROがベストでしょうね WinReader PROという上限というか完全版があるからe-Typistは前にも書かれてますが精度向上が競合製品の後追いしか出来ない
850 :
名無しさん@そうだ選挙にいこう :2012/06/27(水) 16:10:42.23
>>847 革命の方がいいと思う。タイピストはビジネス文書には強いが、レイアウトの複雑な雑誌等には弱い。
また縦書きの日本文の中に、横に倒した英単語が入った場合、タイピストでは完全に読み取らない。
まあ後は体験版で実際に試すしかない。
タイピストはちょっと画像が斜めだと全然読み取れなくなる。 ScanTalarで補正すれば問題ないけど。革命は読み取り精度低いから使い物にならん。
まったく情弱ですまんが、GoogleDocsにOCR機能がついてるんだな。
e.Typist v.14.0 アップグレード版、5000円弱やったので買うてしもた、 思うた通り、特筆する性能アップ無し by 人柱
e.Typist斜めの画像に弱いのは相変わらず?
855 :
853 :2012/07/09(月) 20:21:19.22
わざと傾けて試したけど、勝手にソフトで傾き補正する その精度も良し、とりあえずの報告
ありがとう。じゃあV12よりは進化してるんだね。 俺もうpグレしようかな。
>>852 そうなんだけど、Googleにデータ渡すのが何となくイヤで試す気にならない。
ただでさえ市場小さい上にライトな需要がEvernoteやGoogle Docsに行ったらもう商売にならないわって判断かな
終わったか。 使ったことないけど。
EPSONだったんだ。プリンターには入れるんだろうね
862 :
名無しさん@そうだ選挙にいこう :2012/08/06(月) 11:03:29.81
いやいやAIが喰われた時点で技術消失したろ。 Windowsエイトがでるから対応がメンドくせえって意味なんだろさ ではバンドルソフトはどこの製品になるのやらw
863 :
名無しさん@そうだ選挙にいこう :2012/08/06(月) 16:17:11.48
結構いいとおもうけどなぁ〜 ところで激安中古ソフト屋さんでググると使えるソフトがかなり安い
通報されたくないし
OCRソフトって万人が使うもんじゃないから、バンドルさせて 価格が上がるくらいなら、外したほうがいい。という判断かも。
e.Typist v.14の新機能も、 ・スマートフォン/タブレット連携 ・外部クラウドサービス連携 ・EPUB出力機能 と、OCRとは直接関係のないものばかりだし、 なんかこのジャンル全体に閉塞感が漂うね……。
867 :
名無しさん@そうだ選挙にいこう :2012/08/06(月) 21:31:45.94
オレはAIの製品を愛してたから、エプソンに喰われたときはがっかりしたよ。 微に入り細に入りのカスタマイズができる反面、簡単な操作もできた。 ここのSEさん、もう引退したのかなあ エプソンのソフトウェアにはむしろ悪意すら感じてしまうw e.Typistもインタフェースが全然変わらないんだよなくそのくせにwww
OCRは必要な技術なんだけど、スキャンの手間が最大の障壁として聳え立っている。 見開いてデジカメでパシャパシャ撮影して、歪みや傾きは自動で修正して完璧なドキュメントを出力。 そんなシステムだったら五千円でも買うぞ!
機能追加よりも、使い勝手をよくしてくれればいいのに。 よく使う操作はすべてマウスを使わないでキーボード操作のみで 流れ作業のようにできるようにしてくれればいいのに、どれもいまいち。
871 :
名無しさん@そうだ選挙にいこう :2012/08/07(火) 09:17:42.43
東大がやってた、ぱらぱらとめくると補正して、とかあったような気が。 5000円じゃ無理でしょうけど。2桁から3桁足りないだろうね。
>>870 マンガみたいに画像として読むならそれもありだよね。
これでも使ってろ つ GT Text
900円のe.Typist Mobileで充分かも。 本読んでて、重要箇所に線引く代わりにスマホで写真撮って、 まとめてテキスト化したいだけだった。
877 :
874 :2012/08/23(木) 22:42:42.23
>>875 あんたは昨日までの俺か。
画像として取り込むだけならスキャナの方が綺麗だし、
OCRもあるのでいいと思ったが、日本語認識率80%なんてダメだろ。
しかもUSB接続でないと使えないから、本とスマホだけの手軽さにも劣る。
OCR機能が弱くてもいいなら400-SCN012BLの方がマシ。
そうなんだ。ちょっとよろめきかけたとこだった。
> OCR機能が弱くてもいいなら400-SCN012BLの方がマシ。 サイトを見たら、良さ気なんだけど、例えば文庫本とか小さいものは ちゃんと読み取れるかな? 一枚の紙切れを真っ平な机に載せた状態なら、楽勝だと思うんだけど。 読み取り部が取り外せるファックスを持ってるんだけど、 結構読み取れるものが限られているので。
スマホ持ってたら、900円のe.Typist Mobileがいいと思うよ。安いし。 どうしてもスキャナー買ってみたいなら、それはそれで使えんことはないだろうが。
えっ 午前中14買ってしまったOTZ
角度さえ補正したら、デジカメで撮影したのもちゃんとOCRできるよね。
e.Typist、PDF画像読み込みの際、読み込みが最優先され、 画像読み込みの間、他の作業ができなくなる 読み取り革命はそういうことが無いのに、15早く出て欲しい
読み取り15どうですか
ところでOCRした後のテキストって読んだりすることありますか? 今だったらiPodとかAndroid端末で読んだりするんだろうけど、 やはり紙の本の方が読みやすいですね。 病院とか図書館とかでいきなりiPod見られないし(ケータイと間違えられそうで怖い)
OCR化の訂正時に、熟読して、しばらく立ってぱらぱら読み程度かな IPADで読むのは、ほとんど漫画かもw
888 :
名無しさん@そうだ選挙にいこう :2012/09/09(日) 21:39:09.22
読取革命15ポチっちゃったw
>>886 パソコンでいじりまわして、最終的に本屋に並ぶので、買ってくださいw
890 :
名無しさん@そうだ選挙にいこう :2012/09/11(火) 01:29:22.02
ここをPDFにして某メーカの付録OCRで変換してみた。 「 読んでここ 」が なぜか??? 「 噛んでここ 」に・・・・・
wwwwwwwwww
読取革命15の第2水準漢字の認識は 古い書物をOCR化してると非情に助かる、途中報告です
そうですか。買いですか?
894 :
892 :2012/09/22(土) 07:31:58.89
濁点「・・・」棒線「ー」は、何度登録しても誤変換、これは前と同じ 変換効率は、第2水準が追加されたので、個人的には良く感じます
プレビューなしでの一括置換には良さそうだね。
秀丸の「grepして置換」と同じじゃね?
speeedと何が違うん?
エディタと違って確認置換は糞重いってことだろうか。試せないけど
みんな、どういう携帯機器で読んでる?
901 :
名無しさん@そうだ選挙にいこう :2012/10/01(月) 06:26:39.71
読取革命15はPDFを透明テキスト化すると、ファイルサイズが数倍に ふくれあがる仕様は変わってないのな。 領域設定も全然だめだし。
PDF解析ソフトで調べてみた。 複合機のPDFとかを解析すると文字・図形と背景を分離して別々の圧縮 方式を組み合わせるなどの工夫をして桁違いの高圧縮をかけている。 手持ちのソフトで透明テキストPDFにすると全画像をJPEGで圧縮しなおして おり元の工夫が台無しになっていた。高圧縮方式の特許が絡んでいるのかも。
だとすると、特許を持っているところが文字データだけを取り出すソフトを売り出して欲しく感じてしまう 複合機取り込みOCRの需要は減るが
逆に図形がない、テキストが殆どの場合は そんなにサイズが変化ないってことかな?
>>902 読取革命 以外のソフトもそうなのでしょうか?
例えば講談社文庫とか読むと使ってるフォント、ポイント数はほぼ同じ。 主要出版社のものをスキャン>OCRすることがほとんどだろうから、 そういうものだけでもパターン登録できないもんか。 無理かな。
907 :
名無しさん@そうだ選挙にいこう :2012/10/04(木) 22:25:49.86
>>904 テキストメインでもサイズはAcrobatで透明テキスト化したときの
5〜6倍になる。図形があってもほとんど変わらない気がする。
高圧縮でpdf化すれば2〜3倍程度になる。
>>905 e-Typist だとAcrobatの3倍ぐらい。
とりあえず、今月末にでるAcrobatXIに期待
908 :
名無しさん@そうだ選挙にいこう :2012/10/05(金) 18:12:46.82
よく分からないのだが、いまどきのPCでPDF文書の高圧縮とかに意味があるの? モバイルとかだと、重くなるのかな?
創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね 創・価 死・ね
買い物の際に貰うレシートをスキャンして、エクセルで家計簿をつけたいのですが、 無料で良いソフトはないでしょうか? スレをざっと見た感じSmartOCRというソフトが有名のようですが、現在もSmartOCRが良いのでしょうか?
911 :
名無しさん@そうだ選挙にいこう :2012/10/22(月) 01:38:16.10
あげ
それ今ダウンできたっけ?
配布終了になってた
914 :
910 :2012/10/23(火) 18:32:53.50
レシート程度なら手打ちでやるのが確実
>>910 手で入力することでも家計を意識できると思うから、
手入力おすすめ。
「ああっ!このあんぱんは要らなかった!」ってなるかも。
>>910 スキャンスナップみたいの使うんでなければ
時間ばっかかかるよ
バーコードリーダーはどうだろう?
>919 何を買ったかはわかるが、値段がわかんないだろ。
そっかorz
>>910 そんなことができるのだろうかと「OCR 家計簿」で検索したら
いろいろあるんですねえ。
下記は試用期間が1ヵ月間もあるみたいだから試してみては。
| ニャーニャー家計簿「ねこのて」 Ver.2.1
| 作 者 : 船ヶ台数理情報研究所 さん
| 対応OS : Windows XP/98
| 種 別 : シェアウェア(3,255円)
| 作者のホームページ :
http://www.ne.jp/asahi/fmil/fmil/ | 補 足 : 試用期間は1ヵ月間
昔主婦向け雑誌か何かでレシート用スキャナと家計簿ソフトを モニタプレゼントってやってたな。店名・品名も自動入力で 結構よさそうだった。
OCRは自動的に処理してくれるからいいんだけど、その手前のスキャンが面倒くさくてね。
925 :
910 :2012/10/24(水) 19:43:36.10
>>915 安物のプリンタなのでOCRは付属していませんでした。
>>916-918 家計簿をつけるのにOCRはそれほど便利でもないのか・・・
>>922 シェアウェアならあるんですね。
とりあえず試してみます。
>>923 自動入力でいろいろやってくれるといいですね。
>>924 確かにスキャンって中途半端に時間がかかるし、面倒くさいですね。
926 :
名無しさん@そうだ選挙にいこう :2012/11/07(水) 11:11:19.97
四百字詰め原稿用紙に綺麗に清書された文字はうまく認識されますか?
日本語の場合OCRって難しいね、英語だと楽に認識してくれるけど acrobatで透明テキスト化するときはtiffで読み込んで変換するのが一番きれいになるな 読み込んだtiffを一時的に置いておくところが必要だけどさ
Acrobat(10)でときどきスペースと文字が入れ替わるのはなんでだろう。 例えば Yes, we can. が Yes,w e can. のような感じ。 どうでもいいが、ユーザー作成フォントが携帯絵文字に化けていたのは笑った。 私用領域がバッティングしたんだな。
AcrobatのOCRって読んでここだっけ? 弱いんじゃねえの?
930 :
名無しさん@そうだ選挙にいこう :2012/12/14(金) 19:04:00.92
>>927 確かになぁ=
ところで激安中古ソフトダウンロードマートさんかなり使える
ダウンロードだからすぐに使えるしヨカターヨ・゚・(ノД`)・゚・
ググってみ
934 名前:anonymous[] 投稿日:2012/11/23(金) 15:19:20.60 ID:b0I9+Plr
>>932 サンクス
ところで激安ソフトでググるとかなり格安でソフトがそろうな
今のところすぐ使えてサポートの万全なのが激安PCソフトダウンロードマート
すぐ使えるのがいいよ
935 名前:anonymous[sage] 投稿日:2012/11/23(金) 19:02:39.36 ID:???
すぐ捕まるところがいいね
936 自分:anonymous[sage] 投稿日:2012/11/23(金) 19:48:00.88 ID:???
会社所在地を詐称するところがいいね
〜を=と打っちゃう人
>>930 連絡したら家宅捜索中を受けてるから待ってくれと言われたよ。保釈が決定したら商品を送るって言われたから買うのを止めたよ。
画像のPDFをOCRしてテキストでもらったんだけど……あんまりだぁ。なんじゃこりゃ。 現物よこせ、こっちでスキャンしてやる、みたいな。
日本語だったら糞でも仕様が無い というかpdfだったら透明テキストが基本だろ
読取革命15で いくら登録しても同じ字を間違う「・」「パ」「バ゙」とか どうにかならんのかな。。。
日本語のOCRはあきらめろん
そうだね、簡単に正確にできるようだと、専門にやってる人が失業するしね
939 :
名無しさん@そうだ選挙にいこう :2013/04/21(日) 02:55:33.54
ScanSnapで取り込んだPDFを保存するフォルダを 読取革命14のフォルダーウォッチャーで監視して 透過文字付きPDFにするとOCRの文字認識がなかったページが 自動削除されてしまうけど15ではどうなってますか?
ScanTailorを使えばかなり正確にページ分割とか傾き補正できる。 OCR用にも使えるけど、スマホとか小さい端末で読む用にトリミングとかもできるので重宝してる。
空白ページの自動削除ってさ普通ソフト側で設定できないか?
本読みながらいつでもテキスト化するには、スマホとOCRアプリが便利。 CamScannerは無料だが、検索できるだけでテキスト化も修正も無理。 結局e.Typist Mobile一択か。業者ではないが、900円が今日までは半額の450円だ。
ジャストの一発OCRが何気なくいい。
944 :
名無しさん@そうだ選挙にいこう :2013/05/06(月) 16:27:28.75
ジャストの一発OCR = Panaの「読取革命」OEM版
e.typist android版、試しに買ってみた。 ・いいところ 意外に認識してくれる。悪くない。 ・微妙なところ ルビとか認識してくれない。今後に期待。 改行判定もなんかおかしい。 ・悪いところ 縦画面専用。なんだと。 まぁ450円なら、悪くないかも。 900円は微妙。 横画面に対応したら、optimus chatと 組み合わせて自炊が捗りそう。
>>944 「一発!OCR Pro7」 = 「読取革命Ver.15」 ですか?
読取革命使ってみたんだけど、これって元のPDFファイルを改変しちゃうのは仕様? あくまでもとの状態のまま文字認識だけしてくれればいいんだけど、 出力後のファイル見てヒヤッとしたよ。
計算の途中で微妙に数値が違ってくるんだろうな
元のフィアルをコピーしてから使えばいいんじゃないかな
もらった文書にOCRがかかってたんだけど、なんのソフトでOCRつけたのか調べる方法ありますか?
ファイルにはいろいろ情報が入っているはずだから、プロパティに表示されなくても 変更履歴を取得するプログラムがあれば分かるかもしれない。と、言ってみただけ。スマソ
大正解
OCRを複数かけたらどうなるの? 同じソフトで2回、ソフトA→ソフトB、とか。 知っている人いたら教えてください。
意味がわからん
俺もだ
>954 2回分認識したテキストが出力される。その意義はさっぱりわからんが。特に前者。
透明テキストの2枚重ねは出来るのかって事? OCRエンジンを2つ使って結果を重ねるって事? 両方とも無理だろ
いや、むしろ後者の方がわからん。 前者、解析辞書を修正しながら何度かやり直したら精度が上がるか、というのなら、 上がるかも知れない。
たとえばetypist使った後に読み取り革命使ったらどうなるの?ってことです
どうにもならんよ。 例えばABCDEって文字が書いてあって e.typistが A8CDE 読取革命が HBCOE って認識するとする。 これを、e.typist→読取革命と認識させても e.typistの認識結果は A8CDE そのファイルをすぐ読取革命通しても HBCOE ってなる。e.typistの結果を読取革命が認識 する訳じゃないから。 もしかしたらe.typistの結果を受けて ABCDEって認識してくれるかも?って期待してるの かもしれないけど、そんな動作はしないな。 e.typistを2回かける場合 A8CDEが2回出てくると思う。 Bと8がかなりぎりぎりなら、もしかしたら 時々ちゃんと認識するかもしれないけど、 普通は同じ結果が来ると思う。 あんま何回も認識させたことないからわからんが。 ただ、色々なページにABCDEって出てくる本の場合 最初に出てきたページでA8CDEをABCDEに修正すると それ以降のページではABCDEと認識する事が多くなる。学習するから。 俺はe.typist使ってるけど、e.typist上で修正を 繰り返さないといけない認識結果が微妙な書籍の 場合、1ページずつ認識して作業してる。この場合 2回目以降のABCDEはA8CDEにならずABCDEと認識 してくれるんで助かるね。
丁寧な説明ありがとうございます e.typist→読取革命と認識させた場合、透明PDFが2枚付いたPDFファイルが出来上がるということでしょうか?
できあがらない
自炊した本(状態良、日本語)に透明PDFつけたい Eタイピスト 読み取り革命 アクロバット ソースネクストのいきなりPDFシリーズ そのた どれがおすすめ?
e-Typist > Acrobat 他は知らん
一発OCRが読み取り革命と同じであれば個人的にはe-Typistより良かったから 読み取りにしとけば?
一発OCRってルビいけたっけ?
ああ、それで読み取り革命買わなかったんだ。
一発試して見てるけど、レイアウトがめちゃくちゃに設定される。 これ、ヘルプ読んでも分からないんだけど、レイアウトを同じ版面で全部の画像。 って設定できないかな? 認識とか訂正のしやすさはまあまあ。ルビは対応してないみたい。
たとえば○○文庫で辞書学習していくと○○文庫に対しては認識率100%に なるもんでしょうか? 最悪○○文庫に使われている文字全て(1万文字くらい?)を学習すれば当 然100%になりますよね? 「○○文庫を学習した辞書」というものを、どこかで入手できるとうれしい。
「誰かがスキャンした○○文庫の自炊PDFを元にして作った○○文庫の辞書の」と 「自分でスキャンした○○文庫の自炊PDF」とはソースが別物だから100%になる保証はない だがかなりいい先行く可能性はある だからはやく「○○文庫を学習した辞書」を量産して公開する仕事を始めなさい
なんとか要領よくってやろうという努力はいいけど、根本的なことも理解しような
>>973 ある文庫内で使われてる文字を全て網羅できても、その中で誤認識が起きる可能性があるから100%は無理でしょ。
上の人たちも指摘してるけど必要な辞書に取得したい本文が含まれてるっていうのが本末転倒なワケだが…。
977 :
名無しさん@そうだ選挙にいこう :2013/07/22(月) 13:47:31.75
■2014年9月30日をもってサポートサービス終了となる製品 ◆読んde!!ココ Ver.13 あと一年と二ヶ月か
結局OCR後の校正で全部目を通すから、小説とかは無理なんだよね。
OCRやりっぱなしで済むものなんて無いでしょ? たとえ英文だけだとしても
繰り返し使う資料とかならテキスト化することで、検索できるなどのメリットが。
スキャンとOCRと、混乱してるのかな
透明テキストならocrやりっぱなしでもおk 自分はわざわざ修正なんてしない
983 :
名無しさん@そうだ選挙にいこう :2013/07/24(水) 05:54:20.35
レス981以上では24時間カキコがなければ過去倉庫に落ちてしまいますよっこらしょっと
透明テキストがすなわちOCRだと思っていたんだが、違うんかな。勉強し直してくるよ。
985 :
名無しさん@そうだ選挙にいこう :2013/07/25(木) 03:48:10.94
優秀な人
986 :
名無しさん@そうだ選挙にいこう :2013/07/25(木) 17:47:30.42
そうでもない人
987 :
名無しさん@そうだ選挙にいこう :2013/07/25(木) 19:55:12.65
読んでココ残念。 良いソフトだったのに!。
988 :
名無しさん@そうだ選挙にいこう :2013/07/26(金) 05:03:57.69
そうなのか
OCRソフトとしてはビミョーだった<読んde
結局読取革命買っちゃったしなー
結局全部入力しちゃったこともあるしなー
992 :
名無しさん@そうだ選挙にいこう :2013/07/27(土) 04:39:48.09
次スレお願いいたします♪
993 :
名無しさん@そうだ選挙にいこう :
2013/07/28(日) 01:49:18.07 OOops!