1 :
名無しさん@お腹いっぱい。 :
2006/03/06(月) 18:04:38 ID:eFU2jlRP0 読んde!!ココ・読取革命・e.Typist・OmniPage・OmCR(オムロン)・CROSS OCR・本格読取・表OCRなどなど・・・ 最近SmartOCRなんてフリーソフトも出てきたけど、やっぱり読んde!!ココか、読取革命だよな。
厨房が立てたスレ
読んde!!ココって認識完了後アクセス違反とか出て落ちるんだけど まぁ俺だけだろうな。
4 :
名無しさん@お腹いっぱい。 :2006/03/10(金) 21:26:35 ID:lHDi9coD0
読んde!!ココと読取革命はどっちがいいの?
5 :
鴻Uク :2006/03/10(金) 21:29:44 ID:S0R8zV8a0
あのー僕PC暦短いので色々分からない事があるので聞きます。どうすれば画像をきれいにできるんですか? 僕がやると変な風になって汚いんです・・・・・友達とおんな自画像をやってもなってしまうんです。 どうすればきれいに出来るんですか?教えてください。よろしくお願いします。
6 :
鴻Uク :2006/03/10(金) 21:33:30 ID:S0R8zV8a0
ここいないんですかね?
クソガキは半年ROMってろ
たった半年でいいのか?
>8 まだ半年たってねーぞ
10 :
名無しさん@お腹いっぱい。 :2006/03/14(火) 16:21:51 ID:b6zmMMEN0
変換精度はどれがいい? 俺的には読んでココは日本語と英語が別々に変換できていい感じなんだけど。
得手不得手があるからどれが良いかわからんね なかなか使えそう ・読んde!!ココ ・読取革命 ・SmartOCR うまく使えなかった ・e.Typist SmartOCRでいいや
読み取り革命って英日を別にできたっけ?
11の4製品を試したことあるけど、 一番良かったのがe.Typist、僅差で読取革命、ちょっと落ちて読んde!!ココ 、一番悪かったのがSmartOCRだった 校正の手間を考えるとe.Typistがいいよ
e.Typistは使いにくいことで有名だけどな。 英文と和文が明確に分かれてるときは読んde!!ココを使う。
15 :
名無しさん@お腹いっぱい。 :2006/04/06(木) 16:12:32 ID:pxM0KovP0
一発!OCR PRO4っての使ってる これはいいソフトなのか悪いソフトなのかわからん
16 :
名無しさん@お腹いっぱい。 :2006/04/10(月) 06:57:57 ID:ANgqWY9C0
>14 私は e.Typist が使いやすいです。最初に連続スキャンできるとことか 画像編集と認識枠編集がプルダウンでできる点など。
e.Typist対読んde!!ココ e.Typistは、ちょっと前のバージョンから 認識できない所が画像のかけらとなって残るので 使いにくいと思うようになりました。 OCRとは直接関係ないですが、 スキャナで読んでPDFに変換すると なぜか読んde!!ココの方が画像がきれいです。 容量も大きいですが。 PDFを開く場合、読んde!!ココは300dpi e.Typistは400dpiにできてページ指定もできるので e.Typistの方がいいです。
19 :
名無しさん@お腹いっぱい。 :2006/04/26(水) 09:26:07 ID:FsvYB+jHP
20 :
名無しさん@お腹いっぱい。 :2006/04/26(水) 09:36:38 ID:m0FjrqBt0
>>19 これ使ってた人いる?どうだったか教えて。
無くなると使ってみたくなるなw 誰か持ってないのか。
22 :
名無しさん@お腹いっぱい。 :2006/04/26(水) 09:41:57 ID:lKn05zZA0
>>19 資金繰り悪化なのか
最後にソースネクストから出したらいいのに
>>19 使ってみたけど、フリーならこれ最強じゃん
てか、スキャナ付属のOCRソフトしか使ったことないけど、
画像開いてOCRできるソフトって初めて見た
著作権保護の関係か何かでできなくしてるのかと思ってたんだが
お、ほんとだ。ベクターから行けるね。 ファイルサイズ結構小さいなこれ。
配布終了してから人気が出るパターンかしら
オンラインヘルプ消えた!?と思ったらgoogleさんが保存しておいてくれたので とりあえず落としておいた。
あれ?Helpトップ以外は生きてんのか?
フリーで使えるOCRがあるなんて初めて知ったぞ。 宣伝が足りんかったんじゃないか? 惜しいな。
31 :
名無しさん@お腹いっぱい。 :2006/04/26(水) 15:39:43 ID:5bt7kXOn0
わけあってWinからMacに移行したんだけど Macで使えるフリーのOCR知りませんか? 今までWinでは、スキャナにバンドルされたe.Typist使ってました。 Mac用に新しくスキャナ買う方が早いとは思いますが なるべく出費を減らしたいので…
32 :
名無しさん@お腹いっぱい。 :2006/04/26(水) 17:48:01 ID:lKn05zZA0
>>31 フリーのOCR自体今まで知られてなかったわけで・・・
33 :
31 :2006/04/26(水) 22:49:16 ID:mGh+oZ/Q0
e.Typistの体験版for macを発見したのですが これって無料ですかね… 使用期限とか決まっているんでしょうか? 使っている方いらっしゃいません?
>>33 おまえさんの見つけたページには書いてなかったのかね
>製品の機能を体験版(無料)でお試しいただけます。
>体験版は14日間使用できます。
35 :
31 :2006/04/26(水) 23:35:12 ID:mGh+oZ/Q0
すんません。節穴でした。
vectorからsmart OCR消えてない? ほしいよー
うpうp(´・ω・`)
横からd (・∀・)
持っとき 持つとき 立っとき 立つとき eTyistにはこういうミスがあるんですよね フー
eTyistなんていうtypoよりはかわいいと思う。 ちなみにそういう系統の間違いは読んdeの方がはるかにひどい。
45 :
名無しさん@お腹いっぱい。 :2006/04/29(土) 16:26:19 ID:roNR6MOZ0
>>27 オンラインヘルプのキャッシュは残っているけど、
保存するの面倒だね。
一枚づつ保存するしかないのかな?
47 :
名無しさん@お腹いっぱい。 :2006/04/29(土) 20:27:48 ID:f+6LR83n0
Axfc UpLoader Basic N13_2563に pass=47のID
51 :
47 :2006/04/30(日) 18:48:50 ID:DJadZW8h0
>>51 お前タイ━━━━━━||Φ|(|゚|(ry
>>53 ネ申(
>>48 )からSmartOCRLite107.zipを手に入れた俺は勝ち組w
しっかし、流石ネトランだな
つまり OCR作っている会社の元社員がソース持ち逃げ→会社旗揚げ こっそりやるつもりが評判になって目立ってしまい発覚 あぼーん ってこと?
てかおまいらどんな画像をテキスト化する必要があるんだ?
professionalはもう手に入らないかなぁ。。。
>>59 CDの歌詞。
CDDBに対応してない上に買う奴もほとんどいない古いCDで、
それでも中学時代の最高の思い出だったから、つい。
106と107ってそんなに違うのか?
zipだろ しかも固めてある.exeの解凍した奴を7zで圧縮すると、サイズが増えたり・・・
サイトをzipでくれって意味なんだが
おはよ。
昨日>65は見ていたのだけれど、翌朝早く起きなければ
いけないために寝てしまいました。
要望のあったzipを下記のあぷろだにアップしました。
もし56のサイトやアップしたファイルをwebページなどで
紹介していただけるときには、できれば、smart ocrが配
布中止されたフリーウエアであるため、やむなく56のサ
イトやあぷろだで配布しているという旨の文を入れて
いただければうれしいです。
ttp://newsstation.info/up/img/ns8755.zip
てかこれ、倒産してるとはいえ、勝手に配布していいのか?
某スレの粘着キタ━━━━━(゚∀゚)━━━━━!!!!
>>72 お前の了承を得る必要だけはないな
倒産後に著作権うんぬんを吠える気力なんか残ってねーだろww
死人に口なしと同じ 典型的な犯罪者の論理
何度もID変えて忙しいヤツだな 配布終了ソフトを持ってないヤツが手に入れるのが気にくわないのか? 皆が欲しがってる配布終了ソフトを自分が持ってることで優越感にでも浸りたいのか? 随分と心の狭い人だこと
もともとパクリなのに、それがばれて尻尾巻いて逃げた奴が来襲してるんだろ。
そもそもOCRがフリーって時点で最初から不自然だ
(AAのオートトレーサーは大体フリーだけどね)
失笑、どんだけ開発の手間違うと思ってんだかw
あれってある意味辞書代じゃないの?
84 :
名無しさん@お腹いっぱい。 :2006/05/03(水) 16:56:09 ID:Mi9py0RC0
Office2003がある人ならOCRソフトいらないんだけどな
Officeにそんな機能あったのか。 クライアントから送られてくるWord&Excelファイル開くくらいしか 使ってないから知らなかったよ。
>>85 OfficeツールのMicrosoft Office Document Scanningのこと?
これって精度高いの?
>>87 >これって精度高いの?
そのツッコミあると思った。
あんまり良くないみたいだけど、別途OCRソフトいらないって意味。
どっちみちフリーウェアで間に合わせようとか試してみるだけの人はOCRソフトを本気で使う気ない人だろうし
スキャナーからしか読み取れないからだめぽ
Microsoft Office Document Imaging
91 :
65 :2006/05/03(水) 18:36:57 ID:v5VR/W2R0
>>71 キタワァ*・゚ ゚・*:.。..。.:*・゜(n’∀’)η゚・*:.。. .。.:*・゜゚・* ミ☆
94 :
56 :2006/05/05(金) 08:00:50 ID:tgflGacC0
>>92 乙です。
Firefoxではページの表示がやや崩れてしまうのですが、
ヘルプファイルにするときれいに見えていいですね。
orz
>>97 _n
( l _、_
\ \ ( <_,` )
ヽ___ ̄ ̄ ) グッジョブ!!
/ /
100 :
名無しさん@お腹いっぱい。 :2006/05/06(土) 03:24:16 ID:PetFtHox0
pc japan 5月号の付録CD−ROMのなかにSmartOCRLite107.zipはいってる。 もう、本屋には、並んでないかも。
102 :
名無しさん@お腹いっぱい。 :2006/05/06(土) 10:15:47 ID:y9goNNeE0
どなたかヘルプファイルを…
104 :
56 :2006/05/07(日) 07:40:45 ID:28SofdyF0
>作者さんから削除しろ それは・・・
106 :
ゴルゴ :2006/05/07(日) 08:38:17 ID:QQJTGhLZ0
用があるならいつでも言いな
ここまでやって今更、画像が云々は 気にする必要がない気がする 画像が有る無しは関係ないでしょ。
紙の文書の透明テキスト付PDF化をしようと,読んdeココをかおうとしたら, 5000円程度でScanPaper for PDFという読んdeのサブセットっぽい製品を発見 しかし,両者体験版をダウンロードしてみて試したら, 全く同じ画像を認識させても読み取り結果が違う もしかして同じエンジンを使っていないんでしょうか。
>>107 どっからDLできるのかわからん
流れにくいとこといえばuploader.tvだな
>>104 中の人です。
すみませんが、削除していただけないでしょうか?
誰だよ
116 :
名無しさん@お腹いっぱい。 :2006/05/09(火) 20:33:57 ID:20ZQP+8W0
>>113 本当に中の人なら、公式のページで再配布やめてくれって
ぐらいは表明すべきだと思う
つか、フリーソフトは作者が何と言おうと配布自由だろw
最近の子は おもしろいな
商用製品をパクる>>>>>>>>>フリーソフトを再配布 公開するものに責任も取れないのに、さらに金を取ってたっていうんだからry
>>110 エンジンは一緒でも辞書は違うんだろうね。
>>119 タイ━━━━||Φ|(|´|Д|`|)|Φ||━━━━ホされますよ
民事だろ。しかも親告罪。 訴えられて、裁判に負ければ賠償金。
125 :
56 :2006/05/11(木) 04:26:35 ID:jLp0dWRE0
とりあえずファイルへのリンクを削除しました。 オンラインヘルプのほうは、著作物として保護が 強く要請される(であろう)画像ファイルは使って いないこと、また、既存ユーザーが利用するため に必要な範囲の内容に限って掲載していることから、 そのまま存続させていただけるよう、お目こぼしを お願いします。 では、名無しに戻ります。ノシ
逃げたな・・ 親に告げ口されるのがそんなに怖かったか
会社が消えたら配布し放題
>>124 キミは刑事と民事の区別が理解できていないな
>>125 リンク消しただけでディレクトリ丸見えじゃんw
132 :
名無しさん@お腹いっぱい。 :2006/05/12(金) 01:15:43 ID:j2y3fq7J0
こんな素晴らしい物があるなんてー って思ったら配布停止? あと1ヶ月早く知っていればー。 誰かタイムマシン貸してください。 upキボンヌ
>>132 お前はせめて1レス前を読解できんのかと
134 :
131 :2006/05/12(金) 02:00:01 ID:KhmKITRV0
>>133 もう消えてるよ
余計なこといったかな
まあネトランで拾っとけ
まあ、海外の無料ホームページにうpするのは 足つかんし、無問題だろうけどなw
だから56は海外の450mb.com作ったんでしょ
ネトランも消えた。 再配布を450mb.com限定で許可してほしい>中の人
実際活用してる奴いるの?
海外サーバーなら消す必要無し
著作権法では、証拠物件として配布することは可能らしい。 (例:著作権侵害しているetc)
まあ個人使用で小説をテキストにして携帯するとかあるんじゃね 俺は今それに挑戦しようとしてる
シェアウェアより認識率高いの? それなら欲しいんだけど
読んでココでも買うとけ
文書OCR3.0を使ってましたが、SmartOCRの方が使えました。
>>144 どうみても消えています、本当にあり(ry
ほしゅ
和露他
糞味噌ワロスwwwwwwwwwwwwwwwww
パクリがばれるので止めてください><
155 :
ひみつの文字列さん :2024/12/27(金) 14:40:03 ID:MarkedRes
日本国またはアメリカ合衆国、もしくはその両方の著作権法に触れる内容であると疑われることから表示できません。
SmartOCRLite106.zipがあがってるけど0MBになってる うp中かな?
数ファイルしかないんだからフォルダなんか作るなや
SmartOCRLite106.zip豚楠
filebank wwwww キタコレ(;^ω^)
>>160 filebankのパスワード欄は空白になっていないか?
155の目アド欄を見て入れてみ。
確認してみたら増えてるw
164 :
お腹すいた… :2006/05/13(土) 17:01:43 ID:f+ouwxih0
パス入れてもムリ?
フォルダに入れても落とせない人は環境設定からブラウザモードにすると吉
荒れると難だからそろそろうp不可にするか
おまいらwikiって知ってるか?
ウキ?
これってフリー版がリリースされただけだったの? シェウェア版は?
ホムペよりコピペ 販売価格 SmartOCR 1.0 Professional Edition の販売価格は、1 ライセンス 378,000 円 (消費税込み、本体価格 360,000 円) となっております。 なお、2006 年 4 月 30 日受付分まで、発売記念キャンペーンとしまして、1 ライセンス 189,000 円 (消費税込み、本体価格 180,000 円) でのご提供とさせていただいております。 複数ライセンスを一括購入される際は割引もございます。お問い合わせください。 だそうな。
Professional Editionうpお願いしまーす
なんだクレクレ厨かよ
189,000ってwwwww
378,000ってwwwww
1.07より1.06の方がええのんか?
filebankのダウソに成功!95はファイルダウソできねーんだって(もー
103から104で一気にファイルサイズが増えてるな
試しにゲストのうpを再開
>>155 ただし、3日に一度ログインをしませんと、
保管したデータは削除されますので、ご注意下さい。
>>124 :名無しさん@お腹いっぱい。 :2006/05/11(木) 04:23:51 ID:EEVmh9Wi0
> 民事だろ。しかも親告罪。
> 訴えられて、裁判に負ければ賠償金。
著作権の侵害に対して民事で訴えるのはいつでも可。
親告罪というのは、権利者が告訴すれば3年以下の懲役又は300万円以下の罰金
が、賠償金の他におまけでついてくる可能性があるってこと。
なるへそ
>>180 分かってるよ
やっぱ他のバージョン持ってる人いなさそうなのでゲストうp不可再開
むしろ、この流れでは、大元のOCRソフトの権利者からの攻撃の方が可能性ある。 (「パクった」っていうのが本当だとして) 詳しい法解釈なんかはそれぞれ調べてみてくだされ。
著作権法嫁
186 :
名無しさん@お腹いっぱい。 :2006/05/14(日) 21:19:41 ID:32nAxdZ60
なにもそんなにガツガツしなくても PCjapan6月号にSmartOCR1.07入ってるで。 しょんぼりして本屋で立ち読みしてたら見つけた。
187 :
名無しさん@お腹いっぱい。 :2006/05/14(日) 21:25:19 ID:McYVxA/O0
189 :
186 :2006/05/14(日) 22:41:34 ID:32nAxdZ60
>>188 今本屋に並んでる6月号にも入ってるってことです。
消えてると思ったんだけど。
190 :
181 :2006/05/15(月) 06:34:34 ID:1Va00O5g0
>>184 まぁ142が勇者であろうということは認めるんだが、かなり無謀な感じはする。
スマートリーディングが「資金繰り悪化等」なんて言って突然やめたんだから
なんらかの債権者がいるんでは?
filebank経由で142を民事、刑事の両面で訴えてくる可能性があるんじゃない
かな?
filebankは著作権違反の対応鈍いからなぁ。
192 :
142 :2006/05/15(月) 18:07:03 ID:wtnjcxEq0
今ごろ、パクられた会社の弁護士が、このスレをみてソロバンをはじいているだろう
194 :
181 :2006/05/15(月) 20:43:01 ID:1Va00O5g0
今北ですが、たしかに弁護士としては「ラッキー!」てところですかね。 142氏にとって、アンラッキーなのはfilebankが国内(それも弁護士が山ほどいる 東京)で東京地裁から証拠保全命令が出せること。(海外のサイトだと面倒)。 このためこの142氏が簡単に特定できること(不明であれば2chにも請求可)。 filebank からのダウンロード数が明快で、被害額が特定できること。 Liteは無料でも再配布を認めていなかったこと。加えて10日に再配布を とりやめるように著作権者が要請したことを知っていたのにあえて再配布 していることから刑事での責任も重大… (著作権法は読んだんだよね?コピー手段を提供したものも同罪って…) Liteが無料配布だったからって、被害額は特定できるんだよね。それは、 Liteを無料で配布したために製品版もしくは同等品を販売するチャンスが 減ったと言えるから。これは知的財産侵害でよくあるやり方。 僕が弁護士なら36万円×ダウンロード数をとりあえず被害額として請求するかな。 民事で徹底的に争う気なら、刑事もあるからね。(親告罪ってのはそういうこと) 僕の感じでは、56氏の方は免責される可能性は高いかも? 理由は、56氏がスマートリーディングが再配布手段を失ったための配布を代替 するボランティア活動を意図したと解釈し得ること。 さらにスマートリーディング社の10日の広告で直ちに配布を取りやめたことで、 56氏自身が過誤を認めていること。仮に刑事告訴しても起訴猶予か? これに対して142氏は新たに始めて、こうしてこのスレの一部の意見(助言?) もあるのに、配布を続けていることは悪質とされ得るわけ。 とりあえず、181としては、どうなってももう知りませんw
まあそろそろ消すか
196 :
名無しさん@お腹いっぱい。 :2006/05/15(月) 21:13:20 ID:1Va00O5g0
>>195 まぁ、142氏が弁護士に駆け込むことはないと思うけど、もしも行けば、
「あ、これはまずいですねぇ…」て言われるかも。
もちろん消した方がいいと思うけど、すでに向こうはこのスレも含めて、
山ほど証拠握っていると思うし、ダウンロード数がゼロってことはない
でしょ?
企業なんて、自分に不利益にならない限り、金が取れれば訴訟はいく
らでもしますからね。
【ちょっと質問】 具体的にスマートリーディング側の不利益は?
198 :
ひみつの文字列さん :2024/12/27(金) 14:40:03 ID:MarkedRes
日本国またはアメリカ合衆国、もしくはその両方の著作権法に触れる内容であると疑われることから表示できません。
パクリ疑惑をまとめれば、公然と配布しても誰にも文句は言えない。 著作権法がそれを認めてるから。
>181=194=196=198 ちょっと粘着気味だな。 「過誤」という用語の使い方が少し変で、 法律屋であるかも疑問。
201 :
名無しさん@お腹いっぱい。 :2006/05/15(月) 23:46:36 ID:oTIzafs60
再うp頼みます
>>181 こんなパクリソフトの再配布に文句垂れる位なら
新メモリ最適化ツールのガキにでも粘着してこいよ
ファイルバンクオワタ\(^o^)/ だれか再うpお願いしますorz
うぉ、自分もまにあわんかった。 どなたか、たのんます。
p2pを利用したらいいじゃない
>作者 チラチラ見てんじゃねーよw
付録のDVDに入ってる雑誌買えよ。
smartOCRアップローダーで頂けないでしょうか?
PCJapan・・・高い雑誌だな。しかもソフトバンク。。。 雑誌買わせる方向に誘導してるような気もしないでもない。 やっぱ雑誌売るための罠かな。俺は買わないな。 パソコン系の雑誌って買わなくても困らないんだよね。 買わなくなって5年位は経ってるなぁ。
立ち読み最強
>203,204,205,210 海外のアップローダーで26MBのzipファイルをアップで きて、アップされたことがわるうようにリストに載るところを 教えろ。 「○○にアップした」と言った時点で2chのログからアシが ついてしまうから、慎重になるんだよ。 といっても、俺はアップしないけどなw
FreeFileHosterかMEGAUPLOADの方がよさそう
h抜いとけ
\(^o^)/オワタ
ユー ザーネ ームもパ スワー ドもメー ルアドレ スも適当に入力でダウンロードできそうだな
221 :
名無しさん@お腹いっぱい。 :2006/05/21(日) 14:44:16 ID:pKkiP3YB0
p2p?
ヘルプファイルの人はいづこへ
>224 204サソのロダにアップしました。
サンクス
>227 GJ
GJ OCR初体験だったのだが、smartOCRいいね。 今までちょっとしたものを手打ちしてたんだが、 無駄なことをしていたものだとショックを受けた。
そういえば、水戸黄門ってまだ続いてるの?
>>229 確かにいい感じだな。
どっかこれ権利買い取ってフリーで再公開してくれんかねえ。
広告モデルでも全然構わんから。
これ使ってればいいんだが、公開終了してるのは何か気持ち悪い。
一応、他にもフリーなOCRはまだあるにはあるが、
中華企業の認識率糞、縦書き不可の相当微妙なものしかねぇ。
危倶 → 危惧 割と良く出る間違いその1 タイピストですが
読取革命が一番良かった。
読取物語がダントツで一番良かった。
235 :
sage :2006/05/30(火) 01:34:01 ID:HiFzZ9Ao0
うわーん出遅れた >92をどなたかplz!
235デスガ・・・orz スマソ、忘れて・・ >227トンクスコ!
>>227 リンク切れでした。
誰か再うpしてください。
>>237 次から次へとお前が沸いて永遠に繰り返すことになりそうだなw
>>238 お願いします。
放(ryしてキャッシュ貼りますから。
↑間違った。 放(ryしてハッシュ貼りますから。
もう雑誌にはいってねーのか?
227まだあるじゃん
>>227 はあるけど、中身の本体のリンクが切れてる。
ということでうpしてくだちゃい
>>238 それどころか、
227ヘルプファイルをうp→便乗domが「本体のリンクが切れてるから、誰か下さい」と言い出す
→本体をうp→便乗dom「誰かヘルプファイル下さい」→227の(ry
という、悪夢のスパイラルに陥りそうな悪寒。
ああ、中身の本体かよ。PCJAPANでも買っとけ
というか、まだちゃんとうpされてるサイトあっただろ。 昨日の時点でまだダウソできたことを確認。 場所が場所だけにすげぇ低速だが。
どなたかSmartOCRうpまたは落とせるところお願いします
SmartOCR Lite Edition 等を許可無く再配布しないよう、お願いいたします。 2006 年 5 月 10 日 スマートリーディング
なくなった会社の許可がいるの?
>>250 会社が無くなっても、著作権が無くならないよ。
借金取りが権利を借金の肩に持っていってるかもしれんし、
そうで無ければ、会社が持ってた権利が開発者に戻ってくるだけ。
特に、こいつら金に困ってるみたいだし、いらんこと配布してると
ハイエナのように金をたかってきそうw
いつの間にか配布終了。出遅れた。orz
パクリソフトってことがバレたから配布停止したんだろ
>>250 倒産しててもいるんじゃないかな。
ちょっと違うけどさ、作曲の著作権とかも、
本人の死後50年まで保護されるしさ。
会社じゃないだろ。対応とかどう見ても個人。 会社なら登記があるだろ?
>>256 >会社なら登記があるだろ?
ありますね
対応で個人か会社かなんてどうやって分かるの?
採算性のなさ、2chと連動したタイミングで公開停止&配布禁止掲示・・・ どう見ても厨房の一人芝居です。本当にry
259 :
sage :2006/06/14(水) 11:43:57 ID:YVIbalx90
とりあえずupたのむよ。
260 :
ひみつの文字列さん :2024/12/27(金) 14:40:03 ID:MarkedRes
日本国またはアメリカ合衆国、もしくはその両方の著作権法に触れる内容であると疑われることから表示できません。
υ
>>251 >>そうで無ければ、会社が持ってた権利が開発者に戻ってくるだけ。
・・・?
>>260 今でも落とせるから勝ち組でも何でも無いぉ
>>264 つ過去ログ
俺が落としたのは約1週間前だ。
今でも落とせるかは不明。
266 :
ひみつの文字列さん :2024/12/27(金) 14:40:03 ID:MarkedRes
日本国またはアメリカ合衆国、もしくはその両方の著作権法に触れる内容であると疑われることから表示できません。
>>268 ありがとう今落とせてる
ホントありがとう感謝するよ
270 :
名無しさん@お腹いっぱい。 :2006/06/16(金) 23:35:28 ID:YjKMQuMv0
わからなくてダウンロードできないので他のわかりやすいとこにアップしてくれませんか?
>>270 わからないことないだろう
>>217 のところの下の検索ボックスにOCRでも入力して検索すりゃ出てくるよ
それか翻訳サイト使うか…
272 :
名無しさん@お腹いっぱい。 :2006/06/17(土) 00:13:51 ID:j43y7vvu0
>>271 人それぞれなんだからわからない人もいるって。
たぶん登録の仕方がわからないんじゃないかな?
このスレ、いい人が多いね。
>>272 登録?
いやいや何も登録しなくても落とせたんだけど…
要登録はうpする場合だけ。 ダウソするときは登録はいらん。 実際、俺はそこから落としたしな。
なんでパクりだってわかったの?
バグが同じ
どっかでDL出来ない?
⇒Datei jetzt herunterladen
282 :
名無しさん@お腹いっぱい。 :2006/06/29(木) 01:38:39 ID:xZue9U4M0
SmartOCR入れたんだけど、EXCEL形式でファイル保存できない・・・。 特に設定しなくても標準でできますよね?
エクセルだって所詮ローカルなソフト 標準でもなんでもない。
284 :
名無しさん@お腹いっぱい。 :2006/07/06(木) 20:40:42 ID:Br9WNg2Q0
フリーソフトにそんな必死にならなくても P2Pで普通に流れてますよ どのOCRソフト使ってもじぇんじぇんちゃんと認識されないんだけど もうその画像はどんな方法使ってもダメですかね? 拾ったテキスト画像なんですけど 設定変えたりしたら認識率あがりますか? どのソフトもデフォルトで適当にやって、ってのを次々試してるんだけど
中国人に入力させたらOCR買うより安いよ
スレ違い
>>284 dpiどんぐらいですか?
最低300dpiぐらいはないと実用的な精度はでないと思う。
画像から文字へ変換したいファイルが数百あるのですが、 大抵のOCRソフトが大量変換を意図して作られていないようです。 こうした場合に適切なソフトは何でしょうか。
>>288 >大抵のOCRソフトが大量変換を意図して作られていないようです。
詳しくヨロ
具体的にどういう機能が大量変換向きなんだ???
んー例えば、OCR側から対象の画像ファイルを手作業で指定させる ような動作をすると、大量の画像からいちいち対象を指定させる ことになるため、非常に手間がかかります。 うーん、わかりづらいですね。GUIよりCUI向きなのかな。 仮に、OCRをocr.exeとしてコマンドラインで使用できるとしましょう。 C:\>ocr.exe -i a.jpg -o a.txt のように実行できればと考えています。
>>290 マクロ機能使ってないの?
一万枚くらいなら楽勝だよ。
292 :
291 :2006/07/08(土) 20:46:33 ID:E/7p0F930
例えば 読んdeココだったらOCRファクトリーの「画像をテキストファイルに」 で一気に変換できます。 他のソフトでもマクロ機能は用意されてると思いますよ。
293 :
284 :2006/07/09(日) 13:33:09 ID:sTcFgSd/0
>>287 72dpiでしたorz
5年前くらいにデジカメで撮られた画像らしいです
これしか画像がなくてこれをテキスト化したいのに…
手動でテキスト作るしかないかな
解像度をあげるソフトってないんですか?
なんか映画とかでよくぼやけた画像をピピっと綺麗になおしてますけど
284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0 フリーソフトにそんな必死にならなくても P2Pで普通に流れてますよ 284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0 フリーソフトにそんな必死にならなくても P2Pで普通に流れてますよ 284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0 フリーソフトにそんな必死にならなくても P2Pで普通に流れてますよ 犯罪者なので通報しておきますね
>>945 知りませんじゃねえよ。ちったあ考えろ。
すまん。誤爆。
久しぶりに来たら、smartOCRのダウンロード先が書いてあるじゃないですか。 サンクス。
普通OCRソフト使うのはスキャナを使うときでしょ? んで、スキャナ買うとたいていOCRソフトがバンドルされてるわけだが、それでも あえて使う価値あんの?>smartOCR
HPの多言語OCRは恐ろしくタコ
300 :
名無しさん@お腹いっぱい。 :2006/07/17(月) 01:43:29 ID:O7xJRJm20
smartOCR使ってみたが、はっきり言って修正するより最初から打ち直したほうが明確に速いレベルだ。 元の原稿はかなり綺麗だったのにOCRソフトってこんなもんなんだろうか。
俺はスキャナ付属のOCRや体験版のOCRと比べてみたが SmartOCRが一番認識が正確だった。 他のが90%としたらSmartOCRが99%以上ぐらい
303 :
298 :2006/07/17(月) 12:10:25 ID:U3CEtzD60
>>299-302 なるほど。
とりあえず試してみる価値はありそう。
パクリとのウワサもあるが、要は出来が良ければよかろうなのだァ
smartOCRの精度は読取革命以下。読んでここは使ってないからわからん。 本格読取と同じくらいかな〜
パクリじゃなくて元社員のソースお持ち帰りだろ つまり、ソースを同じくする市販製品のどれかと精度は一緒
お前にはこれが足りないようだ っ辞書
初期のソフト同士を比べても意味ないとおもう 学習と辞書登録しないとどれも使い物になんらし・・・
SmartOCRスゲー!!! 読んdeココなんか買わなきゃよかった!!!
>>280 ガチでd
発売中止後の人気が出るなんて でも、あの価格じゃ売れないよな
売らないつもり→某社が買おうとした→緊急発売停止
>>301 これホント?
スクリーンショットの場合だと70%くらいの出来だなあ
>>312 エロ小説のスキャン認識で、修正なしでもあまり気にならず読めるくらい。
!とか?とか?の誤認識は結構ある
ルビどうするんだ?
()に括って表示させる
>>315 結構手間掛けてるんだ
png読めないんだね
ここ親切なやつが多すぎ 超ありがとう。
同じく、超ありがとう。 でもインストローラを実行するとスタートアップに何か登録されたお。これ何?俺だけ? ちなみにインストローラの拡張子をcabに変えてインストすれば無問題でした。
ありがとう
smartocrも悪くは無いんだが機能制限で連続処理できないから不便だな スキャンした小説をまとめて読み取るには読んでココとか使うしかないのか
マウス操作をマクロ化するフリーウェアでどうにか連続処理させてる
>>325 パッチなんてあるの?
すまんが詳しく教えてくれないか?
smartOCRでpdfからテキスト化ってできん?
パッチ見つけたんだけど 1.07用のしかない・・・ 1.06もある?
パッチを持っている方うpお願いします
>>330 nyで流れてるpro版(crack)じゃあかんんの?
1.06もあったお
W2FL回してもLiteしか引っかからん ハッシュ張ってくれまいか?
パッチをできれば320のサイトにアップしてくれ。 1つのサイトにまとまっていれば使いやすくなるから。
あー・・・誰か読んDEココの辞書UPしてくれねーかな・・・ 修正イチイチやるのにもう疲れた・・・
画像→テキストと聞いて思い浮かんだんだが、ビットマップの画像データを16進数の文字データに変換できたらおもしろそうだね。 #000000から#FFFFFFを使って、HTMLに絵を変換しちゃうかんじの。 もしなかったら作ろうと思ったんだけど、どうかな。
あほ? ビットマップはバイナリで同じようなこと実現してるんだから、データ量が増えるだけ。
ちょっと話を遮ってすまん。
用件は?
あほ?
>>332 著作権法違反幇助の罪で通報しますた。
少なくとも金子よりは露骨な幇助だな。
>>312 OCRは使い込む毎に傾向を学習するような機能を実装するのが普通だから
使い込んだSmartOCRが有料商品より優れてても何の不思議はない。
学習済み製品>学習済みSmartOCR>未学習製品>未学習SmartOCR
?% 99% 90% 70%
だったってだけだろ。
345 :
301 :2006/08/06(日) 18:17:24 ID:Na9dQa9x0
400文字に4箇所でも1%の誤認識だよ? 認識率99%でも誤認識自体は結構あるわけで特別正確というわけじゃない。
アホ? 396文字は正確に認識できてるわけだし
夏だなぁ
>>345 今の時代で1%の誤認識なら
十分正確と言えるよ
>>344 たぶん夏釣りだと思うけど一応レス
学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品
実際こんなもん。
最近のOCRソフトは性能が右肩上がりだから、
少しカスタマイズしたり学習させたりすることで顧客の満足が得られるレベルになるよ
取り合えずOCRがよくわかんねぇ奴は無料のSmartOCRlite使っとけ!
SmartOCR作ってたスマートリーディング社は倒産してるから工作員もいねぇしなw
350 :
名無しさん@お腹いっぱい。 :2006/08/07(月) 11:16:43 ID:qZq47fmj0
学習済みSmartOCRpro>>>未学習SmartOCRpro>>学習済みSmartOCR>学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品
OCROCRうざいからOCRをNGワードにした。
SmartOCRは社員の持ち出しな上、読んでここよりちょっといいくらい。辞書だっておそらく流用だろうし。
>>352 、日本人ならもちっと文をまとめようぜ
・SmartOCRは社員の持ち出し(意味不明)
・私はSmartOCRの方が読んde!!ココより僅かに優れてると思っている
・私はSmartOCRで使用されている辞書は流用だと想像している
まず箇条書きでまとめてみた
さて再度一つ一つの文の説明をしてくれ
要するにパクリ製品で、辞書を流用してて、ヘボ商用OCRよりマシってことだ。 説明もなにも、過去ログに書いてあることをまとめたに過ぎない。
単なる皮肉じゃねーの?
単なる池沼だろ。 それか中の人がファビョってるのか。
358 :
名無しさん@お腹いっぱい。 :2006/08/08(火) 02:10:21 ID:uq6ary4N0
夏だなぁ
夏だなぁ厨
>>352 を読んで理解できなかったID:7pOEwcrp0
文を纏めろといいながら「読んでここよりちょっといいくらい」を「読んde!!ココより
僅かに優れてる」と捏造してしまうID:7pOEwcrp0
反論されたので、日にちも変わったことだし他人のふりして擁護しようと自演した
ら、まだIDが切り替わってなかったID:7pOEwcrp0
さて日本語が理解できなくて捏造大好きで自演までしちゃうのは誰でしょう?w
>>360 は
「僅かに」を「遥かに」と誤認識した、に1票
わかり辛いスレだな。 誰かOCRにかけてくれ。
わかつナこ
SmartOCRのことで、教えてくれ。 どうして1.0.6の需要があるの? 最新版の1.0.7にはない機能があるとか。 教えて君で申し訳ない。
>>365 マルチやめれ
関連スレの過去ログ読むかググれよ
107は精度が落ちてるから
368 :
365 :2006/08/10(木) 18:46:25 ID:Mw/M2k+w0
>366 マルチ違う 関連スレも見たぐぐった >367 教えてくれてありがd お礼に教える君になります。 320のページで検索(Suchen)すると、検索結果が 今までより1個多くなっている。さてなんでしょう(w
369 :
名無しさん@お腹いっぱい。 :2006/08/13(日) 08:44:48 ID:eMHMvqto0
何で読取革命が人気ないかわからん。俺の環境だと 読取革命>>e.Typist>読んで e.Typistは体験版、他は最新版。 今度からランク付けする場合、どんな資料読み取ってるか書いてもらいたい。 俺が読み取ってるのは図形、表、字混合、白黒の資料
ジャケ画の歌詞画像スキャン結果だと 読取革命>e.typist>読んでここ>SmartOCR 全部体験版の初期状態ね。
ヒント:金出して買えない厨房の溜まり場
自覚してるわけですか
まあ読取革命は本格読取からの優待で安く買ったけど
初期状態でのOCR精度比べても無意味だろ 学習させないととてもじゃないが使い物にならんよ
段落を取れん場合は、学習機能も無意味。 段落のとり方を学習できる製品はないのかな。
ある
表面的な匿名をいいことにマナーが悪すぎるな
製品パクってくるよりまし
2chでマナーとかいいだしたらキリが無いですよ。ぜんぜん大人しいほう。
382 :
名無しさん@お腹いっぱい。 :2006/09/13(水) 16:13:30 ID:8KtJLkVe0
Smart OCRを初めて知ったので、今落とせてサンクス。
>>381 表だっては掲示板内で違法行為働いてることを堂々と書き込んでいるのはあまり見ない。
違法を違法と理解してない風な書き込みは流石に痛い。
そういうのがパクリを叩くのもまた痛い。
385 :
名無しさん@お腹いっぱい。 :2006/09/28(木) 03:50:29 ID:y+zC8mrs0
つまりsmartOCRは社員がどこかのocrソフトメーカーからソースぱくってつくたってこと?
表の読み取り最強なのはどれ? ちなみに、表=主に数字と定型的な単語のみで構成され、罫線で囲まれたもの ってことで。 日本語文書読解とかどうでもいいんで、望む機能としては 1.罫線の存在を認識できる = 点線を一や−の連続と思わないこと等 (ユーザーの設定により罫線ありと明示的に設定できるとなお良) 2.表のテンプレート設定が豊富 = セル・行・列指定で数字のみや記号のみに限定できる等 (細かく文字を限定できればなお良 例:「\19,800」みたいな価格→「数字 , \」、電話番号→数字と"−"のみ) 3.数十枚〜数百枚程度の自動認識機能
読取革命の体験版を試してみたんだけど、これって一度作ったテンプレートの融通が利かないんだね。 例えば帳票をADFで連続読み取りしてると、どうしても2〜3ミリくらいは上下左右にずれちゃうんだけど テンプレートを呼び出したあと、ちょっとだけ位置を修正しようと思ってもこれが出来ない。 無理やり移動したり大きさ修正しようとすると、設定したセルや文字種が全部デフォルトに戻るw 表専用OCRじゃないから多くは望めないとはいえ、これはちょっと酷いんじゃないのかな〜。 前の職場で使われてた業務用OCRは優秀だったんだよね。 テンプレート位置を、画像上の罫線を参照して自動修正してくれたり ガチで連続読み取りに特化してた。
388 :
名無しさん@お腹いっぱい。 :2006/09/29(金) 02:30:08 ID:90PHlJ6J0
つーかスマートOCR誤字ばっかりでぜんぜん読み込まない どっかに横文字で書いただけの文字の画像ないかな つーかこのスレをスクリーンキャプチャしてみるか。
389 :
名無しさん@お腹いっぱい。 :2006/09/29(金) 02:37:58 ID:90PHlJ6J0
]9fi:名畑しさん@お腹いっぱい.:2田10∈/ng,'pa(木)0:ifio:四ID:y4■CRTrcO つよU垢rErtOCRば社員がどこかの阻rソフ1・1其一カーからソースぱく丁て]くた.」てこと? t 瑚:名無しさん@お腹い]ぱい.:2田10[fn9,'29(k')OO.11.α91DY目1国DXO 却]請み取り最桂なのばど.れ7 ちなみに、表一土に数字と定型AMs単語のみで構成され、罫腺で匝まηたものーてことて. ヨ本語文書読解とかピうでもいいんで、望む機能としてば 1.…:線の存在菅詔識でぎる一点線を一や一の連続ヒ思わないこと等 (「一サーの設定:「より罫線あり1と明示的「設定できる仁なお良) ■■.表のアンプレー-設定が豊富-セル'fi一列指尼で数字のみ阜記号の捌こ眠定できる等 鰍ゥ(Y字}1狼定できれ1:碍「焉-仲1」:「UIF.Rnfi」みt'1.ln伍格→R歌字.耳」.雪話番岩→?.享t'一'Mh:) 3.数十枝一数百枝程度の目動認識機能 脚:名無しさん@お腹いっぱい.:PfCEIng,'pn(金)OO:20:nP TD:YclkvDXO 読取革命の構験版を証して碍たんだ∪ど、これって一劇乍ったテンプレートの甜動荒不1-VL'td■,んだね. 側えば帳草をA[Fで連続読み取りしてると、どうしても2〜3ミリくらいば上下左右にずれちゃうんだけど アンプレー1-琶呼ぴ山したあと、ちょ訓とだけ位置古修工しようこ思ってもこhhU来奄い. 無哩やり樗動しr一り六芦ざ條[Fしようと丁るk.設定し斤ヤ」しヤ夏字植が全部デフォルトに戻るw 表専用DC屯拝ないから多くば茎めたいとばいえ、こればちょ北酷いんしドtsいの右.な一... 前刃職場で使われてだ茉務用DCRば優秀だ丁だんだよね。 テ?」レート位直を、画像上の罫線を参照して目動修正してくILt[り ガチで連続読み取リに特化してた. ]SE:名無しさん@お腹いーぱい.:2fmE/ng,.pg(金)D2:田:nETD:叩PHL旧.-ID つ一研スマートOCR誤字は.・h,りでぜんぜん読み込よない どっか[こ構夏宰で書.,r一戸'けの又=の由偉煎.巾噴 つ一MILCjxレ芒スクリーノキャプチャし⊂みるか。 .一ワ汀表NnlL,た ー「「「一一一一一一一三]
>前の職場で使われてた業務用OCRは優秀だったんだよね。 それが何だったか覚えてないの?それ使えばいいだけだと思うんだけど。
>>391 創業23年を目前にして、その歴史に幕か・・・。
まあ、「読んde!!ココ V.12」のパッケージに"EPSON"ロゴが入った時にそんな予感はしていた。
あと、EPSON製ソフト「オフィリオ・シナジーウェア」との連携をやたら強調したり・・・。
合併後も、EPSONが積極的に売り出しそうなのは、「読んde!!」等OCR系と「デジカメde!!」シリーズぐらいか?
DiskX、まっぷっぷ、訳せ!!ゴマとかは放置プレーかな・・・。
ひとまず合掌。
WXが・・・
読んdeみたいなクソソフトは消えても全くどうでもいい ・・・といいたいところだが対抗商品が全くなくなると e.Typistが手抜きし始めるから形だけでも残ってもらった方がいいな。
読取革命がある
396 :
386 :2006/09/30(土) 18:12:14 ID:ZJPKuVam0
>>390 日立超LSIシステムズのMY-QREADERってやつで\398,000。
ちなみにソフトだけじゃなく専用のPCIボード込みなのでピーコも_。
専用ハードによる文字認識でPenII 300MHzが主流の時代の代物なのに高速だった。
もっとも今はCPUが速くなったのでソフトだけでも十分なんだけど。
397 :
名無しさん@お腹いっぱい。 :2006/09/30(土) 21:34:12 ID:NBV4N4H80
ダメもとでお聞きしますが、Mac対応でフリーのOCRソフトなんてありませんか。 それが無ければ、1万円を切るソフトはありませんか…? Mac対応版はWin対応のよりも倍ぐらい高いんですよね、どれも。OTL
WinReaderProを仕事用に検討していますが、どなたか使われた方いらっしゃいますか? 20万円もするので気楽には買えませんので。。。
>>398 仕事で使うものの情報を
こんなところで集めるのはやめろよ・・・
自分で調べた方が安全
400 :
名無しさん@お腹いっぱい。 :2006/10/01(日) 09:53:48 ID:WvMARitI0
>>399 PC関係の情報は2chが一番早いので。
仕事で使っているソフト、ハードの情報はほとんど2chで入手しました。
嘘の情報はそれなりにわかりますしね。2chか価格コムで調べて買うというのが多いですね。
401 :
名無しさん@お腹いっぱい。 :2006/10/02(月) 02:32:58 ID:yT4SsxAOO
俺は日立の帳票マスター使ってるよ
402 :
名無しさん@お腹いっぱい。 :2006/10/02(月) 05:41:51 ID:ZYOoziFL0
smartが一番
SmartOCRってまだどっかから手に入れられたりできない?
うお、レイアウトがw
リンクきれてるな
filecache.deあぼーんでsmartocrオワタ\(^o^)/
\(^o^)/
俺持ってるから関係ないや
411 :
名無しさん@お腹いっぱい。 :2006/10/08(日) 18:08:49 ID:N8NhqxEI0
ビジネスソフト板にも尾crすれがあった
413 :
名無しさん@お腹いっぱい。 :2006/10/20(金) 17:49:29 ID:3UV/yuu60
ほすす
ソース糞ソフトから本格読取2がでるよ
名前とか。 他のソフトが付いてたなら、それも削られてる。辞書も多少削られてるかも。
読み取り革命体験版インストして、期間が来たからアンインストしたけど アドイン解除してアンインストしたのに、ワードに読み取り革命のメニューが残ったまま。 どうやって消せばいいの?
C:\Documents and Settings\USER_NAME\Application Data\Microsoft\Word\STARTUPか C:\Documents and Settings\USER_NAME\Application Data\Microsoft\AddInsに なんかそれっぽいのあったら消せ
419 :
名無しさん@お腹いっぱい。 :2006/10/23(月) 07:14:35 ID:kQ6qEoy70
以前、WinReader PRO(バージョンは6)を使って、高額なソフトでもこれでは実用に 絶えられないなと思って、OCRはまだまだだと思っていたが、最近出た、読んでココ(バージョン12) を使ってみて、偉いOCRソフトもかなり進化したなというのを感じた。 しかし、既存のPDFの認識精度はかなりのものがあるが、スキャナーから読み込んだもの に関しては、まだまだ実用の域には達していないと思った。 当方が扱う、法律関係の文章での話しで、通常のビジネス文章なら、そこそこ修正すれば 使えるのかもしれないが。
420 :
名無しさん@お腹いっぱい。 :2006/10/23(月) 07:17:04 ID:kQ6qEoy70
>>398 OCRは仕事に使うには、まだまだだと思います。修正する手間を考えると、
大人しくPDFファイルないしは、紙媒体でのコピーが確実です。
421 :
名無しさん@お腹いっぱい。 :2006/10/24(火) 09:03:43 ID:f/S+mxkS0
>>419 WinReaderPROていまver10だよね。
どうだろうね?
今来た過去ログ読んだ SmartOCR欲しい・・・
>>422 君性格くらいね
スパイウェアを広めるのはいくない
425 :
Nomu :2006/11/03(金) 22:23:36 ID:iUKc4B5G0
スキャン画像にOCRを掛けて透明テキスト付きPDFを作成するところ までは出来ています。実際、検索も可能になっています。 さて、元のデータがExcelやWORDなどで、そこから直接PDF化したものは 元の文字をテキスト選択ツールで選択できますが、 OCRで透明テキストの場合は、テキスト選択ツールで選択できるように するのは無理でしょうか。 なお、TouchUpなどで無理やり透明な文字をかぶせる技もあるでしょうが、 そういう余計な手数は掛けずに、行える範囲での前提とします。
PDFの透明テキストとOCRは関係ない 帰れ
やってみてから書き込め、ボケ
そういう余計な手数は掛けずに、 行える範囲での前提とします。  ̄ ̄ ̄)/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ( ^ω^) ∧_∧ / \ ( )ハァ? 何言ってんだこいつ .__| | .| |_ / ヽ ||\  ̄ ̄ ̄ ̄ / .| | | ||\..∧_∧ (⌒\|__./ ./ ||. ( ) ~\_____ノ| ∧_∧ / ヽ 氏ねよ \| ( ) | ヽ \/ ヽ. オマエ馬鹿だろ | |ヽ、二⌒) / .| | |
( ゚д゚) 「そういう余計な手数は掛けずに、行える範囲での前提とします。」・・・ _(__つ/ ̄ ̄ ̄/_ \/ /  ̄ ̄ ̄ ( ゚д゚ ) _(__つ/ ̄ ̄ ̄/_ \/ / ( ゚д゚ ) ガタッ .r ヾ __|_| / ̄ ̄ ̄/_ \/ / ⊂( ゚д゚ ) ヽ ⊂ ) (⌒)| ダッ 三 `J
読取革命もルビの扱いをなんとかしてくれないことには何とも。
434 :
名無しさん@お腹いっぱい。 :2006/11/21(火) 21:16:46 ID:vrsLPcFX0
ライブPDFとsmartOCRって同じ作者じゃね?
ライブラリィが対応してるので、わざわざ読めないようにする方が手間かかるだけだろ
435はケチをつけたいだけでしょ
438 :
NNN :2006/12/09(土) 01:02:01 ID:2/wxd38Y0
読んde!!ココを使っているが認識してワードで表示する際、文字列をいくつかのテキストボックスで 区切って表示するせいでいちいちコピーしなくてはならず余計に手間がかかるのですが テキストボックスで区切らせない方法orテキストボックスを一気に解除する方法ってないのですか?
ワードのVBA使え
マルチかよ・・・
-‐- ,、 __〃 ヽ lv ! ヽ\ .ノノノ)ヘ))〉ヽ' / ̄ ̄ ̄ ̄ ̄ _!(0.)! (┃┃〈リ / < はいっ! /\ Vレリ、" lフ/ ./ \ \_____ / ./l ̄ ̄ ̄ ̄ ̄ ̄ ̄|ヽ \/l |―――――――! ヽ l | ○ み か ん | l l―――――――| . \l_______|
442 :
名無しさん@お腹いっぱい。 :2006/12/14(木) 10:40:39 ID:7AK0d3kH0
メディアドライブのHP、なんで見られないんでしょうか?
復活しているよ
444 :
名無しさん@お腹いっぱい。 :2007/01/05(金) 00:57:29 ID:EeadamAd0
本格読取2、精度良いね。俺の手持ちのドキュメントでは、読んでココより精度がよかった。 1980円以上の価値はあると思う。
445 :
名無しさん@お腹いっぱい。 :2007/01/07(日) 11:58:38 ID:dRvUQxjL0
>>444 読取革命V9そのままらしいからな。対値段比で考えると相当いい。
ただ英文がやたら弱くないか?
日本語だけの文章なら精度いいんだが、英語が混じると悲惨なことになる。
SmartOCR1.07を常用していたが、透明テキストつきpdfにする場合解像度の設定において勝手に文字の大きさ基準でサイズを変えてしまう。 したがって、(別なソフトで)複数のpdfを連結した場合、元が同じ大きさの原稿でもAdobeReader上では場合によって違う大きさ表示になってしまう。 今までは1画像→1pdfにしていたから問題にはならなかった・・・・・orz で、とりあえず読んdeココ12無料体験版を使ってみたのだが・・・・・自動認識の認識率が非常に悪い・・・・こうも違うものなのか? 読んdeココは、(白地に黒のただの文書原稿ならどうか知らないが)文字と絵や写真をふんだんに使ったカラフルな画像は苦手のようだ。
447 :
446 :2007/01/13(土) 08:13:51 ID:txbwSWm00
>>446 のサイズが変わる件、自己解決。
○○○、捨てないでとっておいてよかった。
今回、色々体験版を使ってみたが・・・ずいぶん認識率に差があるな。
今回使った原稿では、S>e>>>>>ry だった。
とくに、ある特定の文章において文字認識(95%以上の認識率)ができるソフトと、どう設定を変えても文字認識できなかったソフトがあるのはびっくりだった。
英文OCRエンジンを搭載してるかどうか
449 :
446 :2007/01/13(土) 20:49:48 ID:txbwSWm00
>>448 >>447 に対してかな?
ならば・・・・対象文章の詳細。
現物は、黒に近い灰色の地に縦書き日本語白抜きのゴシック文字で2.2mm角位。
それを360dpi bmpファイルにして読ませた。
この文字の他、カラーを使った図や表が沢山あったのだが、Sとeはそれらの図表中の数字(縦2.5〜3mm)も一応読み取ってくれたが、他2はry
もっと高解像度で試せという声が聞こえてきそうだが・・・
印刷の関係上画像ファイルは360dpiでほぼ統一してあり、現物がすでにないファイルも沢山あるので、俺にとっては360dpiでないと意味はない。
デフォルトの精度よりも 使い勝手で選んだ方がいいよ 学習させないとどれも使い物にならないんだし 学習させたらどれも同じレベルになる たまにしかOCR使わない人ならデフォルトの精度だけで選ぶのも手だけどさ
>>450 最初は何をやっても(注)画像としか認識しないのでも、学習により文字認識可能になるのかね?
(注)自動認識だけではなく縦書き横書き・また認識枠を使って強制的な認識を試した。
もちろん、体験版だからちょろっと触った程度である。
でも、各ソフトのスタートラインが違いすぎる。
革体験 傾き補正・自動の精度が悪い。 傾き補正・手動の操作性が悪い。
160GB SATAHDDがカッコヨスぎてwarota キヤンヘ凸−ンはこのFAXを受取られた従業員数1〜400名規模の事業者の方が対象となります。 rl ノ ■=■ 伽凹lTl⊇■:≡:l▲へ′lヨJ■_止□‖亡!■lコ′hザdb■■■ ′つn M 刑同MR月巳の侍仏洞i肌同ロロりし乗lq エロまで!(一部を除く場合かあり打9また本フ・ロモーションの適用は、1′29までにこ注文を頂いた場合に剛打※) AMDCPU搭載PCDimensionC521今週のおすすめ!発注] ̄ド=19788581 ・AMDSempronTMプロセッサ3400+ ・WindowsxpHomeEdition正規版 ・5†2〃β(512MBxl)DDR2−SDRAMメモリ .†6∂GβS∧mJのβ ・サムスン製†タインデ丁打液晶モニタ(フサソク) ・内蔵NVIDIAGe†0rCeTM6150LEGPUクーラフイツクス ・DVD−ROMドライブ ・1年間引き取り修理サービス(保守ハD−ツ含む) ・12時間テクニカル電話サポートくE・メールサホ■−ト付) 大容量160GBHDD槻 さらに大画面19’モニ附!
>>454 e.Typist V11。自動認識で453までの文章結果。
範囲指定してやればもう少しマシだとは思うが。
>キャンペーンはこのFAXを受取られた従業員数1-400名規模の事業者の方が対象となります。
>1/29要!
>期間限定お得な特別商品のご案内
>(一部を除く場合があります。また本プロモーションの適用は、1/29までにご注文を頂いた場合に限ります※)
>AMDCPU搭載PCDimensionC521今週のおすすめ!
>発注コード
>・AMDSempronTMフロセッサ3400+
>・Windows回XPHomeEdition正規版
>・512ル擢∋(512MBx1)DDR2-sDRAMメモリ
.>160GBSA7酒HDD
>・サムスン製19"チTFr液晶モニタ(ブラック)
>・内蔵NVIDIA回Ge拍rceTM6150LEGPUゲラフィックス
>・DVD-ROMドライブ
>・1年間引き取り修理サービス(保守パーツ含む)
>・12時間テクニカル電話サボート(E・メールサボ.一ト付〉
>大容量160GBHDD搭載
>さらに大画面19,モニタ付1
>>454 読んココ12、いきなり認識させて
キヤンヘe−ンはこのFAXを受取られた従業員数1−4m名規模の事業者の方が対象となります。
い
期間限定お得な特月
商品のご案内
(一部を隙く場合があります。また本プロモーションの適用は、1/29までにこ注文を頂いた場合に限ります※)
め
・AMDSempronTMプロセッサ3400+
・Windows@xpHomeEd血m正規版
・512MB(512MBxl)DDR2−SDRAMメモリ
.160GβSA7乃11DD
・サムスン製19ルゲm液晶モニタ(ブカク)
・内蔵NVIDLA@GeforceTM6150LEGPUゲラフィックス
・DVD−ROMトうイブ
・1年間引き取り修理サービス(保守バーツ含む)
・12時間テク二カバ電扇滑ボート(Eメールサポート付)
発注コードこ
州田
植
−
引
仁
9
今、読取革命の最新版の体験版使って、縦書きの文章を処理しているんだが。 コピーを繰り返して、人間様は困難があるものの読み取れるが、ソフトの方では判断に迷うような原稿の場合・・・ 一括修正で、「首が痛くなる」ぞw 修正前の確認として、縦書きをそのまま左に90度倒したのがたくさん出てくる。 (横書きはそのまま) 個々の似たような文字形を一緒に修正するかどうか選べる。 そこで取捨選択するのは、当然人間様のお仕事。 その確認作業では、文字がかすれていればいるほど、間違いなく読み取るには首を傾ける必要がある。 せめて、どちら向きで表示させるか選べればいいのにな。
s
>>455 に感動し、e.typistを買うことにした。
実際試用版つかってみたけど、全然優秀だったし。
読んでココだと、tiffのカラー版はよめないとか言われたし・・
e.Typistと読んde!!ココ両方持ってるけど >459 同意するようなそうでもないような。 誤認識の所を再認識させるのはがやりやすい。 前、試した時は読んde!!ココの方が 元文書のレイアウトに近かった。
461 :
名無しさん@お腹いっぱい。 :2007/02/10(土) 17:26:39 ID:7v8Omm3H0
ここでSmartOCR
462 :
名無しさん@お腹いっぱい。 :2007/02/11(日) 19:03:49 ID:CU4bnzbg0
e.typist¥2万か・・・もうちっと安くならんかな・・・
>>459 あのまま読み込むのではなく
フィルタかけてからのほうがいいよ
そうすれば広告の認識率に近くなる
>>404 d。これ、Copyじゃない方がいいのかな?
あ、今気付いた。コピーの3つは落としやすくするためと、予備か
466 :
名無しさん@お腹いっぱい。 :2007/03/06(火) 15:17:55 ID:wiKC1IMb0
あげちょる
467 :
名無しさん@お腹いっぱい。 :2007/03/11(日) 14:10:41 ID:BmeVkgEa0
現時点で落とせる所キボン ついでにあげ
>404で普通に落とせるよ。 ダウンロードのリンクが表示されるまでに時間が掛かるだけ。
>>468 ちょwマジだw
ありがと&うp主THX!
471 :
名無しさん@お腹いっぱい。 :2007/04/04(水) 23:47:30 ID:5pEd6gF3O
472 :
名無しさん@お腹いっぱい。 :2007/04/07(土) 02:59:49 ID:Mb5vzdo40
本格読取2、英語の読み取り精度が悪いと思ったら、辞書自体省かれてたのね・・・ platinum版は初版ベースなの?2ベースなの?
WinReaderPROの 中古版だと安いし2〜3万円のおもちゃより、 認識度はダントツに違う 探せば掘り出し物はある。 図書館から借りてきて、テレビを観ながら自動スキャンして 満員電車の中でパームを使って読んでいる。
スレ違いだけど借りてきた本を自動スキャンってどうやるの? 裁断できないよね?
文化の荒廃の序章
ちょっとしたロボットみたいな感じだね
1冊300円くらいで画像化してくれる所あるし そういうの利用してるんじゃないかな。
英文オンリーでOCRソフト使いたいんですが、一番認識率いいのは どれなんでしょうか。 海外のフリーソフトとかありますかね??
値段によってだいぶ違う。 とっつきやすいのは、本格翻訳 SUPER(\2900)についてくるOCRとか。
>>480 FineReader Pro
二ページ続きの画像を自動分割してくれる。本をOCRして
PDF保存するときに便利。
英語だけだと役不足かもしれない。欧文多言語認識につよい。
縦書きのルビを誤認識しないソフトはありますか?
>>483 体験版を使って判断したら?
やった上での質問なら使ったことのあるソフト名書いてくれ
扱う原稿の状態などによっても違うし一概には言えないからさ
つかルビなんて確実に認識できるソフトなんてあるか?
487 :
名無しさん@お腹いっぱい。 :2007/04/23(月) 00:37:51 ID:4t8hsufJ0
読取革命の体験版使わせてもらってます。 小説をテキスト化しようとすると、 ページのすみのページ数まで取り込んでしまうため 崩れてしまうので選択範囲で囲んで認識するのですが、 これ毎ページごとにしない方法ってあるでしょうか? 上1cmを読み取らないようにしたいのですが…… とりあえずフォトショップで全部切ってから読み込ませようと思ってますが
読取革命はわかんないけど、e.Typistなら読み取り範囲設定する機能があるよ。 読み取り範囲を自動じゃなく手動で設定する場所ない? 矩形で範囲指定して順番も任意に変えられるから、頁数が本文に混じったりすることはうちではないな
補足。一ページごとじゃなくて全ファイルに設定を適用できるという意味
ttp://no722.cocolog-nifty.com/ 小説画像再配置ツールのとこ。モバ板で開発されてたけど、公開サイトできた。
画像からOCRするときに、これで先に処理しておくと、本文位置なんかをほぼ正確に
設定できる。
読んde!!ココの枠情報ファイルを使った一括認識でも読み取り枠をかなり精密に
指定できるようになる。
だれか電話帳からひとりでデータベース作った奴居る? うちの村は人口少ないけど1ページだけで疲れて諦めた。
無差別DB化って、なんか金儲け目的でやってるような気が・・・ マトモな人間ならやらんように思うんだけど
>>491 手が後ろに回るぞ!
警察に報告しました、逃げるなよ
>>490 トン
まだ試してないがスクショを見て感動した。
神っているもんだな
>>487 体験版はどうか知らないけど、
適当なページを手動で範囲指定して「テンプレートに保存」
一括認識で「テンプレートを使う」でいける
ただ、全く融通が利かないので注意
>497 >490ので処理すると画像内の本文位置を相当正確に統一できるよ。 読んde!!ココもv12まではテンプレ(枠情報ファイル)で設定した認識範囲は固定だったけど、 v13で自動微調整してくれるようになったみたい。
漫画とかの目次の読み取り制度の高いOCRソフトって何? 自炊した漫画に目次とか手打ちしてくの怠過ぎ。
tes
e.typistのエントリーを持っているのですが、製品版にしようか迷っているしだいです。 エントリー版だと精度優先が選択できず、常に速度優先なのですが、 速度優先と、精度優先はどのくらい違うものなのでしょうか?
スクリプトによる自動読み取りを考えているのですが、 コマンドラインから呼び出せるようなOCRを探してます。 ソフト.EXE < 画像.JPG > 結果テキスト.txt みたいな感じで読めるソフトありますか?
?
>>501 最新版の体験版が公式サイトにあるから
ダウンロードして試せば?
ちなみに最新版だと
速度優先と精度優先の設定自体無かった様な気がする。
スレ汚し申し訳ありません。 私、これまでeTypistをつかっていました。 単にキヤノンスキャナについてたというだけのきっかけで それなりにつかってきました。 この度WindowsをVista化して、 eTypistがいつまでもVista対応にならないので 見切りをつけて「読んde」か「革命」あたりに 乗り換えねばと考えてます。 が、いろいろググったり本スレの過去のカキコを 読んでみても決め手に欠けて選びかねています。 体験版で試せばいいのかもしれませんが、 極力Windows環境を汚したくない気持ちもあります。 和文・英文ともにOCRします。新聞・雑誌の記事が 中心ですが、PDF化されたものも対象、 というのが私の使用状況です。 ヒントいただければありがたく思います。よろしくお願いします。
eTypist>>>革命>>>>>>>>よめやここ
>極力Windows環境を汚したくない気持ちもあります。 あほかw 体験版試したあとOSクリーンインストールでもしろ
↑まちがい ↓正解 RegSeeker
>>506 つ[Acronis True Image]
TotalUninstall
e.typistの12っていつぐらいに出ると予想されます? 11買おうかとも思うんですが、 11は、結構古いんで、買ってすぐ新しいのでたらやだなと思いまして。
読んdeココ for EPSON Ver.4.07の直リンわかる方いませんか?
>>514 スキャナー付属の物ならまずwebに無いだろう
>>506 いま読んでここと、etypsit比べているが、認識制度は日英混在なら読んでここのほうが
ずっといい。etypistはなぜか英語がみんな全角になっちゃうし、単語の切れ目もきちんと
認識できていない。
読んではインターフェースがイマイチなんだけど、この認識精度の差は埋めがたい。
純英語同士だとあまり差は感じない。
やっぱり試用して、同じものスキャンしてみるといいよ。
最初の頃は認識精度で選んでたけど 学習させたらどれも大差なくなってくるから 編集しやすいのを選んだ方がいいとおもう。
英も自我全角になるのは何の問題も無いだろ。 簡単に直せる市。
>>518 自己レス。etypistは、デフォルトの設定から一部変えたら、
英単語がきちんと認識されるようになりました。
これでインターフェースで選んでもOKそうです。
>>521 後続の者のために、どのように変えたら良くなったか書いてくれ
>>522 文字認識のメニューから
言語を:日本語(英語混在)にする。
そして、空白文字挿入指定を「空白出力」にする。
これは改行コード指定を「ブロック改行」にするとで
きなくなるので、それ以外の改行コード指定にする。
いろいろいじっていたので、どの設定がデフォかは
忘れたけど、これをやると英単語の間をきちんと認識する。
とにかく「空白出力」を有効にすることが必須。
本文が日本語で、要旨や図の説明が英語になっている
技術論文は、この設定を間違ってしまうと悲惨なことに。
縦書きで、英語部分のみ90度回転(本を横にして読む)してる部分を認識する方法ってあるかな? 読み取り範囲に横書き/縦書きどっちを指定しても画像の上が文字の上と一致しなきゃいけないのは変わらないし、、、 一箇所二箇所なら手打ちで何とかできても、一ページ数箇所とかだと途方に暮れる ちなみに使ってるのはetypist10です
526 :
名無しさん@お腹いっぱい。 :2007/06/14(木) 18:16:13 ID:MZzFuaL20
すみません、学術論文をスキャンして、それを画像からテキストに変換したいのですが、 問題は、論文の中にドイツ語やフランス語も入っているということなんですけど、 さすがにドイツ語やフランス語まで認識してくれるOCRソフトはないですよね?
528 :
名無しさん@お腹いっぱい。 :2007/06/14(木) 21:57:48 ID:MZzFuaL20
>>527 いやらしいと思いつつも、回答していただきありがとうございます。
本当に悪意はないのでw
非常に助かりました。
>>525 メジャーな機能じゃないかも
俺が知ってるのは読取革命くらいしか出来ない
>>528 >本当に悪意はないのでw
最後のwもやめたほうがいいよ
「ないですよね?」や「w」が
自然に出てくるようだとちと怖い
>>529 読取革命できるんだ! 超さんくす
早速体験版落としてくる
OCRってなかなか一ソフトだけじゃすまないよなー
532 :
名無しさん@お腹いっぱい。 :2007/06/18(月) 09:30:58 ID:puvoa998O
533 :
名無しさん@お腹いっぱい。 :2007/06/20(水) 10:49:02 ID:JlYS+vI+O
試した。 フツーーーのOCRソフトだった。 532=533は何が聞きたかったのかな?
聞いてみて
グーグルブック検索。 検索に使わない数式なども丁寧に直している出版社の方が多いけれど、OCR結果を 全く修正しないで登録している出版社が何社かあるな。「工」と「エ」くらいならかわいい もので全く意味不明のものもある。著者がかわいそう。
最近ocrを始めましたがこれってスキャンの解像度が悪いと 影響大きいですか?私の光学解像度1,200×2,400dpi性能では ほとんどうまくテキスト化できませんでした。 どの程度の解像度が必要でしょうか???
538 :
名無しさん@お腹いっぱい。 :2007/07/21(土) 16:23:32 ID:e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと 影響大きいですか?私の光学解像度1,200×2,400dpi性能では ほとんどうまくテキスト化できませんでした。 どの程度の解像度が必要でしょうか???
539 :
名無しさん@お腹いっぱい。 :2007/07/21(土) 16:25:09 ID:e2ZhIFOP0
スレ間違えました。失礼しました。
300dpiあれば十分だろ あとはコントラストとかの問題
300dpiでは低いよ。 400dpi以上。試せばわかるはず。
文字を拡大すれば問題ない。 マメ本だと400dpiでも無理。
300dpiから上は認識率は変わらないと思う。 200dpiと300dpiでもほとんど差がない。 俺の環境(ScanSnapS500でハードカバーや雑誌スキャン)では少なくともそうだ。 認識率に一番響くのは原稿の状態。 汚れていたり黄ばみが酷かったり印刷が悪かったりすると認識率がガタオチ。 「ほとんどできない」ってのは手書き原稿とか 写真背景に文字が刷り込んであるとか コミックの吹き出しの中とかかな。 200dpi相当くらいまで縮小しちゃった物で構わないので スキャン画像のサンプルをアップすれば的確な回答が来るのでは?>質問者
一般的な印刷物って300dpiではなかったっけ? だったら300dpiで十分だし、400dpiあればより安心って感じでないか。
よっぽどクセのあるフォントとか文字が小さいとかじゃない限り 300dpiあれば十分 あとは文字がクッキリとコントラスト等が調節できてるかによる
そんな原稿なら手入力した方が現実的だな。
etypist12はどうですか?
548 :
名無しさん@お腹いっぱい。 :2007/08/05(日) 01:40:32 ID:5939Ae+P0
549 :
名無しさん@お腹いっぱい。 :2007/08/29(水) 20:36:32 ID:HhJFBICD0
ここで大人気のSmartOCRってそんなに性能いい? 試しにLiteを使ってるんだけど、いくら学習させてもXを×と誤認識するし、 段組関係はお話にならないレベル。 X1 ってのが X一になったりするしw 1を右クリックしてもほかの選択肢が出ないし、そもそもの段組の位置が滅茶苦茶。 せめて学習機能が使い物になればエンロールと割り切って使って、 脳みそ鍛えるんだが。 何かいい方法無いかなあ。
タダなんだからそんなもんだろ 品質に不満ならe-typistでも買った方が早い バージョンアップ版は大昔に買ったスキャナに 付いてたのでもOKだし安いからオススメ
ID変わったけど
>>550 e.Typistが一番いい?
読んでココの古いバージョンユーザーなんでうpグレードはこれが一番安いんだが。
質がいいのならそちらに乗り換えます。
メジャー系の全種体験版使って判断すべきだけど、最近のはレジストリ汚しまくりなんで。
背景に画像があるやつ(CDについてる歌詞)を デフォ設定でやったら読み取り革命が一番まともだった。 まあ学習させてなんぼのソフトみたいだから初期設定って意味ないんかもね
学習にあんまり期待しない方がいいかと。 デフォルトでは想定されていないような 一文字のスペースに二文字を突っ込んだような文字とか (句読点とカッコ類を一文字分スペースにまとめてたり) そんな感じのはあまり遭遇しない類の例外処理の追加でしかないよ。 ごくごく当たり前の原稿の認識率は上がらない。 色つき背景に対応しだしたのは最近のverからだね。 柄つき背景はまだどこのもぜんぜんだめっぽい。
背景が英字新聞の場合は?
553はまともに使ったことなさそうだな
>555 縦書きで、本文とルビを混ぜて1文字として認識しているような場合はどう学習させて、どうすれば 次回似たような情況でうまく判定できるようにできるのか教えてくれ。
>557はまともにOCR使ったことなさそうだな。
>縦書きで、本文とルビを混ぜて1文字として認識しているような場合 よく分からん 詳しく説明してほしい
>>558 OCRなど30年前から使ってるが。
ただし真面目には使ってない。
> OCRなど30年前から使ってるが。 認知症ですか。かわいそうに。
>>562 脳内認識エンジンのチューン不足ですか。かわいそうに。
苛めよくない。
プレイなんだよきっと
預金通帳を拡大コピーせずダイレクトにテキスト変換(エクセル等で使いたい)したいのですがうまくいきません。 預金通帳をトライした人いますか? ちなみに使用ソフトは「読取革命」、スキャナーは300dpiです。
解像度を上げて試してみようと思わないのかねぇ……
>スキャナーは300dpi って書いてあるからハードウェアの光学解像度上限が300dpiなのでは? ならばそんなゴミは窓から投げ捨てて新しいスキャナ買え! としか言えない。
>>570 ,571
レス、サンキュー
正解です。300dpiが限度なのです。
どの位ならいいのでしょうか?
画像の前処理が必要なんだと思う。 通帳って紙の地に模様が刷り込んであるよな。 灰色とか黄色とか薄い赤とかで。銀行のマークなんかが。 あれがOCRに読み取られてしまうと滅茶苦茶になるので その模様をうまく消す画像のレタッチが必要なんだろう。 例えば背景が赤系の模様ならばRGBのRチャンネルだけ真っ白に飛ばしてから 残りの色だけで白黒化し、記帳されている数字だけ残るようにしてやる。 自分で思いつけない人は↑もちんぷんかんぷんかもしれんが 用は画像レタッチの知識が必要です、ということ。 スキャン解像度は300dpiあれば十分だと思うよ。
・減色するとき閾値を上げる ・特定チャネルだけを使う(Rが入ってるならBだけとか)
575 :
名無しさん@お腹いっぱい。 :2007/09/09(日) 04:18:08 ID:Wayz4dwa0
OCRよりお前の目で見た方が遥かに認識能力が高い。 なにもわざわざコンピュータにたよらなくとも お前にはそれだけの能力があるんだ。 自分にもっと自信をもちなさい。
tesseract、3を5と見間違えるんですが トレーニングで何とかなりますか
>>573 職業がら200通位×ページ数
データ入力を目視、手入力では、時間が掛かり、転記ミスも発生。
人を雇うほど余裕はない。
画像レタッチ使用すれば黒と白のみと要らないデータは消せる。
しかし必要なデータと同じ色ならその部分のカットしかないし、時間が掛かりそう。
しばらく、考えて見ます。レス、サンキューです。
仕事で継続的にやることがわかってるんならネットバンギング登録すれば? 今時は都市銀でもやってるんだしアグリッパなりなんなり使えばExcelへの流し込みも簡単だろ
banging?
顧客すべてにネットバンキング入れる? IT弱者の事も考えないのかなぁ? ソフト使い方、セキュリティとかいろんな問題が出るでしょ。 よけいに手間が掛かるし老人や障害者もいるのでね。 ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。
> 顧客すべてにネットバンキング入れる? > IT弱者の事も考えないのかなぁ? > ソフト使い方、セキュリティとかいろんな問題が出るでしょ。 > よけいに手間が掛かるし老人や障害者もいるのでね。 > ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。 おまいさんが廃業すればいいんじゃねーの?
スマソ、バンキングね。
>>580 客をネットバンクに入れさせる必要がどこにあるの?
要は取引明細をテキスト化できりゃいいんでしょ?
アンタが使ってる銀行で、アンタの口座をネットでも使えるように登録しとけば
ログインしてPCから明細見れるようになるんだからコピペでExcelに貼っつければいい
相手がどんな方法で振込んでこようが関係ない。
アグリッパは複数の金融機関の明細を一度に参照できるシステムだが
上の手順で済ませるのなら別に必要ない。知りたかったらググって調べろ
画像レタッチしなくてもたいがい取り込み時の設定で カラーバランスやコントラスト弄れるでしょ 必要なデータと背景の色が似てようが濃度や色味 違えば設定でどうにでもなるだろうし あとはOCRで一番大事なスキャン品質を一定に保つ為 スキャナのパネルに枠貼り付けたりして位置ズレを徹底 してなくす努力だけ
システム作るなら、最初からocrエンジンを借りてきて、画像処理くらい自前で用意するだろ 犯罪のにおいしかしない
あ、スマン、 顧客の日々の取引(入金、出金 残高、相手先) のデータ作成を請け負っている仕事なので ぜんぜん自分の口座と関係ないので乙。 カラーバランス、コントラスト いろいろやってみますね。 レス ありがd。
586 :
名無しさん@お腹いっぱい。 :2007/09/09(日) 21:00:43 ID:XLgeQDJm0
既存の会計ソフトで通帳や出納簿に特化したOCRができるものもあるみたいだぞ。 ってかプロなのかyo ドシロウトの俺が「会計 通帳 OCR」と検索してあたりがつけられるようなことを 知らないのってやばいんでねーの。
> 顧客の日々の取引(入金、出金 残高、相手先) > のデータ作成を請け負っている仕事なので > ぜんぜん自分の口座と関係ないので乙。 頭足りてないなら、とっとと廃業するべきだ。
e.typist12.0で ルビを文中に挿入を選択して文庫本をスキャン>認識すると 一部の行が左端の最後の行に重複して表示されてしまうのですが どう対処したらよいのでしょうか?
>591 たぶん傍点なんかで起きる現象と同じじゃないかな。結果のテキスト見ると複数の文章が混ざって しまってる状態。 認識時に文章が赤くマークされるけど、こういうのが起きるときは赤いところが反転して白くなる。 それを見て、ファイル名をメモしておいて、あとから修正モードで傍点を削除してから別途認識 してる。それしか対処の方法はなさそう。 傍点が大量になければ、テキストになった段階で修正するだけ。 傍点以外でも、一部のルビ、ゴミ、……なんかで起きることもあるみたい。 ルビなしで傍点が大量にあるんなら、ルビは無視してしまうと思う。e.Typistの傍点挿入位置は いつでもずれてるから。
>>575 んまあ、人間の脳って余分な作業も多いのか基本的に遅いからね
OCRに関してはまだ信頼性が微妙だからどの道人目チェックは必要だが
それでも手入力で全部やるよりはOCR+人手チェックの方が早い
と、マジレスしてみる
594 :
名無しさん@お腹いっぱい。 :2007/09/28(金) 02:22:27 ID:FG/hllZY0
>>593 お前は自分の能力に自信を無くしている。
しばらく山へ篭って自分を取り戻すべきだ。
ダイバダッダの魂宿りますた。 世界平和のために無償労働するっす。
>職業がら200通位×ページ数
これ見ると、ふつうの稼業じゃあないな
かたぎなら弁護士、司法系、税務・会計系か
やばいのなら斗一か事務所だな、と考えてみる。
だが、
>>585 か 税務資料か
「読取革命」、スキャナーは300dpiです → 最新版にする、解像度は最低400dpi(最新本ソフトの最低要件)でスキャン
597 :
ご参考まで :2007/09/30(日) 05:50:09 ID:fVlDcJAE0
記帳代行で乙。
>>598 ご本人は正にその仕事をされているように思うのだがw
600 :
名無しさん@お腹いっぱい。 :2007/10/03(水) 03:30:28 ID:5xTbDZcD0
名簿データ取り込み?
601 :
名無しさん@お腹いっぱい。 :2007/10/03(水) 04:51:39 ID:9DUfmmoQO
602 :
名無しさん@お腹いっぱい。 :2007/10/03(水) 05:07:51 ID:ZwtirfFY0
犯罪者乙!
604 :
名無しさん@お腹いっぱい。 :2007/10/03(水) 09:58:49 ID:lW4nXSBZ0
キャプチャってcaptureじゃなかったっけ
あー、全然別もんなんだ。俺が悪かった
office2003に入ってる「microsoft office image document」が、 すごく使いやすかったんだけど、office2007になったら無くなってるね。 2003から持ってくることは出来ないのかな。
609 :
名無しさん@お腹いっぱい。 :2007/10/13(土) 17:16:36 ID:nepRO5lX0
読取革命だが、2つの文字を1つと間違えてしまう問題を学習機能によって解決できるの? 解決できるソフトはある?
学習機能は文字だけでしょ
間違えるのも認識するのも全て文字だけだが?
SmartOCR liteeditionのヘルプキャッシュってどこかにない? com経由で利用したいんだけどまったく資料がなくてイミフ。 よろしくたのんます。
今現在 読取革命のVer.7を使って 英文と画像しかない物をスキャンかけてるんだけど 大体ミスが1ページにつき10文字位あるんだけどこれってVer.11 にすればもう少し改善される? あとVer.11の方はアクティベーションあったりする?
>>613 原稿の精度に左右される。
[K]ものだなw
悪知は無かったと思う(あってもクリア)
検証後DELしてしまったので
>>614 一般的な英語のテキストに対して使ってます
[K]もの? 体験版?それともクラックのことでしょうか?
616 :
名無しさん@お腹いっぱい。 :2007/10/24(水) 10:50:55 ID:S7BJ2he10
613 10文字ぐらいだったら、たいした手間じゃないからそのままでいいんじゃないの それが5文字になったとしてもあまり変わらないような気がする
>>613 英語のOCRはよほどスキャン状態が悪くなければ
単語DBとの照合なんかもしてくれるので
99.99%くらいの認識率まで行ってると思う。
英語圏のソフトの最新体験版を試してみては?
原稿にもよるけど英語OCRもまだまだ改良の予定があるよ。 段組なし(1ブロック)、フォント1種類、スタイル1種類、 罫線類なし、みたいな原稿だったらかなりの精度が出るけど、 そういう原稿って実際はあまりないし。 OCRが持ってる綴り辞書との照合もオートでやらせちゃうと 後で間違いを発見するのがかえって難しくなるので、結局 フラグがたったものを1つずつ確認してくしかない。
619 :
618 :2007/11/08(木) 01:24:35 ID:kSzZVbgV0
>>618 >改良の予定があるよ。
(正)改良の余地があるよ。
622 :
名無しさん@お腹いっぱい。 :2007/11/24(土) 16:52:47 ID:vQJ6YjAl0
623 :
名無しさん@お腹いっぱい。 :2007/11/24(土) 17:45:26 ID:/M81SGwoP
624 :
名無しさん@お腹いっぱい。 :2007/12/10(月) 03:27:04 ID:oguiPK7L0
紙にある表の枠を、 Excelで再現させるのは何のソフトがおすすめですか?
特打
626 :
名無しさん@お腹いっぱい。 :2007/12/10(月) 15:20:26 ID:mc4o5/AO0
簡単フォーム
兆安い
>>621 制限がファイル単位ってのは実はかなり緩いんじゃないか?
SmartOCRは制限は無かったけどページ単位でしか処理できなかったからなあ
こいつなら必要なファイルを一括してPDFに変換してそれを一気に処理させれば良さそう
精度うんぬんはまだ試してないから分からんのだけど
629 :
名無しさん@お腹いっぱい。 :2007/12/26(水) 12:05:39 ID:rr6NJUoQ0
上のほうでocr.rossa.ccのスパイウェアの話題をしてましたが... ダウンロードボタンを押したけど、直ぐにブラウザ閉じた。 スパイウェア貰っちゃったかな? 大丈夫ですかね?
ほっしゅ
/⌒ヽ ,, - ──‐ - 、
, < ̄7⌒、_ノ::::::::::::::::::::::::::::::::::::::::::`ヽ
/:::::::::::::::乂 ノ:::::::::::::::::::::::::::::::::::::::::::::::::::::::\
/:::::::::::::>‐7:: ̄::::::::::::::::∧:::::::::ト.:::::::::::::::::::::::::::::::ヽ
:::::::::/ /::::::::::::::::::::::::/. V::::::|.ヽ:::::::::::::::::::::::::::::::::',.
// /::::::::::::::::::::::::/ V:::::.i ヽ.:::::::::::::::::::::::::::::::',
,::::::::::::::::::::::__/. V::i!::i ',::::::::::::::::::::::::::::::::i.
i:::::::::::::::/ ̄/ ` ',::i',::', ─- 、.::::::::::::::::::::|
. |:::::::::::/:::::./ , ',.i ' ,、 ∨::\::::::::::::::::::|
|::::::::::::::::./ !_ ` \ V::::ヽ::::::::::::::::|
. |:::::::::::::::/ /示え、 二_、、 V、::::::::::::::::|
. |八::/⌒ / ん;;;;;;;| /う ヾ、 ',:::::::::::::,
|/{ ∧ 弋二ソ |;;乂メ;| | |>k:::::/
k ⊥  ̄ 弋二ン /、iヽ/
. `‐| '  ̄ /_ `/ <早くVIPに帰ろうよお兄ちゃん
`、 メ__/
> _ r‐、 /ヾ
,, -''´ |!ヽ| >-- ‐ r<´.
rヽ´ / / 〈ニ ヽ , -、
|/ヽ\' ./| ヽ У \ / / かわいいは正義
./ \ヽ { ヽ、 ´ / ヽ ./´γ/ /
http://afox.2ch.net/news4vip/ / / ヽ\ヽ  ̄` ─'/ | ∨Y彡ヽ,〈
633 :
名無しさん@お腹いっぱい。 :2008/02/05(火) 14:27:51 ID:j7DtTZgo0
本格読取2を購入して使ってみたけど、 さすが値段が安いだけあって辞書やパターン登録しても精度がよくないな。 読取革命11の体験版を使ってみようとインストールしてみたが、起動時にエラーが発生して試せなかった。 e.Typist12の体験版を試したら1日で何故か試用期間が終わった……orz e.Typistはルビの埋め込みができるので、手持ちの小説をテキストに落とすのには良さそうだけど もう少し認識率と領域指定を試してみたかったのにな。 手持ちの小説を青空形式でテキストにしている方で、お勧めのOCRソフトってありますか?
>>633 WinReader PRO テキスト作成ならばチョット昔のがいい
pdf作成ならば今のがいいけれど、OSがVistaでなければ安く中古で出回っている
図書館で借りてテレビを見ながらスキャン&テキスト化、約1時間でP250は楽に作成
その後ClieTH55で電車の中やチョットした時間で小説を読んでいる、家中本だらけにならずにすむ
また重い本を持ち歩かなくてすむし、返却も気にしなくてもすむ、今は流行のチョットエコな感じ
読取革命の体験版使ってみたけど何度直しても同じ文字ばっかり間違えて 一向に識字率が上がる気配が無いんですが、仕様ですか?
>>635 読取革命は知らんけど
普通はユーザー辞書みたいに
この文字はこうなんだyoって教え込む機能があんじゃねえの?
そういう機能があっても、間違えるものは間違えるのが読み取り革命
638 :
名無しさん@お腹いっぱい。 :2008/02/06(水) 14:55:56 ID:nDxnu5rf0
>>634 すまんが値段の段階で無理だ……
なにか方法を考えてみるよ。
結局、読取革命はあきらめた。使う側のことがぜんぜん考慮されて無さ杉。 テンプレート一回一回あてさせるつもりか?しかも数行おきに認識されるってどーよ それにしてもe.Typistの精度には驚いた。
640 :
名無しさん@お腹いっぱい。 :2008/02/07(木) 02:16:50 ID:mZYJX8l40
アドビAcrobat PRO CS3に付いているOCRはどうですか?
>>633 小説用途に限った場合の話だけど
e.Typistは比較的領域判定が優秀なのでほとんどの場合は自動でおk
小説再配置ツールやeTilTranで文字領域を切り出すだけで十分すぎるほど
認識率は読取革命よりはだいぶ上
ただ、感嘆符や――、……、ーのような記号をよく間違えたり読み飛ばしたりする
まれに同じページを不完全な状態で二重認識する(上半分だけとかそんな感じで)
ここがネック
ユーザー辞書は読取革命で何回教えても治らなかった経験から、全く使っていない
後で間違えやすい文字だけ一括置換してる
英単語帳を読み取ってエクセルのデータにして P‐STUDYシステムに問題集として読み込ませようと思っているのですが 英単語帳にむいているOCRソフトってありますか?
>>641 規制されていたので、お礼が遅れました。
e.Typist12を購入して使っています。
おっしゃるように! ――、ー、一あたりの誤認識が多いですね。
…に関しては点線処理の縦点線ありにしたら、かなりよくなりました。
一括置換も100個が限度という所からエディタでするようにしました。
なかなか難しい所ですね。
保守
e.Typistでルビの部分の行を本文として処理してしまうことがたまにある。 eTilTranで傾き補正はかけた後なんだけど、これって解決する方法ないのかな? ex) 正解:黄昏(たそがれ)が迫(せま)る道を 誤認識:たそがれ せま 黄昏が迫る道を
646 :
名無しさん@お腹いっぱい。 :2008/03/07(金) 00:49:49 ID:i9ecjhLU0
読取革命12、買おうかな。
読取革命12と読んdeココ13を単行本の読み取りで比較してみたけど、読んdeココの方がよかった。 読取革命は文字以外の部分を無理矢理、認識しようとして意味不明の文字列を連発する。 読んdeココは認識できないものはスッパリ諦めて無視する傾向がある。 この方がむしろ修正の手間がかからないから楽なんだよね。
648 :
名無しさん@お腹いっぱい。 :2008/03/10(月) 09:02:26 ID:1MG90Ymy0
そうかもしれないね。 でも読取革命のがしがし読む感じがいいんだよね(笑) まあまとまったゴミを消去する機能があってもいいよね。
以前から疑問だったんだが・・・ スキャナとかコピーとかしたとき、 原稿の一部だけ、字がにじんだり、潰れたりするのは何が原因なの? 途中で動いたってことなのかな? しっかり押さえたつもりで、自覚症状が無いことがほとんどなんだが。
>>649 そうだと思います。
やっぱり、カード類なんかはプラスチックで滑りやすいんで、画像が
ボケたり、片側だけが広がったりしてますね。
読んでココ13を使い始めたばかりの者です。 英文混じりの書籍を認識させるとき、小文字のc,o,sが頻繁に大文字に認識されます。 候補文字から修正してると自動的にユーザー辞書に追加されていきますが、 このまま同じ文字ばかり追加していって、認識率は上がるのでしょうか? まだそれほど認識速度は落ちていませんが。 ほかにもっと上手いやり方がありますか?
652 :
名無しさん@お腹いっぱい。 :2008/03/22(土) 23:31:46 ID:B1KQW1w80
読取革命liteからver.12へのバージョンアップ、インストールがうまくできないのですが、この場合liteにver.12が上書きされることになるのですか?
653 :
名無しさん@お腹いっぱい。 :2008/03/24(月) 11:50:59 ID:Sg3HQnEQ0
ライトも12も残るよ。
>>653 652です。レスありがとうございます。何度インストールしても辞書の読み込みに失敗、ということになり、どうやらliteインストール後にマイドキュメントをDディスクに移動させたのが原因ではないかと。Cに戻してから再度やってみます。
>>653 辞書ファイルも、ライトと12と両方残るのですか?
>651 それ以上認識率は変わらない。やりすぎると重たくなるだけ。 むしろ、テキスト出力して正規表現置換で小文字にしてしまうほうが 簡単じゃないかな。
657 :
名無しさん@お腹いっぱい。 :2008/03/25(火) 20:01:55 ID:6dsHcr8U0
当然残るよ。
658 :
名無しさん@お腹いっぱい。 :2008/04/02(水) 18:09:26 ID:PsFZJM1O0
etypist使っとけ
>>548 プリンタ付属の古い読んde!!ココ パーソナル(Ver.4.01)を使ってたが,
英文の認識だとこっちのほうがいいね
eTypistて透明テキストつきpdfで出力できないの?
pdfをrtfかodfに変換する時に使えそうなのない?
662 :
名無しさん@お腹いっぱい。 :2008/04/09(水) 18:14:29 ID:wF5n2yAm0
つadobe acrobat
読んでココでpdfを読み込むと、一から画像をOCRしてしまって、 元の透明テキスト情報は無くなってしまうのな? 元の透明テキストをそなまま読み込んで、修正のために、 テキストエディタ的な使い方って出来ないものかな?
画像ビューワとテキストエディタを左右に並べればいいだけでは?
画像ビューワじゃねーや PDFのビューワな
それが器ホンダが、図とか写真とかレイアウトとか書式を設定したりするのが面倒くさいだろ。
>>667 それのどこが「テキストエディタ的な使い方」なんだ?
テキストエディタ的って誰が言ったんだよ?
670 :
名無しさん@お腹いっぱい。 :2008/04/14(月) 11:14:54 ID:dJXYpbuD0
英文しかない場合は、外国産の方が認識率高いの? ヨンデココがどうもダメ、領域を正しく抽出する所から ちゃんとやってくれない、かすれてないのに。 ネットで落としたものだから、コピーし直すとか出来ない。
674 :
名無しさん@お腹いっぱい。 :2008/04/24(木) 08:00:33 ID:34xibooz0
>>673 SmartOCRLこれは? 文字がはっきり写ってるなら 高確率で認識してくれるよ?
675 :
名無しさん@お腹いっぱい。 :2008/04/24(木) 10:21:13 ID:LqECzoR50
>>673 ちゃんと英語モードにしてからやってる?
676 :
673 :2008/04/25(金) 20:14:31 ID:SRLFiK0c0
一応、漢字は無し、英文字記号数字のみの 設定で読み込ませてはいます。 あとSmartOCRはぐぐってみたけど、 サイトが閉鎖してました。
677 :
名無しさん@お腹いっぱい。 :2008/04/27(日) 16:15:02 ID:lWgL7JQt0
678 :
名無しさん@お腹いっぱい。 :2008/04/27(日) 19:31:23 ID:8zNLeoOp0
エクセルファイル⇔一太郎ファイル⇔ワードファイル が出来るフリーソフトありませんかね? 一太郎で作った表を自動計算させたいのでエクセルファイルに変えたいのですが・・・。 ご存知でしたら教えていただけないでしょうか?
>>673 ABBYY社のFineReaderの最新版使うといいよ。
お試し版もあったはず。以前試してみて認識率の高さに感動した。
読んdeココも一応ABBYY社のエンジン使ってるけどたぶん古い。
ソフト形式を変換とかじゃなくて表の(ハイパー?)リンクだけで出来そうだが
>>682 はいはい かしこいかしこい
なにもしなくても一太郎だけでできますよっと
読んでココで認識結果をpdf出力するとき、 認識結果は透明テキストに反映されるわけだが、 2行を1行に間違えて認識してしまった場合、 上の行にしか貼り付けされないのな。 結果編集で改行入れても、その行は無いことになってしまう。 認識段階または結果編集段階で行を挿入できないのだろうか?
>>680 英文なら認識率いいのか…日本語の認識率の悪さに辟易したが。
だって文字の数や複雑さからして違うっていう
購入した本や図書館で借りた本を、OCRソフトで テキスト化して個人的にノートパソコンかPDFで使用は、 著作権の違法に当たりませんか、またこの本を第三者に売却したら?
どう考えても売却はマズいだろ
図書館で借りた本はいいのかな
個人的な使用ならおkじゃ? コピーとるのと同じでしょ
理屈ぽっくてすみません 友人から借りた多くの本でも
>>692 便所の落書き2chに何を興奮してんだよ、
変な物見てんじゃないぞ
>>687 借りた本を売ったらいかんだろ
ってのはともかく、
自分で買った本なら別に法には触れないだろ。
PDF画像からテキストに変換で色々調べて準備終わった。 いざ実行してみるとPDFに画像コピー禁止の権限が・・ ヽ(`Д´)ノ オレノジカンカエセー
e.Typist ver.12を使ってみたんだけど、ルビを埋め込み設定にしたにも関わらず、認識結果は埋め込みとそのままが表示された。 ver.11だと普通に埋め込みのみなんだけど、原因がわからん。 設定同じなんだけどなぁ。なんか設定いじくる必要があるのかな。 どなたか解決策ご存じありませんか。
>>695 互換PDFビューアの過去バージョンで権限無視でコピーできるって話が昔あったような。
ビジネス書とかの単行本をテキスト化してるが、 e.Typist>>読んdeココ>>>>>>>>読取革命 だな。 読んdeココは多機能で使いやすくてバランスが取れた製品だと思うけど、 純粋に文字認識の精度だけを比べるとe.Typistが一番優れてる。
699 :
名無しさん@お腹いっぱい。 :2008/06/03(火) 23:17:38 ID:mqE/evSE0
>>680 ABBYY社のFineReaderはスゴイ
日本語化出来ないんだろうか?
>>699 e.typistと比べてどっちが認識率が高い?
>>700 英語ならFineReader、日本語ならe.Typistに決まってるだろ。
FineReaderってOmnipageよりいい?
703 :
名無しさん@お腹いっぱい。 :2008/06/06(金) 15:13:42 ID:bjY5yxxP0
>>703 このサイト初めて見た。認識率だとやっぱりOmniPageが優れてるね。
FineReaderもそれに近い値だけど、時間も遅いので、なんだかこれを
使うメリットがにくい。
警察は宗教に目を光らせている、盲信によって罪悪感のない犯罪を 起こしやすい、教祖の出来不出来でその人の人生が決まる 教祖だけに罪はない、似たもの同士がお見合いするのかも知らない、 騙す人間が悪いが、騙される人間も同類か
これまた激しい誤爆だな。
708 :
名無しさん@お腹いっぱい。 :2008/06/25(水) 08:59:23 ID:DKou2GCA0
読んでココはpdf出力するとき、追加保存が出来ないんだな。 wardやhtmlならできるのに・・・ 仕方ないから新規ファイルで保存した後、いちいちpdfエディタ立ち上げて 結合させてるけど、マンドクセ。
見開き表示とか綴じ方(右から左)の設定もできないから不便だよね。
710 :
名無しさん@お腹いっぱい。 :2008/06/30(月) 17:17:28 ID:nNrhDlkb0
>>710 ↑クレカの番号と所有者名を収集してるんか?
トップページに行けないぞ?
Domain Name: NUANCESTORE.COM
Registrar: NETWORK SOLUTIONS, LLC.
Whois Server: whois.networksolutions.com
Referral URL:
http://www.networksolutions.com Name Server: PDNS1.ULTRADNS.NET
Name Server: PDNS2.ULTRADNS.NET
Name Server: PDNS3.ULTRADNS.ORG
Name Server: PDNS4.ULTRADNS.ORG
Status: clientTransferProhibited
Updated Date: 16-oct-2006
Creation Date: 01-feb-2006
Expiration Date: 01-feb-2009
Registrant:
Digital River, Inc.
9625 W. 76th Street
Eden Prairie, MN 55344
US
Domain Name: NUANCESTORE.COM
------------------------------------------------------------------------
Promote your business to millions of viewers for only $1 a month
Learn how you can get an Enhanced Business Listing here for your domain name.
Learn more at
http://www.NetworkSolutions.com/ ------------------------------------------------------------------------
Administrative Contact, Technical Contact:
Digital River, Inc.
[email protected] 9625 W. 76th Street
Eden Prairie, MN 55344
US
952-253-1234 fax: 952-253-8497
Record expires on 01-Feb-2009.
Record created on 01-Feb-2006.
Database last updated on 30-Jun-2008 06:31:44 EDT.
714 :
名無しさん@お腹いっぱい。 :2008/07/01(火) 08:23:46 ID:AL20YzVU0
はあ? ieでもsafariでもいけるよ
715 :
名無しさん@お腹いっぱい。 :2008/07/09(水) 09:25:33 ID:tqR/hLP70
手書きの文字が認識できるOCRソフトってありますか?
TextSS
717 :
名無しさん@お腹いっぱい。 :2008/07/31(木) 12:46:10 ID:KkyDCbb60
文字じゃなくて、表などの枠線をスキャナから認識ってできますか?
718 :
名無しさん@お腹いっぱい。 :2008/07/31(木) 14:14:49 ID:kYKcm3m90
>>717 e.Typistってのを使ってるけど、できますん
720 :
名無しさん@お腹いっぱい。 :2008/08/01(金) 10:40:29 ID:DLLVnu+y0
721 :
名無しさん@お腹いっぱい。 :2008/08/07(木) 00:06:40 ID:BSuE1Slo0
SubRipでbmp化した字幕データをテキスト化したくて、 読んでココv9と最新体験版、革命v12、タイピストv12、 スマートライトを試しました。スマートライトは画像読むだけで落ちるので インストールに問題があったようなので別として、のこりでも、 見事に一文字たりとも認識されません。おまけにココだと、解像度エラー といわれてしまいます。 吸い出し時に設定を変えてみましたが、白地に黒縁かその逆かはともかく フチ付きの絵になり、それが誤認識の原因ではないかと考えていますが、 あまり自信がありません。どういう手順で、またどんなソフトを使って (bmpは1500あるので、ひとつずつ開かなくてすむように)色などの 調整を試すのがよいか、どなたか教えてくださいませんでしょうか?
722 :
名無しさん@お腹いっぱい。 :2008/08/07(木) 18:58:58 ID:eM6AkDyu0
前に画像処理ソフトで処理してから読み込ませた方がいいかも。 ネガ反転や、解像度変更、ノイズ除去、余白やいらない部分の削除、カラー画像であればグレースケールや白黒画像に変換など、 一括処理できるソフトもたくさん有りますから、やってみるといいかもね。
どうしても小文字(ぁぃぅぇぉやゃゅょなど)が弱い どこのソフトも駄目だ
e.Typist ver12買ってOCR作業中。 正 。 → o・O・0・0 これは許す。すっごいイヤだけど難しいだろうから。 正 I →1 これも当然許す。すっごい難しいだろうから。英語領域にしていすればかなり改善するし。 正 - → 1・I これはなに? なにしてるの? バカなの?('A`)
727 :
名無しさん@お腹いっぱい。 :2008/08/14(木) 04:33:00 ID:bB/191pD0
設定が悪いんじゃないの(笑)
同じくeTypsit使ってるけど、ScanSnapでPDFに→OCR→透明テキスト付きPDFにすると画像がかなり劣化する。 Scan直後のPDFの画質を守る方法ってないのかな?(´・ω・`) Acrobat Pro持ってるけど、画像が劣化したあとのPDFを編集しても意味ないよね…
729 :
名無しさん@お腹いっぱい。 :2008/08/14(木) 16:13:43 ID:BarBaXMw0
透明テキストつけるだけなのに 画像が痛むのか
OCRソフトのpdf入力は一端仮想プリンタに出しちゃって画像にして 文字認識してから改めてpdfに仕立て直してるからな。 最初からjpgでスキャン出力してそれをOCRソフトにかけるか pdfにしちゃってたものは一度画像として書き出してからOCRソフトにかければいい。
実家にある本でもテキスト化してみるかと思って読んでココの体験版入れてみたけど 使い方もわかんねえし、結構めんどくさいんだな 小説なんかをちゃんと設定してやると誤認識1ページにどれくらいになるの?
732 :
名無しさん@お腹いっぱい。 :2008/08/15(金) 02:20:36 ID:UA5Ln4AC0
きちんとやればほとんどご認識なんかないよ。 どうしても読めない漢字とかってあるけど。 たとえば解像度600dpiとか、試しにやってみれば。
読んdeココのOCRファクトリー便利だぜ。 一度設定すればアイコンをダブルクリックするだけで全部自動でやってくれる。
>>731 元の本のフォントと組版、スキャンの解像度にもよるけど
最良の時で大体1〜2頁に1字前後
酷いと1頁に10字以上とかあるね
1頁に誤字一字の割合だと読でてかなり気になるレベルだから
結局全編目を通して修正することになるね
e.Typist使ってみたけど、たまに一文字を勝手に分離して認識してしまう。 「え」が「、」と「λ」とかになる。 二文字に認識してるから学習しようがない。 細い所とかかすれるとだめ。 まだまだって感じだなあ。
736 :
名無しさん@お腹いっぱい。 :2008/08/17(日) 21:14:50 ID:NNvDk3xe0
何様だよw
737 :
名無しさん@お腹いっぱい。 :2008/08/17(日) 21:44:41 ID:a9bB+bqN0
読んでココの開発者だろ
>>732 ああ普段使わないからスキャナの設定なんか全く見てなかったわ
画像データだけ持ってきたけど、だめかもシンネ
OCRファクトリーでまとめて読み込んだ後って読んでココ上で誤字とか確認してる?
画像勝手に追いかけてくれるし、学習しなきゃだけど、エディターが使い
739 :
名無しさん@お腹いっぱい。 :2008/08/19(火) 14:17:41 ID:m4W/W6650
読んでココを試用してますが、 原稿では2行になってるはずなのに、1行の文として認識してしまい、 わけ分からない文字列を出してくるとき、これを2行に修正することは出来ませんか? ただテキストを起こすだけなら、認識結果画面で改行して手打ちすれば良いだけですが、 当方、画像が重要な資料を扱ってるため、PDFで透明テキストで貼り付ける必要があり、 ただ改行しただけでは、透明テキストにはその追加した行が反映されていないのです。
AcrobatってOCRソフトとしてどんなもんなんだろう? アカデミック版Standardで1万ちょいだから買ってみようかな?
AcrobatのOCRは糞 よんでここ>>e.typist>読み取り革命>>>>AcrobatOCR
742 :
名無しさん@お腹いっぱい。 :2008/08/19(火) 20:34:17 ID:aPjCwCOs0
acrobat ocr≒ヨンデココ ヨンデココ工作員市ね
e.Typist>読んでココだろ。
e.TypistのHP見てきたけど、 取り込んだ画像の補正機能について何も書いてないようなんだが、 見開きの傾き自動補正とか出来るのかな?
ここにはe.Typist使ってる奴はいないってことか
5cm身長アップが50m身長アップになった これで俺も51m56cmだぜ
>>744 見開き手動補正はできる。
自動の傾き補正は見開きには対応してない。
>>747 そっかー手動なのか。
こういうのは機械任せがありがたいんだけどなー。
サンキュー
smartOCRはいつも「事」を「夢」と認識する 後からテキストエディタで一括修正した方がいいのか
>749 認識辞書で対応すべきではある 「夢」と「事」じゃ、正規表現使ってもまともに修正するのは難しいし、 一括置換すると間違ってないところまで間違えてしまいかねん、一つ一つ 修正するのはどっちもそれなりの数がありそうだから面倒 >745 e.Typistも読んdeココも使ってる。 個人的な感想としては、OCR結果を縮小してあるような画像だと、e.Typistのが 認識率はかなり高い。画像がでかくなるほど両者の認識率は近づいていくけど、 OCR直後のでかい画像だと読んdeココのが多少いいような気はする。 >739 不可能だな。1文字の区切りがきちっとできている状態で、それがどの文字なのかを 学習させることは可能だが、1文字の範囲がどこからどこまでかは学習させようが ない。本文とルビをごっちゃにして1文字にしてしまうような場合と同様で、ずっと 以前からこういう状態だから、技術革新がないと無理じゃね
>>750 ピントのずれた、無駄に長い、タイミングの悪いレス、どうもありがとう。
別にずれてないんじゃね
うーん、99.1% ってほぼ自動ってのにはまだまだ程遠いね・・・
つかこれ英語限定じゃないの
人間の正解率てのは元々どのくらいなんだろうな。 俺なんて入力ミスもしてたんだろうが再入力の経験が何度もあるぞ。 人力OCRだから英語以外は対象地域を絞らないと無理だろうね。
>>753 結構いいアイデアだな。
日本語だと厳しいが、まあ2chとかの日本語コミュニケーション限定サイトに
置くなら何とかなるかもしれん。
・・・と書いてて今気付いたんだが、難読文字を読んで貰って、それが正しいかどうかの
答え合わせは誰がやってるんだ?
読んだ結果が正しいと判って、それで初めて認証として成立するんだろ?
>>753 よくこんなこと思いついてしかも実行したよなww
>>757 二つのOCRで一致した部分は正解、ちがった部分は不明として
正解と不明が含まれたものを表示して入力させ
正解の部分は認証として使い、不明部分を入力結果から拾う
とかかね
多数決
761 :
名無しさん@お腹いっぱい。 :2008/08/30(土) 16:48:15 ID:UobhjFbi0
ケツ多数
どんなに正答率が上がったところで人による目視チェックは必須だろう。
>>762 >人による目視チェックは必須
そうです。そしてそこが一番手間と時間がかかる部分。
上に出てたAcrobatのOCRはこのプロセスがないし、埋め込まれた
透明テキストを後から修正するのも事実上困難(不可能では
ないが、OCRソフトでオンタイムに修正していくような訳にはいかない)。
一カ所でも間違いあると困るというOCR作業もあるでしょうが、そうでない
場合には割り切って使うと便利とも言える。特にScanSnapとの組み合わせ
で大量の文書を処理する時など。
OCRエンジンも7で読んde! ココ(の世代落ち)になってるが、8や9で
どうなってるのか分からない。
764 :
名無しさん@お腹いっぱい。 :2008/09/10(水) 11:38:25 ID:H8/lfHgO0
OCR使ってて感じるのは、誤変換の原因はほとんど「切り出し間違い」。 文字列に占める空白の割合なんかから一意に決めてるんだろうけど、 カスレの多い原稿だと区切るところがめちゃくちゃ・・・ きっちり区切りなおせば正しく認識できるのに・・・ ユーザー辞書や単語認識かけて文字列にならないときとか、 この切り出しを見直して再認識処理してくれないのかね? 処理時間がべらぼうにかかりそうだけど。
GPUで処理できるようになったら何でも有りになるな。
読んでココ使ってるんだけど、「〜」が認識されず空欄になってることが多い。 ユーザー辞書にも1文字だけど登録してるのに。何とかならないのかな?
>764 小説みたいに同じ大きさの文字が延々と続いているのであれば、文字の大きさを 手動指定するモードとかあっても良さそうだよな。 見出し、本文、ルビの大きさを指定して、そこから文書を解析して認識するのなら そんなに難しくはないような気もする。新聞とか広告文みたいにいろんな大きさの 文字が混在するのには無力だろうけど
769 :
名無しさん@お腹いっぱい。 :2008/09/21(日) 20:05:56 ID:CcopwTiy0
素人で失礼ですが OCRソフトは、10万円以上の価格でないと、7割文字認識できませんか?
原稿の状態によっては何万出しても変わらない。 認識エンジン自体は1万前後の製品とはそんなに変わらなくて、内蔵辞書を持つとか、そういうところが変わってくる
既存のPDFファイル(複合機でスキャン)に透明テキストを乗せようと 読んdeココ!!と読取革命の体験版、クセロReaderZeroを試してみたのですが、 完成後のファイルサイズがとんでもなくマチマチになるのはどうしてでしょうか? クセロで約3倍、読取革命で約5倍、読んdeココ!!で約17倍にもなってしまいました。 同じ読んdeココ!!で、自動処理ではなく手動で作業を進めていくと 元々のファイルとほとんど変わらないサイズのものができあがるので、 これと同様の処理をなんとか自動でしてもらえたらいいのですが。
複合機の一部では、カラーやグレイスケール画像をJPEGの数分の1に圧縮するものがある OCRで画像を読んで保存するときに、 1 読み込んだ画像を通常のJPEGで保存→ファイルサイズが数倍に 2 元の高圧縮画像のまま保存→ファイルサイズは元のまま というケースに遭遇したことがある。今回のケースに当てはまるか分からんが。
ソフト(と手順)によっちゃ画像をビットマップに展開して 再度圧縮してしまう場合もある OCRソフトって文字認識に関しては強くてもPDFや画像の 扱いがなんでここまで糞なのってのが多い
非可逆圧縮で何度も圧縮・伸張したらひどいことになるんじゃ... と思ったら手動の場合はちゃんとやっているのか
いったい何を言っているんだ?
>>774 結構その「ひどいこと」になっちゃうOCRソフトが多い
777 :
771 :2008/09/25(木) 01:44:15 ID:VosBAVv30
レスありがとうございます。
>>773 さんの書かれているところが問題のようですね。
試しに複合機で作成したPDFファイルをAcrobat Pro(の体験版)でTIFFに変換し、
それをOCRで自動処理し透明テキストPDF出力としたところ、
サイズの変動がほとんどなくなりました。
次からは複合機でのスキャン時にPDFではなくTIFFで保存することにします。
あとは見開きの傾き自動補正がどのソフトでもできないようなので、
これについてはTIFFファイルをどうにか処理してみようと思います。
マンガのスキャン技術スレはマニアックな深みにはまってるようですが、
検索用に本をPDF形式でため込むだけならかなりよい感じですね。
>>777 >マンガのスキャン技術スレはマニアックな深みにはまってるようですが
そのスレ教えてください。
>あとは見開きの傾き自動補正がどのソフトでもできないようなので 読んでココはできるっしょ?
780 :
名無しさん@お腹いっぱい。 :2008/09/26(金) 13:37:29 ID:yFUJpsc5O
e.Typist使ってるんだけど、だんだん操作するのが面倒になってきたので、 ファイル名を渡して連続自動処理を開始させたいんだけど、 どうやれば可能なの?
>最初に読ませるファイルと最後の出力ファイル名以外は全自動でさせるモードだと、 ああ、OCRファクトリーのことか。 それは使ったこと無いからわかんないや。 読んでココで見開き自動補正というと、センターを手動で指定すると、 あとは自動で傾き検出、補正してくれるってことだから。
>>782 はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。
>>782 はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。
>>782 はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。
うわああ連投してしまってた。 申し訳ないですorz
NSr3Vk This pearl has a programmable grind and brew feature, it holds a quarter pound of coffee beans and it has a filter indicator to tell you when your water filter is pooched,
http://frespmesh.cn/vonsweeklyad.html Vons Weekly Ad
, :[[,
http://fresnmesh.cn/protran.html Protran
, 843,
http://fresnmesh.cn/ludogameprogramminginc.html Ludo Game Programming In C
, jii,
http://fresimesh.cn/snugharbormarinachautauquany.html Snug Harbor Marina Chautauqua Ny
, enlfg,
http://fresimesh.cn/jardinetechnicalservices.html Jardine Technical Services
, 8],
http://freshmesfsdfh.cn/lightbearers.html Lightbearers
, fvfm,
http://fresimesh.cn/safestprescriptioneyeglassesfdaapproved.html Safest Prescription Eyeglasses Fda Approved
, 966151,
http://fresjmesh.cn/femalepudenda.html Female Pudenda
, 8-(,
http://fresqmesh.cn/sacagaweadollarquartermachined.html Sacagawea Dollar Quarter Machined
, 6948,
http://fresmmesh.cn/hydrolux.html Hydrolux
, :PPP,
http://freskmesh.cn/dvop.html Dvop
, 8-PPP,
読んでココ、早くunicode文字に対応してくれ!
OCRソフトって、前後の文字から推測するアルゴリズムにすれば 熟語とかの認識率が格段に上がるはずなのになんでやらないんだろう? どうみても1文字ずつ単体でしか認識しようとしてないよな。
OCRって、元々の用途を考えると文章には不向きなんだよね。 申し込み用紙など決まった書式の中に住所、氏名書くようなものとか葉書(送り先を読み取って自動仕分けする機械がある)とか。 一語一句(誤字脱字も異字体も)正確に読み取るような用途向けだったはず。 それに、1文字でも誤認識があると、熟語全体を誤認識する可能性すらある。(だから「格段に上がるはず」という想定が通用しない。) それを自動でどうにかするのが逆に難しい。1文字の区切りや行、列の方向を誤認識する事すらあるくらいなのに、複数文字組み合わせで 判定しようとすると辞書に無い熟語は認識率が上がらないし、辞書に無い熟語を「辞書にある熟語」で誤認識する可能性もある。 辞書の語彙を増やすと似たような文字を誤認識した場合に熟語ごと誤認識する可能性も高まる。 結局は1文字ずつちゃんと認識できないと辞書があっても誤認識率が上がるか大して変わらないからあまり意味が無いのでは?と思う。(人間の曖昧情報の認識力って優秀だよね、と思える部分) かな漢変換エンジン(今で言うIME)のメーカーとOCRメーカーが組んで作ったところで・・・1文字誤認識しただけで1文丸々誤認識とか勘弁して欲しい事態になることも。
そこまでいく文字認識じゃなくて人工知能だからね。 コンピュータに一般常識やら駆け引きやらを実行させなくてはならない問題だ。 膨大なデータベースと高速演算が出来れば可能なのかもしれないが。
796 :
793 :2008/10/30(木) 18:26:59 ID:wNT2JRDf0
いやいや人工知能ってほど大げさなものじゃなくてさ。 例えば「微細」っていう言葉を認識するのに、ソフトは1語ずつ第一候補・第二候補…と 候補の語をいくつか持っていると思うんだよ。 それで2つの語の候補がそれぞれ、[1:徴 2:微 3:徹] [1:細 2:紳 3:組]だったとすると この語句の組み合わせ(3x3=9通り)で熟語として成り立つのは「微細」だけ。 1語ずつ認識すると「徴細」という誤った結果になるけど、語の組み合わせで辞書と照合 すれば正しく「微細」となる。 単純に、辞書で照合できた熟語だけ優先的に出力するということ。 活字のOCRならこの方法が有効だと思うんだけどなあ。
>>793 実際高い製品ではそういうのができるものもあるよ。
というかスペルチェッカや文法チェッカのような技術は確立してるし、日本語の形態素解析も、再変換の技術がある程度確立してるから、技術的な困難はない。
ただデータベースのサイズが格段に上がるうえ、認識に極端な時間がかかる、辞書に載ってない言い回しや単語に弱い、言語が固定されてしまう(外来語に弱い)等の問題がある。
798 :
名無しさん@お腹いっぱい。 :2008/10/30(木) 20:28:12 ID:/oREtNdF0
そういう機能って、E. とか読とかにだって最初からついてるよ。 マニュアルちゃんと読んで使えるようになってください。
英語のような分かち書きする言語だと比較的対応してるよな
800 :
793 :2008/10/31(金) 18:17:48 ID:JCWTUkt60
>>798 が言ってるのはおそらくよく間違えて認識する単語を予め手動で登録しておく
ユーザー辞書のことを言ってるんだと思う。
俺が言ってるのはそうじゃなくて、国語辞典並みの20万語くらいの辞書をソフトが
持っていてその辞書を使って認識させることを言ってる。確かに
>>797 が言うように
極端に時間がかかる可能性があるし、メモリも食うと思う。今まで1時間程度で
終わってた処理がもしかしたら10時間くらいかかるかもしれない。でもそれだけ
かかっても認識の精度の方を選びたいという需要はあると思うんだよな。速度重視と
認識率重視の2つのモードがあってもいい。現在95〜99%と言われる認識率が1〜2%
上がるだけでも十分価値がある。最近のマルチコアのCPUを有効に活用できると思うし。
時間のかかるOCRソフトに用はありません 昔の3D処理ソフトじゃあるまいし
>>800 長文書く前にOCRを使ってみてはどうか?
お望みの辞書がついてると思う。
が、お望みの価値は見出せないだろう。
>>800 先ずワードのスペルチェッカや文法チェッカを使えよ
道具を使えないんじゃチンパンジー以下だぞ
e.typistのバージョン上がってたから一応 001408DE : 11→00 eTyp12mem.dllは一緒
たぶんOCR使ったこと無くて、想像で言ってるんだろうね。 現状、認識処理に1時間もかかるわけがないw
OCRだって自然言語処理してるよ 認識候補に対して辞書を使って絞り込みとかやってる
認識処理は昔から早いけど、 結局は結果確認と誤認識や体裁の修正は必ずしないといけない。 その修正作業がどれだけ楽になるかがOCRソフトの一番大事なところ。
811 :
名無しさん@お腹いっぱい。 :2008/11/08(土) 08:38:05 ID:ZMhDwSXi0
素人ですみません。
OCRソフトを探しています。
透明テキストの機能を使って、文書の全文検索に使えるようにしたいと考えています。
PDFに変換してから、ちょこちょこといじりたいのですが、acrobatのOCR機能ってどうなんでしょうか?
OCR機能の点からみたacroatのメリット・デメリットは、
>>763 以外になにかありますか?(認識率が格段に低いなど)
SmartOCRは現在のOCRのシェアウェアやacrobatよりもどんな点で劣る(あるいは優れている)か教えてください。
PDFのOCR機能は画像OCRの付け焼き
814 :
名無しさん@お腹いっぱい。 :2008/11/16(日) 04:24:48 ID:4vajSCcA0
読んde!!ココの次期バージョンは当分ないのだろうか? ブラザーA3複合機買ったんだけど、OCRソフトは何買ったらいいか迷う。 Acrobat8持ってるから充分なのか、読んde!!ココ 13にアップグレードするか。 それともe.Typistを使ってみるか。 最終出力はテキスト付きPDFにしたいんだけど。 イチオシのワークフローあるかな?
あ
あ
817 :
名無しさん@お腹いっぱい。 :2008/11/16(日) 15:06:04 ID:kMc8Bxa00
読取革命12体験版を使ってみたんだが・・・・。 表編集モードにおいて、誤認識された罫線の削除のコツがよくわからない。 はさみのアイコンでなぞっても、消えない事が圧倒的に多い。 まるで出来ないかというとそうでもなく、あーでもないこーでもないとやっているといきなり消えることもある。 エロイ人、どうかこつを教えてくれ。
818 :
名無しさん@お腹いっぱい。 :2008/11/23(日) 14:26:28 ID:vpMal3Xl0
「本格読取 2」と「本格読取 2 Deluxe」って 何が違うんですか?
819 :
名無しさん@お腹いっぱい。 :2008/12/01(月) 15:15:27 ID:LWVSjDCk0
これまで何の疑問もなく「読んde!!ココ」 のバージョン10.01を使ってきた。 バージョン上げると読み取り精度は上がるのだろうか? 俺が使うのは英文ばかりだけどfの読み取りが悪くてイライラ。
820 :
名無しさん@お腹いっぱい。 :2008/12/02(火) 11:26:40 ID:j5O/upWL0
英文ならomnipageとか使え
FineReaderの最新版は抜群の精度
>>817 ハサミの左の先端で消したい罫線をなぞると良いよ。
ってもう試用期間終わってるかな?
読んでココv13の質問なんですが、 認識結果を修正するとき、候補文字から選択するとどんどんユーザー辞書に追加されていきます。 初期状態は、追加するかどうか、確認画面が出てたのですが、確認しないをチェックしてしまいました。 これを元に戻したい(確認画面が出て、不必要な辞書登録をしない)のですが、どこにその設定があるのか分かりません。 かなり探したのですが・・・何処に隠れてるのでしょう?ご存知の方教えてください。
自己解決しました。 で 別の問題が出てきました。 同じく、認識結果を修正中に、 候補文字から選択すると、半角指定してるはずの記号が全て全角になってしまいます。 仕事場と自宅で別々の読んでココを使ってるのですが、 仕事場のほうは半角で出てくるのですが、自宅は全角です。 環境設定とか同じはずなんだけどなあ・・・ ユーザー辞書が違うからかな?
ユーザー辞書を移植したら、同じように半角で出てくるようになった・・・・ ・・・・が、 今度は、移植した辞書に新しい字を追加しようとしたらエラーが出て落ちてしまう・・・orz なんなんだ? デフォだとユーザー辞書は隠しファイルになってるし、ダミーが置いてあったりするし、 移植したファイルは読めても書けない仕様なのか? 隠しファイル領域に入れないと駄目なのかね? ヘルプ読むと、場所は何処に置いても良さそうなこと書いてるが。 俺みたいに2台のPCで場所変えて作業してる人のために、 設定や辞書の共有が出来るような仕組み無いのかね?
829 :
名無しさん@お腹いっぱい。 :2008/12/16(火) 16:09:26 ID:MKgRiCmn0
お前はマニュアルを読んでここ
ヘルプのマニュアルは一応読んでるよ。 でも読み落としてるかもしれないから、何処に載ってるか教えてくれよ。 ただの煽りなら引っ込んでろ。
>>830 おまえ人に聞く態度か、ドアホ〜
おまえ頭悪いんじゃ 自覚せい 消えろ〜
買ったところから聞け たわけ〜
∩___∩ |
| ノ\ ,_ ヽ |
/ ●゛ ● | |
| ∪ ( _●_) ミ (
>>830 )
彡、 |∪| | J
/ ∩ノ ⊃ ヽ
( \ / _ノ | |
\ " / | |
\ / ̄ ̄ ̄ /
やれやれ・・・釣り扱いかよ。 自己解決しますた。 ユーザー辞書の移植は、読み取りだけならdicファイルだけでいいけど、 書き込むにはコントロールファイルもいるんだな。 マニュアルには載ってないようだけど、
あぁ、1TBHDDが安くなりすぎてテキスト化しなくてもいいと思い始めた。
835 :
名無しさん@お腹いっぱい。 :2009/01/10(土) 13:00:54 ID:TYnOKpqB0
↑いやいや、検索するって役割があるでしょ。 質問です。 e.Typistをインストールすると、mediadriveというフォルダが、Documentsフォルダに作られますが、移動するにはどうすればよいですか。 これ非常に不便なのですが・・・
836 :
名無しさん@お腹いっぱい。 :2009/01/10(土) 15:12:22 ID:IPOI/TmT0
透明PDFにpngが使えないので萎えた lzwのtiffでも数倍でかくなる
OCRソフトってPDFの扱いが弱すぎるよね
そもそもPDFっていらないしな。
いやいやいや、今んところ透明テキストつきPDF以上に、
バランスの取れた形式ってないんじゃないのか?
OCR変換したテキストデータのみを使うとか正気の沙汰じゃないけど、
文字列検索ができるのはただの画像データにはないメリットだし、
何よりも可搬性が高いというメリットもあり。
>>838 はこのスレでPDFいらないっていうことは
全部テキストデータで保存してるのか?
検索しないから。一度読んだらだいたいの場所は頭に入ってる。 読むの速いし、パラパラ高速でめくれないPDFは論外。
まぁ、検索するかどうかは確かに使い方次第かもしれないな。 でもPDFがパラパラ高速でめくれない、ってそれは単純に PCのスペックによるものなんじゃね? 300ページくらいの本をスキャンして30MBくらいで保存してるけど、 Adobe Readerで見開き2ページ表示にしてもさくさくPageUp/Downできるけどなぁ。
読むの遅いんじゃね?
いやいやwww PageDown押しっぱなしで300ページ見開き表示(150面) の冒頭から最後まで15秒もかからないんだけど、 どんな速読マスターでもさすがにこのスピードは無理じゃないのか? ということで脱線してきたのでもうレスはつけない。 スレ汚しすまない。
検索を使わなくてすむような使いかたしかしてない時点で
小説とか?にしか使ってないのかな? 学術書や研究書をデータ化して検索可能にすると全然 違ってくるんだよね 読むときに単語ひとつひとつにまで注意は払えないけど 後から違うテキストにある単語の用法を検索するとか 単語が使われる頻度を調べるとかさ
頭に入ってない、知らないかから検索しなきゃいけないんだろ。要はただの馬鹿。 統計とるのにOCRで作った修正処理してない、合ってるか間違ってるか 分からない透明テキストPDF使うなんて研究者失格だな。 専門分野なら頭に簡単に入るだろ。stockの知識は暗記しろ。
>>846 よう、天才。
あんた、なんでこのスレに粘着してんだ?
まじ天才。 俺の大学では会議はまだプリントされた紙を配る。 邪魔だから、PDFで保存。紙は捨てる。 学内自転車置き場に置かれた放置自転車の問題とか 入学試験の試験監督とか これ結構な量なんだよ。 まれにこれが必要になるから困る。 でこんなものも全部頭に入れてるの? 俺なんて会議中熟睡だぜ ありえんな。研究者とか書いてるが ただのニートと見た。
インド人じゃないの? 向こうのエリ−トは2時間くらいの会議ならその会議での会話を そらで再現出来る頭だって。
850 :
名無しさん@お腹いっぱい。 :2009/01/12(月) 01:47:20 ID:n3qvCL0O0
SVGがもうすこしがんばってくれれば、、、
851 :
名無しさん@お腹いっぱい。 :2009/01/12(月) 02:07:33 ID:SDQi6vqPO
おまえらレベル低いな。俺の国では読む前から本の内容くらい完璧に再現できないようなら落ちこぼれだから。
テキスト化スレでなんでPDFを称賛してんだ? スレ違いだ。
>>852 ID:iuR1Bu1I0は、テキスト化すら必要なさそうだが。
854 :
名無しさん@お腹いっぱい。 :2009/01/12(月) 10:53:10 ID:n3qvCL0O0
つ透明テキスト付きPDF
透明テキスト付きPDFさえスレ違い認定してる奴って なんなんだろう? 手元に元資料なくなったら読取り間違いを見つけるのに PDFの画像だけが頼りじゃん 完全にテキストデータしか残さないの?
>>849 そんなわけないだろw
12年と235日前の会議でもすべて覚えてるんかいw
>>849 インド人の友達いるけど、みんな馬鹿だよ
>857が馬鹿なだけだと思うよ。 子供の反論だな。 「何時何分何秒に〜」w まさか成人じゃないよね?
何時何分ってアホ? 検索する必要もない奴がテキスト化してパソコンに保存? もっとアホだな テキスト化してパソコンに保存する時間が無駄だろうがw その間にどれだけの文章を頭の中に入れれるの?天才君
861 :
名無しさん@お腹いっぱい。 :2009/01/13(火) 11:24:35 ID:EXPdIEAt0
WinReaderPro買うかどうか迷っている。 お前らどう思う? 用途は10万枚のxdwファイルの検索目的。
862 :
名無しさん@お腹いっぱい。 :2009/01/13(火) 15:36:04 ID:uERZu1aC0
xdwってそのまままじゃ検索できないんだ へー
こんなスレに天才君がごろごろしてるとは・・・・・
865 :
名無しさん@お腹いっぱい。 :2009/01/14(水) 02:10:19 ID:0z5ueTXF0
透明テキスト付きPDFの話なんてどうでもいいんだけど。 透明テキスト付きPDFで、テキストに変換した内容をチェックする馬鹿はいないんだから。 ここでは議論が成り立たない。
学術論文データベースでダウンロードできるファイルは ほとんどが透明テキスト付きPDFでございますw
869 :
名無しさん@お腹いっぱい。 :2009/01/15(木) 12:58:17 ID:Coc/BK/S0
>>868 医学論文はスキャンされたPDFが郵送とFAXとかダウンロードできるだけというのが全てかも。
俺が入会している論文屋はそうだね。日本では業界最大手だと思うけど。
それに本をばらしてscanしまくっているから透明テキストは自分でつけないといけない。
あ
>>868 だからスレ違いじゃん。
論文作った人がPDFにしてテキストつけてるのに画像→テキスト化のこのスレに何の関係あるんだよ?
たしかに(DAIGO) 論文書いたならワードとかだろうからそこからpdfに変換したら 文字化けもなにもないな 最初から文字としてpdfに埋め込まれてるだろう
論文データベースで提供される最近の論文なら学術誌の ページまんまの普通にフォント込みのPDF 昔のものはスキャンされて透明テキスト付きPDF 同じように自分でスキャンした論文や本も透明テキスト付きで 残しておいて管理したいってわけ しつこく透明テキスト付きPDFを排除しようとしてる人は こういう用途を理解できないのかな?自分に関わりのない 用途だからって排除するってのはどうかと思うよ
2名くらいが言い合ってるんだろうが そろそろメールででもやれw
読んでここと読み取り革命とe.typist 全部使ってみたけど 読んでここが一番まともだった
一番妙な名前のが一番まともっぽいんだよな。 でもどこも煮詰ってきちゃって停滞してる感じもする。
878 :
名無しさん@お腹いっぱい。 :2009/01/16(金) 07:13:05 ID:YFgvyqNy0
よんでここ良いかあ? typistだろ
880 :
名無しさん@お腹いっぱい。 :2009/01/16(金) 12:34:31 ID:ar3mUcAl0
で、WinReaderProを使った奴はいるか?おれはxdwでscanした文章が20Gくらいあるんだよ。 DocuWorks内蔵のOCRも悪くないけど、更に精度が上がるなら20万出してもいいかなと思うのだが。 俺が人柱になるしかないのか?
881 :
名無しさん@お腹いっぱい。 :2009/01/16(金) 19:19:39 ID:u6xluZvZ0
そうだね
構って君登場w
883 :
名無しさん@お腹いっぱい。 :2009/01/17(土) 13:22:33 ID:8LomD8UX0
くそ。 お前らがそういう態度なら絶対に書いてやらない。 WinReaderProで得た経験を誰にも教えないぞ。
精度なんて似たり寄ったり。重要なのは確認、修正作業のし易さ。
885 :
名無しさん@お腹いっぱい。 :2009/01/17(土) 13:44:11 ID:8LomD8UX0
まじかよ。そんなことしていられないよ。 検索で引っ掛けるのが目的だし。 20万円の価値は無いのか。
886 :
名無しさん@お腹いっぱい。 :2009/01/17(土) 17:14:11 ID:3jWVocFV0
買えば済むのに
888 :
名無しさん@お腹いっぱい。 :2009/01/20(火) 16:59:05 ID:Ez5R3CRM0
読取革命大好き
889 :
名無しさん@お腹いっぱい。 :2009/01/21(水) 02:20:01 ID:nux6CWbW0
>>887 申し込みます。DocuWorksのVer6とVer7と比較してよければ買います。
全文検索は行方不明書類を捜す唯一の手段だからな。
行方不明書類ってどうしても発生するんだよね。
Scan時の重送で検出漏れもあるしね。
>>873 >同じように自分でスキャンした論文や本も透明テキスト付きで
>残しておいて管理したいってわけ
同じく。最新のAcrobatでも表があるページだと表部分だけでなく本文部分
の透明テキスト化も玉砕するんで困ってます。表が入っててもそこそこの
OCR化をしてくれて透明テキストとして出力してくれるソフトってあるの
でしょうか?
892 :
名無しさん@お腹いっぱい。 :2009/01/21(水) 21:37:36 ID:NwoVvKSk0
E.TYPISTでいいんじゃないの?
企業内でスキャンしたい対象ってどんなのがあるかな?
894 :
名無しさん@お腹いっぱい。 :2009/01/21(水) 21:47:38 ID:nux6CWbW0
>>893 FAXやら報告書、見積書、請求書、領収書。
わかるわ
>>891 つ ScanPaper for PDF
絶賛絶版中
残念。....Ver. up待ってたのに...orz
897 :
名無しさん@お腹いっぱい。 :2009/01/22(木) 14:57:17 ID:hloqxcjl0
>>897 そっか?ここ「画像→テキスト化総合」スレだぞ。
900 :
名無しさん@お腹いっぱい。 :2009/01/27(火) 01:41:17 ID:upxCQJ3+0
WinReaderProの試用版ダウソしたぞ。 結構いいな。でも、DocuWorks文章だとファイル1枚ごとの取り込みだから気が遠くなるくらい遅い。、東南アジアとか中南米で仕事をするくらいのスローペース。 全く実用にならない。
901 :
名無しさん@お腹いっぱい。 :2009/01/27(火) 07:41:36 ID:htkl5rYY0
精度がいいんだったらそれくらいの時間我慢しろ
902 :
名無しさん@お腹いっぱい。 :2009/01/27(火) 11:33:20 ID:upxCQJ3+0
903 :
名無しさん@お腹いっぱい。 :2009/01/28(水) 00:27:11 ID:7RPnoVYN0
結局、Docuworksからエンジンを呼び出して使う方法しかないね。でも、デモ版ではこの機能が使えない。。。 300dpiで取り込んだ書類の8pointの文字をきちんと認識したのはさすがだった。 DocuworksはVer6でもVer7でも誤認識したのに。 買うかな。。。でも、実売15万か。。。
俺も興味あるけけど手が出ない。 少なくとも今年度はe.typistで我慢する。
じゅうごまんて…
おまえら解像度って何DPIでやってる? おれは300くらいが多い
907 :
名無しさん@お腹いっぱい。 :2009/01/29(木) 07:37:06 ID:xvpcz/Pm0
やたらにあげればいいってもんでもないからなー
300dpiが標準みたいなもんじゃないの? ソースによっちゃ2値で600dpiとか
909 :
名無しさん@お腹いっぱい。 :2009/01/29(木) 17:54:21 ID:Ed9NlCzi0
400dpi一択だろ
DR-9080cなんだけど、白黒2値でも300→400dpiにすると爆遅になるから300dpiでやってる。
WinReaderProはやっぱりすごい。 試用版使うと欲しくなるね。
精度倍にするとサイズが4倍になるからなぁ。どこで妥協するかだな。
業務用OCR使ってる人いる? 個人向けだと激遅でしゃれにならん
>>913 WinReaderProの試用版を使用中だけど、いいよ。
xdwファイル200枚読み込ませて、レイアウト認識と文字認識をさせたけど早かったよ。
何よりも300dpiなのに認識制度が良いのがすごい。おいらは買うつもりだよ。
915 :
名無しさん@お腹いっぱい。 :2009/02/06(金) 21:55:20 ID:JBi895MP0
「読んDE!!ここ10」使ってるんだけどDocuWorks7とどっちが読み取り精度が高いかな? しかしヨンデにしろドキュにしろネーミングがもう少しどうにかならないのかな
読んでここと読み取り革命とe.typist使ったけど 読んでここが一番良かった
それは無いわ
精度なんて誤差程度だ。どうせ修正するんだし操作性で選んだほうが 画像→テキストまでのトータルの時間は短くなるよ。
それはあるな
920 :
名無しさん@お腹いっぱい。 :2009/02/07(土) 15:55:55 ID:FYPR5kDC0
修正も数値とかが微妙に読み違われてるとなかなか気がつかないし影響も大きかったりするんだよね。 ワードの校正で候補がでるような読み違いならいいんだけど。
921 :
名無しさん@お腹いっぱい。 :2009/02/07(土) 19:48:47 ID:w8++l3bX0
読取革命13出たけど、認識精度には言及していないな マイナーチェンジってとこかな
工数かけて認識率コンマ数%上げるのはROIが悪いんだろうな
バカが校正したらアホな結果しか得られない。 この壁はいくらOCRソフトが優秀だろうと超えられない。
924 :
名無しさん@お腹いっぱい。 :2009/02/09(月) 20:25:13 ID:0NQO+I390
Docuworks内蔵のOCRで生年月日の日が目になっていて、顧客の生年月日が取り出せなくて困った。 WinReaderProではちゃんと日と認識した。小さいことだけど、こういうことの積み重ねが業務を円滑にするね。
WinReaderProと読んでここはどっちが認識精度いい?
読んでここの方が圧倒的に優れている。
WinReaderProはサーバー用ソフトだから値段高いだけなんだよな 高いからって精度いいわけじゃないよね
>>928 まじレスすると、Docuworks内蔵のOCRより精度がいいね。
俺はDocuworksと連携するつもりだから、ポチってしまったよ。WinReaderPro。
読んでここのほうが制度がいいとなると寂しいな。
>>928 サンプルで読んでココを使用したが、WinReaderProからすれば
コストパフォーマンスいい、頑張ったな読んでココの開発者
初期段階から比べたらすばらしい成長だ
10分の1以下で買えるじゃん
WinReaderProは買った人はいい買い物だったてことだ、涙涙涙涙だね
俺は業務用に買ったから良しとせざるを得ないな。 ちょっとの差が検索力の大きな差になると自分に言い聞かせよう。
タイピストとか読み取り革命は 画像をでかい文字として認識するのが萎える
933 :
名無しさん@お腹いっぱい。 :2009/02/11(水) 10:16:43 ID:unbK/L3a0
だってお前ら画像みたいなイラスト文字を認識出来ないとか文句言うから。。。
けどほんとに読んでここの方が winreaderより上なの?
>>934 百聞は一見に如かず
購入するなりサンプルでお試しあれ
20.0と1.5万円を選ぶかはあなたしだい
読んで!ココはxdw文章で取り込みも保存も出来ない。 xdwで文章管理している俺には使いにくい。と自分に言い聞かせた。
937 :
名無しさん@お腹いっぱい。 :2009/02/11(水) 23:12:24 ID:QPs/OlSQ0
英語の本一冊まるまるスキャンしてPDF化して透明テキスト上から貼り付けて検索可能にするソフトって何が最適ですか? ドキュワークスというのに興味がありますがそれでも出来ますか?
OCRは自分で試して納得するものを使うしかない
どれがいいのかって言われてもナ
>>1 にソフトあるけどバージョンで認識率違うし評価も人によって変わるから
比較するなら
アドビのPDF
読んde!!ココ(エプソンのスキャナに良くバンドルされてる)
読取革命(ソースネクストのものは同じエンジンで過去のバージョン)
e.Typist(キャノンのスキャナに良くバンドルされてる)
>>937 俺は専門書を数百冊電子化しているよ。
Acrobatは普及しているけど、使い勝手はドキュワークスが圧倒的に上だよ。
マニュアルなんて無くても使えてしまうくらい直感的で自然な操作系だよ。
内蔵OCRの精度はちょいと遺憾なレベルだから、頑張ってWinReaderProを買いましたよ。
Docuworksから操作できるから便利だよ。検索は全文検索ソフトがついてくるよ。
でも、PDFを検索対象にするソフトは多いけど、Docuworksファイルを対象にするのは少ない。こういうところが残念。
個人でWinreaderはコストパフォーマンス合わない気がする
>>940 俺は大分悩んだね。でも体験版を使って吹っ切れた。
2万くらいのソフトより精度だいぶいいん?
>>942 うーん、わからないw
DocuWorks文章が読み書きできて、DocuWorksから呼び出せるから他に選択肢が無いというのが正直なところ。
いま、800枚くらいのスキャン文章にページ割り振りするために読み込ませているけど、結構早くて、正確だよ。
つーか、当然かw
>>939 俺は同じ用途でAcrobat 9 Pro。ドキュワークスも使ってるけど、Acrobat
の方が好み。文字の表示がAcorobatの方が読みやすいし、インタフェースが
Acrobatの方が洗練されてるように感じる。マニュアルなしで使えるのも同じ。
WinReaderProの精度が価格分だけすぐれてるのか、俺には確信がないので、
Docuworks+WinReaderProではなくAcrobat+etypistの方を選んだ。
ドキュワークスってOCRソフトというよりも複数種類のドキュメントを関連付けて纏めるファイリング機能が主だよね?
>>945 そう。でも、そこそこ使えるOCRエンジンを搭載している。WinReaderProを買えば、それに置き換えられるから強力なOCRソフト化する。
テキストの強みは携帯でも糞PCでも簡単に読めることだ。糞ソフトはいらねぇ。
個人用途でDocuWorks+WinReaderProはなぁ・・・ 単に本をスキャンするだけでそれはコストパフォーマンス悪いよ 自分はOpticBook3600でe.typist使ってるがこれで十分だわ 画像の扱いはバカだけど
>>947 OCRなんて書類検索にしか使わないな。
誤認識ををいちいち訂正する暇があるのはニートくらいだろう。
OCRが何か知らない奴ww というかなんでこのスレいるんだよw
お前が一番知らないだろう。 OCR対象が10万枚以上という世界は理解不能だろうなw 俺は正規表現で必要な情報を取り出してファイル名にして整理したりするのに使う程度だな。 一部分の抽出だけでも誤認識に悩まされているのに、OCRデータで本を読むなんて正気の沙汰とは思えない。
完全に自分の世界に入ってしまってるな。指摘されてもスレ違いだということに気付かないらしい。 10万枚以上が要件だから理解不能ってどんだけ無知なんだよ。それならそれ用のシステム構築するだけだろ。 だいたい誤認識で悩まされるのは校正しないままだからだろうが。ほんとシステム設計に疎い奴は勘違いした奴が多い。
質問 ご認識は仕方ないとしてそれを補正しやすいものってどんなのがりますか s510ってスキャンスナップ付属のアクロバット8では文字変更が大変なのよ 透明テキスト付きpdfってあこがれてたんだけど実際体験したら使えなくて幻滅した
日本語ソースでは諦めろとしか言えん 英語ソース等でようやく透明テキスト付きPDFは実用になる それでも誤認識するから保険のために画像にテキスト振った PDFにして保管しておくわけ 図書館で借りた数冊の本を一度にスキャンして校正までする 暇なんてある奴そうそういないし
>>954 だよね。人力校正なんて必要最小限に抑えないと人的リソースを喰いまくり。無駄の極みだよね。
ギリギリまで絞り込んだOCRデータの校正の労力をほんの少しでも削減するためにWinReaderProまで買っているのにさw
校正程度で無駄の極みか。だから最近の若者は駄目なんだよな。 誤植の多い出版物が多量に出回るわけだ。
まったくさいきんのわかものはかんじばっかりつかってよみにくいったら・・
漢字変換はできるけど漢字を書くのは苦手なんだよな
このスレで話がかみ合ってない場合って、主に欧文文書を 大量にスキャンして透明テキストpdfにする院生とか研究者と、 それを批判する人でグチャグチャやってるよね。 批判する人はどういう使い方かまったく明らかにしないけど。
俺は毎日届く取引先からの紙文章をスキャンして整理するため。 OCRデータから特定の条件を満たす単語をそのままファイル名にする業務用ソフトに組み込むためと全文検索用。 どんなに気をつけても行方不明書類は発生するからね。全文検索での手がかり用だから大体あえばいいと割り切っている。 業務で使っていると校正などするのは無駄の極みだよ。趣味で小説を取り込むのとは時間と量が桁違いだよ。 毎日100枚の書類を校正するのは愚の骨頂だ。
全文検索するときに誤認文字を補うようなしかけはあるの?
全文検索はwidegrep?
>>961 >>962 コンセプトサーチの一種のエクスパンドファインダーを使っているから今は仕掛けはないですね。正規表現が使えるのがあれば乗り換えたいですね。
サーチクロスが良かったんですけど、開発中止したので途方にくれてます。私はxdw文章が主なので対応するソフトが少なくて困っています。
最近、everythingを使い始めたんですけど、これがあればファイル名だけでもいいかなと思い始めました。
あらかじめ条件設定しておいて、ファイル名で自動振り分けしていれば、誤認識されて付けられたファイル名のものは振り分けられずに残るし。
>>959 >、主に欧文文書を
>大量にスキャンして透明テキストpdfにする院生とか研究者
その一人です。でも最近は日本語文献も取り込んでる。
文字種よりも図表の扱いが稚拙で困るのがAcrobat。
別のOCR必須。
全文検索する時って何をキーにして検索する?
>>964 何分野?俺も研究者なんだけど数理の方なのでかなりしんどい。
>>965 取引会社名の一部とか顧客名の一部とか。かなり当てずっぽうに試行錯誤している。
システマチックな方法があれば知りたいな。
文系研究者の端くれでMacユーザなんだけど、 文系分野だと縦書きまで出てくるので尚更困る。 ジャーナルは良いけど単行本の縦書きテキストは MacOSXのフレームワークじゃだめで、 Acrobatじゃないとちゃんと認識してくれないのがネックになる。
しかし、変換結果が合ってるどうかわからないまま、それを抽出、統計とって論文に引用されてたらたまらんな。 文系恐るべし。
もう全部を電子書籍にしてもらえればどんなに楽か・・
972 :
名無しさん@お腹いっぱい。 :2009/02/13(金) 12:03:41 ID:gQ1mRyPc0
>>971 図星だったかなw
論文データ捏造とかニュースにならないといいね。
なんか、気持ち悪いのが湧いてるな。
バイオ系に多いよこういうの。バイオ系はあまり教科書も論文も読まないけど。
数学苦手だから生物学者になるってやつ多いよね。
物理学者=数学者(コンピュータサイエンス含)>地質学者>化学者>>>生物学者
比べる必要もないけど地質が変なところにいないか?
地質学者ではなく土木学者でした。すみません。
979 :
名無しさん@お腹いっぱい。 :2009/02/13(金) 15:01:16 ID:ugTZXpCm0
地学とかどうやって生活するんだろう。。。
俺の知り合いは環境アセス会社でお手盛り地質調査をやってる
金になる順 化学>>>土木>生物≧コンピュータサイエンス>物理
982 :
名無しさん@お腹いっぱい。 :2009/02/13(金) 17:52:46 ID:ugTZXpCm0
化学ってフラスコ職人じゃね?
化学は主に素材とかかな
>>983 は化けなの?
化け分野では下付・上付が多いから苦労しそう。
OCRは何使ってる?