【本の取り込みに最適なスキャナ】その2

このエントリーをはてなブックマークに追加
933名無しさん@お腹いっぱい。:2008/09/15(月) 08:40:10 ID:D9+k5Xjd
きみたちはキーボード打てる手があるんだろう
ページぐらい手でめくりたまえ
934Socket774 :2008/09/15(月) 09:11:25 ID:2/bUFhB2
アーム付きのほんたった持ってるけど、便利だよ。
めくりにくいかなと思ってたけど、そう悪くもない。
むしろ慣れないうちはセットするのが一番面倒だった。
あまり下向かないで本が読めるから、目や肩や首が疲れない。
スレ違い失礼。
935名無しさん@お腹いっぱい。:2008/09/17(水) 11:18:50 ID:Cq1ZWsDk
本を裁断してスキャンする理由って二つあるんだよね。

1.綺麗に取り込める。
2.ページをめくることなく自動で処理できる。


大量の本があるので、2番は捨てられない。
936名無しさん@お腹いっぱい。:2008/09/17(水) 11:54:35 ID:4Ixud7MT
>>935
それだとADF前提だから、そこからいかに補正するかの腕が問われるけどね。白線出るし。
小説なら文字ページはADF、表紙・挿絵はフラベにするといいかも。
アイロン分解→裁断の方が中表紙も取り込めてオススメ
937名無しさん@お腹いっぱい。:2008/09/18(木) 22:43:35 ID:q8NMzps3
いっそデジタルデータですべての本を売ってくれたら、
こんな苦労しなくて済むのに・・・
938名無しさん@お腹いっぱい。:2008/09/18(木) 23:09:48 ID:ysaOsu00
いずれネット経由で定期刊行物を購入できるようになるだろうね。
印刷業界は死活問題
939名無しさん@お腹いっぱい。:2008/09/18(木) 23:52:35 ID:ictq9yJ4
印刷業界なんて全部合わせたって年商は落ち目の中堅家電一社以下だし
つぶしてしまってもちっとも困らないような気はする。

でも「いずれ」の日が来るのはもっとずっと先なんだよ。
1980年代にパソコンが普及し始めた時点でも
1995年にネットが爆発的に普及した時点でも
電子出版の時代だと言われたけど
そんな時代が近くなった気は少しもしない。

科学雑誌やマンガ雑誌なんかはネット配信されてるものもあるが
このスレの住人で定期的に買ってる人はほとんどいないだろう。
940名無しさん@お腹いっぱい。:2008/09/19(金) 08:13:45 ID:YubaCuS+
雑誌や本一冊分を一日でディスプレイで読んだら目がつぶれそうな気がする。
特に最近の液晶ディスプレイは昔より疲れる気が。。短時間ぱっとみるならいいんだけどね。
取り込みの目的は、検索で必要なものをぱっとだして見る、だな。俺にとっては。
941名無しさん@お腹いっぱい。:2008/09/19(金) 08:21:25 ID:rWyhAAjK
俺は部屋の雑誌を片付ける為にjpeg化したよ
でも検索とかまったくできない
jpegをzipで固めてあるだけなのです

雑誌のタイトル(○○?号とか)
漫画のタイトル(○○1巻とか)だけだから
942名無しさん@お腹いっぱい。:2008/09/19(金) 11:19:54 ID:ntR1occ5
雑誌がマンガとか小説誌みたいな読み物なら検索できなくてもどうってことないけど
そうでないならPDF化して検索できるようにしておくと
資料としての使い勝手はずいぶん違うよ。
HDDも今や1TBが一万円なわけで
PDFに加工したのとは別に生スキャンを残しておいてもそう負担にならなかろー。
943名無しさん@お腹いっぱい。:2008/09/19(金) 13:46:10 ID:6y7yxtto
>>936
> それだとADF前提だから、そこからいかに補正するかの腕が問われるけどね。白線出るし。

何を補正すんの?

いくらがんばったってオリジナルには勝てないんだし、
補正 = 修正 = オリジナルと違うものにするってことでもある。


そんなに大事なものならスキャンしないで取っておけば?
本当に大事なものなんてたいしてないだろ?
944名無しさん@お腹いっぱい。:2008/09/19(金) 13:50:25 ID:+nf6iA3t
>>943
なぜ補正をがんばる=大事って発想になるの?
見易さを高めて資料としての価値を上げようと思うのは至極常識的な考えだと思うけど。
945名無しさん@お腹いっぱい。:2008/09/19(金) 13:53:32 ID:6y7yxtto
その補正で資料としての価値が上がるの?

逆に下がってない?


見易さなら紙には勝てないよ。
それでもスキャンするのは本の量が多いからじゃないの?
大量の本を補正していたら時間がいくらあっても足りないと思うんだけど?
946名無しさん@お腹いっぱい。:2008/09/19(金) 13:56:05 ID:+nf6iA3t
>>945
pdfで文字検索おいしいです
趣味も兼ねてるから問題ない。慣れもあるしね

で、君は結局何が言いたいの?
本をスキャンすることを前提にしてるスレだから、紙で保存したいならスレ違い
947名無しさん@お腹いっぱい。:2008/09/19(金) 14:03:47 ID:6y7yxtto
文字検索するような資料なら、
逆に補正なんていらないじゃん?

そういうのは見た目の綺麗さよりも情報でしょ?
948名無しさん@お腹いっぱい。:2008/09/19(金) 14:30:29 ID:ntR1occ5
ID:6y7yxttoさんはOCRはあまり使わない人なんだろう。

スキャンしたままの状態だとコントラストが低めで紙質の風合いまで残ってる。
印刷物の情報は「インクで刷り込まれた部分」なので紙質はノイズ。
コントラストを高めて紙の質感を飛ばし、インク部を濃くしてやることで
OCRの認識率はかなり向上する。
(単に白黒2値化しても紙のザラザラまで「真っ黒」な点として残るのでダメ)

補正は同一条件原稿の中で一枚だけ手作業でパラメータを決め
あとはバッチ処理で全自動でやるので労力はほとんどかからない。

ScanSnapから直PDFみたいな作業してるとわかりにくいけど
画像の下処理の有無で資料の使いやすさはずいぶん変わる。


一言でまとめると「勉強不足」だ。
949名無しさん@お腹いっぱい。:2008/09/19(金) 14:33:14 ID:ntR1occ5
あ、一行目訂正。

OCRはあまり使わない人 → OCRをあまり有効に使っていない人
950名無しさん@お腹いっぱい。:2008/09/19(金) 22:03:42 ID:ARaC8K9r
皆さんは解体してスキャンした本をpdfにしていると思いますが、何で見ていますか。
もちろん、PCで見るのが普通ですが、電車の中でも文庫本を読むようにできないかと考えています。
初代W-ZERO3とZaurus(SL-C860)を持っているのですが、1ページをフルに表示させると
文字が小さすぎるし、拡大してスクロールするには手間がかかりすぎるし、思案しています。
文庫分程度の大きさのビューワーがあればいいのですが。
951名無しさん@お腹いっぱい。:2008/09/20(土) 04:42:40 ID:2bFbIxvg
何それ?電車の中では文庫本読めばいいよ。
952名無しさん@お腹いっぱい。:2008/09/20(土) 07:44:31 ID:wf87m/JZ
PSP!! PSP!!
953名無しさん@お腹いっぱい。:2008/09/20(土) 11:09:24 ID:MIjb3Awf
>>950
Zaurusで読むならPDFではなくJPG保存したものをZIPにまとめるのが吉。
ZaurusでPDFは使いづらい。
表示にはaBookReaderという画像ビューワが定番。

少し手をかけてもいいなら
小説はMeTilTranというツールで文字を再配置して
読みやすく画像を加工するのもおすすめ。
こちらはWin上での前処理用。

どちらもフリーソフト。
954名無しさん@お腹いっぱい。:2008/09/20(土) 11:13:21 ID:MIjb3Awf
つかここスキャナスレじゃねーか。
モバイル板にそれ向き専用スレがある。FAQの部類だな。

【自炊】電子書籍ビューア 4【出来合い】
http://pc11.2ch.net/test/read.cgi/mobile/1177321005/
【PDA】PDAで読む電子書籍【専用】
http://pc11.2ch.net/test/read.cgi/mobile/1080391499/
955名無しさん@お腹いっぱい。:2008/09/20(土) 12:55:33 ID:5qNWN707
>>948
> コントラストを高めて紙の質感を飛ばし、インク部を濃くしてやることで
> OCRの認識率はかなり向上する。

本当に? 理屈だけで言ってない?

そういう処理をすることで、OCRの認識率が向上するという
明確なデータがほしいんだが。

OCRだってただ画像を解析するんじゃなくて、
内部でコンストラクト高めたりという処理をしているはずだし。
956名無しさん@お腹いっぱい。:2008/09/20(土) 14:03:32 ID:lIDrwOAh
>>955
自分で同一の原稿をレタッチしたのと生のとで試してごらんよ。
データなんて自分で取れる。

前処理の話はOCRでは割と定番だと思う。
ソフト板とビジネスソフト板にOCRスレもある。
957名無しさん@お腹いっぱい。:2008/09/20(土) 15:37:17 ID:EVsBxRFU
ま、普通に考えても、ただ「画像」としか認識してないOCRソフトが
(まさに)機械的かつ汎用的に行う前処理よりも
人間が画像の性質や状態を目で見て判断して施した前処理の方が
より適切なデータに仕上がることのほうが多いだろう。
958名無しさん@お腹いっぱい。:2008/09/20(土) 22:27:51 ID:t9gJn1BM
>>955
そんなに涙ぐむなよ…
959名無しさん@お腹いっぱい。:2008/09/20(土) 22:39:10 ID:aBRCLck/
煽るなよ。。。
960名無しさん@お腹いっぱい。:2008/09/21(日) 18:50:30 ID:qwGqCtS4
>>957
理屈の上では正しいけど、現実的には不可能じゃね? 時間的な点でさ。

汎用的にやらないってことは、つまり一ページ一ページちゃんと
見てるって事でしょ? ページごとに文章や読み取り状態は違うんだから。

そんな時間ないよ。
961名無しさん@お腹いっぱい。:2008/09/21(日) 20:00:39 ID:HsFZ2NbQ
ADFスキャナ持ってないのかw
ひとつの本で紙や印刷が途中で切り替えられていなければ
ADF機ならばどのページもほぼ同じ濃度のスキャンが得られるよ。

少なくとも一ページだけ抜き出してレタッチ内容を決めて
ほかのページをバッチ処理しても問題ない程度に。

最初の「レタッチ不要論」の人は真剣に主張してたみたいだけど
955と960は別のやつがアホのふりして遊んでるだけに見えてしまう。
962名無しさん@お腹いっぱい。:2008/09/21(日) 22:04:40 ID:7AYCdmBT
>>955
理屈じゃなくて主観でいってるんだろ。
10年前ならともかく、背景と文字との区別を人間が教えて
やらなきゃならないOCRソフトなんて今時ありゃしないよ。
コントラスト強調がデータの間引きに過ぎないのは画像処理のイロハ。
機械処理にかけるなら、コントラスト強調はしてはいけない。
963名無しさん@お腹いっぱい。:2008/09/22(月) 08:37:45 ID:PXGzb5an
前処理なくても認識はできるが精度悪いだろ?
精度上げたいならOCRソフトで試行錯誤するより
前処理で認識しやすい状態を作った方が速くて確実。
透明txt付きPDFなら画像の視認性upにもなる。

コントラストを調整すれば文字と背景の閾値を目で確認できる。
その後背景を白く飛ばせば誤認識が減る。

一度最適値だせば1冊丸ごとor同種の媒体全部一括処理できる。
スキャナの調整もフラットベッドでも再プレビューしない限り変わらない。
964名無しさん@お腹いっぱい。:2008/09/22(月) 13:50:24 ID:/MJ1fJa/
ムダムダ。
962は「背景と文字との区別を人間が教えてやる必要のないソフト」の
具体的な名前なんて出ない。
テキトーなこと書いてるだけだもん。

eTyもココもヘルプや動作中の画面、ソフトの設定可能パラメータを見ると
画像の濃度なんて無視して白黒2値にしちゃってると思うよ。
究極のコントラスト強調だな。
965名無しさん@お腹いっぱい。:2008/09/23(火) 00:05:42 ID:QOQ/75bd
OCRソフト自身が内部で画像を読みやすく前処理してるから時間の無駄だろ、
手動での前処理は。
966名無しさん@お腹いっぱい。:2008/09/23(火) 01:17:54 ID:24b0c8qx
つーかここはあくまでスキャナの話題がなされるべきであって、OCRうんぬんはスレ違い。
967名無しさん@お腹いっぱい。:2008/09/23(火) 11:55:31 ID:QLc2FlgI
>>963
OCRソフトが中でどんだけ複雑な処理やってると思ってんだ。
二値化しきい値の最適値決定なんて処理の内にも入んねーよ。
自分の目に見やすいようにコントラスト上げてやったから、
OCRソフトも処理しやすくなっただろなんて考えるのは愚の骨頂。
968名無しさん@お腹いっぱい。:2008/09/23(火) 12:03:10 ID:HTcHIHvv
>>967
愚の骨頂なのは、スキャナスレでまだOCR話を引っぱるお前。
969名無しさん@お腹いっぱい。:2008/09/23(火) 12:17:39 ID:QLc2FlgI
>>968
反論できなくなって切れたかw
970名無しさん@お腹いっぱい。:2008/09/23(火) 12:27:58 ID:fKdskgoO
>>969
・・・。
971名無しさん@お腹いっぱい。:2008/09/24(水) 14:25:59 ID:goWVDO63
jx250の取り込みは回転や切り取り後の保存が出来て使いやすいのに
後継機が殆どないんだな
972名無しさん@お腹いっぱい。:2008/09/26(金) 16:37:06 ID:TObgGYYJ
初読は本。 必要箇所だけ読むときはモニタ って感じだよね
973名無しさん@お腹いっぱい。:2008/09/27(土) 14:25:45 ID:GiaccrJa
取り込んだ後の管理ソフトって何使ってますか?
974名無しさん@お腹いっぱい。:2008/09/27(土) 14:27:09 ID:xKj+PEC4
フォルダに名前をつけてジャンル分け で十分じゃない?
975名無しさん@お腹いっぱい。:2008/09/28(日) 17:47:30 ID:tW8WKWtY
やさしくデジタルファイリング を使っています。便利ですよ。
976名無しさん@お腹いっぱい。:2008/10/01(水) 09:33:48 ID:R8VJvHul
手作業で一枚一枚漫画を取り込みたいのですが
CanonScan8800Fと
ttp://cweb.canon.jp/canoscan/lineup/8800f/index.html
CanonScanLide200
ttp://cweb.canon.jp/canoscan/lineup/lide200/spec.html
どっちが適してるでしょうか?キャノンスキャナに詳しい方是非教えてください。
977名無しさん@お腹いっぱい。:2008/10/01(水) 09:50:48 ID:XRi2kYvz
CISはだめ。
ダウンロード板の自炊スレの定番は8800。
978名無しさん@お腹いっぱい。:2008/10/01(水) 09:56:54 ID:R8VJvHul
>>977
ありがとうございます、いままでLiDEシリーズを使っていて
8800Fの「ゴミ汚れ除去」機能が気になっていたのですがそれ以前の問題ですね、
レンズはCISって時点でNGとは…さっそく8800F買ってCCDの威力を試してみます
ありがとうございました
979名無しさん@お腹いっぱい。:2008/10/01(水) 22:43:57 ID:VM6/4jiM
>976
雑誌を解体して、完全に平面状態にしてからスキャンするつもりならCISでOkと思う。

CCDはレンズで縮小して取りこむから、機種によっては中央(レール沿い)と端(レールから遠い場所)の間で長さが変わる(微妙な変形・ゆがみ)ことがある。
特にEの一部機種でゆがみ方が大きくて、このスレ他、いくつかのスレでは問題化したこともある。

C_ISではレンズゆがみはない。
本を裁断しないでスキャンすると、綴じ目付近など、わずかに浮いているだけでも全くスキャンできなかったりして、
深刻な影響が出る可能性はある。
980名無しさん@お腹いっぱい。:2008/10/01(水) 22:52:56 ID:XRi2kYvz
8800やエプの新型S620は歪みがほとんどない模様。
■■エプソンスキャナ GT-X750/GT-F570/GT-F520■■
http://pc11.2ch.net/test/read.cgi/printer/1118718709/653-660

CISでも実測すると、多少は歪む模様。
■■エプソンスキャナ GT-X750/GT-F570/GT-F520■■
http://pc11.2ch.net/test/read.cgi/printer/1118718709/374

あと、CISは色がだめ。
981名無しさん@お腹いっぱい。:2008/10/03(金) 02:52:50 ID:nrgjnNKy
でもまあ、漫画を取りこみたいって用途が決まってるんだから、
カラーの色合いの問題は、別に困らんだろう。
ほとんど白黒ページだけだろうしな。

ところで >980さん、次スレよろしゅう。
982名無しさん@お腹いっぱい。
>>972
そうだね〜。