きみたちはキーボード打てる手があるんだろう
ページぐらい手でめくりたまえ
アーム付きのほんたった持ってるけど、便利だよ。
めくりにくいかなと思ってたけど、そう悪くもない。
むしろ慣れないうちはセットするのが一番面倒だった。
あまり下向かないで本が読めるから、目や肩や首が疲れない。
スレ違い失礼。
本を裁断してスキャンする理由って二つあるんだよね。
1.綺麗に取り込める。
2.ページをめくることなく自動で処理できる。
大量の本があるので、2番は捨てられない。
>>935 それだとADF前提だから、そこからいかに補正するかの腕が問われるけどね。白線出るし。
小説なら文字ページはADF、表紙・挿絵はフラベにするといいかも。
アイロン分解→裁断の方が中表紙も取り込めてオススメ
いっそデジタルデータですべての本を売ってくれたら、
こんな苦労しなくて済むのに・・・
938 :
名無しさん@お腹いっぱい。:2008/09/18(木) 23:09:48 ID:ysaOsu00
いずれネット経由で定期刊行物を購入できるようになるだろうね。
印刷業界は死活問題
印刷業界なんて全部合わせたって年商は落ち目の中堅家電一社以下だし
つぶしてしまってもちっとも困らないような気はする。
でも「いずれ」の日が来るのはもっとずっと先なんだよ。
1980年代にパソコンが普及し始めた時点でも
1995年にネットが爆発的に普及した時点でも
電子出版の時代だと言われたけど
そんな時代が近くなった気は少しもしない。
科学雑誌やマンガ雑誌なんかはネット配信されてるものもあるが
このスレの住人で定期的に買ってる人はほとんどいないだろう。
雑誌や本一冊分を一日でディスプレイで読んだら目がつぶれそうな気がする。
特に最近の液晶ディスプレイは昔より疲れる気が。。短時間ぱっとみるならいいんだけどね。
取り込みの目的は、検索で必要なものをぱっとだして見る、だな。俺にとっては。
俺は部屋の雑誌を片付ける為にjpeg化したよ
でも検索とかまったくできない
jpegをzipで固めてあるだけなのです
雑誌のタイトル(○○?号とか)
漫画のタイトル(○○1巻とか)だけだから
雑誌がマンガとか小説誌みたいな読み物なら検索できなくてもどうってことないけど
そうでないならPDF化して検索できるようにしておくと
資料としての使い勝手はずいぶん違うよ。
HDDも今や1TBが一万円なわけで
PDFに加工したのとは別に生スキャンを残しておいてもそう負担にならなかろー。
>>936 > それだとADF前提だから、そこからいかに補正するかの腕が問われるけどね。白線出るし。
何を補正すんの?
いくらがんばったってオリジナルには勝てないんだし、
補正 = 修正 = オリジナルと違うものにするってことでもある。
そんなに大事なものならスキャンしないで取っておけば?
本当に大事なものなんてたいしてないだろ?
>>943 なぜ補正をがんばる=大事って発想になるの?
見易さを高めて資料としての価値を上げようと思うのは至極常識的な考えだと思うけど。
その補正で資料としての価値が上がるの?
逆に下がってない?
見易さなら紙には勝てないよ。
それでもスキャンするのは本の量が多いからじゃないの?
大量の本を補正していたら時間がいくらあっても足りないと思うんだけど?
>>945 pdfで文字検索おいしいです
趣味も兼ねてるから問題ない。慣れもあるしね
で、君は結局何が言いたいの?
本をスキャンすることを前提にしてるスレだから、紙で保存したいならスレ違い
文字検索するような資料なら、
逆に補正なんていらないじゃん?
そういうのは見た目の綺麗さよりも情報でしょ?
ID:6y7yxttoさんはOCRはあまり使わない人なんだろう。
スキャンしたままの状態だとコントラストが低めで紙質の風合いまで残ってる。
印刷物の情報は「インクで刷り込まれた部分」なので紙質はノイズ。
コントラストを高めて紙の質感を飛ばし、インク部を濃くしてやることで
OCRの認識率はかなり向上する。
(単に白黒2値化しても紙のザラザラまで「真っ黒」な点として残るのでダメ)
補正は同一条件原稿の中で一枚だけ手作業でパラメータを決め
あとはバッチ処理で全自動でやるので労力はほとんどかからない。
ScanSnapから直PDFみたいな作業してるとわかりにくいけど
画像の下処理の有無で資料の使いやすさはずいぶん変わる。
一言でまとめると「勉強不足」だ。
あ、一行目訂正。
OCRはあまり使わない人 → OCRをあまり有効に使っていない人
950 :
名無しさん@お腹いっぱい。:2008/09/19(金) 22:03:42 ID:ARaC8K9r
皆さんは解体してスキャンした本をpdfにしていると思いますが、何で見ていますか。
もちろん、PCで見るのが普通ですが、電車の中でも文庫本を読むようにできないかと考えています。
初代W-ZERO3とZaurus(SL-C860)を持っているのですが、1ページをフルに表示させると
文字が小さすぎるし、拡大してスクロールするには手間がかかりすぎるし、思案しています。
文庫分程度の大きさのビューワーがあればいいのですが。
何それ?電車の中では文庫本読めばいいよ。
PSP!! PSP!!
>>950 Zaurusで読むならPDFではなくJPG保存したものをZIPにまとめるのが吉。
ZaurusでPDFは使いづらい。
表示にはaBookReaderという画像ビューワが定番。
少し手をかけてもいいなら
小説はMeTilTranというツールで文字を再配置して
読みやすく画像を加工するのもおすすめ。
こちらはWin上での前処理用。
どちらもフリーソフト。
>>948 > コントラストを高めて紙の質感を飛ばし、インク部を濃くしてやることで
> OCRの認識率はかなり向上する。
本当に? 理屈だけで言ってない?
そういう処理をすることで、OCRの認識率が向上するという
明確なデータがほしいんだが。
OCRだってただ画像を解析するんじゃなくて、
内部でコンストラクト高めたりという処理をしているはずだし。
>>955 自分で同一の原稿をレタッチしたのと生のとで試してごらんよ。
データなんて自分で取れる。
前処理の話はOCRでは割と定番だと思う。
ソフト板とビジネスソフト板にOCRスレもある。
ま、普通に考えても、ただ「画像」としか認識してないOCRソフトが
(まさに)機械的かつ汎用的に行う前処理よりも
人間が画像の性質や状態を目で見て判断して施した前処理の方が
より適切なデータに仕上がることのほうが多いだろう。
煽るなよ。。。
>>957 理屈の上では正しいけど、現実的には不可能じゃね? 時間的な点でさ。
汎用的にやらないってことは、つまり一ページ一ページちゃんと
見てるって事でしょ? ページごとに文章や読み取り状態は違うんだから。
そんな時間ないよ。
ADFスキャナ持ってないのかw
ひとつの本で紙や印刷が途中で切り替えられていなければ
ADF機ならばどのページもほぼ同じ濃度のスキャンが得られるよ。
少なくとも一ページだけ抜き出してレタッチ内容を決めて
ほかのページをバッチ処理しても問題ない程度に。
最初の「レタッチ不要論」の人は真剣に主張してたみたいだけど
955と960は別のやつがアホのふりして遊んでるだけに見えてしまう。
>>955 理屈じゃなくて主観でいってるんだろ。
10年前ならともかく、背景と文字との区別を人間が教えて
やらなきゃならないOCRソフトなんて今時ありゃしないよ。
コントラスト強調がデータの間引きに過ぎないのは画像処理のイロハ。
機械処理にかけるなら、コントラスト強調はしてはいけない。
前処理なくても認識はできるが精度悪いだろ?
精度上げたいならOCRソフトで試行錯誤するより
前処理で認識しやすい状態を作った方が速くて確実。
透明txt付きPDFなら画像の視認性upにもなる。
コントラストを調整すれば文字と背景の閾値を目で確認できる。
その後背景を白く飛ばせば誤認識が減る。
一度最適値だせば1冊丸ごとor同種の媒体全部一括処理できる。
スキャナの調整もフラットベッドでも再プレビューしない限り変わらない。
ムダムダ。
962は「背景と文字との区別を人間が教えてやる必要のないソフト」の
具体的な名前なんて出ない。
テキトーなこと書いてるだけだもん。
eTyもココもヘルプや動作中の画面、ソフトの設定可能パラメータを見ると
画像の濃度なんて無視して白黒2値にしちゃってると思うよ。
究極のコントラスト強調だな。
OCRソフト自身が内部で画像を読みやすく前処理してるから時間の無駄だろ、
手動での前処理は。
つーかここはあくまでスキャナの話題がなされるべきであって、OCRうんぬんはスレ違い。
>>963 OCRソフトが中でどんだけ複雑な処理やってると思ってんだ。
二値化しきい値の最適値決定なんて処理の内にも入んねーよ。
自分の目に見やすいようにコントラスト上げてやったから、
OCRソフトも処理しやすくなっただろなんて考えるのは愚の骨頂。
>>967 愚の骨頂なのは、スキャナスレでまだOCR話を引っぱるお前。
jx250の取り込みは回転や切り取り後の保存が出来て使いやすいのに
後継機が殆どないんだな
初読は本。 必要箇所だけ読むときはモニタ って感じだよね
取り込んだ後の管理ソフトって何使ってますか?
フォルダに名前をつけてジャンル分け で十分じゃない?
やさしくデジタルファイリング を使っています。便利ですよ。
CISはだめ。
ダウンロード板の自炊スレの定番は8800。
>>977 ありがとうございます、いままでLiDEシリーズを使っていて
8800Fの「ゴミ汚れ除去」機能が気になっていたのですがそれ以前の問題ですね、
レンズはCISって時点でNGとは…さっそく8800F買ってCCDの威力を試してみます
ありがとうございました
>976
雑誌を解体して、完全に平面状態にしてからスキャンするつもりならCISでOkと思う。
CCDはレンズで縮小して取りこむから、機種によっては中央(レール沿い)と端(レールから遠い場所)の間で長さが変わる(微妙な変形・ゆがみ)ことがある。
特にEの一部機種でゆがみ方が大きくて、このスレ他、いくつかのスレでは問題化したこともある。
C_ISではレンズゆがみはない。
本を裁断しないでスキャンすると、綴じ目付近など、わずかに浮いているだけでも全くスキャンできなかったりして、
深刻な影響が出る可能性はある。
でもまあ、漫画を取りこみたいって用途が決まってるんだから、
カラーの色合いの問題は、別に困らんだろう。
ほとんど白黒ページだけだろうしな。
ところで >980さん、次スレよろしゅう。