P D F 開 発 の ノ ウ ハ ウ

このエントリーをはてなブックマークに追加
1acrobat
みんなで語り合いましょう。
アクロバットの?
PDF 開発ってどういう意味でいってんの?
検索に不便なスレタイつけたな
5デフォルトの名無しさん:02/07/01 10:14
PSの方が開発っぽいな。
ダメなスレ立てる奴にかぎって、
タイトルに飾りいれたりスペース入れたりする。
まさか、例えば.dviを.pdfにすることを開発といっているのではないよね?
手書きPDF入門
http://www.kobu.com/pdf/pdfxhand.htm
Adobe Solutions Network Technical Notes - Acrobat-PDF
http://partners.adobe.com/asn/developer/technotes/acrobatpdf.html
PDFlib home page
http://www.pdflib.com/
PDF作るのってスレ立てなきゃならんほど難しいものなのか?
(AcrobatとPDFのここが嫌い http://pc.2ch.net/test/read.cgi/bsoft/1020708227/l50 )

PDFって嫌われてるよね。
所詮は印刷物なのに、それ以外のものに利用する人がいるために嫌われるという面もある。
とにかくPDF周辺は不満が多いのだが、逆に、開発に対する需要も多いと言えるのかもしれない。

情報としては、物理的構成のPDFに比べ、論理的構成のHTMLの方がずっと価値があるけど、
世の中からアホが根絶することはないので、PDFはそれなりに利用されるだろう。

>>9
まともなPDFをつくる必要のある印刷屋は、本や仕様書を読んだりして勉強しないとだめだろう。
11デフォルトの名無しさん:02/07/02 00:03
次は認証技術だとかで、独自のもの以外にプラグインでベリサインとか、
他社の認証も使えるようになったから、こういうスレができるのかしら。

さらに、フォームを埋めこんだPDFでも、リーダー側で書きこみとセーブが
できるとかという話もあるようだ。

確かにXMLとかで作ったほうが、後々の再利用にも便利だと思うが、とり
あえず今ある文書類を電子的に管理し、さらに再利用の可能性が出てくる
となると、XMLで全面的に作りなおすよりは遥かに効率が良い。

アメリカでは個人もすべて確定申告をする必要があるので、これらの書類
がすべてPDFで配付されているそうだ。しかもフォーム付きで、書き込みと
セーブができるアクロバット・リーダー(カスタムメイド)までついて、数ドル。
(手間賃のみ、ということ)
>>10
オンライン販売のソフトのマニュアルが PDF ってのは良いと思う。
論文も ps と PDF で公開ってのが多いね。
TeX2html でもあればいいんだろうけども。
PDFって今の環境で満足してるからいいよ
http://member.nifty.ne.jp/~masumoto/clibpdf/
こんなん有るの知らんかった
やめてくれよ、PDFから文字抜き出すの大変なんだから・・・。
pdfからテキストを抜き出す方法を教えてください。
17デフォルトの名無しさん:02/09/22 21:30
>>16
お前、JavaかCかVBか使える?
1817:02/09/22 21:32
ビジネスsoft板と間違えてレスしちまったじゃねーか!
恣意的な論理的構成は物理的構成に如かず
FOPとSVG使ってPDFを生成したことが、やること多くて面倒だったよ。
Lisp は屑!
PDFは迷惑です。
やめてください。
23デフォルトの名無しさん:02/10/21 15:15
しいてき
>>16
Acrobatを買って、拡張子.txtでファイルに保存する。
>>24
プロテクトかかってるのもできるっけ?
じゃ全部印刷してから文字認識ソフト使え
画像キャプチャしてタブレットPCに送ればOK。
これだったらプログラミングできる。
タブレットPCの宣伝ご苦労様でつ。
ぱいそんぱいそんぱいそん!
30デフォルトの名無しさん:02/11/02 14:16
Readerが5.1になって注釈の追加とかができるようになったみたいだけど、
Readerで注釈を追加できるPDFってどう作ればいいんですか?
暗号化辞書を追加して/Pで許可するのかと思ったんだけど、うまくいきません。
Acrobatは持っていないんで、何か書き方が間違っているのか、それとも
全然別の方法なのかどうか、サンプルを作って調べることもできません。
やっぱFOPだぽ。
実装されてないところも多いけど。
32あどべぇ:02/11/12 18:33
>16
PDF内の...の箇所を zlibでinflateしる。それがStep1。
<< /Length 1000 /Filter /FlateDecode >>
stream
...(omit,binary code)...
endstream
endobj
33あどべぇ=15:02/11/12 18:38
ageちまったい。
step 2.
出てきた文字はなんちゃってPSみたいになってるから
日本語だったら<>、英語だったら()の間にはまってる文字をぶっこ抜く。
しおりや注釈、本文でない要素は全てUCS2だ。
こんだけわかりゃ、あとはかんたんずら。
34あどべぇ:02/11/12 18:45
>24
PDFの暗号化なんて、あって無いようなもんだ。自分でプログラム作るなら、の話だが。
プログラム作るときにゃぁ中にMD5 valueがあるんだからそれ使えば全然問題なしだ。本当はダメだが。
仕様書にも「プログラマの良心に…」って行があったぞ。
3515:02/11/12 19:30
>34
あどべぇは俺じゃないYO!
>>32
ネタはおわりでしゅか?
おい36よ、ネタなのかよくみてみることだ。
んなことも分からん香具師は逝け。

だが実は36がネタなのかもしれないという罠。
>>11
PDF1.4からは内部にXML形式でメタデータが埋め込んである。
結局PDFはごちゃごちゃになっていく。
39デフォルトの名無しさん:02/11/12 21:14
あどべぇの話は実は本題に即しているのでageでも良い思われ。
40デフォルトの名無しさん:02/11/12 21:16

class >>1 {

   public static void main( String args[] ){

     while( >>1 == アフォ ){
         System.out.println("糞スレ立てんな!");
     }
   }
}

すいません。loopから抜けなくなってしまいました。
loopから抜けるにはどうすればいいのですか?
41あどべぇ:02/11/12 21:19
/FlateDecode <- ZLIBのinflate
/LZWDecode ≒ UNIXのCompress

/Ascii85Decode <- Adobeの仕様書をみれ。実装はそんな面倒ではない。
ただし、これ単品で使用されることは無い。
テキスト抽出に関してはFilterはこれだけでいい。


おまいら興味あるやつだけでsage進行で逝ってください。
43デフォルトの名無しさん:02/11/12 21:30
PDFの暗号無効化する方法教えれ!
44デフォルトの名無しさん:02/11/13 00:21
下げるか( ゚Д゚)ヴォケ!!
45デフォルトの名無しさん:02/11/13 08:34
pdf2textのsource,とある4行をコメントすると暗号が関係なくなる。
良識の範囲でおながいします。
>>45
Thx.
あの会社も優秀な人いるんだね。
4745:02/11/14 08:21
あの会社に優秀な人いるデスか?
じゃ全部印刷してから文字認識ソフト使え
49デフォルトの名無しさん:02/11/25 20:23
Cocoon2最強?
50デフォルトの名無しさん:02/11/25 21:58
>>49
(゚Д゚)ハァ?
PDFは頭のversionを見た後にケツまで飛んでいって
"startxref
xxxxx
%%EOF"
って言うところをみるんだよ。その後に"xxxxx"ってところをatoi()して
fseek( FILE*PDF, [file先頭から数えて%PDF-の"%"があった場所]+ atoi( xxxxx ), SEEK_SET );
したらばxrefが始まってるから
1行20byteで
0000000000 00000 n
見たいに並んでるからそれを見ていくの。この1行は、
offset(10 byte), generation number(5 byte), enable/disableのスイッチ( 1 byte )
の順番に並んでるの。
Objectは/Catalog,> /Pages,> /Page > /Contentsの順番に階層になってて、まず最初に/Catalogに行くためには
xrefの下にくっついてる"trailer dictionary"から飛んでいくのよ。
trailer dictionaryは
"trailer <<
/Root 25 0 R
/Info 26 0 R
>>"
見たいになっててね、ここの"/Root"って値を見るの。つまりxrefでとった25番目のレコードへ飛べ、と。
fseek()でそうすると、
25 0 obj
<<
/Type /Catalog
...みたいになってるから、ずんずん突き進むのさ。
Contents Streamは
→ FlateDecodeがZLIB
→ LZWDecodeはまぁgzipのsourceにイイのがあるとして、
→ ASCII85DecodeはBase64よりちょっとむずかしいさ。
→ RunLength,ASCIIHexは今日日見ないし、
→ DCT,CCITTFax, JBIG2は画像専用だから抜きたいやつだけやればいいのさ。

stream - endstream魔での長さはcontent streamの/Lengthの値。
ここは間接参照になってるかもしれないから気をつけるべきだね
56名無しさん:03/01/05 02:23
                             / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\
Λ_Λ  | 君さぁ こんなスレッド立てるから          |
( ´∀`)< 厨房って言われちゃうんだよ             |
( ΛΛ つ >―――――――――――――――――――‐<
 ( ゚Д゚) < おまえのことを必要としてる奴なんて         |
 /つつ  | いないんだからさっさと回線切って首吊れ     |
       \____________________/

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
もしかして>>56 て、漏れが一週間ででっち上げたPDF作成ライブラリの社内売り込みに失敗したヤシじゃねぇー?
とか思ってしまった
58IP記録実験:03/01/08 21:57
IP記録実験
http://qb.2ch.net/test/read.cgi/accuse/1042013605/

1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。

27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?

38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。

73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
もうひろゆきいないのか・・・面白いダジャレをいってほしかったんだが・・・
ひろゆきは毎日何してるの?w
>>228

ハングルへ速やかにお帰りください
>>257
訴えられた時点で、書き込み者にアポとって、消すか消さないか尋ねる、とか。
>>267はスレスト
64デフォルトの名無しさん:03/01/09 14:58
>>361
ウェー ハッハッハ  PART 2
http://live2.2ch.net/test/read.cgi/news/1041867442/
======2==C==H======================================================

         2ちゃんねるのお勧めな話題と
     ネットでの面白い出来事を配送したいと思ってます。。。

===============================読者数: 138720人 発行日:2003/1/9

年末年始ボケがそろそろ収まり始めた今日このごろのひろゆきです。

そんなわけで、年末に予告したIP記録ですが実験を開始しています。

「2ちゃんねる20030107」
こんな感じで各掲示板の最下部に日付が入ってるんですが、
20030107以降になってるところはログ記録実験中ですー。

んじゃ!

────────────────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
────────────────────────────
Keep your thread alive !
http://pc3.2ch.net/test/read.cgi/software/1041952901/l50
────────────────────────────
2ちゃんねるがアクセスログ記録を始めましたが、あなたの考えは?

2003年1月9日より 計1868票
匿名性に絡む問題なので反対�� 28% 527 票
サイトのためになるから賛成�� 53% 1004 票
利用しないから関係ない�� 9% 171 票
2ちゃんねるってなに?�� 4% 85 票
アクセスログってなに?�� 4% 81 票
http://newspolls.yahoo.co.jp/public/archives/2076384460/p-ne6-7
確かに。
管理人を「3日以内に消せ」と呼ばれた時に
実際どうするか、刑事責任は誰にあるのか、って事は厳しいですね。
今回の判決は。
同時に、管理人が潜伏して隠れていた時に「消した」ヤクザの責任も問われますしね。
>>119
だな
これは悪い夢だ
実際金払うことになったらどうするんだろう・・・
DHCの判決はやく〜。
6億とは言わないまでも、今度は病院よりも一杯取られるぞー。
          l≡l  . l≡l
          |:::└┬┘:::|
          |:::┌┴┐:::|
/ ̄ ̄\   ノ::::::丶 /:::::::\.   / ̄ ̄\
| 記念 .> (::(,,゚Д゚)(゚ー゚*)::) < パピコ .|
\__/   |:∪::::| |::::∪::|.   \__/
       〜((((:::::))(((:::::)))〜
         ∪ ̄U U ̄∪
まあ、いざというときにIPを相手側に渡すんでしょ?
今までのように、ほどよく。
そして時には“びっしびし”告発していかないと2chの存在が・・。
あけおめ。
今年もツッコミまくるんでよろしく。

持ってるからイラネ

「通報しますた」と言って欲しいのか?
さてどうなるか
>>665
ほんまや。
華麗なうんこレスで引き続きお楽しみください
なんで串さすの?
======2==C==H======================================================

         2ちゃんねるのお勧めな話題と
     ネットでの面白い出来事を配送したいと思ってます。。。

===============================読者数: 139038人 発行日:2003/1/10

なにやら、連日メルマガだしてるひろゆきです。

そんなわけで、ログ記録実験ですが、いちいちサーバ指定するのが面倒なので、
全部のサーバに入れてみました。

重くなって落ちたりしてもご愛嬌ってことで。。。

んじゃ!

────────────────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
────────────────────────────
Keep your thread alive !
http://pc3.2ch.net/test/read.cgi/software/1041952901/l50
────────────────────────────
全国のネットカフェ大繁盛の予感ですな
顔ぶれみてると半島軍団に勝てる気しないな。
デモとかやる前に強くならないと駄目そう。
おいらも米軍とかに入って強くなりたい。
>WINNYなんて、倒産・違法化したら結局存在できない訳でしょ。
WINNY倒産・・・








                               笑うとこ?
ううん、既存のTripodとかじゃなくて新たにそういうシステムを
作っちゃうの。

どう作るかはわかりませんw

しかし嵐とか不愉快な対策には「こいつがむかつく」と
ひとり1票で投票してきめます。
そしてその人はもうカキコ禁止。

どうやってカキコ禁止にするとかそういうのはわかりませんw
前スレは、強い電波が検出されちゃったからじゃないかな。。。
うそをうそと
今日新たに登録した顔文字

ヽ(*`Д´)ノぬっころぬ!!!!
>852 そりゃどうも。DQFF板もついでに
見てきたけど、まだ荒らされてなかったよ。
ええ根性しとるわ。荒らし。ワラ
産経は頭弱いのか?
そいつだけ完全に浮いてるな(w
2ちゃんねるは生まれ変わります
じゃぁどうやって書き込んだ人に連絡をとるんですかね?
gambleやったんだったらnews3をおまけに
やってくれるのが親切というものだと・・・。
93山崎渉:03/01/13 18:59
(^^)
DHCぐらいしか知らん
95山崎渉:03/01/15 18:12
(^^)
96山崎渉:03/01/23 22:13
(^^)
PDFの暗号無効化する方法教えれ!
PDF Reference third edition Adobe Portable Document Format Version 1.4 を読んでいるのですが、

Array Objects の各要素のデリミタは White-space characters と考えてよいのでしょうか。

例えばこんなのは、配列内の要素数は2つ? 6つ?
/Contents [ 10 0 R 12 0 R ]

ううむ。
誰も見てくれてないので age てみる。

ただ age るのもアレなので・・・間違ってたら教えてホスィ。

アルゴリズム 3.2 encription key の計算

1. パスワード文字列を 32 バイトきっかりになるよう、パディングまたは切り詰めをします。もしパスワード文字列が 32 バイトよりも長い場合は、最初の 32
バイトのみを使います。パスワード文字列が 32 バイトに満たない場合は、足りないぶんを次のパディング文字列の初めから取り出して追加します。

< 28 BF 4E 5E 4E 75 8A 41 64 00 4E 56 FF FA 01 08
2E 2E 00 B6 D0 68 3E 80 2F 0C A9 FE 64 53 69 7A >

もし、パスワード文字列の長さが n バイトの時、パディング文字列の最初から 32 - n バイトをパスワード文字列の後ろに追加します。もし、パスワード文字列
がない(長さゼロ、パスワードなし)の場合はパディング文字列の全てをパスワード文字列として置き換えます。

2. MD5 ハッシュ関数を初期化し、ステップ 1 の結果を入力としてハッシュ関数に通します。

3. encription dictionaryの O エントリの値を MD5 ハッシュ関数に通します。(O エントリの値をどのように計算するかは、アルゴリズム 3.3 で示します。)

4. P エントリの値を符号なし4バイト整数として扱い、下位バイトから順に MD5 ハッシュ関数に通します。

5. ファイルの、file identifier 配列の最初の要素を、MD5 ハッシュ関数に通します。

6. (リビジョン3のみ) 次のことを50回繰り返します;直前までのMD5ハッシュの出力を取り出し、それを入力として新規の MD5 ハッシュ関数に通します。

7. 最後の MD5 ハッシュの出力を取り出し、その先頭 n バイトを encription key とします。リビジョン 2 では n は常に 5 であるとなっていましたが、 リビジョン 3
では n は encription dictionary の Length エントリに従います。

PDF Reference, Third Edition, Version 1.4
Algorithm 3.2 Computing an encryption key
http://partners.adobe.com/asn/developer/acrosdk/docs.html
100デフォルトの名無しさん:03/02/07 19:38
age るの忘れてた。
101デフォルトの名無しさん:03/02/19 22:25
PDF読むときって、後ろから読まなきゃだめなのか。
腐れPDFは読みにくいし、重い。
HTMLに変換する方法教えれ。
103デフォルトの名無しさん:03/02/19 22:30
>>102
あと1年待っててくれたら、PDFtoHTMLって関数作ってあげるよ
pdfは印刷屋のフォーマットだから、真っ当なHTMLには変換できますぇん。
>>102
どっかにうpしとけば、いつかぐぐるが変換してくれるよ。w
106106:03/02/26 02:35
質問です。
グラフをPostScriptで出力するプログラムを書きたいんですが、
座標値の範囲に制限はあるのでしょうか?
107デフォルトの名無しさん:03/03/25 01:32
あげ
削除ガイドライン5

掲示板の趣旨と違う
他にふさわしい掲示板のあるもの(Web製作板)
>>108
何故削除しようとするんじゃ。
ある特殊な状況のみでしか、PDFファイルというものに遭遇したことが無い為に
PDFというものがWebにのみ関連しているものであると誤解したため。
で、そろそろPDF1.5になるらしいAcrobat6が出るとか出ないとか言ってるけど、ドキュメントの和訳どうなるのかな?
やっぱ書籍買え?
英語で我慢するしかないか(死
112山崎渉:03/04/17 15:50
(^^)
goodies
verygod
>>114
GOD かよ !!
116山崎渉:03/05/28 13:23
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
117デフォルトの名無しさん:03/06/05 10:16
6age
DHCぐらいしか知らん
119デフォルトの名無しさん:03/06/30 13:03
>>@はこさたんかな?
検索出来ねえタイトルつけんなよ。
見つからないからAcrobat買っちまったじゃねえか。
ま、見つかったところで買う事にはかわりなかったようだが。

全然知らないから書くんだけど、もし.psファイルの最初と最後に
数行付け加えるだけでPDFになったりするんだったら
くやしいじゃないですか。

それはそうと、これくらい書いとけば?
●PDFのフォーマットは100%公開されている。
●PDFを作成するアプリは自由に作ってよい(?)
●既にいくつかのフリー/シェアウエアが出回っている。
●Acrobat高えよ。
>>120
あんたは板違い
122山崎 渉:03/07/15 10:23

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
123山崎 渉:03/07/15 14:18

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
124デフォルトの名無しさん:03/07/17 18:51
印刷不可設定のPDFを印刷するにはどうすればいいんですか
おまえらに教えるKnow-Howは無い
>>124
オーナーパスワードを打ち込む。
忘れちゃったらあきらめるかBluteForce(ry
127デフォルトの名無しさん:03/07/31 22:25
ほす
こさたんはぁはぁ(げらげら
129山崎 渉:03/08/02 02:08
(^^)
130山崎 渉:03/08/15 16:12
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
>>126
BruteForceのノ ウ ハ ウを教えてください
>>131
そりゃもう総当たりなわけで(ry
そもそもPDFのBruteForceツールあったか?
>>133
有名なロシア人のアレがそのものだな。もちろんKeySerch攻撃もやれるが。
てかツール使うんじゃ開発は必要なかろう。
こさたん、はぁはぁ
しかしブルートフォースとかやるとクラスタマシンとか欲しくなるのぉ。
ちっとも終わらん。
印刷できないPDFを印刷できるようにするツールキボン
【社会】印刷不可の政治資金収支報告書 簡単に印刷できる方法がネットの掲示板に掲載
http://news5.2ch.net/test/read.cgi/newsplus/1080892214/
139デフォルトの名無しさん:04/04/02 20:39
画面キャプチャすりゃ何でも印刷出来るという罠。
時期フォーマットでは以下の書式が追加されます
/ViewerPreferences << /NoScreenCapture true
141デフォルトの名無しさん:04/06/10 18:46
VECTOR & PDF WORKS
http://f44.aaacafe.ne.jp/~pdfwork/index.html
ミラーサイト
http://pdfworks.hp.infoseek.co.jp/index.html

以下のサービスを低コストにてご提供いたします。
● ラスター・ベクター変換サービス 600円〜
● PDFファイルの禁止事項解除、パスワード解析・解除 500円〜
● 合成写真作成サービス  1500円
● 写真のイラスト化サービス 500円

無料プレゼントコーナーに飛行機のペーパクラフト型紙があります。
よろしかったらホームページをご覧になってください。
>>141
Advanced PDF Password Recovery Proとか使うだけだったりしてな(w

APDFPRPのMacOSX版開発中みたいですな>Elcom。Xgrid対応とかでLAN内の余ったマシン全てでブルートフォース!
とかになってたらG5 Dualとセットで買っちゃいそうな悪寒(死
143デフォルトの名無しさん:04/10/01 11:08:24
PDFに関する日本語の規格書はどこで手にはいるのでしょうか?
144デフォルトの名無しさん:04/10/01 11:16:32
>>143
古い規格だけと、大きな書店で売っているよ。
アマゾンあたりで検索しなさい。
145デフォルトの名無しさん
中身ってPSじゃないの?