【SH506iC】携帯で電子書籍(XMDF,TEXT)【V602SH】
アクセス制限に巻き込まれている上、大学鯖に設置しておいた
串も死んでいるので携帯から書き込み。
>>932 おつ! 本来なら自分で組まないといけないんだけど、
試験期間中で時間が取れなかったorz
とにかく助かりました。試験が一段落したら読みまくるぞー。
ああ、そうそう、PerlとPHPしかインストールしてなかったので
今回Rubyをインストールしたのだけど、空白を含んだ場所に
インストールするのは不味いってことを失念してた。
今からインストールする人は注意。自分はショートパス使って対処しました。
txtは作成されるんだけど中身が書かれてないものが出来ます
Rubyとxdoc2txtいれてパス変更もしたのですけど
あと何か注意しなければいけないところなどありますか?
環境は以下の通りです
XP SP2
xdoc2txt 1.14
ActiveScriptRuby 1.8.2.2
私も
>>935同様 空のテキストファイルができます。
sakkade2.txt.batが開けないんですが、関係あるでしょうか?
動作環境はXPでSP1使用以外は
>>935と同じです。
>>935-936 sakkade2txt.bat にPDFをD&Dすると、場合(xdoc2txtの場所)によっては
上手くいかないので、コマンドプロンプトを開いて
cd "xdoc2txt.exeのあるディレクトリへのパス"
sakkade2txt.bat sf01.pdf
のようにすれば上手くいけるかと。
携帯からじゃ限界あるなぁ。さっさと規制解除してほしい。
普通にWindowsアプリケーションとして一つにパッケージングできないのか?
>>932 お疲れ様です!
俺も空テキストが作成されるだけだ
>>937さん
のもやったんだけどエラーがでる
OSはXPSP1
これ使えると凄い便利そうなんだけどなぁ
空のテキストが出てくるって言うのは、どういう状態?
ファイル名がどうなっているのか。どんなエラーが吐かれているのか。
コマンドプロンプトで
xdoc2txt -f sf01.pdf
と打ったら、整形前のテキストは正常に出力される?
うちの環境はWinXP Pro SP1, xdoc2txt 1.14, ActiveRuby 1.8.2.2
これで正常に動作してるよ〜。
>>942 横槍で申し訳ないのですが、Forbiddenくらいます・・・。
945 :
通りすがり:05/02/06 16:28:03 ID:bg7/U45p
指定の場所にもUPしました。なんか場違い臭いので、
少ししたら消します
>>946 ありがとうございました。
DL完了です。
削除のほう頼みました ○丁乙
>>937 パスはどうやって作るんですか?
>>940 cmdでそれを入力したら
'xdoc2txt'は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチファイルとして認識されていません。
と出ます。
できなそうなら途中に改行あるファイルで我慢して読むしかないかな…
949 :
932:05/02/06 17:21:38 ID:MFqjkQuC
>>948 Q1:展開したフォルダの中にxdoc2txt.exeとzlib.dllはコピーしてありますか?
Q2:説明書にあるようにsakkade2txt.batへのショートカットを同一フォルダ内に作り、
そこにドラッグ&ドロップしましたか?
(直接sakkade2txt.batにドラッグ&ドロップすると、作業フォルダがドラッグ&ドロップした
ファイルのフォルダになるようで、動作しません。)
950 :
948:05/02/06 17:28:03 ID:p9iT4jVJ
>>949 Q1:コピーしてあります。
Q2:ショートカットをつくり、そこへD&Dしたんですが空ファイルができます。
sakkade2txtフォルダには
00readme sakkade2txt.exe zlib.dll xdoc2txt sakkade2txt.exe
sakkade2txt.exeへのショートカット
の6ファイルがあります。
951 :
932:05/02/06 17:28:13 ID:MFqjkQuC
>>938 RubyプログラムをWindowsで単体で動くEXEファイルにすることはできるらしいけど、
面倒なのでやってない。
xdoc2txtの同梱は作者に許可を取ればできるけど、面倒なのでやってない。
所詮自分自身のために作ったソフトなので、公開に当たって最低限の説明を
付け加えたけど自分では困らない事には手をつけていない。
改造・再配布は自由なので、初心者にも簡単に使えるようにしてやろうと思う
有志がいたら好きにいじって使いやすくして公開してくれると嬉しい。
952 :
948:05/02/06 17:32:37 ID:p9iT4jVJ
訂正です。
フォルダにあるファイルは
00readme.txt sakkade2txt.rb zlib.dll xdoc2txt.exe sakkade2txt.bat
sakkade2txt.batへのショートカット
の6ファイルです
953 :
932:05/02/06 18:02:41 ID:MFqjkQuC
>>952 "sakkade2txt.batへのショートカット"のプロパティを開いてください。
ショートカットタブの[作業フォルダ]はsakkade2txt.rbやxdoc2txt.exeの
あるフォルダになっていますか?
954 :
948:05/02/06 18:11:48 ID:p9iT4jVJ
>>953 はい。
sakkade2txtフォルダにsakkade2txt.rbやxdoc2txt.exeは入れてあり、
作業フォルダにはsakkade2txtになってます。
955 :
932:05/02/06 18:17:03 ID:MFqjkQuC
>>934 俺が読みたかったので問題なし。
空行の処理とか会話文直後の処理とかでなんかいい案があったらいじってくれると
ありがたい。
Windowsのデフォルトのプログラム置き場が"C:\Program Files"以下ってのは
罠だよな。ファイル名・フォルダ名に空白入れるなよ…。BATファイルで呼び出す
ときにはいちいちダブルクォーテーションで囲まなきゃならんし…。
って、囲めば問題ないか。
公開しているアーカイブのbatファイルのruby呼び出し部を""で囲んだ。
これで、Program Files以下にインストールしてあってもたぶん大丈夫。
956 :
932:05/02/06 18:22:24 ID:MFqjkQuC
>>954 うーむ。作業フォルダはちゃんとしていてxdoc2txt.exeもあるのに
うまくいかない、か。
sakkade2txt.batは作業をまとめてやるので問題を切り分けにくいので、
順を追って試してみよう。
仮にsf01.pdfを整形するとします。
■STEP1
sakkade2txtを展開したフォルダにてコマンドプロンプトを実行してください。
(任意のフォルダでコマンドプロンプトを実行するには、「窓の手」を
インストールして、右クリックメニューの 「任意のフォルダーから
コマンドプロンプトを可能にする」を有効にすると便利です。)
以下のコマンドを実行してください。
xdoc2txt -f sf01.pdf
"sf01.txt"はできましたか?
957 :
932:05/02/06 18:23:07 ID:MFqjkQuC
■STEP2
以下の内容
SET RUBYPATH=C:\usrlocal\ruby-1.8\bin
"%RUBYPATH%ruby" -v
pause
のBATファイル"test0.bat"を作って、実行してください。
(RUBYPATH=〜はインストールしたRubyのruby.exeのあるフォルダに
書き換えてください。デフォルトは作者の環境のになってます。)
ruby 1.8.2 (以下省略)
と表示されますか?
■STEP3
以下の内容
SET RUBYPATH=C:\usrlocal\ruby-1.8\bin
"%RUBYPATH%ruby" sakkade2txt.rb < sf01.txt > sf01_.txt
のBATファイル"sf01conv.bat"をを作って、実行してください。
(RUBYPATHに関する注意はSTEP2と同様)
"sf01_.txt"に整形されたテキストファイルが出力されていますか?
958 :
939:05/02/06 18:25:22 ID:+vSELdFP
できましたー!
凄いアフォなとこでつまづいてました
言うのも恥ずかしいくらいなんですが
後の人の参考になればと書いておきます
一つ目は
>>934さん
が指摘しているのですが
ruby-1.8をインスコするとデフォでC:\Program Filesの階層におかれるのですが
空白を含んだ場所なので移動させる事が必要でした
(俺は C:\ruby-1.8 に移動させました)
この状態でC:\sakkade2txtに目的のPDFファイルをおいて
sakkade2txt.bat へのショートカットにD&Dで出来ました
もう一つの恥ずかしい間違えは
sakkade2txt.batの書き換えで
> cd "xdoc2txt.exeのあるディレクトリへのパス"
> sakkade2txt.bat sf01.pdf
の階層指定の一行目を
「"」のマークをつけたまま入れてました
前にも同じミスをしたのに同じ間違いをしてて OTL
同じとこでつまづいてる人なんていないかもですが
こゆとこでつまづく人もいるんだーと参考程度に。
改めて作者さん、質問に答えていただいた方有り難うございました
愛用させて頂きます
959 :
948:05/02/06 18:45:25 ID:p9iT4jVJ
>>932 できました。
凄い恥ずかしいんですが
>>958の言うrubyフォルダをCフォルダの直下に
移動させたらできました。
長文にて指導してもらったのにすみません。
できるようになって気づいたんですが、
文芸賞別作品集の「最後の脚本」をテキスト化させてみたんですが
なぜかPDFにて全49枚中41枚目までしかテキストにできません。
私だけでしょうか?
960 :
非通知さん@アプリ起動中:05/02/06 18:57:45 ID:KGUhKKJx
乙
961 :
932:05/02/06 19:00:57 ID:MFqjkQuC
>>958-959 すまん。配布ファイルのBATのruby呼び出し部を""で囲まなかった俺のミスだな。
俺の環境だと、そういうのが面倒だからフリーウェアの類はC:\usrlocal以下に
置くので気づかなかった。
962 :
948:05/02/06 19:04:16 ID:p9iT4jVJ
batの編集でProgram Filesの間のスペースを空けても空けなくても反応がないので
そこは関係ないのかなって思ってました。
試しにやってみたらうまくいったので、うまくできない場合フォルダを移動させて
みるのが良いと思います。
またテキスト化で途中で終わるものやまたエラーになるものがありましたので
お伝えします。
ウィングス小説大賞の「LADY BE GOOD」が
PDF65ページ中55ページまでしかテキスト化されませんでした。
また朝日新人文学賞の「The Closed Tower」は
変換前にエラー終了になりました。
963 :
932:05/02/06 19:06:02 ID:MFqjkQuC
>文芸賞別作品集の「最後の脚本」をテキスト化させてみたんですが
>なぜかPDFにて全49枚中41枚目までしかテキストにできません。
うちでは、最終ページの
>『最後の脚本』
> ナチ著
> sakka.org
ってところまでちゃんと変換されています。
ただ、実際に変換したPDFはごく一部なので、うまく変換できない
ファイルがある可能性は大です。
964 :
948:05/02/06 19:12:05 ID:p9iT4jVJ
>>963 最後の脚本の場合
文が途中の「しーんという音でうるさいほどだった。」
までしか変換されてないのに
>『最後の脚本』
> ナチ著
> sakka.org
が最後にありました。PDFファイルと比較確認していただけたら嬉しいです。
長い作品を読みたかったんですが、変換が私のではうまくできないみたいで
残念です。
全くできないよりはマシなので活用させてもらいますね。
965 :
932:05/02/06 19:14:46 ID:MFqjkQuC
>>962 >ウィングス小説大賞の「LADY BE GOOD」が
>PDF65ページ中55ページまでしかテキスト化されませんでした。
xdoc2txtが出力するデータが56ページ以降無し。
>また朝日新人文学賞の「The Closed Tower」は
>変換前にエラー終了になりました。
xdoc2txtがエラーを吐いて終了。
…というわけで、sakkade2txt側では対処できません。
Adobe Readerで連続表示にして「全てを選択」「コピー」でテキストを
切り取って、テキストエディタに貼り付けて保存。その後何らかのフィルタに
かける。という手がありますが、当然整形スクリプトは新たに書き起こす
必要があります。
966 :
932:05/02/06 19:20:45 ID:MFqjkQuC
>>964 確かめました。たしかに、ありませんね。
xdoc2txtの出力を確認したところ、途中で出力がとぎれていました。
元々「空の光に想いを馳せて」を読むためにsakkade2txt.rbを作ったのだけど、
これもダメだ。とほほ…。orz
xdoc2txtの使用はあきらめて、Adobe Readerから全てを選択・コピーした
文章を整形するスクリプトを作ってみます。
967 :
932:05/02/06 19:49:31 ID:MFqjkQuC
作ってみた。まだまとめてないけど、とりあえず公開。
http://baku.zive.net/program/sakkade2txt/w.txt.sjis ダウンしたファイルをw.rbとでもリネームして(しなくてもいいけど)
ruby w.rb < 変換元 > 変換先
で変化できる。コマンドラインのさわり方とかリダイレクトとかがわからない人は
ちょっと待ってくれ。
小説は終わりを先に読むとネタバレするので、うかつにチェックできん…。
読むの速い人チェックキボンヌ。
ところで、もう残り40を切っているので次スレが必要ですな。
俺はケータイに関してはあまり詳しくないので、誰か詳しい人テンプレ
作ってくれんかのぅ。
968 :
958:05/02/06 21:05:19 ID:8duX68vi
漏れには理解できない事柄が大杉ですが、みなさん大変モツカレさまです。
970 :
932:05/02/06 23:18:21 ID:MFqjkQuC
971 :
932:05/02/06 23:37:55 ID:MFqjkQuC
整形精度に改善の余地ありです。
今のプログラムは段落の判断を行末に"。"があるかどうかだけで
行っているので、
プロローグ
と書いてあったら、文が次の行に続くと判断してそこで改行しません。
行の文字数を判断の助けにすればもっとマシになるはずですので、
もうちょっといじってみます。
972 :
932:05/02/07 00:21:08 ID:oUyxdTUJ
改良完了。
差し替えました。
>>972 乙です。
>>932のソフトを使ってテキストにきれいにできるサイト
ごはん以外に知ってる方いましたら教えてください。
何個か検索してPDFで小説やってるとこ見たけど無理でした。
974 :
932:05/02/07 20:39:20 ID:oUyxdTUJ
「空の光に想いを馳せて」を読了。
括弧の後の改行の処理が変な部分があったので改良。
新バージョンをアップしました。新バージョンでエンバグしている
可能性も高いので、旧バージョンも残してあります。
>>973 xdoc2txtを使う旧版は既に忘却の彼方だけど、Adobe Readerから
クリップボード経由でデータを受け取って変換する新バージョンの
sakkade2txt.rbは、ファイル名にするために題名を取得する部分が
「作家でごはん!」の参考作品の書式専用に作ってあるため、
他の形式では題名を取得できないため正常動作しません。
既に整形された文章をつなぎ合わせる部分はおそらく汎用で
使えるはずです。題名の自動取得をしない汎用バージョンが必要かな。
…というわけで、汎用バージョンを作る励みになりそうな面白い小説の
紹介キボンヌ。
So-net規制がやっと解除されたorz
今すぐは無理なんですけど、もう少ししたら試験があけるので、
そしたら少しでも手伝えるかもしれません。Rubyは分からないので、
恐らくコンソールアプリになると思いますが。
なんかイイ流れですな〜。
最後にはGUIで整形の設定とか出来るようになったり…
HTML整形までできるようになったり…
望みすぎだけど
PDF解析から自前で出来れば大分違ってくると思うんですけどね。
なかなか難しいかな。PDF構造の解説がどこかのサイトにあったな……
>997 NamazuのPDFフィルタを参考にするとか。
979 :
非通知さん@アプリ起動中:05/02/09 00:26:50 ID:MYBgiWP7
997にプレッシャーがかかりました
980 名前: 非通知さん@アプリ起動中 [sage] 投稿日: 05/02/09 08:19:06 ID:u19IF+Ry
>>979 誤爆かよ( ´,_ゝ`)プ
980 = 978