mht←→html 変換

このエントリーをはてなブックマークに追加
1ペンネームMHTさん
.mht(WEBアーカイブ)と.htmlを相互変換出来るプログラムって無いでしょうか?
特定のフォルダ以下の大量の.htmlを→.mhtにしたりしたり、
検索用には→.htmlにしたりを自動処理したいんで、
出来ればCUIプログラムでそういうのがあれば良いんですが…
結構探したんですが見つかりません。

inetcomm.dllあたりを使って出来ないものかな?
>>1
質問スレで聞けこのカス
>>1
うんこ
4ペンネームMHTさん:03/09/25 17:09
>>2-3
分からないならレスするなよ低脳
        まもなくここは 乂>>1騙り合戦場乂 となります。

      \∧_ヘ     / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ,,、,、,,, / \〇ノゝ∩ < >>1騙り合戦、いくぞゴルァ!!       ,,、,、,,,
    /三√ ゚Д゚) /   \____________  ,,、,、,,,
     /三/| ゚U゚|\      ,,、,、,,,                       ,,、,、,,,
 ,,、,、,,, U (:::::::::::)  ,,、,、,,,         \オーーーーーーーッ!!/
      //三/|三|\     ∧_∧∧_∧ ∧_∧∧_∧∧_∧∧_∧
      ∪  ∪       (    )    (     )   (    )    )
 ,,、,、,,,       ,,、,、,,,  ∧_∧∧_∧∧_∧ ∧_∧∧_∧∧_∧∧_∧
      ,,、,、,,,       (    )    (    )    (    )    (    )
RFC 2110を読んで自分で作れば〜?
perl使えば簡単に作れそう。
                                                 単発質問スレ良くない。
>>4
>あらゆる質問はまずすれ立てるまでもない質問はここでスレにしてください。
注意書きも読めないのかよ。
この超スーパースペシャルウルトラミラクルマッハ低脳。
うるせ〜馬鹿
       人
      (_)
      (___)
     (,,・Д・) <ウンコキターーー!!!
      ( O┬O
  ≡ ◎-ヽJ┴◎  キコキコ
10ペンネームMHTさん:03/09/26 00:04
4は偽物。(煽って楽しい?)
建設的な意見求む…

あと、perlモジュールでも、そういうのはどうしても見つからなかった
需要は大きいと思うし、まだ解決していない所を見ると
問題の重要性は大きいのでは?
これだけでレス上げる価値はあると思うんですが…
mhtってなに?
>>11
MIME使って、1ページのhtmlとそこで使われる画像ファイルを、
まとめてひとつのファイル (*.mht) にしちゃうの。

IEなら、「ファイル」「名前を付けて保存」「Webアーカイブ、単一のファイル (*.mht)」
RFCに有ったのか。
Mozillaも早く実装しろ。
サイト内容の整理ならInternet Ninja使えばいいじゃん
15デフォルトの名無しさん:03/09/26 10:40
VBでコントロール使ってできない?

mht読ませてhtmlではいたりとか
>>12
IEでできるならIEコンポーネント使ってできんの?
そういうインタフェースないの?
MHTGenerator
>>10
だから単発質問スレ止めろっての。
19デフォルトの名無しさん:03/09/26 22:51
未解決上げ
上級 第1位 熾天使:セラフ (Seraph: 複数形 Seraphim)
    第2位 智天使:ケルブ (Cherub: 複数形 Cherubim)
    第3位 座天使:ソロネ (Throne)
中級 第1位 主天使:ドミニオン (Dominion)
    第2位 力天使:ヴァーチャー (Virtue)
    第3位 能天使:パワー (Power)
下級 第1位 権天使:プリンシパリティー (Principality)
    第2位 大天使:アークエンジェル (Archangel)
    第3位 天  使:エンジェル (Angel)
>>20
良いこと聞いた
ソロネから下の複数形は?
23デフォルトの名無しさん:03/10/04 06:36
ねーのか・・結局。
>>1
それだったら、3時間くらいで作れる。
2524:03/10/04 07:38
すまんmhtは知らん。
多分ソロネとプリンシパリティー以外はSつければいい気がする

(ソロネーズ?)
ドミニオンズDominion's
ヴァーチャーズVirtue's
パワーズPower's
(プリンシパリティーズ?)
アークエンジェルス Archangel's
エンジェルスAngel's
>>26
英語読みではthrones(スローンズ)だがな
28デフォルトの名無しさん:03/10/04 09:36

MAC用のフリーウエアで変換ソフトあったっけ。
winにはないんだw
さすがだねw
29デフォルトの名無しさん:03/10/04 10:59
>>28
OSに標準でついてるし<IE
                | ̄``''- 、
                |      `゙''ー- 、  ________
                |    ,. -‐ ''´ ̄ ̄`ヽ、_        /
                |, - '´ ̄              `ヽ、     /
              /               `ヽ、ヽ   /
             _/                    ヽヽ/
           / / /   /  /  /            ヽハ
          く  / /!   |   〃 _/__ l|   | |   |  |  | | ||ヽ
           \l// / |  /|'´ ∧  ||   | |ー、||  |  | l | ヽ
            /ハ/ |  | ヽ/ ヽ | ヽ  | || /|ヽ/!  |/ | ヽ
            / |  ||ヽ { ,r===、   \| _!V |// //  .!   |
            | ||   |l |ヽ!'´ ̄`゙   ,  ==ミ、 /イ川  |─┘
            | ハ||  || | """ ┌---┐  `  / //  |
            V !ヽ ト! ヽ、    |     !    / //| /
               ヽ! \ハ` 、 ヽ、__ノ    ,.イ/ // | /
    ┌/)/)/)/)/)/)/)/)/)/)lー/ ` ー‐┬ '´ レ//l/ |/
    |(/(/(/(/(/(/(/(/(/(/│||      | \  〃
  r'´ ̄ヽ            | |.ト     /  \
  /  ̄`ア             | | |  ⌒/     入
  〉  ̄二) 知ってるが    | | |  /     // ヽ
 〈!   ,. -'               | | ヽ∠-----', '´    ',
  | \| |   お前の態度が  | |<二Z二 ̄  /     ',
  |   | |               _r'---|  [ ``ヽ、      ',
  |   | |   気にいらない >-、__    [    ヽ      !
  \.| l.              ヽ、      [     ヽ    |
    ヽ|              \    r'       ヽ、    |
mhtの分解なら自在眼でできるけど
逆は知らん。
32デフォルトの名無しさん:03/10/05 19:06
Windows2000以上にはMIMEを扱うためのActiveXオブジェクトが既に入っているので
バラすのも固めるのも自由自在
VBSでIEぶん回せばおわりじゃん
34デフォルトの名無しさん:03/10/05 19:34
>>33
確かにそうだが
センスのないやり方だよ
35デフォルトの名無しさん:03/10/05 19:35
別にカプセル化しとけばいいじゃん

あとで暇になったらセンスのあるやり方と差し替えろ
36デフォルトの名無しさん:03/10/05 19:41
カプセル化?
オブジェクト指向最近覚えたばっかりっぽいな
3733:03/10/05 19:43
>>34
だったら自分で書けばいいじゃん。
わざわざスレを立てるような話だとはとうてい思えない。
38デフォルトの名無しさん:03/10/05 19:45
>>36
別に言い方はなんでもいいよ。

まず変換するっつー仕様を満たすのが先決
39デフォルトの名無しさん:03/10/05 19:48
じゃあ聞くけど

mhtの中身覗いてみた?
覗けばわかるよ。バイナリファイルじゃないんだよコレが
base64エンコーディングさえ理解してもらえば誰でもいけるし
どんな言語でもOK
>>36
カプセル化はオブジェクト指向の概念じゃありませんよ
41デフォルトの名無しさん:03/10/05 20:00
>>40

俺にそんなコトいわれてもな

おれは
>カプセル化はオブジェクト指向の概念
なんて言ってない

「カプセル化」なんて言葉がいまさら出てくるやつはオブジェクト指向覚えたてか?と考えただけだ
話の流れで自然に出てきた「カプセル化」なんて言葉に敏感に反応するやつはオブジェクト指向覚えたてか?
>>42
何が、くやしいのだ?
( ´,_ゝ`)
45デフォルトの名無しさん:03/10/05 20:26
>>39
別に言語はなんでもいいよ。

まず変換するっつー仕様を満たすのが先決
>>45
何を偉そうにしてるんだ?
だから、mhtの中身見たのかよ
単なるテキストファイルだよ
面白そうなのでやってはみるが
完成までに来週まで待て
今日が土曜日だったらよかったんだけどな
47デフォルトの名無しさん:03/10/05 20:43
>>46
別に偉くなくてもいいよ
ようやくSEXまでこじつけた女が
マンコ臭かったら腹立ちませんか?
もう悔しくて悔しくて
49デフォルトの名無しさん:03/10/05 20:58
>>48
別にクンニしなくてもいいよ。

まず挿入するっつー征服欲を満たすのが先決
>>49
お前ホントにわかっているのか?
臭いコーマンっていう奴を・・・

洗っても指の臭い2〜3日取れないんだぜ
挿入してピストン運動していても
その風でにおいが舞い上がって俺の鼻をくすぐるだけでもういや
この女のコーマンにパンチしたい

>>48
一緒に風呂入って洗ってやれ
>>51
だから根本的にわかってないな

あのな、洗ってない臭さじゃないんだよ

いわゆるクサマンというのは体臭と同じようなもので

できるかどうか知らんが治療しないと直らないレベルなのよ

においだって、ホント半端じゃないぜ
野菜食え
なんでこのスレでマンコの臭さを訴える?
55デフォルトの名無しさん:03/10/06 10:35
.       ∧_∧  / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
       ( ・∀・)< ちわー軽急便で〜す。
  -=≡  /    ヽ  \_____________
.      /| |   |. |      ) )
 -=≡ /. \ヽ/\\_  / ̄ ̄ ̄ヽ
    /    ヽ⌒)==ヽ_)= | (\/) |
-=   / /⌒\.\ ||  ||  |  > <  |
  / /    > ) ||   ||  | (/\). |
 / /     / /_||_ || ヽ___/
 し'     (_つ ̄(_)) ̄ (.)) ̄ (_)) ̄(.))
ie なんて使わないからイラナイ。
57デフォルトの名無しさん:03/10/09 17:56
>>39
base64じゃねーよアホか・・・
>>46
ふいてんじゃねーよ、こいつら・・・
話の流れで自然に出てきた「カプセル化」なんて言葉に敏感に反応するやつはオブジェクト指向覚えたてか?
MHTを分解・その1

#!/usr/bin/env python
import sys, os, email

def m2h(src, prefix='mesg'):
    root = email.message_from_file(src)
    n = 0
    table = {}

    for mesg in root.walk():
        if mesg.get_content_maintype() == 'multipart':
            continue
        n += 1
        filename = '%s-%04d-%s.%s' % (prefix, n,
                   mesg.get_content_maintype(), mesg.get_content_subtype())
        location = mesg.get('Content-Location', filename)
        table[location] = filename
        print location, '->', filename

    src.seek(0)
    root = email.message_from_file(src)
    n = 0
    for mesg in root.walk():
        if mesg.get_content_maintype() == 'multipart':
            continue
        n += 1
        payload = mesg.get_payload()
MHTを分解・その2

        if mesg.get('Content-Transfer-Encoding') == 'base64':
            payload = payload.decode('base64')
        elif mesg.get('Content-Transfer-Encoding') == 'quoted-printable':
            payload = payload.decode('quoted-printable')
        for url in table:
            payload = payload.replace(url, table[url])
        dst = file(table[mesg.get('Content-Location')], 'w')
        dst.write(payload)
        dst.close()

def main():
    if len(sys.argv) >= 1:
        for filename in sys.argv[1:]:
            if not os.path.exists(filename):
                sys.stderr.write('no such file: %s\n' % filename)
                continue
            prefix = os.path.splitext(os.path.basename(filename))[0]
            m2h(file(filename), prefix)

if __name__ == '__main__':
    main()

(おしまい)
>>60
GIF、JPEGなどのデータが壊れてしまうので、
dst = file(table[mesg.get('Content-Location')], 'w')
という行を、
dst = file(table[mesg.get('Content-Location')], 'wb')
のように、バイナリモードでオープンする様に、修正してください。
62デフォルトの名無しさん:03/10/20 06:42
↑じゃ無理だろ・・
大体、html→mhtはどうする?
クソスレは、下げましょうね。
64デフォルトの名無しさん:03/10/27 19:31
結局無理…?
>>50
すごいなー。
そんなにすごい女がこの世に存在するとは知らんかった。
作り話と違うよなー?
66デフォルトの名無しさん:03/11/06 16:58
57 名前:デフォルトの名無しさん 投稿日:03/10/09 17:56
>>39
base64じゃねーよアホか・・・
>>46
ふいてんじゃねーよ、こいつら・・・

↑はぁ?はぁ?はぁ?
お前が吹いてんだろ?
見たのか?mhtファイルをよ!
テキストエディタで覗けよ。
base64に決まってんじゃん↓
画像ファイルは全部こうなってんだよ。

From: <Microsoft Internet Explorer 5 で保存する>
Subject: =?iso-2022-jp?B?GsysRCdRj+AsyaEJndQTQf9OtBsjoQg==?=
Date: Thu, 6 Nov 2003 16:53:37 +0900
MIME-Version: 1.0
Content-Type: multipart/related;
boundary="----=_NextPart_000_0000_01C3A486.85DB98C0";
type="multipart/alternative"
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2800.1165

This is a multi-part message in MIME format.

------=_NextPart_000_0000_01C3A486.85DB98C0
Content-Type: image/jpeg
Content-Transfer-Encoding: base64
Content-Location: http://defs.cams-nas.com/hgmo/002.jpg
67デフォルトの名無しさん:03/11/06 23:55
もっとテンションあげていきましょう>ALL
sage
ほしゅぴたる
IE6にはない、mht保存
モジラに実装できないの?
72fujiansan:04/06/18 00:38
能書きたれてるヤツは、
->mhtのスクリプトだか何だかを早くここへ書け。
私は結果を利用させてもらいます。
変換ロジックを書いてください。
73fujiansan:04/06/18 00:45
若しくはBASE64で書け
HTMLを 表示しろ
MHTで 保存しろ
75fujiansan:04/06/18 00:49
やだよ
mhtに変換してもIEでしかみれないじゃん。それで満足なのか?
IE以外でも見られるが、仮にIEだけだとしてもRFCに載ってるんだから今後増えるだろ。。
>>77
「RFCに載ってるんだから」は根拠として薄いのではないかと。
Safariの次のバージョンで、保存形式に「Webアーカイブ」が選べるらしいね。
フォーマットは何なんだろう。
Outlook Express をインストールしていないと保存できにゃい…
裏技アンインストールを使って削除した場合ももちろん保存できず。
つまり、OEが必要ってことなのか…?
81デフォルトの名無しさん:04/07/26 02:07
age
>>77
IE以外って何か教えろハゲ。肝心なところをごまかすんじゃねえ
85デフォルトの名無しさん:04/09/27 02:36:16
まぁ結局あれだ
ビッグマウスしかいなかったってことか
86デフォルトの名無しさん:04/09/27 18:18:41
テンジクネズミとか?
87デフォルトの名無しさん:04/12/01 11:19:51
まぁ結局あれだ
ビッグマウスしかいなかったってことか
88デフォルトの名無しさん:04/12/08 11:05:47
html/jpeg/gif -> mht については ttp://www.gir-lab.com/ にあるソースでなんとなくわかったのですが、
Flash(*.swf)や動画(*.mpg , *.wmv) を mht に含めてしまうことはできないのでしょうか?
89デフォルトの名無しさん:04/12/08 11:19:01
メールの添付ファイルと同じような状態になるだけなので、
どんなフォーマットであろうと含めるだけならいくらでも出来る。
9088:04/12/08 13:07:43
>>89
レスありがとうございます!
IEの ファイル->名前を付けて保存->*.mht での保存だと、表示させているWebページ内のJPEGやテキストは*.mhtに含まれるのですがFlashは保存されないのです。
自分でswf2mhtみたいなのを作らないとダメなんでしょうか?
もしくはすでに先人が作っていればご紹介いただけませんでしょうか?

9188:04/12/08 13:58:14
連投すいません。いろいろグーグルで検索してみまして、
ttp://www.goupsoft.com/
が販売している'EzSaveMHT3.0'がFlash埋め込みのWebページをMHT保存できるということで購入しました。
早速Flashを埋め込んでいるページをMHTで保存してみましたところ、確かにMHTできたのですが、
その保存したMHTをIEで開くとグチャグチャの文字列が表示されるだけで正しくFlashが表示されません(TT)あうぅ…なぜ?
92デフォルトの名無しさん:04/12/08 16:16:06
単にIEが対応していないから。
それ以上でもそれ以下でもない。
疑問の余地など微塵もない。
9388:04/12/08 18:02:50
>>92
生成したMHTファイル(↓)からIEがswfを再構成できてないという事?


From: <Save By EZ Save MHT at http://www.goupsoft.com>
Subject:
Date: Wed, 8 Dec 2004 16:16:06 +0900
MIME-Version: 1.0
Content-Type: multipart/related;
boundary="----=_NextPart_000_0000_01C4DD41.385CB8F0"
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.2180
Product: GoUpSoft Inc. WebSite:http://www.goupsoft.com

This is a multi-part message in MIME format.

------=_NextPart_000_0000_01C4DD41.385CB8F0
Content-Type: text/html;
charset="shift_jis"
Content-Transfer-Encoding: 7bit
Content-Location: file:///C:/FlashEmbededWebPage.html

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=shift_jis">
<META content="MSHTML 6.00.2900.2523" name=GENERATOR></HEAD>
<BODY><EMBED src=SampleInput.swf width=500 height=500></EMBED> </BODY></HTML>
9488:04/12/08 18:03:35

------=_NextPart_000_0000_01C4DD41.385CB8F0
Content-Type: application/x-shockwave-flash
Content-Transfer-Encoding: base64
Content-Location: file://C:\SampleInput.swf

Q1dTBmLoBwB4nIS7dVyT7Rc/PmLECFEcqIQYdEoMSQlBBWkYMUFCehslAwQUUFIBJYWRIt2xjW5E
Rlj0RimhxOBBJaR+m8/3wY+/1y/8R1/32X3e5zrXOed9znXd+gOAdwEA9igAgPk5SJP66OgogpZO
 <<<中略>>>
/LSruDivDdT2x2e7NTPw6XqRW5LXQP97H3/GqaIxyCOGhEOT/xfHOT7brQ2CkOb/i+P9Z8y/9lz9
vzDm/61xjs92+3/ta/v3bLf/u6+n/f+TPyv4R+nngTz0v/MHgv4/EjE7hg==
9588:04/12/08 18:06:17
------=_NextPart_000_0000_01C4DD41.385CB8F0
Content-Type: text/html;
charset="iso-2022-jp"
Content-Transfer-Encoding: 7bit
Content-Location: file://C:\FlashEmbededWebPage.html

<EMBED SRC="SampleInput.swf" WIDTH="500" HEIGHT="500"></EMBED>
------=_NextPart_000_0000_01C4DD41.385CB8F0--

<<<終わり>>>
96デフォルトの名無しさん:04/12/09 09:40:42
OutlookExpressがインストールされていないとMHTは表示できないような
97デフォルトの名無しさん:04/12/21 12:52:32
関係ないけど、リッチテキストはもう終わったフォーマットでつか?
98デフォルトの名無しさん:05/01/19 14:20:32
>97
WinHelp内部で使われてるので、すぐには死なない。ヘルプの内容をコピーする時に使え
99デフォルトの名無しさん:05/01/20 08:50:26
結局IE対応変換ツールなるものは無いということか
100デフォルトの名無しさん:05/01/22 20:29:21
boundaryに設定する文字列が本文中に出てきたりしないのかな・・
101デフォルトの名無しさん:05/01/24 20:31:04
 
102デフォルトの名無しさん:05/01/24 20:35:36
本文中に出てこないパターンをboundaryに設定する仕様なんだが
103デフォルトの名無しさん:05/01/24 21:14:15
これでいいか、ぼけ
xdoc2txt
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
104デフォルトの名無しさん:2005/06/07(火) 12:58:54
age
105デフォルトの名無しさん:2005/06/11(土) 13:35:23
mhtの用途がIEしかないとかいってる奴がいるが
実はSHARPのZaurusが採用しているWebサイト保存形式がmht

結構便利なものだと思うが。
106デフォルトの名無しさん:2005/06/12(日) 17:59:26
>>103
そのソフト便利だな。
107デフォルトの名無しさん
>103
テキストだけじゃねーかボケ