Proxomitron フィルター作成スレッド Part8
Match = "$NEST(<!-- isweb auto-insert ((\* /)+)\1 -->,<!-- inserted by isweb server \1 -->)"
>>8 ありがとうございます
でも
>>7 にあるフィルタにその部分だけ入れ替えても無効ですね、、、
他の部分はどうしたらいいのでしょうか
Bounds の行を消す
ありがとうございました! urlの行も消しても問題ないですね
いや infoseek 以外のサイトでは機能しないようにする事で 処理に無駄がなくなるから url は残しておく でも Google キャッシュや Web アーカイブ経由でもフィルタされるように 簡略化した方がいいかも *.infoseek.co.jp/ にしてた自分は
ありがとうございましたあ 一応他の人のためエクスポートしときます [Patterns] Name = "Kill Infoseek ad banner" Active = TRUE URL = "*.infoseek.co.jp/" Limit = 3000 Match = "$NEST(<!-- isweb auto-insert ((\* /)+)\1 -->,<!-- inserted by isweb server \1 -->)"
あとこれは意義があるかは分からないけど Limit は 16 の倍数で統一するのが好き このくらいのフィルタなら 4096
((\* /)+)\1 これって何か意味あるの?
おそらく$TSTのつもりだったんだろう
そうそう $TST の付け忘れです、って付けたら利かなくなったし
*/ と /* で逆だったのか気付かなかった今まで何やってたんだ
というわけでもう面倒なので両方のパターン並べます
>>13 さん直しといてくださいごめんなさい
Match = "$NEST(<!-- isweb auto-insert \*/ -->,<!-- inserted by isweb server /\* -->)|"
"$NEST(<!-- isweb auto-insert -->,<!-- inserted by isweb server -->)"
いや、直さなくても問題ない。 オミトロンの表記としてはおかしいが誤動作はしないからOKだ。
逢魔時さんのinfoseek killer1.0とパソコン遊戯さんの"End with </html>"の フィルタ使えばきれいに消せるのだが・・・。 ここでは、あえて言わないがスジなのか?
そんなゴミ使うくらいなら自分で書いたほうがマシ。
このスレにあるフィルタも大半はゴミ。
パソコン遊戯のほうはマトモだが逢魔時のは本当にゴミじゃないか。 正規表現無茶苦茶じゃん・・。
例えばこのフィルタは [Patterns] Name = "ActiveX auto download Killer2" Active = TRUE Bounds = "<object *>" Limit = 256 Match = "<objects \1|* codebase=(^\wshockwave\w).(dll|cab|exe) \2 >" Replace = "\n<!-- ActiveX Killer2 -->\n" このフィルタとまったく同じ動作になる。 [Patterns] Name = "ActiveX auto download Killer2" Active = TRUE Limit = 256 Match = "<object *>" Replace = "\n<!-- ActiveX Killer2 -->\n" これがゴミじゃなかったらなんなのさ。
あれ? <objects って何だ?
>>22 白背景を灰色にするのは色々詰め込んでるうちにこうなった
Name = "Make White BgColor Gray"
Active = TRUE
Multi = TRUE
Limit = 1024
Match = "(<[a-z][^>]++bgcolor=)\#$AV(white|#+f[a-f]f[a-f]f[a-f]|#+fff)$SET(\#=#efefef)|"
"(($NEST({,})|<[a-z][^>]++style=$AV(*)*>)&&"
"((*background(-color)+ : [^;]++)\#"
"(rgb\( [#250:255] , [#250:255] , [#250:255] \)|white|#f[a-f]f[a-f]f[a-f]|#fff)"
"$SET(\#=#efefef)(^[0-9a-f]))+{1,*}\#)"
Replace = "\@"
unescape()で括弧内の変換されているのを元に戻すフィルターをオミトロンで作成できるでしょうか? こういう風にしたいのですが unescape(%64%38%33%64%39%38%38) ↓ unescape(d83d988)
Match = "unescape\(([^)]+)\0\)" Replace = "unescape($UESC(\0))"
>>29 ありがとうございます。おかげでちまちまやりながらほとんどできました
javaスクリプト?でリンクを表示させてるのを普通のリンクに戻したいのですが
Match = "\('<a\sh'\s\+\s'ref\'\s\+\s\'\="(*)\1\'\s\+\sunescape\(\'([^)]+)\0\)\s\+\s\'\">\'\);"
Replace = "<a href="\1$UESC(\0)">"
('<a h' + 'ref' + '="/test/' + unescape('%64%38%33%64%39%37%2e%68%74%6d%6c') + '">');
↓
<a href="/test/d83d97.html'">
↑ここの「'」がどうしてもマッチしてくれないのですが・・・
\0の代入に巻き込まれてるとかなんですかね・・・・
>>22 [Patterns]
Name = "Background Sober"
Active = TRUE
URL = "$TYPE(htm)|$TYPE(css)"
Limit = 256
Match = "background-color : (white|#fff(fff|(^(^[^0-9a-f]))))$SET(#=background-color:#f5f5f5)|"
"bgcolor=("|)\0(white|#fff(fff|(^(^[^0-9a-f]))))$SET(#=bgcolor=\0#f5f5f5)|"
"<body(^*bgcolor=|*background(-color|) :)\0>$SET(#=<body bgcolor="#f5f5f5"\0>)"
Replace = "\@"
bodyタグがスクリプト内に書かれてたりするとたぶんバグる。
そんなサイト見たことねえけど。
好みでマルチ付けれ。
(参考:think氏の「bgcolor: Replace white by gray」)
>30 Match \('<a\sh'\s\+\s'ref\'\s\+\s\'\="(*)\1\'\s\+\sunescape\(\'([%a-z0-9]+)\0\'\)\s\+\s\'\">\'\);
>>32 ありがとうございました、おかげで動作するようになりましたm(__)m
もうちょっとやってみた。\s は空白に変更してみた。 >30のサンプルを見る限りでは、Boundsを使っても問題ないと判断した。 Bounds = "<a\s[^>]+>" Match = "*h['+ ]+r['+ ]+e['+ ]+f['+ ]+=$AV(([^']+)\1\' \+ unescape\(\'([%a-z0-9]+)\0\'\) \+ \')*"
>>34 こちらでも動作しました
整理してくれてありがとうございます
この場合は$AVは使わないほうが。
37 :
名無しさん@お腹いっぱい。 :2007/12/06(木) 23:09:11 ID:R8U55YGP0
頭が悪いんだと思う ちょっと専門外だから精神科か脳外科に行ってくれ
俺の環境では、Infoseek ad bannerはバッチリ消えてる。
41 :
名無しさん@お腹いっぱい。 :2007/12/06(木) 23:37:30 ID:R8U55YGP0
>>40 マジ?どんなフィルタ入れてるか教えてほすい
42 :
13 :2007/12/06(木) 23:43:11 ID:ELyWchZw0
ほんとだ、消えないですね urlのところを削ってもダメだ
ソースぐらい見ろよ
>36 JavaScriptは専門外なので、そのへんは知識のある人にまかせます。
>>27 いただきました。 ほとんどのサイトで有効になりました。
俺もちょっといじってみたけど、infoseekアドレス以外のinfoseekバナー消せないな、、、 だれか教えてくれー
topics.news.www.infoseek.co.jp
Limit = 24 Match = "<div(^(^\sid="trackback">))$STOP()" Replace = "<div style="display:none""
51 :
49 :2007/12/08(土) 17:15:16 ID:IeJgHuLc0
>>50 早速ありがとうございます。
活用させていただきます。
>52 「オンラインお問い合わせ窓口」ってのに直接意見を書いた方がいいかも。 名前必須だけど、書きたくなければ適当にごまかしてもいいだろうし。 URIを示してtitle要素くらいきちんと書けとでも言えば対応してくれるかもしれん。
>>53 ありがとうございます!やってみます!
ってwまじかー
上手い方法が思い浮かばなかったから、デキるお兄さんに一度作ってもらって
勉強させて貰おうかと思ったんだけど…
スマートにやる方法はない、がFAってことでFAでしょうか?
>>55 <P CLASS="entry_title cfff f14"> のとこを変数に取得してtitleに流し込めばいいんじゃない
>>54 [Patterns]
Name = "kill weather.goo itiban ue no ad"
Active = TRUE
URL = "weather.goo.ne.jp/area/[0-9]+.html"
Limit = 4000
Match = "<!--ad_superbanner--> * <!--ad_superbanner-->"
"$STOP()"
>>56 その「titleに流し込む」方法が勉強不足故かわかりません…。
<title> から <p class="entry_title hogehoge /p>辺りまで全部マッチ範囲に含めれば
簡単に可能なのは分かるんですが、ちょっとスマートじゃないなと思いまして。
ありがとう! スクロールせずに天気が見られるようになりました
>>57 取り込み専用のフィルタ作って、グローバル変数に代入しろってことだろう。
それがスマートかどうかは疑問だが。
1、titleタグを消す 2、pタグの内容を取り込み、その場所にtitleタグを挿入する。 で良いかと。 htmlの文法違反になるけどブラウザはちゃんと認識してくれるはず。 htmlの文法を守りたいならjavascriptでtitle要素を置換。
やってみたけど、titleの中身を置き換えるのがうまくいかない。 やはり上から順にフィルタリングさせる以上は無理か。 Name = "New HTML filter1" Active = TRUE Multi = TRUE URL = "www.smashbros.com/jp/" Limit = 64 Match = "<TITLE>[^<]+</TITLE>$TST(smashbros=?*)" Replace = "<title>$GET(smashbros)</title>$SET(smashbros=)$STOP()" Name = "New HTML filter2" Active = TRUE URL = "www.smashbros.com/jp/" Limit = 256 Match = "(^(^<P CLASS="entry_title cfff f14">([^<]+)\1</P>))$SET(smashbros=\1)$STOP()"
Limit = "128" <TITLE>*</TITLE>$URL(*jp/index.html) $SET(0=<TITLE>トップペ―[ジ - スマブラ拳!!</TITLE>)$STOP()| <TITLE>*</TITLE>| ( <P\sCLASS="entry_title cfff f14">\1</P>| <IMG\sSRC=$AV(../images/common/(title|text)*)[^>]++ALT="\1"> )\2 $SET(0=\2\n<TITLE>\1 - スマブラ拳!!</TITLE>)$STOP() Replace = "\0"
リンクが貼られたページに、リンク先のタイトルを表示することってできますか?
Ajax使えば何とか 結構重いと思うけど
>>57 JS版とHTML版の2タイプ。
[Patterns]
Name = "smashbros.com: Replace Title JS.ver. [2007/12/09] test1"
Active = TRUE
URL = "$TYPE(htm)www.smashbros.com/jp/music/"
Limit = 256
Match = "(^(^$NEST(<p\s[^>]++class=$AV(entry_title(\s*|))[^>]+>,([^<]+)\0,</p>)))$STOP()"
Replace = "<script type='text/javascript'>"
"document.title="\0";"
"</script>"
Name = "smashbros.com: Replace Title [2007/12/09] test1"
Active = TRUE
URL = "$TYPE(htm)www.smashbros.com/jp/music/"
Limit = 256
Match = "$NEST(<title>,\1,</title>)$SET(Title=\1)|"
"(^(^$NEST(<p\s[^>]++class=$AV(entry_title(\s*|))[^>]+>,([^<]+)\1,</p>)))"
"$SET(0=<title>\1</title>)$STOP()"
Replace = "\0"
どっちかというと、スマートなのはJavaScriptを使う方ですね。
>65 HTML版の方を試してみた。 <title>X(エックス):トンネルシーン</title><P CLASS="entry_title cfff f14">X(エックス):トンネルシーン</P> 書き換え後のソースは上のようになるけど、 ・ソース中では、head要素の中からtitle要素が消える。 ・DOM Inspectorで調べると、書き換え後の位置にtitle要素がなかったことになっている。 ・DOM Inspectorで調べると、head要素内にtitle要素があるものとみなされている。 Firefox/2.0.0.11では以上の結果になった。 title要素は結局1つしかないからこういう結果になったけど、 こういう場合の対応はUAに依存するかもしれないね。 時には強引な手段も使えるということがわかった。
ちらしの裏にでも書いてくれ
最近 overtureの広告がどんどん多くなってきてる・・・ いろいろ試してみてもぜんぜん消えない いたちごっこだな
>>64 Ajaxじゃ無理。 jsの同一鯖制限に引っかかる。
N天堂に変更依頼メール出すのが一番スマートだとおも
>>68 広告はほっといて、アクセス自体カットしちゃえば。
初めからついてるフィルターの中にそういうのあるからリストに登録しとけ。
斧でDL制限に引っかかったときのエラーページにローカルの時計を表示させるとかできますかね
エラーページ? というか○○秒以内にどうこうのページには、アクセス時刻あるじゃん。
>>72 jsで出来る。 とほほのjs編に現在時刻を表示するサンプルコードがあるよ。
>>69 $RDIRを使えば何とかなるかと
Match = "\h/proxo-rdir/\0"
Replace = "$RDIR(\0)"
ってな感じで
その手があったか。 そいや
>>72 も$DTMで出来るかも。
ああ、違うわ、$DTMじゃページの読み込み時刻が表示されるだけか。
文字化け「潤オ」を発生させないフィルタきぼん
Match = "潤オ" Replace = ""
プロバイダに規制がかかり、書くためにp2.2ch.netを使用しています p2は使いにくいので、読むときはp2を使わずに閲覧して 書き込み時のみ勝手にp2に送信するようにしたいのですが 有志の方よろしくお願いします
2chの閲覧は何でしてるの?普通のブラウザならオミでも何とかなるかも 専用ブラウザならスレ違い
>>81 ブラウザはプニルです
けど、オミトロンって専ブラでも使えるんじゃ?
>>82 ocn全規制11日目
結局p2買ってオミトロンなどで工夫するしかないですよね
>>83 専用ブラウザはDAT直読みしてる
で、それを加工してHTMLにして表示している
これ以上は自分で考えてくれ
>>84 それは画像じゃなくてFLASHだから、プレイヤーを逆コンパイルして
その広告部分を非表示にするJSを書けばおk
サイトのフォントを強制的に指定(例えば[Meiryo mod 12pt AA])するフィルタお願いできませか?
IEのオプションで可能なんじゃないか。
>>89 ある程度は可能なんですがサイト側でフォントを指定しているとそっちを優先されてしまうんです。
ここはオミトロンの出番かなと想いまして。
!important
ユーザースタイルシート!
常時フォントを固定すると、何かと支障がありそうだけどな。 必要なときだけそうしたいならばオミトロンを組み合わせればいいけど、 常時固定なら * { font-family: "Meiryo mod 12pt AA", sans-serif !important; } これでいい。
>>90 ユーザ補助の指定されたフォントスタイルを使用しないってやつ
>>90 サイト側でフォント指定しててもIEオプションで強制的に指定できるんだよ。
全般でフォント指定してから、ユーザー補助で。
「Web ページで指定されたフォント スタイルを使用しない」を有効にすればいい。
かぶったようです。 ども。
強制的にリンクの文字列の前半だけクリックすれば_selfで開き、 後半を_blankで開く。って出来るでしょうか 例えば、<a href="xxx.html">abcd株式会社ご案内</a> のような場合に、 abcdをクリックすると_selfで開いて、株式会社をクリックすると_blankで開く。 $NEST(<a\s[^>]++href=$AV(\0)[^>]+>,(????)\1 \2</a>) こういう形だとabcdは1バイトが4つなので(????)一応できるのですが、 「abc株式会社ご案内」のような場合は株にかかって文字化けしてしまいます。 2バイト文字判定が必要でしょうか。
>>97 そもそも「前半」と「後半」を貴方がどう定義してるのかわからんから、どうもこうも言いようがないよ。
>97 悪いことは言わないから、 「前半」とか「後半」とかくだらないことは考えない方がいい。 対策(どちらか片方だけ実行すればよい) a. アンカーの開始タグから終了タグまでマッチさせてtarget="_self"にさせ、 その直後、target="_blank"にしたアンカーも作る。 b. アンカーの開始タグにマッチさせてtarget="_self"にするだけ。 新規ウィンドウで開きたければ、Shiftを押しながらアンカーをクリックする。 タブブラウザであれば、マウスのホイールクリックでもよいかもしれない。
「前半」と「後半」に分けて色も変えたら面白い。
<span>鬼畜すぎるヒーロー<span>.flv (´・ω・`) span
きっと別窓で開きたいときは前半 同じ窓で開きたいときは後半 ってしたいのだろう Sleipnirだったら設定いじれば右クリックしたまま左クリックで別窓で開く設定にできるよ。
>>103 から釣り針が垂れてるみたいなのだけど、どうすべき
漏れならアンカーの頭に[bl]とか入れてそちらをブランク専門にするとかかな 長い文は読みづらいだろうけど
>>103 ( ゚д゚)
(つд⊂)ゴシゴシ
(;゚д゚)
(つд⊂)ゴシゴシ
_, ._
(;゚ Д゚) …?!
>>107 アンテナサイトとかでは良く使われてる方法だな
リンク頭に「*」を挿入してそちら側だけ別窓強制とか
_blankを取ってしまって、新規ウインドウはホイールクリックすればいいだけだろ。 自分でサイト作る訳じゃあるまいし、操作性で他人に気を使う必要もないからな。 自分でサイトを作るなら最初からそう書けば良いだけだからオミトロンは関係ないし。
table#mbEnd { display: none; } DOM Inspector使えば簡単。
>>112 稚拙ですが、こんなでどうでしょう?
[Patterns]
Name = "google AD Killer"
Active = TRUE
URL = "www.google.(com|co.jp)/search?"
Limit = 8192
Match = "$NEST(<table\s,[^>]++id=$AV(mbEnd)*,</table>)"
"|$NEST(<div\s,[^>]++id=$AV(tpa[1-9])*,</div>)"
>>110 こういう細かな自分流使い勝手を良くして行くのがおみとろんの楽しさだと思うが
他人にとっては無意味な変更であってもね
>>117 ありがとうございます。
これから自分でもバリバリフィルタリングするぜ!
>>119 インターネットのキャッシュを消してみたり他のフィルターを切ってみたりしてみましたがやっぱりできませんでした。
でもきっとこっちに問題があると想うので引き続き調査してみます。
ありがとうございました。
うちのグーグル様用フィルタ [Patterns] Name = "Google | ad::hide + simplize 20070524" Active = TRUE URL = "www.google.[^/]+/ $TYPE(htm)" Limit = 100 Match = "(id=$AV(tpa(1|2)|guser|mbEnd))\1[^>]+>|" "(<br clear=all><table)\1[^>]+>" Replace = "\1 style="display:none">"
>>114 >>121 ごめんなさい、こっちの設定でGoogleカレンダーとかGmail用にgoogleをバイパスさせてました^^^;
>>115 だがそれがわざわざオミトロンである必要もあるまいさ。
オミトロンはあくまでも選択肢の一つでしかない訳だしな。
労力に見合った見返りを考えると更にね。
アンカーの別ウインドウの部分を開くを選んでクリックも、
アンカーをホイールクリックも作業量的には変わらないし、
むしろ後者の方が狭いアンカーをクリックする必要が泣く適当で良い分楽とも言える。
その程度の事を、汎用的な操作への慣れを捨ててまでやる必要は無いと思うよ。
他人や公共のPCを使う際に、わざわざ使い慣れず不便な思いをする慣れを選ぶのは損。
>>123 それは、「ホイールクリックが使える」場合限定の話だからね
ノートPCだと、該当クリックが物理的に存在しない事があるんだよ
だからこそ「他人にとっては無意味な変更であってもね」となる訳だ
どれが「overture広告」なのかわからんが、 とりあえず以下をAdlistに入れたらだいたい消えた。 click.linksynergy.com/ img.kakaku.com/images/(^productimage/) img.kakaku.com/jpeg_gif/bbs/ kakaku.com/images/bb/ kakaku.com/prdsearch/
>>124 のついでにStage6の広告消し。
[Patterns]
Name = "Stage6: ad killer [2007/12/20]"
Active = TRUE
URL = "www.stage6.com/ $TYPE(htm)"
Limit = 4096
Match = "<div\s[^>]++id=$AV(ad_container) & $NEST(<div,</div>) $STOP()"
>>127 それで消えます?
ページ右側にある
--------------------
-広告-
アップルiPod touch
ストア限定。送料無料。ギフト包装無料。メッセージ刻印無料。
store.apple.com
BOSEのiPod用スピーカー
新発売!iPodのための高音質サウンドシステムがポータブルに。
-------------------
とか表示されたままになりますけど、これを消したいんです。
ソース見ると
http://rc20.overture.com/ ○○○とリンクがあるんでこれをadlistにいれてもやっぱり消えません。
>129 @-moz-document domain(kakaku.com) { div#mainRight > div#module { display: none; } } 価格.comも(amazonと同様に)すぐマークアップを変えるので、 フィルタは書くだけむだ。 スタイルシートでやった方がいい。
自分もこれはスタイルシートでやっちゃうけれど、ソースをみると広告欄はdiv要素 #mainRight→.prTitle→#listing_ad と #listing_ad_top だからこれに一致させるものをつくって <div\s(id\=\"listing(_ad|_ad_top)\"|class\=\"prTitle \"|id\=\"mainRight\")> ※右側の広告欄はどこから消すかで選ぶ これを表示させないように変換、<div style="display:none"> [Patterns] Name = "kakaku" Active = TRUE URL = "kakaku.com/item/$TYPE(htm)" Limit = 256 Match = "<div\s(id\=\"listing_ad_top\"|class\=\"prTitle \")>" Replace = "<div style="display:none">" 場合によってはmainLeftのテーブルの長さを長くする。消えることは消えるけどフィルタの記述の自信全くなし
>>123 「作成スレッド」なんだから練習問題とでも思っとけばいいんだよ。
必要のないこと。 めったに使わない他人の環境を心配する。 必要なこと。 ホイールクリックがない人や、 あってもルーペツール起動とか割り振っててそれがどうしても必要な人など、 色々な人がいること。
てゆうか
>>123 の理屈でいくとホイールのついたマウスを捨てるべきなのではw
違うだろ。 ノートPCを捨てろって結論だ。
136 :
名無しさん@お腹いっぱい。 :2007/12/28(金) 15:48:23 ID:KdEm04DM0
あれ?
アフィは別にうざくないと思うがなんで消したいんだろう。 ネットの活性化にも繋がるし率先して推奨したいくらいなんだが。
超適当
pt.afl.rakuten.co.jp/*\?url=([^&]+)\0 $JUMP($UESC(\0))
hb.afl.rakuten.co.jp/*(item.rakuten.co.jp[^&]+)\0 $JUMP(
http://$UESC (\0))
他にもURLあれば教えて欲しい
あと、m=にあるURLは何じゃろ?
あーモバイルのmか
線引きが難しいのだがどこまでがアダルト広告になるの? 正直全部エロ関係にしか見えないのだが。 女しかいねぇ。
ワロタ
ひどいなこれ。全部アダルトに見える。 あと、マッチさせようという考えはおそらくむだ。他のブログで誤爆する。 対象のブログのみURLマッチさせる場合はその限りでないけど。 @-moz-document domain(blog30.fc2.com) { a[href^="http://item.rakuten.co.jp/"], a[href^="http://bookweb.kinokuniya.co.jp/"], a[href$="/ref=nosim"], img[src^="http://hbb.afl.rakuten.co.jp/"], img[src^="http://bookweb.kinokuniya.co.jp/"] { display: none; } } フィルタで消したいなら、 「猫のオススメ」とその周辺の div にマッチさせて style="display: none;" を書き加える。 フィルタで消すのは面倒なのでCSSをおすすめする。
これはひどい
148 :
143 :2007/12/30(日) 07:11:23 ID:H8pgehG20
フィギュアまではOKで。
広告の中身が何かまで調べさせたら膨大な負荷をかけることになりそうだが。 しかもフィルタリングしたところですべて思い通りにいくとは到底思えない。 そこまでやる気になる人がいたらどうするのか教えてもらいたいくらいだ。
ajax使ってリンク先の情報から判断するフィルタを作ることは可能だが実行時の重さが とんでもなくて速攻で削除されるフィルタになるな。 画像を1つ1つ登録していくタイプの リスト型フィルタでなんとかするのが一番現実的。 これなら既存のフィルタでも出来るし。
973 :名無しさん@お腹いっぱい。 [sage] :2007/11/25(日) 16:27:44 ID:nJ1OmcI/0
http://nekoare.blog30.fc2.com/ このページのアダルト広告だけカットしたくて簡単なフィルタをかけているのですが
これだと1個は表示されてしまいます。
もう全部アダルトってことで画像非表示にしちゃえよ
先ずは、どれがアダルト広告に該当「しない」のかから教えてもらわないとどうしようも無いな
155 :
せっ☆マ ◆wwwwWwWWWw :2007/12/30(日) 17:33:04 ID:vZWb8AcI0 BE:432452148-BRZ(10002)
In = FALSE
Out = TRUE
Key = "URL: add 2ch sid"
Match = "
http:// ([^\.]+)\0.2ch.net/test/read.cgi/([a-z0-9]+)\1/([0-9]+)\2/.*"
Replace = "$JUMP(
http://2ch.net/ )"
助けてください
2ちゃんねるのスレッドを開こうとすると過去ログを表示させるフィルタ作成中で
今はテスト動作でJUMPさせていますが
まったく動作しません。なにがいけないんでしょうか?
>>155 おまえの正規表現は適当すぎる。 適当に書いて動くわけがない。
基礎からやり直せ。
文字クラスの中のドットはエスケープ不要だと思うよPerlでは。
>>158 サブドメインに\とか何ワケワカメなこと言っちゃってんの?
161 :
せっ☆マ ◆wwwwWwWWWw :2007/12/30(日) 21:49:49 ID:vZWb8AcI0 BE:540564858-BRZ(10002)
すまんなんとか置き換えはうまくいきました ありがとうございます Perlやらと全然違うのに気づきませんでした 立てつづけに質問になって申し訳ないですが proxomitronでgzipを自動で解凍してくれると書いてありますが どうのような条件だと解凍してくれるのか分かりません 教えてください
a
163 :
名無しさん@お腹いっぱい。 :2007/12/30(日) 21:55:35 ID:Nx1MqhmG0
a
ここはニュー速ほど親切じゃないぜ。 泣く子も騙す天下のソフト板だ。
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: HDD killer killer (out)"
Match = "
http:// (www.gigigi.net|1230.jpg)"
Replace = "\k"
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: HDD killer killer v2 (out)"
Match = "
http:// (([^/]++.|)gigigi.net|59.106.13.175)"
Replace = "$ALERT(HDD killer was Blocked.)$LOG(RHDD killer was Blocked.)$JUMP(
http://yahoo.co.jp/ )"
IPアドレスで指定されたら困るから事前に対応。
\k使うとオミの画像を保存するか聞かれてうざいからヤフーに飛ばすようにした。
一個上のレスすら見ないとは・・・
ロダ自体は普通のロダだろ? 別の場所に転載されたら終わりじゃん
本体は別にあるのか、解析するのめんどくさ。。 パス。
中身はただのスクリプトか?
>167に行ってその画像のMIMEを見たら、image/jpegだった。
>171はその画像に転送する。HTTP/1.1 302 Found + Locationヘッダ。
ソースを見るとJavaScriptがある。中に奇妙な文字列。
あとは怪しげなコメントと oncontextmenu="return false;" がある。
ttp://web-sniffer.net/ ソースを見たい人はこっちへどうぞ。URLをフォームに入れてenterするだけ。
>>169 見ても分からない癖に態度だけはデカいんだな
そのデカさが脳みそになればよかったのにね^^
>>175 お前は煽るだけで一切何の役にも立ってないチンカス野郎だボケ。
コピペですまん。
243 名前: AV監督(愛媛県)[] 投稿日:2007/12/30(日) 21:18:08.35 ID:X08PgMDX0
スレタイ:【ブラクラ】HDDをフォーマットするWebサイト登場【ウイルス】
本文:
132[名無し]さん(bin+cue).rar [sage] 2007/12/30(日) 21:04:24 ID:ZdkjaBJz0 (PC)
//www.gigigi.net/up/img/1230.jpg
相当やばいサイト発見(´・ω・) ス
画像を表示後にアラートでエラー警告を表示して
25回目のアラートでC以降のHDDのフォーマットや
システム関係などのファイル消去?が実行されるbatファイルをスタートアップにダウソさせようとする(´・ω・) ス
その後アラートで再起動催促、アラートを閉じ続けるとアミララ関係の有害ページへ行く(´・ω・) ス
ほんとだ、ただのjsだね。 セキュリティに自信の無い奴はjs切っとけばおk。 IEコンポ系以外のブラウザなら何もしなくてもおkかも。
該当スレを見たところ 単にファイル消去やフォーマットが書かれたbatファイルをスタートアップにDLさせようとするだけみたいだな ダイアログ消すためにEnter連打とか馬鹿な事してない限りDLの時点でバレバレの罠っぽい
>スタートアップにDLさせる これ嘘じゃね?フォルダの指定は出来ないだろ VMwareで一々試したけど、ただのホワイターをDLさせようとしてから、 古典的ブラクラが発動するだけのゴミだったよ
182 :
名無しさん@お腹いっぱい。 :2007/12/31(月) 06:45:32 ID:+qF4dZg40
tesutesu
noscriptは入れておくべき
URL = "203.131.199.131:[#8000:8100]/ $TYPE(htm)"
yahooのトップがうざくなった。
Match = "$LST(YahooAD)" ↓ Match = "<&$LST(YahooAD)" こうするだけでかなり早くなるぜ。 >中の人
ヤフーTOPのデカいFlashだけを消すフィルタ。
[Patterns]
Name = "Yahoo: Big Flash Killer - Top Page (08/01/01)"
Active = TRUE
URL = "(www.|)yahoo.co.jp(:80|)/((^?)|index.html|[?#])"
Limit = 8192
Match = "<div\s[^>]++id=$AV(brandpanel) & $NEST(<div,</div>) $STOP()"
Replace = "<!-- Flash killed by proxomitron -->"
http://www.yahoo.co.jp:80/?proxomitron
[Patterns]
Name = "Yahoo: Kill TopPage ad [2006/06/04]"
Active = TRUE
URL = "(www.|)yahoo.co.jp/(index.html[?#]+|[?#]|(^?)) $TYPE(htm)"
Limit = 8192
Match = "$NEST(<table\s,*"
"(href=$AV((
http://rd.yahoo.co.jp/toppage/center/*|/r/ (ubz|udm|upr|pl|lpb))\0)|"
"<img\s[^>]++src=$AV((
http://img.yahoo.co.jp/*/centerbox/* )\0))"
"*,</table>)|"
"<!-- (TopLink [^>]++)\0 -->*<!-- TopLink end -->|"
"(<!-- TRB -->)\2"
"$SET(0=Topics)"
"$SET(1=</table></table></table></table><table style="display: none">"
"<table style="display: none"><table style="display: none">"
"<table style="display: none">\r\n\2\r\n)"
Replace = "\r\n<!-- Killed Yahoo TopPage ad: \0 -->\r\n\1"
これが使えなくなってる('A`)
そりゃそうだ
ナデナデ ナデナデ ナデナデ
ナデナデ ナデナデ
∧_∧
.∧_∧( ・ω・)∧_∧
( ・ω・)U)) .(・ω・ )
⊃))
>>190 ((⊂
.∧_∧∩))((∩∧_∧
( ) .( )
ナデナデ ナデナデ ナデナデ
前のYahoo広告フィルタは削除したほうがいい?
195 :
せっ☆マ ◆wwwwWwWWWw :2008/01/01(火) 18:08:50 ID:SIHdDVRE0
>>195 それなら昨日ニュー速に書いたぞ。 犬にちんこ噛まれちゃったスレッドな。
>>198 [HTTP headers]
In = FALSE
Out = TRUE
Key = "User-agent: test (out)"
Replace = "Proxomitron de filter sitayo."
これ入れてやほー見たら酷かった。
>>198 わざわざIEで見れないようにサイトを作っている奴が言ってもただのギャグだなw
Gecko系使ってる奴にロクなやついないよな。 ぷにるが一番。
>200 application/xhtml+xmlに対応していないUAが悪いだけだと思うけどな。 application/xhtml+xml(IEにはtext/html)で提供している者として弁護しておく。
>こっちだって開発中はGeckoエンジンでUA判別しとったっちゅーねん。 そこが理解できないアホがエンジニアやってるかよ。なめんな。でかい会社なめんな! 手足拘束されて猿ぐつわまでされた状態で開発してるほうの身にもなってみろ!!! だってさ
>>198 これは痛いな・・・Yahooのデザインがクソかどうかはさておき、言ってる事がアホすぎる・・・。
インターネット(笑)に詳しくなったつもりの専門学校生の意見みたいだ。
現状のポータルサイト(を目指すサイト)が何を基準に設計・デザインしてるか知らんし
分からんって事は、仕事なんかした事無いんだろ、多分。
そいつの話題はもうやめような。 こういう構ってちゃんの相手してたらきりが無い。
じゃあおみとろんスレらしく、Gecko系のありとあらゆるUAを 新Yahoo!のUA判別に対応したUAに変更するフィルタでも書こうか
全部FireFoxにすりゃいいだけじゃん
210 :
名無しさん@お腹いっぱい。 :2008/01/03(木) 13:57:34 ID:gGLmCZXd0
皆様、新年明けましておめでとうございます本年もよろしくお願いいたします。 普段はロム専なのですが、如何とも致したく皆様のお力添え願えませんでしょうか。 恐れ入ります、さっそくですがProxomitronを使うとyahooにoperaだと ログイン出来ませんFireFoxeだと出来るのに何故なんでしょうか。
yahooの中の人に聞いてくれ。
バイパスすれ
>>210 知ってるが、おまえのOperaが気に入らない。
FireFoxe
ファイヤーフォクセ
ヤフオクのPRを除去するフィルタとか自動ログインとかの詰め合わせフィルタは無いのでしょうか?
ぷろくそぉみとろん
Yahooのトップページのみ「文字のサイズ」を大にするフィルター をお願いします。
IEの文字大ってどういう仕様だったっけ
infoseekの <!-- isweb auto-insert --> の記述が変わった。 ヘッダースタート <!-- isweb auto-insert */ --> ヘッダーエンド <!-- isweb auto-insert 1.6d --> フッタースタート <!-- isweb auto-insert --> フッターエンド なし うう。今まで一個のフィルターで両方消せたのに。 </html>以降を \k するように改造しないと。
マジか・・・タチが悪いな・・・
1個のフィルタで十分だが。
>>222 「|」でくっつけて無理矢理「ほら、1個のフィルター」
という方法でないなら、教えて欲しいです。
今朝作ったinfoseekのやつ Match = "(<body*>|</html >)\0 <!-- isweb auto-insert * --> $NEST(<div *>,</div >)" Replace = "\0<!-- proxomitron -->"
解ったから死ねよカスw
>>226 そう思うなら教えてやれよ。天才君。
本当は図星をつかれて「オマエのカーチャンデベソ」て逃げてるだけなんだろwwww
なんでID変えてまで煽る必要があるんだろ?
せっ☆マはどこで見てもウザいな
そいつにニュー速で教えてやったのに見逃してやんのw
解ったから死ねよカスw
234 :
名無しさん@お腹いっぱい。 :2008/01/05(土) 20:54:51 ID:ij7dVkVh0
フレッツ・スクウェアv6がバイパスしてもみられないようだけど、何とかならないかな?
なるよ。
236 :
名無しさん@お腹いっぱい。 :2008/01/05(土) 22:20:01 ID:Nyi7qDb30
フレッツ・スクウェアv6みる方法教えて下さい
>>236 プロキシ設定でHTTP以外のプロトコルにもオミトロン通す設定してるだろうからそれを解除しろ。
「このプロキシを全てのプロトコルに使用する」 みたいなとこにチェックが入ってたら外せ。
んでIEでそのサイト行ってActiveXインスコすれば見れる。
238 :
名無しさん@お腹いっぱい。 :2008/01/05(土) 22:56:33 ID:Nyi7qDb30
ありがとう、うまくつながりました。
俺ってすごいよな。
自画自賛きたこれ
241 :
名無しさん@お腹いっぱい。 :2008/01/05(土) 23:34:21 ID:H4e1jqfp0
うまくいったと思ったら、メディア使用権限が受け取れない。
> フレッツ・スクウェアv6みる方法教えて下さい この時点でスレ違いだろ
243 :
名無しさん@お腹いっぱい。 :2008/01/06(日) 00:05:27 ID:u6XZI90O0
例外処理でバイパスルート作る。これなら何とかみることが出来る。
例外処理の意味知らないくせにこの言葉使うな馬鹿。
なんか変なの来てるからしばらく閑古鳥になるだろうな。 ここの住人はその辺シビアだし。
元々変なのしか来てないが。
何処のスレでもそんなの一緒だろ
248 :
せっ☆マ ◆wwwwWwWWWw :2008/01/07(月) 16:58:56 ID:hLjoJHKF0
報告遅れましたが 無事目的を達成することができました っと言っても結局proxomitronでzlib.dllにgzipを食わせて解凍させることはできませんでしたので 最終的にはbatを自動生成(コマンドラインオプションの容量限界があった)してそこからLhaplusに解凍してもらいました 手助けありがとうございました
こいつは結局何がやりたかったんだろうな。
>>212 返事後れましてすみません、無事ログイン出来る様になりました。
8giq/PA80様有我等御座いました。
test
>>252 Limit = 2000
Match = "$NEST(<table\swidth="600",/table>)"
>>252 デフォルトのbanner blaster有効にして
URL killfile.txtに
rcm-jp.amazon.co.jp/e/cm\?t\=*22*
255 :
252 :2008/01/11(金) 20:38:59 ID:Llznf5LU0
ニコニコへのiframeを使ったリンクを解体してリンクだけにするのってどうしたらいいでしょうか。 sleipnirで勝手に飛ばされるのがうざくて
>>256 ウェブフィルタを使って解体するといいよ。
d
Name = "Add FlotingMenu for IE (Handler)" Active = TRUE Limit = 32 Match = "(^(^<(/head|body|script)))" Replace = "<!-- Begin to the FlotingMenu(Handler) -->\n" "<script type="text/javascript">\n" "var prxClickMenu = 0;\n" "var prxDragMenu = 0;\n" "var prxSelString = "";\n" "function prxShowClickMenu() {\n" " if( "3"!=event.button ) return true;\n" " if( "A"==event.srcElement.tagName.toUpperCase() ) return true;\n" " prxSelString=document.selection.createRange().text;\n" " if( ""==prxSelString ) {\n" " prxClickMenu = document.all["prxClickMenu"].style;\n" " prxClickMenu.left = window.event.clientX + document.body.scrollLeft + "px";\n" " prxClickMenu.top = window.event.clientY + document.body.scrollTop + "px";\n" " prxClickMenu.visibility = "visible";\n" " }\n" " else {\n" " prxDragMenu = document.all["prxDragMenu"].style;\n" " prxDragMenu.left = window.event.clientX + document.body.scrollLeft + "px";\n" " prxDragMenu.top = window.event.clientY + document.body.scrollTop + "px";\n" " prxDragMenu.visibility = "visible";\n" " }\n" " event.cancelBubble = true;\n" " event.returnValue = false;\n" " return false;\n" "}\n"
続き "function prxCloseClickMenu() {\n" " prxClickMenu.visibility = "hidden";\n" " prxDragMenu.visibility = "hidden";\n" "}\n" "function prxWindowOpen(url, qry, attr) {\n" " PrxRealOpen(url+qry, attr);\n" "}\n" "document.onmousedown = prxShowClickMenu;\n" "</script>\n" "<style type="text/css">\n" "<!--\n" " A.prxClickMenu:link { color:#008b8b; text-decoration:none; }\n" " A.prxClickMenu:visited { color:#008b8b; text-decoration:none; }\n" " A.prxClickMenu:active { color:#008b8b; text-decoration:none; }\n" " A.prxClickMenu:hover { color:#ffff00; background-color:#ffa07a; text-decoration:none; }\n" " A.prxDragMenu:link { color:#008b8b; text-decoration:none; }\n" " A.prxDragMenu:visited { color:#008b8b; text-decoration:none; }\n" " A.prxDragMenu:active { color:#008b8b; text-decoration:none; }\n" " A.prxDragMenu:hover { color:#ffff00; background-color:#ffa07a; text-decoration:none; }\n" "-->\n" "</style>\n" "<!-- End of ClickMenu(Handler) -->$STOP()\n"
続きその2
Name = "Add ClickMenu for IE (Menu)"
Active = TRUE
Limit = 32
Match = "<end>"
Replace = "<!-- Begin to the ClickMenu(Menu) -->\n"
"<div id="prxClickMenu" style="position:absolute; visibility:hidden; font-size:9pt;">\n"
"<table border="3" cellpadding="2" cellspacing="3" bgcolor="#C0C0C0">\n"
"<tr><td bgcolor="#008b8b">\n"
"<a class="prxClickMenu" href="javascript:prxCloseClickMenu()" title="Hidden Menu">"
"<strong style=color:#FFFFFF>ClickMenu<br></strong></a>\n"
"</td></tr>\n"
"<tr><td bgcolor="#ffffcc">\n"
"<a class="prxClickMenu" href="
http://\xbypass.\h\p\q " target="_blank" onClick=prxCloseClickMenu()>Bypass</a>\n"
"<a class="prxClickMenu" href="
http://\xdbug.\h\p\q " target="_blank" onClick=prxCloseClickMenu()>Debug</a>\n"
"<a class="prxClickMenu" href="
http://\xsrc.\h\p\q " target="_blank" onClick=prxCloseClickMenu()>Src</a>\n"
"<br>\n"
"<a class="prxClickMenu" href="
http://\xbweb.\h\p\q " target="_blank" onClick=prxCloseClickMenu()>Bweb</a>\n"
"<a class="prxClickMenu" href="
http://\xsrc.bweb.\h\p\q " target="_blank" onClick=prxCloseClickMenu()>Src&BWeb</a>\n"
"<br>\n"
続きその4
Name = "Add DragMenu for IE (Menu)"
Active = TRUE
Limit = 32
Match = "<end>"
Replace = "<!-- Begin to the DragMenu(Menu) -->\n"
"<div id="prxDragMenu" style="position:absolute; visibility:hidden;">\n"
"<table border="3" cellpadding="2" cellspacing="3" bgcolor="#C0C0C0">\n"
"<tr>\n"
"<td bgcolor="#4b0082">\n"
"<a class="prxDragMenu" href="javascript:prxCloseClickMenu()" title="Hidden Menu">"
"<strong style=color:#FFFFFF>DragMenu<br></strong></a>\n"
"</td></tr>\n"
"<tr><td bgcolor="#ffffcc">\n"
"<a class="prxDragMenu" href="javascript:clipboardData.setData('text', prxSelString); prxDragMenuClose()">Copy</a>\n"
"<br>\n"
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://www.google.com/search?q= ', prxSelString, '_blank'); prxCloseClickMenu()">Google</a>\n"
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://web.archive.org/web/*/ ', prxSelString, '_blank'); prxCloseClickMenu()">WebArchive</a>\n"
"<br>\n"
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://so.7walker.net/?site= ', prxSelString, '_blank'); prxCloseClickMenu()">SourceChecker</a>\n"
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://www.kakiko.com/check/?url= ', prxSelString, '_blank'); prxCloseClickMenu()">JumpChecker</a>\n"
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://www.jah.ne.jp/~fild/cgi-bin/LBCC/lbcc.cgi? ', prxSelString, '_blank'); prxCloseClickMenu()">BCC</a>\n"
"<br>\n"
続きその5
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://gulab.ruitomo.com/s.cgi\?k= ', prxSelString, '_blank'); prxCloseClickMenu()">ThreadSearch</a>\n"
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://oo.2ch2.net/\?q= ', prxSelString, '_blank'); prxCloseClickMenu()">Oosugi</a>\n"
"<br>\n"
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://whois.ansi.co.jp/?key= ', prxSelString, '_blank'); prxCloseClickMenu()">WhoAmI</a>\n"
"<a class="prxDragMenu" href="javascript:prxWindowOpen('
http://ja.wikipedia.org/w/wiki.phtml?search= ', prxSelString, '_blank'); prxCloseClickMenu()">Wikipedia</a>\n"
"</td></tr>\n"
"</table>\n"
"</div>\n"
"<!-- End of DragMenu(Menu) -->$STOP()\n"
今度からtxtに保存して
>>1 の専用ロダに上げてくれ。
Yahooトップの運勢を常に100点にしてくれませんか? 80点とかうざいんですけど
>>190 そのフィルタの作者です。
Yahooは内部構成がよく変わるので、他に作る方がいるなら対応したくない気持ちです。
# 以前から感じていたことですが、Yahooはコンテンツをブロックレベルで分割して、各ブロックを担当者が編集しているような印象を持っています。
# どこのサイトでも担当区分はあると思いますが、Yahooの場合はバラバラに作りすぎる嫌いがあるような気が。
# 年明けのリニューアルでは、tableで分割していたのをdivに変更しただけ。
# 必要ないところまで、divで括ってしまう体質は何も変わっていません。
そういう事情から、Yahooは前方互換性のあるフィルタが書きづらく、また、私自身がYahooを(検索以外で)利用していないので、対応意欲が沸かないのです…。
ごめんなさい。
>>268 お疲れ様です。
ほぼ問題ないですが、一つだけ。
100点が1000点になってしまいますね。
以下、0-99点の範囲でマッチさせてみました。
[Patterns]
Name = "Yahoo: Have a nice day! [2008/01/14] test3"
Active = TRUE
URL = "www.yahoo.co.jp/"
Limit = 128
Match = "(<a\s[^>]++href=$AV(r/pbox/fortune/today/\*-*)[^>]+>)\0[#0:99]+(^[0-9])$STOP()"
Replace = "\0100"
わざと1000点にしたんじゃね?
んなわけないか
272 :
267 :2008/01/15(火) 00:40:13 ID:gxNfkb360
>>268-269 ありがとー
100点でも1000点でもいいや。
占いは信じないだけに目障りだったんだよね。
これからは信じてみるよ。
Have a nice day!!
ウィッキーさんかよ
yourfilehostの広告消すフィルターありませんかね?
アメブロで画像が×になって表示されないってのが自己解決したので一応報告。 結論から言うとCounter Killerが「stat」って部分に誤爆していた。 ググっても情報がまったくないから、不思議に思ってたんだけど、 Counter Killerって作者非推奨なんだね。納得。
デフォのフィルタは精度低いよ。 最後に更新されたのが2003年だしね。
>>124 に含まれている「Location: title.ext」と「URL: title.ext」について悩んでます。
任意のファイル名でファイルをDLするためには、
http://fake.domain/filename.ext? http://true.domain/true?fileuri ファイル名指定用偽URI ←||→ 本物のURI
といった形式のリンクを作成しておき、
1. URL:(out)で $RDIR(
http://true.domain/true?fileuri ) とする。
2. GETで要求したURLとRESPで返されるLocationが一致しない場合は
Location:(in)を用いて再度ブラウザを騙す。
という手順を踏めば、「filename.ext」として保存できる。
…というところまで理解できました。ただ、
・なぜ「URL: title.ext (both)」なのか?(outだけで動作しているように見える)
・同じ方式を用いても何故ニコニコでは403を返され失敗するのか?
が、どうにもわかりません…。
どなたかお手隙でしたら、よろしくお願いします。
>>275 デフォルトのBanner Blaster (full text)をオンにして
keyword list.txt(Adkeys)の# Basic Adv keyword regexpに
*/ads/*
Killfile.txt(Adlist)に
(click|affiliate).dtiserv.com/
www.mmaaxx.com/index*.html\?affid\=
adtology.com/yourfilehost/120x600nsfw.htm
www.juicybucks.com/promo/cw/cwbanner*.gif
banners.virtuagirlhd.com/customdata/banner/*.gif
というのはどうでしょう
>>278 outだけで動くのならoutでいいのでは。
Wikiを編集してる方の中にはoutで良いはずのフィルタをbothで書く人がいます。
これはProxomitronのメインウインドウにある送信するヘッダフィルタ・受信するヘッダフィルタのどちらかの
チェックが外れていた場合でもフィルタが動作するようにとの意図があるようです。
メインウインドウで両方ともチェックを入れるように注意書きをした上でフィルタをoutにしたほうが
無駄な処理をせすに済むので私はこちらを推奨します。
その注意書きは一々突っ込んでくる人が板から書いたまでだよ
283 :
282 :2008/01/18(金) 10:48:31 ID:hqOBtbHg0
284 :
278 :2008/01/18(金) 11:28:21 ID:euBuZYRl0
>>280-281 すみません、質問したのにチェックすっかり忘れてました。
outだけでいいんですね…。俺の6時間はなんだtt
>>283 消せたフィルタと消せないフィルタを貼れ
>>285 [Patterns]
Name = "infoseek.co.jp ad killer"
Active = TRUE
URL = "*.infoseek.co.jp/"
Limit = 3000
Match = "(<body*>|</html >)\0 <!-- isweb auto-insert * --> $NEST(<div *>,</div >)"
http://aoix.hp.infoseek.co.jp/proxomitron.html は消えました。
[Patterns]
Name = "infoseek.co.jp ad killer"
Active = TRUE
URL = "[^/]++.(hp|at|image).infoseek.co.jp/ $TYPE(htm|gif)"
Limit = 2000
Match = "(<body*>|</html >)\0 <!-- isweb auto-insert * --> $NEST(<div *>,</div >)"
Replace = "\0<!-- proxomitron -->"
これで 他のはある程度消えました。
でも
http://proxomitron.at.infoseek.co.jp/ は消えません。
正規表現がわからないので 上に書き込みしてあるのを 前からあるのに合体させました。
まるで くれくれ君or教えて君ですが よろしくお願いします。
Limit = 40 Match = "<!-- isweb auto-insert[^>]+> <div" Replace = "<div style="display:none""
>>286 (<body*>|</html >)\0 を省けばいいだけ。
でも省いたらどんな弊害があるのか自分にはわからない
>>288 ありがとうございます。
きれいに消えました。
ニコニコスレではoutで書くべきフィルタをinにしてた人がいたなぁ。 複数の人にoutにするべきと指摘受けてたけどよく分からないという理由でそのままだった。 ヘッダフィルタで "URL:" に対してbothにしてるフィルタはほぼ間違いなくoutでも動く。 今見直してみたら自分のとこにも3つbothのフィルタが入ってたw
$TYPE(htm|gif) こんなのない
>>290 あれはどこかで配布されてる設定済みオミトロンがinのみ有効になってたから
質問です 以前ここで作られたような覚えがあったんでこっちにきました 今使ってるのはthink氏のフィルター群からです Google: High Light で # Google: High Light 1 <br>\r\n--- debug ---<br>\r\n 略 をリプレイス用のリストに入れるとワードがいくつでも一つ目がハイライトされずボールドのままになります 8つ以上のワードを入れるとずっしり重く デバッグ用とありますし、いれなければまったく問題ないんですが なぜこうなるのか(特に前者が)気になります というか、このデバッグはどのようにみるのか お手すきでしたらご教授ください
クレクレで申し訳ありませんが、mixiの右側に表示されている広告を消すフィルターってありませんか?
>>294 何故作者に直接聞かないの? 確かthink氏のサイトにはお手製のSQL仕様の掲示板があったはず。
出入りしてるんだから、ここで聞いてもいいんじゃね?
>>297 すでにあったとは。失礼いたしました。
ありがとうございました。
>>294 「デバッグ用 (Match or Replace)」以下の記述は、テストウインドウで単体テストするときのために作りました。
Proxomitronで用意している「テスト」は複数のフィルタをまたいで働かないので、代替手段としての位置づけです。
両方のデバッグテキストをReplace欄に入れて、実際のWebページでテストするとおかしな動作になると思います。
デバッグするときには、以下の形でテストしてみてください。
■「Google: High Light」でデバッグ処理を活用する
1. 「Google: High Light」で8つの検索ワードを認識させたい
2. 「Google: High Light 1」のデバッグテキストを使って、Key8のグローバル変数が正しく代入されていることを確認する
3. 「Google: High Light 2」のデバッグテキストを使って、8つの検索ワードがテストウインドウに入力されたHTMLソース上で正しくマッチすることを確認する
4. それぞれのデバッグテキストを外し、GoogleのWebページでテストする
>>298 掲示板は閉鎖中なので、こちらに来たのだと思います…。
今もURL直打ちで行けますが、.htaccessの影響で文字化けしちゃってます)
あの掲示板を作り始めたときには、ユーザー登録型の掲示板を想定していました。
が、登録型だと一部のコアなユーザーによる囲い込みができてしまい、Proxomitronユーザーが増える方向には向かないように思えて、
半登録型(登録ユーザーと未登録ユーザーが混在する形)の掲示板に作り替えようと当時は考えていました。
その後、いろいろと目移りして、現在は掲示板の開発はストップしています。
時間がないのは言い訳に過ぎませんが、やる気をある方向へ誘導させていくのは難しいとよく思います。
mixiで役に立つフィルダなんかあります?
懐かしい選手だな
mixi自分用フィルタ。いろいろ消えます。たぶん必要なものまで消えます。 二つ目のフィルタは動画ページやミュージックページで一番上が残るので無理やり縮めてます。 初心者なのでひどい表現が多々あると思います。 [Patterns] Name = "mixi: AD all killer" Active = TRUE URL = "$TYPE(htm)[^/]++mixi.jp/" Limit = 8192 Match = "$NEST(<h1 id="pagetop" name="pagetop">,</h1>)" "| $NEST(<p class="(adBanner|beginnersContents)">,</p>)" "| $NEST(<div class="(adBanner|contents02|prContents)">,</div>)" "| $NEST(<div ,class="searchForm01 homeSearchBox">*,</div>)" "| $NEST(<div id="adBanner">,</div>)" "| $NEST(<div ,id="(keywordRanking|prSepecial)" class="bodySubSection">*,</div>)" "| $NEST(<ul class="footerNavigation*",</ul>)" [Patterns] Name = "mixi: header height Adjuster" Active = TRUE URL = "$TYPE(htm)[^/]++mixi.jp/" Limit = 16 Match = "<head>" "$STOP()" Replace = "<head>\n" "<style type="text/css">div#headerArea { height:48px;}</style>"
>>304 自分もページ上部に隙間が出来てて気になってたけど
2つ目の入れたらキレイに縮まった GJ!!
306 :
294 :2008/01/20(日) 05:43:14 ID:dVoPjjj00
前にフィルタの元がここで作られてたの見てたのでなんとなくここに書いてしまいました。すみません
>>301 デバッグテキストの使い方は大体わかりました
このままで十分なので外して利用したいと思います
> 一つ目がハイライトされず
こっちがまだわからないのですが、もう少し考えてみます
丁寧な説明をありがとうございました
>>295 気がついたものの突っ込みはないだろうと考えてたので余計恥ずかしい…
>>306 > > 一つ目がハイライトされず
> こっちがまだわからないのですが、もう少し考えてみます
実は、こちらの状況は私もわかってないので、問題ないと思われる方法を示唆する回答に留めました。
「両方のデバッグテキストをReplace欄に入れて」という状況ならおかしな動作になるだろう、という想像だったのですが、どうも違ったみたいですね。
・「ハイライト」という表現を使うところをみると、Webページ上でテストしたのでしょうか?(テストウインドウ上ではなく)
・デバッグテキストは両方とも有効にしたのか?
・片方だけ有効にしたのなら、High Light1、High Light2のどちらにデバッグテキストを挿入したのか?
など、状況がわかれば、私の方でも検証したいところです。
差し支えない範囲で、もう少し詳しく状況を教えていただけないでしょうか?
> > 一つ目がハイライトされず 外しているかもしれませんが、「Google: High Light 1」のデバッグテキストのKey1で日本語を代入しているのなら、一つ目がハイライトされないかもしれません。 Proxomitronの置換表現に書いた日本語はShift_JISで出力されますが、Googleの文字コードはUTF-8がデフォルトなので、文字コードの不一致から起きる問題かも。 GoogleのURLに &oe=shift_jis を加えれば、Googleで出力される文字コードがShift_JISに変わりますが、 「Google: High Light」で「Shift_JIS, ISO-2022-JP のダメ文字問題」を解消できなくなります。 変数の代入させる方式のテストをするときには、日本語を使わない方がいいと思います。
こういうやり取りも情報だし悪くないな。 専用ブラウザだとログの検索も簡単だし。
jpeg画像内に"<?xml version="1.0" encoding="UTF-8"?>"で始まる記述が ツラツラと埋め込まれたものについて、この記述部分を無効にするフィルタは あるでしょうか?(古いブラウザなので、この種の画像を読み込むと不具合に)
>>312 > hoge\hoge\page1.html を hoge/hoge/page1.htm lに変換する
変換自体は簡単で、下記フィルタでOKです。
[Patterns]
Name = "Replace Link \ -> / [2008/01/21] test2"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 256
Match = "(<a\s[^>]++href=)\#$AVQ((("|)http(s|):/)\#(([^\\]+)\#\\$SET(#=/))+([^\\]+)\#)(^(^[ >]))"
Replace = "\@"
Firefoxでは、円記号はURLエスケープされた文字「%5C」に置き換わります。
URLエスケープされると、元々エスケープされていた文字なのか、区切り文字として宣言された円記号なのか、わからなくなってしまうため、タグに打ち込まれている文字から置換しました。
ところで、>314は多くの状況で問題ない動作なのでしょうか? Firefox v2.1.11 でもfileスキームでは、\(円記号) が / に変換されました。 これはWindowsのファイル名で \ が使えないことを踏まえれば、納得のいく動作です。 httpスキームの場合は、\ はURLエスケープする動作 (\ -> %5C) が正しいと思うので、「\ -> /」の変換を既定の動作にしてしまうと、 本来は正しく動作するページで誤動作を引き起こしてしまう可能性があるように思えます。 (その場合、IE未対応となるので、事実上あり得ないかもしれませんが) どちらかといえば、IEの動作が間違っていると思いますが、IEがデファクトスタンダードということを踏まえて、 多くのサイトがそういう仕様にしている現状がある、と想定するべきなんですかね? URLに円記号を使っているWebページは見たことがないので、差し支えなければ参考事例を掲示していただけると参考になります。 # 円記号に関しては、「http Text to Link」フィルタでも悩んだところです。 # 結局、参考例を全く見つけられなかったので、円記号をURLに使える文字という動作にはしませんでした。
>314のフィルタは、\ を含まないリンクにもマッチしていたので、\ を含むリンクのみにマッチするよう、修正しました。 (動作としては問題ありませんが、元と同じ文字列に置換するので、無意味でした) [Patterns] Name = "Replace Link \ -> / [2008/01/21] test3" Active = TRUE URL = "$TYPE(htm)" Limit = 256 Match = "(<a\s[^>]++href=)\#$AVQ((("|)http(s|):/)\#(([^\\]+)\#\\$SET(#=/))+{1,*}([^\\]+)\#)(^(^[ >]))" Replace = "\@"
ttp://www.ietf.org/rfc/rfc1738.txt URLに使用可能な文字を列挙したサイトを探しても見つからないから、
RFCを当たってみるしかないのかな。
httpurl = "
http:// " hostport [ "/" hpath [ "?" search ]]
hpath = hsegment *[ "/" hsegment ]
hsegment = *[ uchar | ";" | ":" | "@" | "&" | "=" ]
uchar = unreserved | escape
unreserved = alpha | digit | safe | extra
alpha = lowalpha | hialpha
lowalpha = "a" | "b" | "c" | "d" | "e" | "f" | "g" | "h" |
"i" | "j" | "k" | "l" | "m" | "n" | "o" | "p" |
"q" | "r" | "s" | "t" | "u" | "v" | "w" | "x" |
"y" | "z"
hialpha = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" |
"J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" |
"S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z"
digit = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" |
"8" | "9"
safe = "$" | "-" | "_" | "." | "+"
extra = "!" | "*" | "'" | "(" | ")" | ","
hostportの部分を飛ばして、パスのところだけ抜き出してみた。
これの意味を正確に把握するだけの知識はないけど、
見る限りだと円記号をパスに使うことはできない。
IEがRFCを無視して余計な世話をしているだけかと。
escape = "%" hex hex hex = digit | "A" | "B" | "C" | "D" | "E" | "F" | "a" | "b" | "c" | "d" | "e" | "f" 抜けていたところを付け足し。
319 :
312 :2008/01/21(月) 22:39:51 ID:wnreh1x+0
>>313-315 丁寧な説明ありがとうございました。
参考事例はこのサイトになります。
ttp://www.geocities.jp/ever_sakura/novel.html ここのいくつかのリンクが \ 表記になっています。
このサイトで作成していただいたフィルタを試してみたのですが、
動作していないみたいです。
ソースを見てみたら
a href="novel\sakura\sakura04.html"
のようなパス以下を記述する書き方をしていたので、
これがまずいのでしょうか?
(hrefに http を含んだ記述で試してみたらうまくいきました)
thinl氏のは絶対URIのみ対象になるのかな。 >319 前にフィルタを書いていたので載せてみる。リンク先でテストもしてみたよ。 あまりテストしてないので、そのへんはご勘弁を。 URL = "$OHDR(User-Agent: *Gecko*)&$TYPE(htm)" Limit = 128 Match = "(background|href|src)\1=$AV((([^\\]+)\#(\\)$SET(\#=/))+{1,*}\#)" Replace = "\1="\@""
>>317-318 まとめ感謝です。
やはり、RFC的には円記号をパス (パス名コンポーネント分離符が正式名称かな) に使えないですよね。
そこまでは私も何となく(英語が苦手なので読み切れている自信がなかったw)把握していたのですが、ひょっとして私の知らないところでIEをデファクトスタンダードとして、円記号をパスに使う風潮があるのかな、と思ったのです。
XHTMLのソースでXML宣言を省くように、大多数がIE仕様に対応させようとしているなら、フィルタでもIEに合わせた方が問題が少ないと考えたのですが、それほど気にしなくていい些細な問題なのかもしれませんね…。
>>319 リンクは相対パスでしたか。
前述の通り、\ を置換するのに懸念が残っていたため、>316では置換対象をhttpスキームに限定していました。
ttp://www.geocities.jp/ever_sakura/ で動作するように、更新しました。
更新点
- 相対パスのリンクも置換するように
- URLを www.geocities.jp/ever_sakura/ に限定した
[Patterns]
Name = "ever rest: Replace Link \ -> / [2008/01/21] test4"
Active = TRUE
URL = "$TYPE(htm)www.geocities.jp/ever_sakura/"
Limit = 256
Match = "(<a\s[^>]++href=)\#$AVQ((("|)(http(s|)://|(^[0-9a-z]+:)))\#"
"(([^\\]+)\#\\$SET(#=/))+{1,*}([^\\]+)\#"
")(^(^[ >]))"
Replace = "\@"
このフィルタは標準準拠ではない暫定措置のため、フィルタが有効になるURLを「ever rest」に限定しています。
今のところ、\をパスに使っているサイトは、>319で報告されたサイト一件しか見つけられていないので、
このフィルタの動作は例外的なものだと思ってください。
重複してしまいました…。 >320氏のフィルタも書き方が違うだけで、同じ動作になると思います。 # 320氏のフィルタでは、backgroundにも対応されているみたいですね。
>>319 すごいなこのサイト・・・IEで見たらリンク先が普通に表示されて挙動の気持ち悪さに噴いた。
IEで\がパスに勝手に変換されるのは、多分Winのパス記号が\だからだろう・・・多分。
ローカルで作成して動作確認したファイルをそのままうp→IEで問題なく動いてるから作者もそのまま放置、かな。
超例外的なサイトだと思う。
名前typoで失礼しました。 パスの「/」が円記号になっているサイトはごくまれに見かける。 頻度はかなり少ない上に、ステータスバーを見れば円記号があることはわかるので、 $KEYCHKを好みで組み合わせて必要なときだけフィルタを有効化すればよいかなと。
これから書く内容はスレ違いだと思いますが、参考意見として一つ。
Webサイトの中に不適切な記述があってそれに気がついたときには、サイトの管理人に一報を入れると皆が幸せになれるのではないでしょうか。
そのサイトの管理人だけでなく、そのサイトに訪問する人すべてに感謝される行為だと思います。
(おまけに、フィルタを作る手間も省けます)
「ever rest」のメールフォームは小休止中とのことですが、日記をみると新旧2つのサイトを同時運営されているようです。
Googleでサイト名を検索してみると、旧サイトが引っかかり、そこからメールフォームをたどれます。
ttp://www10.ocn.ne.jp/~ever/access.html 今後、定常的に訪問されるようでしたら、管理人さんに不具合を報告する手も有りかなと私は思います。
jsのスクリプト内でエスケープとしての\に誤爆しないか心配だな。
あらら、また一歩違いです。
>>324 > 名前typoで失礼しました。
指摘されるまで気がつきませんでしたので、お気になさらず。
> パスの「/」が円記号になっているサイトはごくまれに見かける。
> 頻度はかなり少ない上に、ステータスバーを見れば円記号があることはわかるので、
> $KEYCHKを好みで組み合わせて必要なときだけフィルタを有効化すればよいかなと。
ごくまれに、ということなら「円記号の変換」を標準動作とする必要はなさそうですね。
$KEYCHKの方法を使わせていただきます。
以下、円記号(\)を入力したときだけ、「\ -> /」の置換を行います。
[Patterns]
Name = "Replace Link \ -> / [2008/01/21] test5"
Active = TRUE
URL = "$TYPE(htm)$KEYCHK(^220)"
Limit = 256
Match = "(<a\s[^>]++href=)\#$AVQ((("|)(http(s|)://|(^[0-9a-z]+:)))\#"
"(([^\\]+)\#\\$SET(#=/))+{1,*}([^\\]+)\#"
")(^(^[ >]))"
Replace = "\@"
>>326 うーん…。
それに対応させるためには、script要素があったときに、グローバル変数でフラグを作るぐらいしかなさそうです。
[Patterns]
Name = "Create flag script element [2008/01/22] test1"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 16
Match = "(^(^<("
"script[ >](^$TST(scriptFlg=1))$SET(scriptFlg=1)|"
"/script>$TST(scriptFlg=1)$SET(scriptFlg=)"
")))"
[Patterns]
Name = "Replace Link \ -> / [2008/01/21] test6"
Active = TRUE
URL = "$TYPE(htm)$KEYCHK(^220)"
Limit = 256
Match = "(<a\s[^>]++href=(^$TST(scriptFlg=1)))\#"
"$AVQ((("|)(http(s|)://|(^[0-9a-z]+:)))\#"
"(([^\\]+)\#\\$SET(#=/))+{1,*}([^\\]+)\#"
")(^(^[ >]))"
Replace = "\@"
未テストですが、既存のフィルタを改変しただけなので期待通りに動作すると思います。
329 :
312 :2008/01/22(火) 00:22:25 ID:na0xRl2c0
330 :
311 :2008/01/22(火) 12:43:37 ID:feVMxE290
Opera使ったら? 98でも使えたと思う。
>>330 win98SE+IE6で正常に表示されました。
>330の画像のソースを見ると、確かにXMLが埋め込まれている。
その中身がplistとかいうものらしい。
ttp://www.itmedia.co.jp/enterprise/articles/0705/30/news011.html IE5.5で>330を読み込んでみると、ページ内の画像はほとんど表示されなかった。
(接続中の状態がずっと続く)
キャッシュを消してから、
XMLが埋め込まれた画像を直接表示させてみると問題ないこともある。
IE5.5は「拡張子ではなく、内容によってファイルを開く」をやっているから、
そういうサイトではIEを使わない方がよい。
>330の画像ではXMLの部分が8kバイトほどあるけど、
これを除くためだけにすべてのJPEGの中身をフィルタリングするというのはちょっと。
削れても別の問題が出るかもしれないし。
Yahoo地図情報の右の広告部分は消せないでしょうか?
>>335 [Patterns]
Name = "AdSpace"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 4096
Match = "<!--+\sadspace\s*-->*<!--*\s*AdSpace\s*-->"
自分の環境ではこれで消えてました。どうでしょう?
337 :
330 :2008/01/23(水) 18:46:08 ID:vbM2T43K0
レス下さった方々、ありがとうございます。 とても古いPC環境なのでブラウザを最新にし辛く、5.5を使ってました。 あの種の画像はふいに遭遇して、そうなるとブラウザ再起動以外に 解消する手がありません。 今は試しにFirefoxを使ってますがかなりマシンへの負担が大きいです。 IE6やOpera等のブラウザを考えてみます。ありがとうございました。
そんなスペックのPCじゃやりたいこと全然出来ないんじゃ。 Dellで6万弱でいいPC買えますよ。 中古でなら3万とかで買えるものもあるけどスペックが低すぐるからおすすめ出来ない。
2000年製のPCをまだ使っているけど、 メモリを128MBから256MBに増やしたら快適になった。 アフォなMeは相変わらず落ちるが。 Firefoxでも問題ない。(起動するのが遅いのは仕様)
5から5.5にするくらいなら6にしろってどっかで聞いたような スレチすまん
数年前ならWin98やWin2kにIE6を入れるのはアホみたいな流れだったんだが、 ここ最近はIE5.5だと不便さが目立ってきたのでIE6に乗り換えた方が良い様な流れだと思う。
最近はWebもどんどんリッチになってきてるから いい加減スペック面が厳しいんじゃないかとも思うが… まぁ、スレチっすね
>>341 残念ながら2月には7に強制的にバージョンうpだったりして
>>336 ありがとう
うちの環境(XPsp2,IE6)では消えませんでした。
<!-- Adspace (\w)\0 -->*<!-- /Adspace $TST(\0) -->
>>345 それでも消えないです^^;
有難うございました。
野暮な質問だが、www.infoseek.co.jpだけを対象外にする意味は?
^www.infoseek.co.jp/
>>349 ありがとう!
>>348 普段はインフォーシークニュースしか見ないけど、このページの検索ボックス下のテキスト広告が
ニュースと紛らわしくて許せなかったら。
そうしたらインフォーシークTOPから読むものが半分以下になったので除外しようかと。
会員用のログインリンクまで消えてたから、そりゃもう悲惨なページだった。
infoseekのトップページのことでいいんだよね? ニュースを読むだけなら、 コメントにマッチさせて広告部分をまるごと消すとか、 スタイルシートを使うとかした方がもっと見やすくなるよ。
>>343 IE7はXPとVistaのみだからWin98とWin2kは関係ない。
つーか今どきWin98なんてサポートされるわけがない。
クリアタイプで表示出来ないフォントを指定してるページを何とかしたいんですが、どうすればいいんでしょうか。
>>354 インターネットオプション→ユーザー補助→Webページで指定されたフォント以下略
ias.rakuten.co.jp topics.news.www.infoseek.co.jp/isweb/news prox_wahahaさんフィルタのブロックリストに 上の二つ入れてもinfoseek系バナーとテキスト広告は消せるよん。
YouTubeのダウンロードリンクの今のを誰か持ってないですか? 今まで使ってたのが使えないので・・・。 クレクレ君ですいません。
仕様変更あったみたいだね。 作ってあげたいんだが、入試直前なので誰か頼んだ
>>357 >>1 のうpろだのYouTubeまとめを更新しました。
Wikiのほうはオリジナルの作者さんにおまかせ。
>>358 ガンバレ
ツンデレwww
>>355 わがままで申し訳ないんですが、それ系だと英字が困ってしまうんです。
あ、当方operaです。
向こうで指定してるフォントは、出来るだけその通りに表示してあげたいんですが
MSゴシックとかは勘弁して欲しいんですよ
>>360 なるほど、そうやって画像を埋め込む方法があったのか
気が付かなかった
>>362 力業でやるなら
問題になってるフォント名を、問題にならないフォント名に置き換えればよいだけでは?
ただ、日本語表記のフォント名の場合、文字コード分の複数パターンが必要になるけど
>>362 一応確認
自分のブラウザのフォント指定にはMSゴシックを指定してないけれど相手側が指定している場合だよね。
自分はfirefox使ってるのでMSゴシックとMS Pゴシックを指定してくるサイトだけ追加してスタイルシート書き換えてるけど
@namespace url(
http://www.w3.org/1999/xhtml );
@-moz-document domain("mainichi.jp"),domain("hochi.yomiuri.co.jp"),domain("sankei.jp.msn.com"),domain("itmedia.co.jp"),
url-prefix("
http://www2s.biglobe.ne.jp/~takao777/versionupinfo/ ") {
body {
font-family: "MeiryoKe_PGothic" !important; }
}
@-moz-document
domain("wikiwiki.jp") {
td,th {
font-family: "MeiryoKe_PGothic" !important; }
}
operaにそういうスタイルシート書き換えるような機能あればそっちのほうが簡単だと思う。
オミトロンでやるならそのサイトがcssかhtmlでMSゴシックが記述されてるところのフォント指定を書き換える感じ?
http://vipvipblogblog.blog119.fc2.com/ ここの画面上部に出る4個のウィンドウがジャマなので消したいのですが、
<!--▼ プラグイン3ここから ▼-->
から
<!--/プラグイン3ここまで-->
までを消去したい場合はどのようにマッチさせればいいのでしょうか?
全角文字が使われているのでそのまま当てはめようとすると文字化けして認識してくれません・・・
お手数ですがご教授願います。
>>366 プラグイン3の中はentry_blockというクラス属性なのでこれを消すというのはどうでしょう?
(^(^<div class=$AV(entry_block)))$NEST(<div,</div>)
自分の環境ではソースは以下のようになりました。
<!--▼ プラグイン3ここから ▼-->
(ここの中が空白)
<!--/プラグイン3ここまで-->
対策1) 全角文字をEUC-JPでエンコードする ▼ プラグイン3ここから ▼ %a2%a7%20%a5%d7%a5%e9%a5%b0%a5%a4%a5%f33%a4%b3%a4%b3%a4%ab%a4%e9%20%a2%a7 対策2) 全角文字以外の場所でマッチさせる Match = "<div(^(^\sclass="entry_block"> <div class="entry_body">))" Replace = "<div style="display:none"$STOP()"
369 :
名無しさん@お腹いっぱい。 :2008/01/26(土) 17:27:24 ID:wkOu/P/l0
Match = "<div(^(^\sclass="entry_block"> <div class="entry_body">))"
Replace = "<div style="display:none"$STOP()"
を使用して除去できました。
>>367 、
>>368 の方ありがとうございました。
どういたしまして(^ー^)v
幅468 高さ60 サイズのバナーをカットするフィルタを作って頂けないでしょうか?
>371 一応サンプルのソースがあれば示した方がよいと思う。 なお、画像の幅と高さは自己申告なので、属性がない場合は対処不可。
それは適当なamazon用のフィルタで消えるね あちこちで公開されてるからぐぐるよろし
iframe
rcm-jp.amazon.co.jp/ をAdlistに加えればおけー。
373です。 無事カットすることができました、ありがとうございます。
何時もの如くyoutubeの動画落とせなくなってますねw
何時もの如く修正出来ない所かスレもろくに見ない馬鹿が湧いてますねw
>>383 風俗サイトに通じるURLですね。
私の環境では、「http Text to Link [2007/07/08]」でリンク化されています。
とりあえず、「ByPassリストにGoogleのURLが入ってないか?」を確認してみてください。
[HTMLデバッグ情報] で他のフィルタが先にマッチしていないか、もチェックするといいかな。
>>384 一秒違いだ。確認ありがとうございますチェックしてみます。
>風俗サイトに通じるURLですね。
いいえ、
>>383 のgoogle.comのページです。
>>387 すみません。これが最後です。
http Text to Linkですが、正常に動作しました。
指摘されたように、googleをバイパスリストに載せていました。
大変申し訳ありません、ありがとうございました。
>>388 > いいえ、
>>383 のgoogle.comのページです。
該当ページ自身は google.com ですが、「http Text to Link」を使用すると www.o-story.com への転送案内ページのようにも見えます。
このスレッドに来る人は未成年者も含まれるでしょうから、注意喚起の意味で前置きしておきました。
(>379のリンク先を見ればわかることですが、うっかりリンクを踏んでしまう人がいないとも限らないので、念のため)
ただのお節介なので、気にしないでください。
>>389 解決して何よりです。
ちんこうざい
42TnZX2v0はリアルチンカス
+preで問題なく見れてる
「http Text to Link [2007/07/08]」が>385のリンク先サイトで誤爆する不具合を修正しました。
更新点
- style要素内でフィルタが動作しないようにした
- script要素内でフィルタが動作しないようにした
- pre要素内でフィルタが動作しないようにした
- textarea要素の存在チェックを行うフィルタの名前を「check <textarea>」から「Global-Flag: inner textarea element」に変更
thinkのScrapBook: リンク化フィルタ「http Text to Link」で <style>, <script>, <pre> ブロック内に誤爆する不具合を修正
http://thinkarc.blogspot.com/2008/01/http-text-to-link.html
pre要素に対応しておきながら、code要素に対応しないのは不自然な気がしてきたので、code要素内でも動作しないように更新しました。
更新点
・code要素内でフィルタが動作しないようにした
# >394の時点で導入してしまった人は、お手数ですが以下のフィルタを追加&入れ替えてください。
「Global-Flag: inner code element [2008/01/29] test1」
「http Text to Link [2008/01/29] test3」
thinkのScrapBook: リンク化フィルタ「http Text to Link」でstyle要素、script要素、pre要素、code要素のブロック内に誤爆する不具合を修正
http://thinkarc.blogspot.com/2008/01/http-text-to-link.html
それ使わせて貰ってるぜ乙
そもそもURLテキストの後部判定で </style> をはねてないことに気がついたので、修正。
ぐだぐだですみません……。
更新点
- NOT関数でもstyle要素をはねるように修正 (http Text to Link [2008/01/29] test4)
thinkのScrapBook: リンク化フィルタ「http Text to Link」でstyle要素、script要素、pre要素、code要素のブロック内に誤爆する不具合を修正
http://thinkarc.blogspot.com/2008/01/http-text-to-link.html >>393 「http Text to Link +pre [2007/07/20]」はこの方法ではねているようですね。
http Text to Link [2008/01/29] test4に後方参照が抜けてたりしない? これはそういうフィルタなんだって言うならそれ以上突っ込まないけど 一体このフィルタの用途は何なんだろうという疑問が残る
抜けてるのは代入と出力だけだから直すのは簡単だ。 あとは自分でやれってことでしょうw それはそうと+preってどこかに落ちてないかな。
+pre拾えました、part28の805のGoogleキャッシュで捕獲。
>>403 あ、了解
自分でどうにか出来そうです。
ありがとう。
>>398-399 > http Text to Link [2008/01/29] test4に後方参照が抜けてたりしない?
後方参照が抜け落ちていることを確認しました…。
どうも、自前の「テキスト→HTML変換」スクリプトのバグで特定の文字が取り除かれてしまうようです。
後方参照が抜けているのは本意ではないので、もう一度、上げなおします。
ご報告ありがとうございました。
>>402 ,404
お手数おかけして申し訳ないです。m(_ _)m
テキストエリアをマウスオーバーで選択出来るフィルターを作ってくれませんか。
広告ってのがどれだかわからない。 pagead2.googlesyndication.com/ のことだったら、それをAdlistに追加。 天気の部分は table#wholetable div#weather0_div { display: none !important; } をユーザスタイルシートに追加。ただし、わずかながら誤爆の可能性がある。
ニコニコ動画で、右上に表示される文章やPR広告と、 プレミアム未登録リンクを消すフィルタをお願いします
>>407 できるかどうかは別として、面白そうなネタなので、詳しい説明が欲しいです。
テキストエリアはマウスドラッグで範囲選択できますよね?
マウスオーバーでテキストエリアの文字列全体を選択して欲しいということでしょうか。
マウスオーバーで勝手にフォーカスを奪われるとちょっと煩わしく感じてしまうように思うので、何か用法を誤解している予感が。
差し支えなければ、目的を聞いておければと思いますが、どうでしょうか?
乙。頂きました。
>>412 すいません説明不足で。
「<textarea 〜 onMouseover="select();">」の効果と同じ様にして欲しいです。
目的は、ただ単純に私のめんどくさがりな性格からきてまして
Google・2ch・その他HPでのテキストエリアの文字の全選択が楽にならないかなぁ・・・と。
よろしければお願いします。
>>414 過去に何度か作成依頼したけど取り扱ってもらえなくて…
でもやっと向こうで答えてもらえました。ありがとうございました。
スレ汚し申し訳ありませんでした。
Match = "<textarea\0>" Replace = "<textarea\0 onmouseover="this.select()">" こんなんで十分な気がするが。かえって煩わしいわ。
ondblclickにしてダブルクリックで選択にすれば良いんじゃないかな。
エロですまなんだがyourfilehostの動画リンクを開いたときに動画を全画面で表示してくれるフィルターをお願いします。 わざわざソースをあさってリンクを探す手間を省きたいので、お願いします。
420 :
http://killthecult.blog.shinobi.j p/ :2008/02/01(金) 23:19:20 ID:3XDA328S0
421 :
294 :2008/02/02(土) 04:40:11 ID:dJD1WmDI0
今更のこのことすみません
支障はなくただの疑問なのでこのまま流していただいて構いません
>>307-308 Google: High Light 1、2
Charset: Set global variable [2006/06/04]"
ReplaceStr: BlockList [utf8]
URL: Google transfer
とリスト2種、検索文字列"trio""quartet""quintet""sextet""septet""octet""combo"
で確認しました。他のフィルタ類は全て消しています
以前は気にせず削除したのですが、
ReplaceStr-utf8のリストに含まれていたデバッグ用テキストが今更気になり
あるからにはそのまま使うのだろうと試したところ
ハイライトされなかったので疑問に思った次第です
この動作が間違ってるのかそうでないのか自分にはわかりませんでした…
オミトロン使って、リンククリックしたらそのアドレスを 指定のソフトに送る事って出来ませんかね?
>>423 ありがとうございます。
ですが、レジストリ弄るのは自分には敷居が高く無理っぽいです
>>423 スキーム登録ってのが面白くてやってみたんですが、
指定ソフトに送るとき、スキームごと送っちゃってダメっす
○○://以降の文字列を送るにはどうすればいいか、ご教示願えませんでしょうか
426 :
423 :2008/02/05(火) 06:03:54 ID:9P//UzgU0
>>425 そういう場合はブラウザと目標のソフトとの間にvbscriptを挟むといいです。
1、ブラウザからスキーム付きのURLがVBSに送られる
2、VBSがURLを加工し、目標のソフトに渡す
という感じで。(同じことが出来れば他の言語でも構いません)
vbsでも正規表現を使った高度な文字列置換が出来るのでいろんなことが出来るようになりますよ。
言語としてももっともシンプルな部類のスクリプト言語なので覚えてみては。
質問があります。 undonutをブラウザに使ってるみなさんは、 ほかにどんなソフトを、使ってらっしゃいますか? 自分は、undonutのように便利なソフトだなと思い、使用しているのは Proxomitron Headline-Reader Lite Irvine Becky! Ver2 秀丸 等です。 是非、教えていただけませんか?
>>429 シロートの俺にはなにを話しているのかすら理解できんw
431 :
http://killthecult.blog.shinobi.j p/ :2008/02/06(水) 03:26:56 ID:IAEss0eA0
432 :
423 :2008/02/06(水) 06:43:44 ID:oYr1Yz400
マルチですかね、残念です。
433 :
名無しさん@お腹いっぱい。 :2008/02/06(水) 14:29:47 ID:fkevVnT30
2chのスレに貼られているリンク先の画像を そのままスレ内に表示するフィルターってないですか?
専用使わなくても見れる方法があったはず。 壷を使うか、P2を使うか。
壷もP2も専ブラじゃ 用はcgi通さないでdatを読むものをそういうんだから
異議あり
dat読みのフィルターあったよね。
汎用バナーキラーをONにしていると一部サイトでエラーが出てしまいます。
フィルタをどう修正すれば対策ができるのかご教授頂けないでしょうか?
問題のフィルタ
[Patterns]
Name = "DOM Banner Blaster v0.007
Active = TRUE
URL =
Bounds = "<a\s*</(a|td|tr)>|<iframe*</iframe>|<ilayer*</ilayer>|<img*>|<input*>|<script(*(</sc|"*'))++ript >|<object*</object>|<form*</form>"
Limit = 8000
Match = "*=$AV($LST(AdKeys)*)*&<((a|form)\s*<img\s[^>+]+>|[^fa])"
Replace = "<a name=PDomTarget ></a>"
問題の出るサイト例
http://www.asahi-net.or.jp/~wp5m-kmkr/profile.htm
>>439 マルチするようなカスに誰が教えるかよ。 氏ね。
うるせーバカ
ごめん
>>433 これを改良すればできるんじゃね?
Name = "@2ch cgi/kako"
Active = TRUE
URL = "(*2ch*|*bbspink*|*jbbs*)/\w.(cgi|html)"
Limit = 256
Match = "<a href="mailto:(^sage )\1">\2</a>$SET(0=<u>\2\[\1\]</u>)"
"|(
http://\w. (jpg|jpeg|png))\1</a>$SET(0=<img src="\1" border=0></a>)"
"|([^h])\1
ttp:// (\w.(gif|jpg|jpeg|png))\2(<|\s)\3$SET(0=\1<|\s)\3$SET(0=\1<a href="
http://\2 "><img src="
http://\2 " border=0></a>\3)"
"|([^h])\1
ttp://\2 (<|\s)\3$SET(0=\1<|\s)\3$SET(0=\1<a href="
http://\2 ">
ttp://\2</a >\3)"
"|<form$SET(0=\n-->\n<form)"
"|textarea rows=5$SET(0=textarea rows=10)"
"|area>$SET(0=area><br>sage:<INPUT TYPE=checkbox VALUE=sage NAME=mail>\n)"
"|隊長! \w<a href="([^"]++)\1">$SET(0=<META HTTP-EQUIV="REFRESH" CONTENT="0; URL=\1">)"
"|(<title>書きこみました。$OHDR(Referer: \1))$SET(0=<META http-equiv="refresh" content="0;URL=\1#submit">\k)"
"|<center>$URL(\w/kako)$SET(0=<noembed>)"
"|</center>$URL(\w/kako)$SET(0=</noembed>)"
"|<P>\n<HR>$URL(\w/kako)$SET(0=</body></html>\k)"
Replace = "\0"
>>433 [Patterns]
Name = "ImageLink Viewer"
Active = TRUE
URL = "[^.]+.(2ch.net|bbspink.com)(:[0-9]+|)/test/read.cgi/"
Limit = 256
Match = "((<a\s[^>]+>)\0&&*href=($AVQ(("|)\1*.(jpg|jpeg|gif|png|bmp)("|)))\2*)(^*<img)\9</a>"
Replace = "\0<img src=\2 alt=\1ImageLink_Viewer\1 width=\1110\1 title=\1ImageLink_Viewer\1>\9</a>"
クオートの処理が若干アクロバットだが気にするな。
GJ
447 :
439 :2008/02/07(木) 21:34:32 ID:Uv2V5J220
ここにしか書いてないんですが・・・・
>>446 誤爆…してますか?
デバッグモードで動作させてみましたが、正しくマッチしているように見えました。
差し支えなければ、「どのように誤爆しているか」を指摘していただければ。
でも、不安要素がないわけではないので、マッチングを厳しくしてみました。
[Patterns]
Name = "Allow right mouse click plus [2008/02/08] fixed"
Active = TRUE
Multi = TRUE
URL = "$TYPE(htm)"
Limit = 512
Match = "(<[a-z]+{1,*}[0-9]+(^(^\s))[^<>]++\s)\0oncontextmenu(^(^=))"
Replace = "\0ProxAllow"
個人的に常用フィルタではないのと、他作のフィルタを応急措置した経緯もあって細かい部分は気にしていなかったのですが、
改めてみると、全要素を検索する手法の影響でパフォーマンスが落ち気味なのがちょっと気にかかります。
< から検索を始めているのでそれほど失速していませんが、作っている立場としてはスマートな検索の仕方ではないところがやはり気になるわけで…。
他のフィルタ(「Allow right mouse click 2」等)と同じように、 addLoadEvent で操作する方に切り替えた方がスマートなので、その方法に切り替えてみようと思います。
とりあえず、週末に。
# 忘れていたら、声をかけてくだされば対応します。
>>421 私の説明が誤解して受け取られているか、294氏の希望を私が誤解しているか。
どこかですれ違っている感覚があります……。
確認したいのは2つ。
「どのような行程を経て、デバッグしているか」と「デバッグテキストをどのような用途で使うか」です。
私のデバッグ方法では、デバッグを二段階に分けて行います。
1. テストウインドウでデバッグ
2. Webページ上でデバッグ
この内、デバッグテキストを使うのは 1. の時だけです。
そもそも、あのデバッグテキストは、2つのフィルタを対象にテストウインドウ上でテストできないProxomitronの仕様に対処するために作りました。
「Google: High Light 1」は「Google: High Light 2」と組み合わせずとも動作しますが、「Google: High Light 2」は「Google: High Light 1」があることを前提としたフィルタのため、「High Light2」単体では期待通りに動作しません。
ですので、私は「High Light 1」で行う「グローバル変数にセットする処理」をデバッグテキストに含めたのです。
>301でも触れましたが、デバッグ方法を別の言葉に改めると以下のようになります。
1. 「Google: High Light 1」をテストウインドウで単体テスト
2. 「Google: High Light 2」をテストウインドウで単体テスト (1. で行った処理をデバッグテキストに含めてみる)
3. デバッグテキストを外し、Webページ上で実地テスト
3. のステップは単体テストではないので、デバッグテキストは使いません。
勿論、3. のステップで単体テストを行っても構いませんが、あくまで単体テストなので、「デバッグにかけるフィルタのみを有効に」します。
(デバッグテキストを使う場合は、「Google: High Light 1」と「Google: High Light 2」を両方有効にして、デバッグを行いません。)
認識にズレがないということでしたら、手間をかけてすみませんが、「どのような行程を経て、デバッグしているか」と「デバッグテキストをどのような用途で使うか」を説明していただけないでしょうか。
私の方でも検証しようと思います。
> ReplaceStr-utf8のリストに含まれていたデバッグ用テキストが今更気になり
ReplaceStr-utf8のリストにデバッグテキストが入ってました…?
記憶にないです(汗)
>>421 > 支障はなくただの疑問なのでこのまま流していただいて構いません
疑問に思うところがあれば指摘していただいてかまいません。
というより、指摘していただいた方が私は嬉しいです。
「何度もしつこいと思われるかもしれませんが」というような懸念があるのであれば、全くの杞憂なのでそこは気になさらないでください。
レスをつけるかは別にして、否定的な意見も肯定的な意見も参考にさせていただいています。(煽りは勘弁願いたいですが)
>>415 私より詳しい方(>417-418)がアドバイスがあったので静観していましたが、解決したのでしょうか?
解決済みであれば良いのですが。
下記、ちょっと誤解を生む表現だったので、訂正します。
>>449 > 勿論、3. のステップで単体テストを行っても構いませんが、あくまで単体テストなので、「デバッグにかけるフィルタのみを有効に」します。
フィルタを一つだけ有効にするのは骨が折れるので、そこまでしなくても良いです。
ここで言いたかったことは、ある組み合わせのフィルタがあるときに「その組み合わせの中の一つだけを有効にする」という意味です。
(例) 「Google: High Light 1」と「Google: High Light 2」の内、片一方のフィルタだけを有効にする
# このやり方で大方問題ないですが、希に他のフィルタが先にマッチしてしまう事があるので、デバッグモードでフィルタが干渉していないか調べておくと安心です。
# 慣れてくると干渉しそうなフィルタに見当が付いて先に無効化しておくこともできますが、フィルタの数が多くなるとそれも怪しくなってきます。
# フィルタの干渉に気がつかないで時間を浪費するのは悲しいので、デバッグモードによるチェックを習慣にしておくと良いと思います。
3行で頼む
少 年 ナイフ
googleにリンク付けるフィルタの更新もお願いします。
>>448 02/08fixed版だと誤爆しなくなりました。ありがとう御座います。
で、誤爆の状況ですがこんな感じ。
http://up2.viploader.net/upphp/src/vlphp135247.jpg 上がバイパス状態で下が適用してた時です。
ソースで言うと
---------- ここから ----------
<a href='/service/attach/?BP=493453&FP=010000001898584' target='_blank'>
<img copyright="yes" border='0' style='margin:5px;'
src='
http:// 〜〜(長いので略)' align='' onContextMenu='return false;' /></a><br />
[謎の袋]<br />
---------- ここまで ----------
これが
---------- ここから ----------
<br />
<a href='/service/attach/?BP=493453&FP=010000001898584' target='_blank'>ProxAllow='return false;' /></a><br />
[謎の袋]<br />
---------- ここまで ----------
こうなってました。
ウチも[2007/05/23] fixedだけど、ちゃんと謎の袋画像見えるよ。
thinkさぁ、丁寧なのは良いんだけどイチイチ冗長なんだよ。 前にも言ったけど。 /.Jの様なノリでケツにゴチャゴチャ書く事多いし。
そりゃ長文が苦手で余談・補足の記法に馴染みがないだけじゃね
冗長なのは基本的によくないけど、 専門的なフィルタに説明が必要なのはしかたないことかと。 あとは説明の方法しだい。
冗長かもしれないけど、説明的でわかりやすいからこれはこれで有りだと思う。 あと、簡潔にわかりやすく書くのって結構センス居るんだわ。 その辺の問題があるから、無理して簡潔に書くより取りこぼしが少ない方が嬉しい。 それに、わかる人なら読み飛ばせばいいだろうってのも。
お前らが理解できようが読みづらかろうが、今は関係ないけどな 大事なのは、相手に正しく伝わったか、だ
自サイトでフォーラムなり掲示板なりを作って そっちでやったほうがいいのにとは思う。
なんで?
a a
>>462 自サイトでフォーラムなり掲示板なりを作って
三行以上書き込めないようにしたら?
見てるだけでも勉強になるからそのままのチンクでいてくれ
同感
同感
この手の人間に何かを期待するのは無駄だよ。
他人の書き込みが目に障るならフィルタリングすればよいのでは
名前欄がthinkの書き込みの語尾を「にょ」に変換するフィルタきぼん!
私はバカなので丁寧な説明が付いているのはありがたい 自分で応用する時に役に立つし
専ブラでみるとき楽だからここでやってもらった方がログ見るの面倒くない 自分関係なくても丁寧な説明はなんだか役に立つような気がする・・・気がする・・ しばらく前からアマゾンとかでスクリプトエラー頻発するけどナニが問題なのかパッと見分からん めんどい・・・
>>471 作ってみたw まだ作り途中だがw
[Patterns]
Name = "think ress to nyo"
Active = TRUE
Multi = TRUE
URL = "[^/]++.2ch.net/*/read.cgi$TYPE(htm)"
Bounds = "(<a|<font)\s[^<]+<b>think*(</dl>|<dt>)"
Limit = 4096
Match = "(\#<br>$SET(#=にょ<br>))+\#"
Replace = "\@"
ワラタ 句点だけでも置き換えられたらもっと面白い
なるほど"。"を"にょ。"にすればいいか [Patterns] Name = "think ress to nyo" Active = TRUE Multi = TRUE URL = "[^/]++.2ch.net/*/read.cgi$TYPE(htm)" Bounds = "(<a|<font)\s[^<]+<b>think*(</dl>|<dt>)" Limit = 4096 Match = "(\#。$SET(#=にょ。))+\#" Replace = "\@"
>>476 意外に違和感なかったw
「の」を全部「にょ」に変換しても良いかもしれないな
451 :think ◆MM0nnAOCiQ :2008/02/08(金) 01:50:31 ID:G2JZag5c0
下記、ちょっと誤解を生む表現だったので、訂正しますにょ。
>>449 > 勿論、3. のステップで単体テストを行っても構いませんが、あくまで単体テストなので、「デバッグにかけるフィルタのみを有効に」しますにょ。
フィルタを一つだけ有効にするのは骨が折れるので、そこまでしなくても良いですにょ。
ここで言いたかったことは、ある組み合わせのフィルタがあるときに「その組み合わせの中の一つだけを有効にする」という意味ですにょ。
(例) 「Google: High Light 1」と「Google: High Light 2」の内、片一方のフィルタだけを有効にする
# このやり方で大方問題ないですが、希に他のフィルタが先にマッチしてしまう事があるので、デバッグモードでフィルタが干渉していないか調べておくと安心ですにょ。
# 慣れてくると干渉しそうなフィルタに見当が付いて先に無効化しておくこともできますが、フィルタの数が多くなるとそれも怪しくなってきますにょ。
# フィルタの干渉に気がつかないで時間を浪費するのは悲しいので、デバッグモードによるチェックを習慣にしておくと良いと思いますにょ。
愛されてるナァw
こういうばかばかしいのはいいな。もっとやってくれ。
本人には悪いが和んだ (*´∀`)
ノリがいいですねw
でもこれじゃ にょにょ。になる罠ww
>>481 自分で語尾ににょを付けて
>>476 のフィルタの例外処理不足を教えるとは…
ほんとにthinkさんはいい人ですにょにょ。
ネタにマジレスするばかばかしさが好きですにょ。
>>477 > 「の」を全部「にょ」に変換しても良いかもしれないな
それはこういうときに困ると思うの。
宣伝は要らないな
thinkをちんこにするフィルターおねがいします
ちょっと調子に乗っちゃったかもね… まあガンバレ
今頃気がついたがここは隔離スレだったのか
ニコニコは専用スレがあるからそっちで
>>491 Match = "(<a href="
http://www.nicovideo.jp/ "
"(watch$SET(1=thumb)|mylist$SET(1=thumb_mylist))"
"(/[^"]+)\2")\0(^(^ class="video">))"
Replace = "\0 onMouseOver="return popThumb('\1\2', 0)" onMouseOut="return nd()""
>>493 ありがとうございます。おかげで何とか出来ました。
>>492 そうですね。次からはそちらで質問させていただきます。
>>455 こちらでは「Allow right mouse click plus [2007/05/23] fixed」で動作しているので、どこに原因があったのかは未だにわかりません。
しかし、02/08fixed版で正常動作しているということなので、終わりよければということで…。
(ひょっとしたら、他のフィルタと干渉していたのかもしれませんね。)
別の方法で対策した改良版を作ってみましたので、良かったらこちらもどうぞ。
3点のフィルタで使われた対策に加えて、それ以上の対策も少し施してあります。
thinkのScrapBook: 右クリック禁止を解除するProxomitronフィルタ
http://thinkarc.blogspot.com/2008/02/proxomitron.html
>>252 私も
>>253 さんのフィルタを使ってます。マッチできないものもあったので、フィルタを自作できない自分ですが、自分なりに書き換えてみました。
もしまだ見てたら使ってみてください。
URL = "202.212.88.55/|techside.in.arena.ne.jp/"
Limit = 3456
Match = "$NEST(<table\swidth="600"*['|]*,/table>)"
これは酷い
>>497 やっぱり?
きちんとしたものにするためのアドバイスがあったらおくれ。
何の意図があって、どのような仕様/結果を期待して改造したのかさっぱりわからない。 だからアドバイスもしようがない。
>>500 いや、そりゃわかるわw
Limitを3500〜4000程度に変えるだけで問題なさそうだけど、*['|]*って何がしたかったの?
* これだけで済むなw
>>501 こっちの掲示板の、
http://202.212.88.55/anime/chabo.cgi この文字列がマッチしなかったからマッチするように試行錯誤したのです。
<table width="600" border="0" align="center" cellspacing="2" cellpadding="4"><tr><td><small>■ おもちゃ&ホビー−トップセラー(Ama
zonアソシエイト) ○<a href=httde-22 target="_blank">魔法少女リリカルなのはA's フェイト・テ</a> </small></td></tr></ta
ble></FORM></DIV><hr><!--202.212.88.55--><b><b><足></b>崩した正座。<a href="http:
//dat.jpg" target='_blank'>[URL]</a><SMALL>[02/10 01:33] </SMALL>
行が長すぎるから途中で改行したけど、ソース全体が一列の文字列になってます。一列になってるおかげでマッチしなくなってたのです。
結果原因見つけて、「'」があってもなくてもどっちでもマッチしないとパターンによって消えないからそれを入れてみたら動いたのです。
>>502 ほんとだっ(`・ω・´)
もとのだとマッチしなくて困ってたので、よりスマートに出来てよかったのです。
どもですっ。
505 :
名無しさん@お腹いっぱい。 :2008/02/11(月) 14:16:19 ID:2dXZFCkK0
Limitはリンクの最大の文字列にあわせつつ、数はどういうのが適当なのかわからないから
>>14 の書き込みにあわせてみました。
もとのに*入れるだけでよかったとは、いろいろためしたくせに気づかなかったです。
ありがとうですっ。
ということでこんどこそきっと完成です(`・ω・´)
URL = "202.212.88.55/|techside.in.arena.ne.jp/"
Limit = 3456
Match = "$NEST(<table\swidth="600"*,/table>)"
506 :
名無しさん@お腹いっぱい。 :2008/02/11(月) 14:55:43 ID:9RqHnvJn0
>>505 先日そこの掲示板でProxomitronを知った俺にぴったりのフィルターだ
あんただったのか。サンクス。 知識のない俺には難しそうだけどフィルター作り挑戦してみるかな−。
$NESTだからアスタリスクなくてもよくね?
>>509 それだとリンクに'がまざったときにマッチしなかったのです(´・ω・`)
>>503 は削りすぎました(´・ω・`)
>>511 > それだとリンクに'がまざったときにマッチしなかったのです(´・ω・`)
これってどういう状況なんでしょう?
テストウインドウ上では、>253のフィルタで>502のHTMLソースにマッチしましたし、実際にフィルタを見ても、「'」に原因があるようには思えませんでした。
<table> が以下のようになっていればマッチしませんが、そういうことなんでしょうか…。
<table width='600' border='0' align='center' cellspacing='2' cellpadding='4'>
>>510 今回のフィルターとは全く関係無いが
$NESTが上手く動作しない理由を始めて理解したよw
>>518 自分も全く思いもよらなくて、数時間に渡ってすこしづつ文字列を削ってようやく発見したので、別のところで役に立ったのならうれしい限りですっ。
結局今のところ
>>505 のフィルタじゃないとしっかり動いてくれてないです_| ̄|○
なんかカオスになってきたな…なんか違う話してるやつが混じってないか?
>>515 どうやら原因は、以下2つのようです。
・HTMLソースに </table> がない
・>253のフィルタでは、Limitが足りない
UPされたソースの最後に </table> を付け加えて、Limitを 4096 に変えたら>動作しました。
ttp://202.212.88.55/psp/chabo.cgi では </table> があるので、ソースのコピペで失敗しちゃってるのかもしれないです。
[Patterns]
Name = "253"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 4096
Match = "$NEST(<table\swidth="600",/table>)"
Replace = "<!-- 253 -->"
というわけで、「'」は無罪となりましたw
>>513 > amazonのURLは和書だと以下のようなものもあるので、
あ、そこまで厳密には考えてませんでした。
AmazonのURLは仕様変更が多々あって非常にわかりづらいですね。
Control URLのリスト用に書いた「Amazonの表現」があるので、これを改造して作ってみました。
■Control URL用リスト
# Amazon -- 新URLに転送
(www.|)amazon.(co.|)jp/(exec/obidos/ASIN/([\%~0-9%41-%5a]+{10}/)\0|gp/product/\0)&[Tab]$JUMP(
http://www.amazon.co.jp/dp/\0 )
# Amazon -- URL内の商品名文字列を削除
(www.|)amazon.(co.|)jp/[\%0-9a-z~]+{1,*}(-[\%0-9a-z~]+{1,*})+{1,*}/(dp/[\%~0-9%41-%5a]+{10}(/|(^?)))\0[Tab]$JUMP(
http://www.amazon.co.jp/\0 )
■フィルタ
[Patterns]
Name = "TS: Kill amazon affiliate ad [2008/02/11] test1"
Active = TRUE
URL = "$TYPE(htm)202.212.88.55/(ch/|psp/)chabo.cgi(^?)"
Limit = 8192
Match = "$NEST(<table(\s|>),"
"*<a\s[^>]++href=$AV((
http:// (www.|)amazon.(co.|)jp/([\%0-9a-z~]+{1,*}(-[\%0-9a-z~]+{1,*})+{1,*}/|)"
"(dp/[\%~0-9%41-%5a]+{10}/|exec/obidos/ASIN/[\%~0-9%41-%5a]+{10}/|gp/product/[^/]+/)[^/-]+-22(/|)"
")\0)"
"*,</table>)"
Replace = "<!-- Kill Kill amazon affiliate ad: \0 -->"
■備考
アフィリエイトURLはよくわからないので、あまり深い検証はしてないです。
サンプルがあれば対応する気はありますので、希望があれば仰ってください。
よく考えたら、知識のないままいろいろなフィルタをつけてるので、それのどれかが干渉してることがあるかもしれないですね_| ̄|○
うちの環境なら
>>505 で一見普通に動くのは、その他のフィルタと何らかの干渉があるのかもしれないです。
$NEST起因の問題かどうかは今ひとつわかりませんがとりあえず、$NESTを使わない方式に切り替えてみましょうか。
[Patterns]
Name = "TS: Kill amazon product url [2008/02/11] test2"
Active = TRUE
URL = "$TYPE(htm)202.212.88.55/(ch/|psp/)chabo.cgi(^?)"
Limit = 8192
Match = "<table(^(^(\s|[^>]+>)"
"((^</+table>)?)++<a\s[^>]++href="
"$AV((
http:// (www.|)amazon.(co.|)jp/([\%0-9a-z~]+{1,*}(-[\%0-9a-z~]+{1,*})+{1,*}/|)"
"(dp/[\%~0-9%41-%5a]+{10}/|exec/obidos/ASIN/[\%~0-9%41-%5a]+{10}/|gp/product/[^/]+/)([^/-]+-22(/|)|)"
")\0)))"
Replace = "\r\n<table style='display: none'"
更新点
- アフィリエイトが付かないURLにも反応するようにした (>524のAmazonのリンクはアフィリエイトではありませんでした)
- $NEST を外し、先読みでAmazon URLを発見したら、table要素に "display: none" を適用するようにした
# >524での正常動作を確認済みです。
>>525 > その他のフィルタと何らかの干渉があるのかもしれないです。
検証時に少し気になったのですが、>524はフィルタ適用後のソースですよね?
(私が作成したフィルタが出力したと思われるHTMLが混じっていたので)
HTMLソースをテストにかけるときには、Proxomitronを通さないバイパス状態のHTMLでテストするのが一番いいです。
フィルタリング後のソースに対してテストするということは、干渉すること前提の検証になってしまいます。
Web制作者が作ったそのままのHTMLでテストした後に「フィルタが干渉しないようにするにはどうしたらいいか」を考える方が無駄が少ないと思います。
# 私の環境では>523のフィルタで
ttp://202.212.88.55/psp/chabo.cgi の広告を削除できているので、
# 問題があったとしても原因がどこにあるのかが判断できないでいます。
次にまた問題が発生したら、バイパス時のソースで試してみてはどうでしょうか。
自分で考えてわからなければ、また一緒に考えてみましょう。
>>527 ありがとうございますっ。
今回のフィルタで完全にフィルタが見えなくなってましたっ(≧▽≦)
Boundsのほうがなんとなく安心して使えるような気がします。
ただ、掲示板群全部を対象にしたいので、URLのマッチについては
$TYPE(htm)202.212.88.55/|techside.in.arena.ne.jp/ に変更してみましたっ。
この掲示板群で、唯一改行が完全に入ってる
http://202.212.88.55/ch/chabo.cgiだと 、もとのフィルタで問題がなかったのですが、全てが一行になってるほかの掲示板では機能しなかったのです。
それから、アマゾン部分を抜き出しただけでは機能するのですが、このソースの最後に、一つ以上「'」をつけると、いきなり機能しなくなります。
このことが、「'」が原因じゃないかと自分が考えた理由です。
>>526 のソースも、全ての改行を削除して、最後に「'」の一文字だけを追加するだけで、Proxomitron側のテストでも、合致なしとなってしまいます。(バージョンはNaoko 4.5(2003-6-1)+6です。
あと、デフォルトのソースだとIPアドレスがそのまんまソースに乗ってしまうので、ついフィルター後のをアップしてしまいました。
一応、全て一行になっている、Proxomitronを通さないソースもアップしときます。(undonuts使ってるので切り替えは楽なので。)
IPアドレスだけはIPアドレスと書き換えておきました。こっちのソースで試しても、もとのフィルタではもちろん駄目でした。上記条件でも全く一緒でした。
http://www.uploda.org/uporg1245745.zip.html それにしても、掲示板にアクセスしただけで自分のIPがソースに載るってことは、投稿時か何かに使われるってことですかね?
>>528 あっと、
>>523 のフィルタの場合、私の環境でもほとんどの場合問題がないです。大体削除できています。
でも、何度もクリックしていると、「'」のあるリストだけは削除されずに表示されるのです。
初見の場合はもちろん気づかないのですが、このサイトのユーザー的には一日に何度も見るので気にかかってたのでした。
この掲示板群のあるサイトについてですが、この一言形式の掲示板はこのサイトの主催者が自分でソースを改造したりして作ってて、URLとかも独自なものとなってます。
>>529 ソースにリモホ出してる意味はわからないけど、それとそのIPを使うかどうかは別問題というか
そもそもTCP/IPで通信するならこちらのIPを通知しないと通信が成立しないから。
(初対面の人にこちらの住所書かないで「必ず返信ください」って葉書出してもムリなのと同じ)
リモホを公開ページ上で利用するかしないかは管理人次第だけど、まぁ、要するに全く別問題。
このリモホを表示するってのはこの『ChaBo』っていう掲示板CGI自体の初期仕様だね。
TECHSIDEの中の人が意図的に表示してるわけではないみたいよ。
>>530 > URLとかも独自なものとなってます。
なんのこっちゃ?
ぶっちゃけTECHさんは何も改造してないみたいだぞ。
ていうか改造してるとかしてないとかオリジナルかどうかとか、フィルタ書くのに関係ないよね?
必死に何かを伝えたいようだが、何を伝えたいのか理解に苦しむ。
わけわからなくなってるのは俺だけかもしれないけど…。そうなら、ごめん。
ちょっと一度落ち着いてからにした方がいいんじゃないかな。
>>533 なるほど、URL Matchの誤爆を警戒してたのね。
TECHSIDEは共用サーバで済むようなアクセス規模じゃないから、専用サーバだと思う…多分。
そうでないとしても、thinkさんみたいに/chabo.cgiまで見るMatchなら実用上問題はないでしょう。
で、確かにケツにシングルクォートを付けると突然Matchしなくなるのはこちらでも確認…
なんでだろう。
俺個人としてはAmazonのURLまで見なくてもURL Matchとwidth="600"を見るだけで
実用上誤爆の危険はほぼ皆無と踏んでるので、これくらいシンプルに書いちゃう。
[Patterns]
Name = "TS: Hide amazon ad [2008/02/11]"
Active = TRUE
URL = "(202.212.88.55|techside.in.arena.ne.jp)/*chabo.cgi $TYPE(htm)"
Limit = 64
Match = "<table width="600"[^>]+"
Replace = "<table style="display:none""
これで、全てのページで動作するのは確認できました。
多分thinkさんは妥協しないでしょうがwもし妥協するならこれでどうでしょう?
いや、ていうかあれか。もうなんでケツに'が付いてると動作しないのかを ひたすら検証する流れになってるのか。なんかくらくらしてきた。 ごめんなさい。俺が悪かったですorz
$NESTに>510のような仕様があったなんて……。 ちょうど対策に困っているフィルタがあるので、ひとつ改善を依頼してみます。 Name = "invisible frames to links1 (2007.06.04)" Active = FALSE URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))" Bounds = "$NEST(<frameset,</frameset>)" Limit = 3072 Match = "*(cols|rows)=$AV(" "( (0%|[01])\1 , \2| (^0%|[01])\1 , (0%|[01])\2| (100%)\1 , (0%|[01]|\*)\2| (100%|\*)\1 , (0%|[01])\2) " "((,*)\7$SET(frame3=<p>[more frames found]</p>\r\n)|)" ")" "*<frame\s(([^>]++name=$AV(\3)|$SET(3=no-name)&[^>]++src=$AV((?*)\5)|$SET(5=about:blank)" ")$SET(frame1=<p>[frame - "\3" - \1]<br>\r\n<a href="\5">\5</a></p>\r\n))" "(*<frame\s(([^>]++name=$AV(\4)|$SET(4=no-name)&[^>]++src=$AV((?*)\6)|$SET(6=about:blank)" ")$SET(frame2=<p>[frame - "\4" - \2]<br>\r\n<a href="\6">\6</a></p>\r\n)" ")|$SET(frame2=<p>[frame not found]</p>\r\n))" "(*<frame\s$SET(frame3=<p>[more frames found]</p>\r\n)|)" "*" Replace = "<body class="invisible-frames">\r\n<p>invisible frames found</p>\r\n" "$GET(frame1)$SET(frame1=)" "$GET(frame2)$SET(frame2=)" "$GET(frame3)$SET(frame3=)" "</body>" アクセス性の向上を目的としたフィルタ。 UAに表示されるURLを固定させるために見えないフレームを使っているサイトがあり、 これらのサイトで「戻る」動作をすると、戻りたくない場所まで戻ることがある。 このフィルタは、フレームをアンカー化することにより見えないフレームを可視化する。
>>534-535 ありがとですっ。
$NESTはなんとなく今回謎の挙動をしたので、$NESTは外した形で、フィルタは
>>527 で完璧だと思うのですが、
自分がじっくり見たソースがもとにした新しいフィルタをみるのは勉強になりますね。
>>1 のProxomitron等に関するWiki でマッチングルールとにらめっこしてても、イマイチ理解できないというかどうもさっぱりなのですが、新しく書いてくれたのを見ると
前のと見返して、なるほどと思える部分があっていい感じなのです。
$NESTを使う意味については
>>510 で教えてもらったページを読んでもまだしっかりとわかってないのですが_| ̄|○
誤爆する例。 内側のframesetにのみマッチすると想定通りの結果が得られるが、 外側のframesetにまでマッチしてしまう。 <frameset rows="89,*" border="1"> <FRAME name="topFrame" height="89" scrolling="NO" noresize marginheight="0" marginwidth="0" src="head.htm"> <FRAMESET rows="50%,0" frameborder="NO" border="0"> <FRAME name="mainFrame" marginheight="0" marginwidth="0" src="main.htm"> <FRAME name="voice" src="voice.htm" noresize scrolling="NO"> </FRAMESET> <NOFRAMES><P>このページを表示するには、フレームをサポートしているブラウザが必要です。</P></NOFRAMES> </frameset> 考えられる対策 ・バイト制限。ただし、根本的な対策にならない。 ・$NESTを使わない。 ・$NESTを使いつつ、条件を改善する。 できれば$NESTを使えるほうが速さを落とさずに済むような気がします。
$NESTを使えば早くなるという嘘を広めてるのは誰なんだ。
>>529 > 全てが一行になってるほかの掲示板では機能しなかったのです。
どうやら、これが原因みたいですね。
>531のHTMLを一行にして、テストウインドウで検証すると興味深い結果になりました。
■>523のフィルタの場合
- HTMLソースの一部に改行を含むと、マッチする
- </table> の直後に ' を挿入するとマッチしない
- </table> の直後に改行以外の文字を挿入して、その後「'」を挿入するとマッチしない (例) </table>test'
■回避策
$NEST を $INEST に変更することで、問題を回避できるようです。
[Patterns]
Name = "TS: Kill amazon affiliate ad [$INEST] [2008/02/11] test1"
Active = TRUE
URL = "$TYPE(htm)(techside.in.arena.ne.jp/|202.212.88.55/)*/chabo.cgi(^?)"
Limit = 4096
Match = "<table(\s|>)$INEST(<table(\s|>),"
"*<a\s[^>]++href=$AV((
http:// (www.|)amazon.(co.|)jp/([\%0-9a-z~]+{1,*}(-[\%0-9a-z~]+{1,*})+{1,*}/|)"
"(dp/[\%~0-9%41-%5a]+{10}/|exec/obidos/ASIN/[\%~0-9%41-%5a]+{10}/|gp/product/[^/]+/)[^/-]+-22(/|)"
")\0)"
"*,</table>)</table>"
Replace = "<!-- Kill Kill amazon affiliate ad: \0 -->"
>>534 > 多分thinkさんは妥協しないでしょうがw
別に対抗意識を燃やしたわけじゃないんだか(ry
>>540 いやいや、変な挙動をすると原因と対策がわかるまでとことん調べてくれるのは
いつもthinkさんなので…。そういう意味で、妥協しない、と。変な意味じゃないんですよ。
いつも勉強になってます。
>>540 何度もありがとうございますっ。
ただ、私のところでは、今回の$INESTをつかったフィルタでも、
http://202.212.88.55/psp/chabo.cgiで 、>531の■ おもちゃ&ホビー−トップセラーがでた場合、表面に出てきてしまいました。
Proxomitron側で>531の文字列で最後に ' を入れてテストみても[合致なし]になってしまいました。
>>527 以外だと、最初のものに*を加えただけの
>>505 機能してるという謎の状況です。
こんがらかりますね_| ̄|○
でも
>>527 を$TYPE(htm)(techside.in.arena.ne.jp/|202.212.88.55/)*/chabo.cgi(^?)に書き換えて機能してるからおっけです(`・ω・´)
>>542 なるほど。
そうすると、自分でこの一言板群に対してフィルターを作ってみる時も、URLで限定しとけば安心っぽいですね。とはいっても、そうそうフィルターを作ることはないでしょうけど。
どうも$NESTは速度向上に役立つという固定観念があります。 今回書いたフィルタではframesetの入れ子を解釈する必要があり、 範囲を指定するために$NESTを使っていたことを忘れていました。 >542 内側のframeset内にあるフレームのみアンカー化するのが希望です。 <frameset rows="89,*" border="1"> 外側のframesetはそのままでもフレームが見えるので、マッチさせないようにします。 <FRAMESET rows="50%,0" frameborder="NO" border="0"> 内側のframesetではrows="0"にあたるフレームが見えなくなるので、 マッチさせる対象になります。 >538の場合、期待する結果は以下のようになります。 <frameset rows="89,*" border="1"> <FRAME name="topFrame" height="89" scrolling="NO" noresize marginheight="0" marginwidth="0" src="head.htm"> <body class="invisible-frames"> <p>invisible frames found</p> <p>[frame - "mainFrame" - 50%]<br> <a href="main.htm">main.htm</a></p> <p>[frame - "voice" - 0]<br> <a href="voice.htm">voice.htm</a></p> </body> <NOFRAMES><P>このページを表示するには、フレームをサポートしているブラウザが必要です。</P></NOFRAMES> </frameset> フレームをすべてアンカー化する方法も考えたものの、 そこまでするといちいちアンカーから移動するのが面倒に感じたので、一応やめました。
>>543 > 今回の$INESTをつかったフィルタでも、
http://202.212.88.55/psp/chabo.cgiで 、>531の■ おもちゃ&ホビー−トップセラーがでた場合、表面に出てきてしまいました。
あ、あれ…?
$INEST版でも、>531を1行にまとめたコードでもマッチしなくて、「■ おもちゃ&ホビー」が出た場合、表面に出てきてしまいました。
検証不足ですね…。失礼しました。
ちょっと思いついたことがあって試してみましたが、今度こそ当たりっぽいです。
>531の問題発生条件は、2つあって
1. </table> の後ろの「'」がある
2. <table> 内部に「'」を含んでいる
というように、2つの「'」が関係しているようです。
>531が 2. で該当しているのは「魔法少女リリカルなのはA's フェイト・テ」ですね。
なので、「A's → As」の変更を加えるだけでも問題を回避できました。
問題をわかりやすくするために、コードをシンプルにしてみました。 ■テスト用のHTMLソース <test>'</test>' ■テスト用フィルタ [Patterns] Name = "$NEST + ' test1" Active = TRUE Limit = 256 Match = "$NEST(<test>,</test>)" Replace = "Replaced" ■不具合症状 $NESTで本来マッチするはずの状況で、マッチしない ■再現条件 $NESTの第二引数の範囲に ' が存在し、$NESTの後に ' が存在する ■回避策 $NESTの第一引数で ' を消費する。 つまり、 Match ="$NEST(<test>',</test>)" ならば、マッチする。 ただし、入れ子チェックが有効に働かないので、実用的ではない。
>547に訂正を入れます。m(_ _)m ■再現条件 以下の2つの条件がそろっている時に再現する。 - $NESTの第二引数の範囲に ' が存在し、$NESTの後に ' が存在する。 - $NESTで消費してから、' が存在する場所まで改行されていない
どもですっ。
条件はそれですねっ。
この板のアマゾンの商品はその日のランキングによってころころ変わるので、今あるほかのランキングでは、ゲームだと、【○ときめきメモリアル Girl's Side 2nd Seaso】がひっかかって表面化するのですが、次はどのジャンルのどんな商品に「'」がくるのかわからないので、
<table>の中に「'」があったら「'」だけを無視する感じならいいかもと思ったのが最初のカキコで書いた
>>496 のフィルターの意図だったのです。
それが、なんか記号間違えてたうえに「*」を加えただけでなぜかうまくいったのでさらにこんがらがったのです。
>>549 >496でマッチするのは、$NESTの第一引数「*['|]*」で ' を消費してしまっているからです。(>547の回避策と原理は同じ)
>505がマッチするのも、* で ' を消費しているから。
ですが、* は貪欲に消費するので、誤爆を考えると使いたくないところです。
再現条件を知ってから、以下のフィルタで ' → ' の置換をして回避を試みましたが、徒労に終わりました。
処理順の関係で有効でないのはわかってはいたのですが……。
[Patterns]
Name = "BugFix: $NEST + single quotation [2008/02/11] test1"
Active = TRUE
Multi = TRUE
URL = "$TYPE(htm)"
Limit = 512
Match = ">(([^<>]++)\#'$SET(#='))+{1,*}"
Replace = ">\@"
>>545 時間の都合で暫定対処ですが、下記フィルタで望み通りの結果を得られると思います。
更新点
- 最小の <frameset> にマッチするようにした
[Patterns]
Name = "invisible frames to links1 [2008/02/11] fixed test1"
Active = TRUE
URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))"
Bounds = "$NEST(<frameset,</frameset>)"
Limit = 3072
Match = "[^>]++(cols|rows)=$AV("
"( (0%|[01])\1 , \2| (^0%|[01])\1 , (0%|[01])\2| (100%)\1 , (0%|[01]|\*)\2| (100%|\*)\1 , (0%|[01])\2) "
"((,*)\7$SET(frame3=<p>[more frames found]</p>\r\n)|)"
")"
"((^<frameset)?)++<frame\s(([^>]++name=$AV(\3)|$SET(3=no-name)&[^>]++src=$AV((?*)\5)|$SET(5=about:blank)"
")$SET(frame1=<p>[frame - "\3" - \1]<br>\r\n<a href="\5">\5</a></p>\r\n))"
"(((^<frameset)?)++<frame\s(([^>]++name=$AV(\4)|$SET(4=no-name)&[^>]++src=$AV((?*)\6)|$SET(6=about:blank)"
")$SET(frame2=<p>[frame - "\4" - \2]<br>\r\n<a href="\6">\6</a></p>\r\n)"
")|$SET(frame2=<p>[frame not found]</p>\r\n))"
"(((^<frameset)?)++<frame\s$SET(frame3=<p>[more frames found]</p>\r\n)|)"
"((^<frameset)?)+"
Replace = "<body class="invisible-frames">\r\n<p>invisible frames found</p>\r\n"
"$GET(frame1)$SET(frame1=)"
"$GET(frame2)$SET(frame2=)"
"$GET(frame3)$SET(frame3=)"
"</body>"
>>551 の続き。
* を ((^<frameset)?)++ に変更することで、$NEST() 内部に <frameset> を持たないようにしています。
まだ最適化の余地はありそうでしたが、時間の関係で今回は暫定対処に留めました。
時間がとれたら、また手を入れてみようと思います。
時間がとれたらと言いながら、よりスマートな解決法に気がついたのでほんの少し更新。 更新点 - cols属性、rows属性を <frameset> のタグ内で読むようにした (>551で修正しています) - <frameset> の内部チェックを (^*<frameset>) に変更 [Patterns] Name = "invisible frames to links1 [2008/02/11] fixed test2" Active = TRUE URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))" Bounds = "$NEST(<frameset,</frameset>)" Limit = 3072 Match = "[^>]++(cols|rows)=$AV(" "( (0%|[01])\1 , \2| (^0%|[01])\1 , (0%|[01])\2| (100%)\1 , (0%|[01]|\*)\2| (100%|\*)\1 , (0%|[01])\2) " "((,*)\7$SET(frame3=<p>[more frames found]</p>\r\n)|)" ")[^>]+>" "(^*<frameset>)" "*<frame\s(([^>]++name=$AV(\3)|$SET(3=no-name)&[^>]++src=$AV((?*)\5)|$SET(5=about:blank)" ")$SET(frame1=<p>[frame - "\3" - \1]<br>\r\n<a href="\5">\5</a></p>\r\n))" "(*<frame\s(([^>]++name=$AV(\4)|$SET(4=no-name)&[^>]++src=$AV((?*)\6)|$SET(6=about:blank)" ")$SET(frame2=<p>[frame - "\4" - \2]<br>\r\n<a href="\6">\6</a></p>\r\n)" ")|$SET(frame2=<p>[frame not found]</p>\r\n))" "(*<frame\s$SET(frame3=<p>[more frames found]</p>\r\n)|)" "*" Replace = "<body class="invisible-frames">\r\n<p>invisible frames found</p>\r\n" "$GET(frame1)$SET(frame1=)" "$GET(frame2)$SET(frame2=)" "$GET(frame3)$SET(frame3=)" "</body>"
>>550 なるほど。
処理の優先順位とか、* の強力さとかでマッチだけはしてたって感じなんですね。
原因を理解できてよかったですっ。
>think氏 $NESTの誤爆マッチングの例、間違ってる。 <div class='ad'>では無く<div class='ad2'>では?
テロリストが暗号でやり取りしてるスレっぽいので通報しました
JavaScriptがonだと(何時もonです)メール欄がsageになりません。 方法を教えてください。 Name = "2ch Reset+" Active = TRUE URL = "[^/]++.(2ch.net|bbspink.com)/" Limit = 30 Match = "<input name=mail size=19>" Replace = "<input name=mail size=19 value="sage">"
>551-553 どうもありがとうございます。希望する動作になりました。 最深部のframesetにマッチするしくみのようで、 マッチの対象になるframesetが多重にあった場合、 階層の浅い方のframesetにはマッチしないことになりますね。 ただ、フレーム関連はただでさえ要素が入り乱れて対処が面倒なので、 誤爆対策だけしっかりしておけばだいたい通用するかと思います。 (^*<frameset>)の部分では、「>」は必要でしょうか。 「\s」などに置き換えたり消したりしても問題なく動作しているように見えますが、 あえて「>」を入れる理由があれば知りたいです。 もともと3つ以上のフレームに同時に対応させるつもりで設計したフィルタですが、 現在のところ2つまでしか対応させていないので、 グローバル変数を削除するなど細部のメンテナンスをしました。
Name = "invisible frames to links1 (2008.02.12 beta1)" Active = TRUE URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))" Bounds = "$NEST(<frameset,</frameset>)" Limit = 3072 Match = "[^>]++(cols|rows)\0=$AV( " "((0%|[01])\8 , \9|(^0%|[01])\8 , (0%|[01])\9|(100%)\8 , (0%|[01*])\9|(100%|[*])\8 , (0%|[01])\9) " "(,*$SET(3=<li>more frames found</li>\r\n)|)" ")[^>]+>" "(^*<frameset)" "(*<frame\s([^>]++name=$AV(\4)|$SET(4=no-name)&[^>]++src=$AV((?*)\6)|$SET(6=about:blank)" ")$SET(1=<li><dl>\r\n<dt>frame: \4; \0="\8"</dt>\r\n<dd><a href="\6">\6</a></dd>\r\n</dl></li>\r\n))" "((*<frame\s([^>]++name=$AV(\5)|$SET(5=no-name)&[^>]++src=$AV((?*)\7)|$SET(7=about:blank)" ")$SET(2=<li><dl>\r\n<dt>frame: \5; \0="\9"</dt>\r\n<dd><a href="\7">\7</a></dd>\r\n</dl></li>\r\n)" ")|$SET(2=<li>frame: not found</li>\r\n))" "(*<frame\s$SET(3=<li>more frames found</li>\r\n)|)*" Replace = "<body class="invisible-frames">\r\n<p>invisible frames found</p>\r\n<ol>\r\n\1\2\3</ol>\r\n</body>"
>最深部のframesetにマッチするしくみ と書いて気づいたのですが、以下のような例だと>559はマッチしませんでした。 <frameset rows=" 100% , 0 "> <frame name="MENU" src="menu.html"> <frameset rows=" 100 , 0 "> <frame name="CONTENT1" src="content1.html"> <frame name="CONTENT2" src="content2.html"> </frameset> </frameset> この例の場合、本来なら外側のframesetのみマッチさせる対象になり、 内側のframesetはマッチさせる対象になりません。 外側にマッチさせてそこにbody要素を置く都合上、 内側のframesetの存在はどうでもよくなります。 >536は内側のframesetを無視してフレームをアンカー化させるものの、 >559では(^*<frameset)の副作用で[合致なし]になります。 (^*<frameset)を取り除くとマッチするので、 (^*<frameset)以外によい方法を考えるか、>536と併用することになりそうです。
ここはちんこ隔離スレ
>>516 まだみてたら。
素人的アプローチ。
[Patterns]
Name = "Naruse junkai deleter (technashi)"
Active = TRUE
URL = "www.rakugakidou.net/"
Limit = 30000
Match = "$NEST(<table\scellpadding="0"\scellspacing="0"\swidth="172",/table>)"
[Patterns]
Name = "Naruse kininaru deleter (technashi)"
Active = TRUE
URL = "www.rakugakidou.net/"
Limit = 15000
Match = "$NEST(<td\swidth="178"\salign="left"\svalign="top",/table>)"
[Patterns]
Name = "Naruse amazon deleter (technashi)"
Active = TRUE
URL = "www.rakugakidou.net/"
Limit = 30000
Match = "$NEST(<table\scellpadding="0"\scellspacing="0"\swidth="170",/table>)"
563 :
名無しさん@お腹いっぱい。 :2008/02/12(火) 12:48:20 ID:th3f4nE80
>$NEST(<a\s,</a>) は <a\s*</a> よりも高速に動作する、という事です。 これ、\sの直後に*が来てるから後者が遅いだけじゃないか? $NEST(<a(\s*|)>,</a>) と <a(\s*|)>*</a> 検索対象=「<a hoge>url</a>aaaaaaaaaaaaaaaaaaaaaaaaa」を100個並べた物 だと逆転する。どっちにしろ誤差の範囲内だが。
>>516 自分はこれで見てます
[Patterns]
Name = "Rakugakido Filter"
Active = TRUE
URL = "www.rakugakidou.net"
Limit = 20480
Match = "$NEST(<a\sh[^>]++hobbystock.jp,</a>)|"
"$NEST(<p\salign="center">,</p>)|"
"$NEST(<table[^w]++width="530" height="1(1|2)0",</table>)|"
"$NEST(<table[^w]++width="170,</table>)|"
"$NEST(<(no|)script,</(no|)script>)|"
"$NEST(<table[^w]++width="896" height="120,</table>)"
Replace = "<!-- Proxo for rakuga -->"
よりスマートなやり方があれば、申し訳ないが教えて頂きたい
566 :
557 :2008/02/12(火) 18:40:45 ID://JOoZX+0
誰か教えてください><
>>563 $NESTで高速化したと思ってる人にはそう思わせてあげようよ。
$NESTを使うと逆に何倍も遅くなるケースだってあるけどそれでも体感的には変化ないし。
>>565 Limit = 64
Match = "<td width="180" align="left" valign="top">"
Match = "$SET(0=<td style="display:none">)|"
Match = "\] </h4>$SET(0=\] </h4>\k$STOP())"
Replace = "\0"
>>568 ありがとうございます。とてもスマートです
570 :
516 :2008/02/12(火) 21:15:15 ID:/QvU7x9R0
>>562 ,565,568
ありがとうございます。
広告がなくなり快適に見られるようになりました。
IDはまだ変わってないかな。 >564 わざわざ報告ありがとうございます。 しかしながら、これは仕様通りの動作です。以下で説明します。 マッチさせる前のソース。いらない部分は省略。 <frameset cols="145,*"> <frameset rows="*,0"> <frame src="menu.htm" name="menu"> <!-- <frame src="realtime/real_moe.cgi" name="menu"> --> </frameset> <frame src="top.htm" name="top"> </frameset> マッチさせた後のソース。 <frameset cols="145,*"> <body class="invisible-frames">(略)</body> <frame src="top.htm" name="top"> </frameset>
<frameset cols="145,*"><frame src="top.htm" name="top"></frameset> framesetの中にbodyを含んではならないことになっているので、bodyは無視されます。 その結果、無視されなかった左フレーム(cols="145")だけが描画され、 右フレーム(cols="*")には何も描画されません。 このフィルタはもともと、外側のframesetにマッチさせることを前提とした設計なので、 今回のような場合は誤爆に近い扱いになります。 >564のような場合に対応する (内側のframesetにマッチさせても期待する結果を得る)には もっと複雑なフィルタを考えるか追加でフィルタを作成するなどの必要があり、 そこまで対応させることは考えていません。 わざわざ対応させなくても、今回のような場合は このフィルタが原因で右フレームが描画されなくなったのは明白なので、 問題があった場合に備えてあらかじめ$KEYCHKを設定しています。 $KEYCHKでこのフィルタをバイパスさせるか、 dbug..からソースを見て行きたいフレームの場所を特定することで対策してください。
>559-560の対策として改善をほどこしたフィルタ。 $NESTの中身を調整することで、>538に書いた誤爆を回避した。 Name = "invisible frames to links1 (2008.02.12 beta2)" Active = TRUE URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))" Bounds = "$NEST(<frameset\s[^>]+>,</frameset>)" Limit = 3072 Match = "[^>]++(cols|rows)\0=$AV( " "((0%|[01])\8 , \9|(^0%|[01])\8 , (0%|[01])\9|(100%)\8 , (0%|[01*])\9|(100%|[*])\8 , (0%|[01])\9) " "(,*$SET(3=<li>more frames found</li>\r\n)|)" ")[^>]+>" "(*<frame\s([^>]++name=$AV(\4)|$SET(4=no-name)&[^>]++src=$AV((?*)\6)|$SET(6=about:blank)" ")$SET(1=<li><dl>\r\n<dt>frame: \4; \0="\8"</dt>\r\n<dd><a href="\6">\6</a></dd>\r\n</dl></li>\r\n))" "((*<frame\s([^>]++name=$AV(\5)|$SET(5=no-name)&[^>]++src=$AV((?*)\7)|$SET(7=about:blank)" ")$SET(2=<li><dl>\r\n<dt>frame: \5; \0="\9"</dt>\r\n<dd><a href="\7">\7</a></dd>\r\n</dl></li>\r\n)" ")|$SET(2=<li>frame: not found</li>\r\n))" "(*<frame\s$SET(3=<li>more frames found</li>\r\n)|)*" Replace = "<body class="invisible-frames">\r\n<p>invisible frames found</p>\r\n<ol>\r\n\1\2\3</ol>\r\n</body>"
574 :
名無しさん@お腹いっぱい。 :2008/02/12(火) 23:50:13 ID:DHZsR0rS0
Proxomitron使ってるとyourfilehostで「ERROR: Invalid stream url」って出て動画見れないんだけど どのフィルターを外せばいいんでしょうか?
当たりつけて外して絞って自分で確認しろよ
てs
2chの書きこみ&クッキー確認を押してくれるフィルターがあったと思うのですが ご存知の方、教えてください。
578 :
577 :2008/02/13(水) 13:43:37 ID:X9CWY97V0
2ch bbs.cgi auto submitというフィルタが見つかりました。ありがとうございました。
誤爆と利便性のバランスを踏まえると、全てのフレームをリンク化するのが合理的に思えてきました。 更新点 - URLマッチの & を外した - $TYPE(js) を外した - 全てのフレームをリンク化するようにした - 可視化に伴う記述を若干変更 [Patterns] Name = "invisible frames to links1 [2008/02/14] custom test1.5" Active = TRUE URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))" Bounds = "$NEST(<frameset\s,</frameset>)" Limit = 3072 Match = "((" "<frameset\s" "$SET(#=<p style='color: green;'>frameset: )[^>]++((cols|rows)=$AV(([^,]+, )++([01]%+|100%)*))\#[^>]+>$SET(#=</p>)|" "</frameset>|" "<frame\s$SET(#=<p style='color: green;'>frame: )(([^>]++src=)\#$AVQ(("|)\#" "([^ "']+)\0$SET(FrameSrc=\0)$SET(#=<a href='$GET(FrameSrc)'>$GET(FrameSrc)</a>)("|)\#" ")|)([^>]++)\#/+>$SET(#=</p>)|" "(<(^/frameset>|frame(set|(^set))\s)[^>]+>)\#" ")" "([^<]+)\#)+" Replace = "<body>\@</body>$SET(FrameSrc=)" 入れ子のframeset要素にも対応できますが、入れ子構造を把握できない欠点が残っています。 >564で frameset、frame の内容を把握できますが、frameとframesetの親子関係を見て取れません。
>579は一部、更新が反映されていませんでした。 今度こそ更新点 - URLマッチの & を外した - $TYPE(js) を外した (JSコード内のHTMLにマッチさせるのは危険なため。何か理由があったのかもしれませんが…。) [Patterns] Name = "invisible frames to links1 [2008/02/14] custom test1.6" Active = TRUE URL = "(^$KEYCHK(f))$TYPE(htm)" Bounds = "$NEST(<frameset\s,</frameset>)" Limit = 3072 Match = "((" "<frameset\s" "$SET(#=<p style='color: green;'>frameset: )[^>]++((cols|rows)=$AV(([^,]+, )++([01]%+|100%)*))\#[^>]+>$SET(#=</p>)|" "</frameset>|" "<frame\s$SET(#=<p style='color: green;'>frame: )(([^>]++src=)\#$AVQ(("|)\#" "([^ "']+)\0$SET(FrameSrc=\0)$SET(#=<a href='$GET(FrameSrc)'>$GET(FrameSrc)</a>)("|)\#" ")|)([^>]++)\#/+>$SET(#=</p>)|" "(<(^/frameset>|frame(set|(^set))\s)[^>]+>)\#" ")" "([^<]+)\#)+" Replace = "<body>\@</body>$SET(FrameSrc=)" # 後、一回ぐらい更新してまとめる予定です。
………。 3度目の嘘つきは避けたい更新点 - 2つ以上の<frame>をリンク化したとき、全てのリンクが1つめのURLになってしまう不具合修正 [Patterns] Name = "invisible frames to links1 [2008/02/14] custom test1.7" Active = TRUE URL = "(^$KEYCHK(f))$TYPE(htm)" Bounds = "$NEST(<frameset\s,</frameset>)" Limit = 3072 Match = "((" "<frameset\s" "$SET(FrameLink=$GET(FrameLink)<p style='color: green;'>frameset: )[^>]++((cols|rows)=$AV(([^,]+, )++([01]%+|100%)*))\0[^>]+>" "$SET(FrameLink=$GET(FrameLink)\0</p>)|" "</frameset>|" "<frame\s$SET(FrameLink=$GET(FrameLink)<p style='color: green;'>frame: )(([^>]++src=)\1" "$AVQ(("|)\2([^ "']+)\3("|))" "$SET(FrameLink=$GET(FrameLink)\1\2<a href='\3'>\3</a>\2)|)([^>]++)\4/+>$SET(FrameSrc=\4</p>)|" "(<(^/frameset>|frame(set|(^set))\s)[^>]+>)\0$SET(FrameLink=$GET(FrameLink)\0)" ")" "([^<]+)\0$SET(FrameLink=$GET(FrameLink)\0))+" Replace = "<body>$GET(FrameLink)</body>$SET(FrameLink=)"
>581 すごいですねこれ。 やろうとしてできなかったフレーム全アンカー化が実現されてます。 cols/rows属性の数値も書かれているので、 どういう風にフレームを使っているか、脳内でだいたいレンダリングできるでしょう。 $TYPE(js)を使っているのはそのまんまの意味です。 外部スクリプトで見えないフレームを挿入しているサイトがいくつかあったので 取り入れましたが、JSの知識はほぼないのでそのへんの検証はあまりできていません。 (現在のところ、このフィルタでJSを通しても誤爆したことはないと記憶しています)
>後、一回ぐらい更新してまとめる予定です。 という話なので、もうひとつのフィルタも載せておきます。 Name = "invisible frames to links2 (2008.02.14 beta1)" Active = TRUE URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))" Bounds = "$NEST(<frameset[^>]+>,</frameset>)" Limit = 3072 Match = "<frameset(^[^>]++cols|[^>]++rows)[^>]+>*" "(<frame\s[^>]++src=$AV(\3)[^>]+>$SET(1=<li><a href="\3">\3</a></li>\r\n))" "(*<frame\s$SET(2=<li>more frames found</li>\r\n)|)*" Replace = "<body class="invisible-frames">\r\n<p>invisible frames found; cols/rows not found</p>\r\n<ul>\r\n\1\2</ul>\r\n</body>" Name = "invisible frames to links2 backup (2007.11.11)" Active = TRUE URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))" Bounds = "$NEST(<frameset,</frameset>)" Limit = 3072 Match = "<frameset(^[^>]++cols|[^>]++rows)[^>]+>*" "(<frame\s[^>]++src=$AV(\1)[^>]+>$SET(2=<li><a href="\1">\1</a></li>\r\n))" "(*<frame\s$SET(3=<li>more frames found</li>\r\n)|)*" Replace = "<body class="invisible-frames">\r\n<p>invisible frames found; cols/rows not found</p>\r\n" "<ul>\r\n\2\3</ul>\r\n" "</body>" 上のフィルタは下のフィルタを微調整したもので、検証が済んでいません。 下のフィルタは調整前のものです。こちらは一応の安定版。
>583が動作するソースの例。 cols/rows属性が両方ない場合も、見えないフレームが設置されます。 <frameset> <frame name="test" src="test.html"> <noframes><body></body></noframes> </frameset>
出来るよ。 誰か作ってくれるといいね。
>>585 Match = "(<a href=$AV(
http:// (profiles.yahoo.co.jp/[^/]+{1,*})\1)>*</a>)\0"
Replace = "\0 / <a href="
http://old.\1 ">OLD</a>"
URL Matchはわからないからほったらかしにしたよ。
, - ,----、 (U( ) ページ内のフォーム(<form 〜 </form>)だけ表示して | |∨T∨ < 残りを全て消してしまう様なフィルターをお願いします。 (__)_)
折角なので、素人が作ったらこうなったと言う例でもw Name = "DeFramer 20070314" Active = TRUE Limit = 200 Match = "<((frameset|noframes|/frameset|/noframes)*)\1>" Replace = "<body Add_Proxomitron><span style="color:#000;background-color:#ddd;font-size:10pt;"><\1></span><br></body>\r\n" Name = "Convert Frames to Links 20070314" Active = TRUE Limit = 512 Match = "<frame\s*\0src=$AV(\1)\2>" Replace = "<body Add_Proxomitron><span style="color:#000;background-color:#ddd;font-size:10pt;"><frame \0 src="<a target=_blank href="\1">\1</a>"\2></span><br></body>\r\n" 色やらtargetやらは私の好みと言う事で
>>587 どうもありがとうございます。おかげさまですごく使い勝手が良くなりました。
オクは売買ともによく使うので本当に助かりました。感謝です。
あ、ミス Name = "Convert Frames to Links 20070314" は Match = "<frame\s\0src=$AV(\1)\2>" が正しい‥‥はず
Name = "invisible frames to links2 (2008.02.14 beta2)" Active = TRUE URL = "(^$KEYCHK(f))&($TYPE(htm)|$TYPE(js))" Bounds = "$NEST(<frameset[^>]+>,</frameset>)" Limit = 3072 Match = "<frameset(" "([^>]++(cols|rows)=($AV( [*] | 100% )|["']+ ))|" "(^[^>]++cols|[^>]++rows))[^>]+>" "(*<frame\s[^>]++src=$AV(\3)[^>]+>$SET(1=<li><a href="\3">\3</a></li>\r\n))" "(*<frame\s$SET(2=<li>more frames found</li>\r\n)|)*" Replace = "<body class="invisible-frames">\r\n<p>invisible frames found; cols/rows not found</p>\r\n<ul>\r\n\1\2</ul>\r\n</body>" >584のほかに、以下のようなframesetにも対応した。 実際に試してみると、やはり見えないフレームが設置される。 <frameset cols=""> <frameset rows="*">
>592は誤爆が確認されたので、なしということでお願いします。 誤爆する例。 <frameset cols="100,*" rows=""> <frame name="test" src="index.html"> </frameset> 以下のようなframesetをすべて正常に処理できないと、 フィルタリングされない場合が出てくるかもしれない。 <frameset> <frameset cols=""> <frameset cols=> <frameset rows="*"> <frameset rows=" 100% " cols=" 100 , * "> <frameset cols="100,*" rows=""> <frameset rows="*" cols="*"> <frameset cols="" rows=""> <frameset cols= rows="">
0か1が6個続く [01]{6}ってのはどう書けばいいの?
+がいるのか、ありがとう。
Gmailのスポンサーリンク消すフィルターってありませんか? メールの内容とシンクロしてて気持ち悪い・・・
598 :
http://killthecult.blog.shinobi.j p/ :2008/02/18(月) 14:56:02 ID:pdAJ2Md40
>>598 FAQより。
6. Gmail で広告は表示されますか。
はい。Gmail メッセージの横に、関連性のあるテキスト広告が表示されます。
これらは、Google 検索結果ページの横に表示される広告と同様のものです。
広告とコンテンツの照合は、コンピュータにより完全に自動化されたプロセスで行われます。
広告を表示する際に人間がメールをチェックすることはなく、メールの内容や個人を特定できるような情報を
Google が広告主に提供することもありません。
広告は受信または送信する Gmail メッセージの本文には挿入されず、
ポップアップ広告や関連性の低いバナー広告が表示されることもありません。
>>599 へー。俺GmailはPOPで受信してるからそんなのにお目に掛かったこと無いわ
Gmailのアカウント欲しい
取ればいいじゃん。
>>601 今は昔とちがって登録制だから誰でも取れるぜ
Flash Animation Opener (2003/12/09) 使うとYouTubeの動画が再生されないんだけど 誰か回避法教えて 無効とバイパス以外で
最近また仕様が変わったからな それにあわせて修正しろとしか
特定の要素以外全部削除、ってできますか?
はい
>>610 Bypass.txtに
imepita.jp/image/
を入れる。
tp://www.uta-net.com/ の歌詞をコピペ可能にするフィルタをどなたかお願いできないでしょうか
フラッシュだから無理
可能だけどフィルタの書き方知らん。
>>616 ということはテキストのパスはわかる?
それさえわかればあとは俺とか俺じゃない人とかがちゃちゃっと書くZE
>>618 U R L を よ く 見 る ん だ
てかwikiに既にあるし
凄いオチw
>>613 wikiにあるのはうたまっぷとヤフーミュージックで
今回希望しているのは歌ネットです
うたまっぷのフィルタを参考に自分で書いてみたけど無理でした
可能な方がいらしたら引き続きよろしくお願いします
もうLyricMaster使えばよくね? とか言うのはダメ?
あれ、歌詞のテキストファイルがどこにあるのか分からんな。 ブラウザのキャッシュ漁ってみたけど無かった。 これが分かれば出来たも同然なんだが..。
flashに変数を渡して歌詞ファイルを読み込む形式なら シロートの俺でもたぶんわかるんだけど、 これひょっとして歌詞テキストがInirial Textに設定された状態の swfファイルをphpで生成して表示させてたりするわけ? さっぱりわからん。
phpでtextロードしてからflashとして吐き出してるだけじゃね? swfを直接開くとテキストが表示される
>>628 とすると
・歌詞ページを開くとフラッシュファイルのURLにリダイレクトするフィルタ
・フラッシュファイルのMimeをcontent-typeをtext/plainに書き換えるフィルタ
の2つを入れるだけでいいのか。 これならすぐ作れそう。
>>631 何が言いたいのか全くわからん。
630を取得するってのは630のレスの内容を取得するって意味?
>>632 うわ、申し訳ない。もう一度。
630のレスの内容ではなくて、URLの一部(/以降の任意の数字)にマッチさせて
それをReplaceの時に参照したいってことです。
歌詞を探すのが目的なら
>>623 に同意。餅は餅屋。
635 :
613 :2008/02/26(火) 02:04:02 ID:hubNRM8f0
餅は餅屋、たしかにそうですね LyricMasterを使用することにします 尽力くださった皆様ありがとうございました
>>637 人の書いたフィルタ見てわからないのがあったら調べていけ。
そのうち知識つく。
作成スレとはいえ、単純なものを聞いてばかりではうんざりだし
少しは自分で考えて書かないと応用がきかないと思う。
$JUMP系使ってるフィルタ参考にすりゃだいたい片付くよ。
wikiのJumpToとかthink氏のControl URLとかさ。
>>638 正直回答だけ欲しくて隔離スレの方に来たんだけど、
参考フィルタ見ながらやってみるよ、ありがとう。
>>638 ごめん 自分の思ってることと内容が全然違かった
でも、参照の例にならないでもないか。
まぁがんがれ。そう難しくない。
ここって隔離スレだったのか。
何を今更…
643 :
624 :2008/02/26(火) 20:27:01 ID:TQaU0Xjd0
ttp://www.uta-net.com/ 用フィルタ。 歌詞をIFrame内に表示。
本当はajax使って取り込んだほうが作詞と歌詞を同時にコピペ出来ていいんだろうけど
フィルタが馬鹿デカくなるからやめた。
[Patterns]
Name = "Uta.net: Insert IFrame (2008/02/26)"
Active = TRUE
URL = "www.uta-net.com/user/phplib/view[^/?]++.php\?"
Limit = 4096
Match = "(^(^$NEST(<object,*src=$AV(*showkasi.php*)*,</object>)))$URL(*[?&]ID=([0-9]+{1,*})\1)"
Replace = "<iframe src="
http://www.uta-net.com/user/phplib/swf/showkasi.php\?ID=\1 " width=450 height=1300></iframe><br>$STOP()"
[Patterns]
Name = "Uta.net: kasi Cleaner (2008/02/26)"
Active = TRUE
URL = "www.uta-net.com/user/phplib/swf/showkasi.php\?"
Limit = 256
Match = "FWS[%06]*[%00][%00][%00][%00][%00][%3C][%00][%00]"
"|[%0A][%00][%86][%06][%06][%01][%00][%02][%00][%00][%40][%00][%00]$SET(0=\k)"
"|\n$SET(0=<br>\n)"
Replace = "\0"
[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-type: Uta-net (in)"
URL = "www.uta-net.com/user/phplib/swf/showkasi.php\?"
Match = "application/x-shockwave-flash"
Replace = "text/html; charset=utf-8;"
隔離スレって言うが、隔離じゃないほうの活発なスレを見つけれん俺涙目。
もともとはクレクレ隔離スレでした
まぁ、実際にフィルター作って意見やり取りしてるスレが一番盛り上がるのは当然な訳で
なるほど。ありがとう。 今は活発で有益なスレはここで、出来た経緯は隔離だったというわけなのね。 んで、流れ的に今はここがメインのスレだってことか。 そうなった流れはわからないけど、最初は隔離したつもりが、少数が切り離されたのは元のスレだったという感じかな。知らないけど。 とりあえず、Proxomitron万歳ってことで。
ソフトの開発はとっくに終わってるけど、フィルタはまだまだ作れるからな 当然の結果でしょ
そういえばオミは少年ウェアだったっけ
('e`)…
ところで解説サイトを見ると、WEBフィルタは順番が大事だと かいてあるんだけど。 できるフィルタ作成者はどのあたりに 入れたらいいか書いてもらえると素人の俺たちには助かる。
>>655 先頭に配置すべきフィルタはちゃんとそう書いてある。
何も書いてなかったら比較的どうでもいいし、他のフィルタに誤爆/干渉するかは
個人の環境にも依存するから誤爆したら自分で確認して調整するしかない。
結論:先頭に入れるべき物以外はどこでもいい
657 :
655 :2008/02/28(木) 14:34:52 ID:IhpFw+Li0
先頭に置いたからといって、後続のフィルタより優先されるとは限らないからな。 そこの扱いが面倒だとは思う。
>>655 ,657
私の作成したWebページフィルタは、以下の順序にすることを意識しています。
■Webページフィルタの上からの順序
1. URLマッチに $KEYCHK() があるフィルタ
2. URLマッチにホスト名の記述があるフィルタ
3. URLマッチに $TYPE() 以外の指定がないフィルタ
■この順序にする理由
1. $KEYCHK() を付けているフィルタはある場面に遭遇したときにユーザーが自発的に動作させるフィルタ。
ユーザー任意で発動させるので、優先度は最も高い。
2. URLマッチにホスト名の記述があるフィルタは特定のサイトに機能を付加するか、サイトの機能をキャンセルする動作をするフィルタ。
ユーザーがそのフィルタを導入しているということは、そのサイトへの訪問頻度が高いと思われるため、優先度は高い。
3. URLマッチに $TYPE() 以外の指定がないフィルタは、汎用的な動作をするフィルタ。
汎用故に様々なサイトで動作することが望まれるが、特殊な用途のあるフィルタと比べれば優先度は低い。
■既知の不具合
フィルタの干渉には気を遣っていますが、「http Text to Link」と「ReplaceStr」の干渉は避けられませんでした。
これらのフィルタは、テキストにマッチさせるための仕組みが一緒なので、片方でマッチした場合はもう片方でマッチしません。
「ReplaceStr」のリストに「http Text to Link」のパターンを取り込めれば良かったのですが、そうするためには置換スタックをグローバル変数に変える必要がありました。
リストに登録された全ての表現をグローバル変数化すると、メンテが大変なのでこの手法は諦めました。
自分は$KEYCHKを多用しているせいか、 特定ドメイン内でのみ動作させるものの方を優先させている。 フレームを読み込まなくさせる(アンカー化させるなどする)フィルタだけは例外で、 これを使うと余計なフレームを読み込まなくて済む (=フィルタリングさせるファイルを減らせる)ので、 一応これが最優先になっている。 インラインフレームを読み込まなくさせるのも同様の利点があるし、 実はブラクラ対策にもなる。 (iframeでウイルスか何かを読み込ませようとしているのを何度か見たことがある)
まだあった。 Adlistにいろいろ放り込んでおくと、これも同様の効果が期待できる。 ・広告のドメイン ・よく行く情報サイト内の画像で消してもいいもの ・よく行く情報サイト内のインラインフレーム こういうものが対象。 URLをAdlistに書くだけなので、フィルタを追加する必要はない。 URLにマッチさせるのはマッチングルールの基礎的な練習にもなるので、 +などの使い方を覚えるのにもよい。
外部スタイルシートの background-color または background
確か俺がこないだスレに書いたやつは外部CSSも対応させたはずだけど、どこに書いたっけな
Firefoxだったら背景色を変えるのは簡単だけど、 IE系はフィルタを使わないとかなり面倒。 >662だと、asciiの方は誤爆を覚悟の上でなら変更できる。 body#digitallife { background-color: #eee !important; } こんな風にすればIEでも有効。
666 :
662 :2008/02/29(金) 14:53:33 ID:tqiRAmym0
おーすげえ!
>>664 を信じてこのスレ探したら
>>27 にあったよ。 アスキーが灰色になったよ、マイコミは半分
灰色になった。 664&27さんサンクス!
IE系はユーザー補助を使えばいいんじゃないの?
Veoh TVで動画を見ていると、広告が替わるたびにカチカチ音がして気になります
Anti-Auto-Refresherを有効にしてみたんですが、効果ありませんでした
フィルターで消したいので、よろしくお願いします
http://www.veoh.com
Hotspot Shieldを使ってる時のAnchorFreeの広告を消せませんか? ヘッロー、ヘッローうるさくて頭がおかしくなりそうです・・・ よろしくお願いします。
ポップアップする広告(プロホスの)がウザいからAdList(URL Killfile.txt)に URL書いたら中身は消えるんだけど、ポップアップは止まりません。 どうすればいいですか(><)
ポップアップを呼び出してるスクリプトを killすればいいんじゃないでしょうか。。。
(><)。。。
>>674 すまんがprohostingのポップアップが
どこででるかわからない。
prohostingのHPスペースで
出るわけでもなさそうだし。
たとえばどのページででるの?
どっかのサイトにprohosting社が出してる広告、というオチ
ああ、後半を読むに、
>>675 は前半でそう言ってるのか・・・スマソ
Google ReaderのNGワード作れないかなあ。 "AD:"とか入ってたらそのフィード消すみたいな。
Yahoo! JAPAN トップ並びにメール等の広告に対し効果的な フィルタを教えて頂きたいのですが、過去に何度か自分なりに 作ってみたのですが、フィルターの記載方法が悪いのか 直ぐに広告が表示されてしまいます。こちらでも書きづらいと の事ですが、どうぞ宜しく御願いします。
>>643 みたいにmusic.j-total.netもできます?
弾き語りにいいんだよね
いいえ、遠慮させていただきます
Yahoo! JAPAN トップのフラッシュっぽい広告は Protect Contents except HTML (2002/11/18) があれば、表示されなくなるな。
yahooのトップページを見なくてもニュースなどの情報は入るだろうし、 メールはgmailでも使えばいいだろうし。 わざわざフィルタを書く必要はないんじゃないか? 長年使い慣れたメールアドレスなどがあればともかく。
686 :
名無しさん@お腹いっぱい。 :2008/03/07(金) 08:56:17 ID:adnas8MA0
なるべく軽くなるように、ファイルターを再構成と作成しようかと思っている
687 :
名無しさん@お腹いっぱい。 :2008/03/07(金) 10:44:14 ID:adnas8MA0
スクリプトや表示されない部分を消し去ってブラウザに優しいのを作りたいのだが・・・ 誰でも使えるセットにするには大変そうなので断念した・・・
688 :
名無しさん@お腹いっぱい。 :2008/03/07(金) 10:45:46 ID:adnas8MA0
自作はあきらめて動作が遅いか速いか既存のやつを調べてまとめることにする
日記はチラシの裏に書いてくれ
俺も今はthink氏のとかwebとかここで公開されて便利そうなのつっ込んでるけど 正規表現の勉強もかねて一から必要なもの自分で作っていこうと思う
自作はいいですね。 最初は簡単なものから取りかかると長続きするかなと思います。 私が初めに作ったフィルタは外部スタイルシートのblink指定を解除するフィルタだったかな。 [Patterns] Name = "Hajimeteno Kill blink css" Active = TRUE URL = "$TYPE(css)" Limit = 64 Match = "text-decoration : blink" CSSプロパティをいじるフィルタは必要な構文が簡単で作りやすいと思います。 # 私のように未熟な腕で「Google: High Light」に挑戦するとたくさんの煽りをもらうことになるので、複雑なフィルタは後回しがいいです……。
罵倒・煽りはスレの華
>>687 > スクリプトや表示されない部分を消し去ってブラウザに優しいのを作りたいのだが・・・
ホワイトリストにないURLのscriptを無効化するフィルタなら、以前書いたような記憶がおぼろげにありますが、どこにいったかなー。
現在、Firefox拡張のNoScriptが重いので外していて、代替手段を探しているので興味ある分野ではあります。
具体的にどんな動作のフィルタが欲しいのでしょうか?
私が想定しているフィルタは、NoScriptの動作(ホワイトリストにないJavaScriptを無効化し、無効化したらウインドウ最下部に警告メッセージを表示する)ですが、実際に実現できるかどうかはわかりません。
# (別件)
# 下記は今週中にやります。
■ToDo
- >555の調査
- >581の更新
自作フィルタは、最初のうちは誤爆上等で単純に作って行くのが良いかと そのうちスレやサイトで公開されてるフィルタが良いお手本になって来て 色々出来る事も広がって行くから まぁ、私なんかは今でも誤爆上等で深く考えずにサクサクフィルタ作って使ってるけどw
youtubeのソート機能消えたけど フィルタで復活させたのはないのか
NoScriptは使ったことないな。 objectやiframeはフィルタでアンカー化しているし、 あやしいJavaScriptもフィルタでコメント化させている。 どのフィルタも長年使っているよ。 >無効化したらウインドウ最下部に警告メッセージを表示する これもフラグをセットすればできないこともないかと。 あるいはCSSのposition:absolute;で下に配置させるとか。
誤爆上等で未だにアスタリスクばっかり使ってます
699 :
686 :2008/03/08(土) 05:44:19 ID:9OZ+Stfe0
アップパスはNaokoです。
701 :
686 :2008/03/08(土) 06:20:16 ID:9OZ+Stfe0
702 :
名無しさん@お腹いっぱい。 :2008/03/08(土) 06:53:05 ID:9OZ+Stfe0
703 :
名無しさん@お腹いっぱい。 :2008/03/08(土) 06:59:40 ID:9OZ+Stfe0
コツはURLだけで切ってしまうヘッダフィルタを中心にすると軽くなりそうですね
704 :
名無しさん@お腹いっぱい。 :2008/03/08(土) 08:45:40 ID:9OZ+Stfe0
バージョンアップ8回ほどしてしまいました・・ 現在 pr0154.zip です 表示に問題があったら直します 教えてください
Refererをリストで一括管理するフィルタが無いですね。 あとはGoogleの検索結果を便利にするフィルタなどがあると喜ばれると思います。
706 :
名無しさん@お腹いっぱい。 :2008/03/08(土) 09:16:47 ID:9OZ+Stfe0
それらはどこら辺にありますか?
ID:9OZ+Stfe0 どうせ作るならこのスレで公開されたものだけにしとけよ
Firefoxのアドオン自動更新みたいに、 それぞれのフィルタも自動更新出来たら便利なんだが そんなツール作ってくれる人居ないよなぁ…
判定が難しい。 ・フィルタ名で判断…自分でタイトル弄れなくなる ・全文解析…無茶 みんなで共同開発できなくなる。(固定の作者と固定の公開場所が必要になってくる) →成長が止まる
YouTubeのDLフィルタ、&fmt=18でのmp4対応改造をしていて気付いたんですが、 flvと違ってContent-Dispositionでfilename=video.mp4が指定されてました。 当然title.extの意味が失われるので、無効化する新しいヘッダフィルタが必須です。 URL無視したやっつけですが [HTTP headers] In = TRUE Out = FALSE Key = "Content-Disposition: neutralize video.mp4 (In)" Match = "attachment; filename=video.mp4" こんな感じで。URLはたまに変わったりするんで、どうなんですかね…。 で、DLフィルタ本体なんですが、少々事情があって私のは公開できません。 どなたかやれる方いらっしゃったらお願いしますー。
判断が難しいのは同意だが、成長が止まるってのはどうだろう >固定の作者と固定の公開場所が必要になってくる 固定の作者である必要はどこにも無いし、 固定の公開場所が居るのはFirefoxでも同じで、自動アップデートできるようにするなら当然な訳だが
autopagerizeのsiteinfoみたいにWiki式にするとか
>>712 固定の公開場所が必要なら、当然固定の作者が必要になるでしょう。
勝手に変な物に書き換えられて自動アップデートで強制配布されちゃ困る。
wikipediaのように誰が更新したのか署名が残るようになっていればいい アップデートするかどうかはユーザー次第 リストに一致する人の更新であれば自動更新〜とか
間を取って、更新情報だけ集積したRSSを配信すればいいんじゃない?
>>710 > 固定の作者と固定の公開場所が必要になってくる
自動更新はともかく、固定の公開場所は実現すべく現在試行錯誤中です。
私自身が今の公開形態(複数フィルタをzipで固めて配布)を面倒に感じており、簡単に更新できるシステムが必要だと常々考えていました。
(ブログも想像したほど記事投稿が簡単ではありませんでした)
フォーラムを用意して、1スレッドにつき一つのフィルタというローカルルールを作れば一元管理できて便利ではないかと考えています。
■現在、頭の中で考えている掲示板仕様 (★ … 必須 / ※ … 検討中)
★親記事、子記事にタグを付けられる
★記事検索で「inname:名前」のような特殊構文が使える
★一部のはてな記法が使える(少なくとも、順不同リスト、序列リスト、定義リスト、表ぐらいはほしい)
★記事全体を作者が任意でバックアップ(XMLまたはテキストで出力)できる
★携帯で投稿できる(移動中に携帯からアイデア投稿したい)
※記録フォーマットはXMLかDB(XMLにするとエクスポートが楽。APIも使える。DB管理するとしても内部動作でXMLに変換するのも面白そう)
※半会員制(完全に会員制にすると投稿者が少なくなる。会員は署名を使える、名前の同一性が保証される、などのメリットを得られる。)
※スラッシュドットのスコア機能を付ける(評価されるとより注目される記事を書きたくなるわけで議論に期待できそう。どうせなら、タグにしきい値を付けた方が統一性があっていいかも)
※BBCodeが使える(はてな記法を使うことを考えると統一性がない)
※記事一つ一つにファイルアップロード可能(ファイル添付する形にするか、base64エンコードするか。前者はバックアップ時に有用。)
■課題点
- PHPによるXML実装でどの手法を使うか(DOM, SimpleXML, XMLReader, SOAP)
- はてな記法をどうやって実装するか
# 文字列置換だけならわりと簡単なんですが、Proxomitronの「文字列を消費する」概念(一度マッチした部分には二度とマッチしない)を取り入れようとしたら一気に難易度が跳ね上がりました。
# 表は「Excel→table」のJavaScriptからアルゴリズムを流用すれば実装できそうです。
今ははてな記法をXHTML変換するJavaScriptを書いているところです。(上手くいけばPHPに移植予定)
>自動更新はともかく、固定の公開場所は実現すべく いやいや、自動更新が必要ないならWikiで十分だと思うけど
719 :
名無しさん@お腹いっぱい。 :2008/03/08(土) 20:37:26 ID:Xk9Ulf4G0
:9OZ+Stfe0だけどまとめじゃなくて、なるべくブラウザに負荷をかけずに 快適動作をさせるかが作成のポイントなんです 利便性は失われないようにして
721 :
名無しさん@お腹いっぱい。 :2008/03/08(土) 21:31:02 ID:Xk9Ulf4G0
リストの質問です hoge.com ではヒットしないのに [^/]++hoge.com だとヒットします どういう理由なんですか?
722 :
名無しさん@お腹いっぱい。 :2008/03/08(土) 21:38:21 ID:Xk9Ulf4G0
あと hoge.com [^/]++hoge.com と ([^/]++.|)hoge.com と [^/]++hoge.com/ と [^/]++hoge.com* はマッチパターン変わりますか?
723 :
名無しさん@お腹いっぱい。 :2008/03/08(土) 21:42:04 ID:Xk9Ulf4G0
>>721 どっちでもマッチするけど? その現象が発生するフィルタとリスト晒してよ
念のため言っとくがURLマッチは部分一致じゃなく前方一致だならな。
(jp.|www.|)youtube.com/ を最適化する場合 (jp.|www.|(^[jw]))youtube.com/ と (jp.|www.|(^(^y)))youtube.com/ のどちらが処理が速い、あるいは書き方として妥当だろうか 要は否定先読みと肯定先読みのどっちが速い?って質問なんだけど
速度の話は荒れるからやめろとテンプレに…あったっけ?ないね。 所詮無視できる誤差の範囲内、有意な差はないから好きなの選んでください。
>>727 実際にテストフィルタ書いて実測してみるのが一番かと
実測してもどちらが早いのか解らないなら、それはどちらを使っても同じと言う事だ
flashの画質を低で固定するフィルターって前出てた気がするんだけど教えてください。
大体は肯定のほうが速いような気がする
最適化とやらがなされていないことによってこの先ロスするであろう合計時間の 数億倍数兆倍の時間を割いて検証し最適化フィルタを書くことに 無駄を感じないようであれば、検証する価値はあると思うよ。
733 :
名無しさん@お腹いっぱい。 :2008/03/09(日) 15:22:42 ID:H7KCeNOF0
ローカルに落としてあるファイルに対して、処理時間を計測するプログラムを作るよ たとえば proxchk C:\html (ディレクトリ名) と打てば処理時間を計測する
>>692 ># 私のように未熟な腕で「Google: High Light」に挑戦するとたくさんの煽りをもらうことになるので、複雑なフィルタは後回しがいいです……。
Google: High Lightを作ってるときの話は知らないけど
腕が未熟かどうかとは関係ない理由*でも*批判されてたことにはご自分では気づいておりませんでしたか?
735 :
733 :2008/03/09(日) 18:26:35 ID:H7KCeNOF0
>>727 (jp.|www.|)youtube.com/ インデクス化(ハッシュ)可能。意味が分かりやすい。
(jp.|www.|(^[jw]))youtube.com/ インデクス化(ハッシュ)不可能。意味が分かりにくい。
(jp.|www.|(^(^y)))youtube.com/ インデクス化(ハッシュ)不可能。意味が分かりにくい。
結局、シンプルにするのが処理が速くて、書き方も妥当。
リストにおいては状況により (jp.|www.|)youtube.com/ の最適化の結果が
youtube.com/
jp.youtube.com/
www.youtube.com/
になることはありうる(見た目もそれほど分かりにくくなってない、むしろ分かりやすく感じる人もいるかも)。
737 :
名無しさん@お腹いっぱい。 :2008/03/09(日) 18:49:30 ID:H7KCeNOF0
スペースが無いか、あるかは(\s|)でいいですか?
そういえばJリーグ始まったな
741 :
名無しさん@お腹いっぱい。 :2008/03/09(日) 21:30:58 ID:H7KCeNOF0
サンクス ほかの質問もきいてもらえますか? 上にはヒットしないのに下にヒットします なぜでしょうか? pagead[0-9].googlesyndication.com pagead2.googlesyndication.com
君は
>>721 なんだろうけど、
検索表現は何で検索対象文字列が何の場合にマッチした(しなかった)
というのを明確にした方がいい。
743 :
名無しさん@お腹いっぱい。 :2008/03/10(月) 01:24:33 ID:8B4S+KnE0
フィルター、リストの順序で速度変わるね
どういう意味? ブロックリストの各行を入れ替えるってこと? 体感出来るほどの差異が出るかどうかは甚だ疑問だが、 ブロックリストはリスト上位から順にテストしていって、 マッチしたところで抜けるんだから、 出現頻度が高いと思われる語句(に対する検索表現)を リスト上位に置いた方が理屈の上では速くなるだろうね。 注意事項として、リストの行は順位を不用意に入れ替えると マッチしていたものがマッチしなくなったりすることがある。
> 注意事項として、リストの行は順位を不用意に入れ替えると > マッチしていたものがマッチしなくなったりすることがある。 もともとマズい書き方をしていた場合に、ね。 ヘルプの"Creating blocklists"ページ内の"Limitations..."の項参照。
746 :
名無しさん@お腹いっぱい。 :2008/03/10(月) 05:52:11 ID:8B4S+KnE0
747 :
名無しさん@お腹いっぱい。 :2008/03/10(月) 05:53:07 ID:8B4S+KnE0
749 :
名無しさん@お腹いっぱい。 :2008/03/10(月) 08:19:57 ID:8B4S+KnE0
さすがは隔離スレだ
>>734 気づいてたらそれを全部羅列しろとでもいうのか?メチャクチャ迷惑なんだけど。
「主たる批判内容はそんな話じゃなかったでそ?」と言っているのでわ? 全部挙げろってんじゃなく、 その最も批判を受けていた部分について自覚してくれないか?という話なのでわ? 多分根拠薄弱なフィルタスピード比較論の話のことだと思うけど 「デタラメ垂れ流さないでくれ」みたいな 「経験的にはこんなことがいえるような気がするのであくまで参考程度に」 くらい断ってあれば問題ないと思うけどね 断定的に書かれちゃうとさ、関連スレへの貢献度が高く オミトロンに関する知識も一般のオミトロン使いよりはずっと深いので 初心者が鵜呑みにする危険性があるのよ
749 「オミトロンスレでトリップ持ちになっちゃった・・・(#^.^#)ドキドキ」 753 「(やっとNG指定出来る)」
>734に対して>751はひどい 同じ日本語話者とは思えない
下らない話題はよそでやってくれ。 あぼーんするのが大変なんだ。
それと
>>734 とかはthink氏をNGNameに入れておくといいよ。
ぶっちゃけ俺は入れてます。
>>734 がレス付けなければ
>>692 の書き込みに
永遠に気付きませんでした。
>>754 お前…言っちゃったらトリつけてくれなくなるだろ!バカバカ!
>>734 にしてみればまたThink氏が妙な教義を唱えていたらダメ出しする為に
NGに入れるわけにはいかないんジャマイカ。
(実効性の不明な)スピード向上に関するパラノイア的こだわりの部分さえ読み流せば
結構参考になる部分が多いので俺は読んでるけど。
>>734 はどう見ても場を荒らしたいだけに見えるが。
あんなもんに応える必要はない。
同じ言うにしてももう少し言いようってものがあるだろうとは確かに思うが、 荒らそうと思ってやっているとは思えない。
もち
>>734 も速攻でNGに入れたw 基地外はいらね。
何この流れ…
俺のNGを聞け!な流れ
さすが隔離スレ・・・
隔離スレ住人≒本スレ住人 な件
みんなNGしてるから気付いてないのかも知れんが、 thinkさんは最近速度の話は全くと言っていいほどしてないよ。 ハッシュの件でほんの少し触れたぐらいか。
いや、昨日はテレビの前で「Qちゃん失速した!」と叫んだはずだ。
速度の話で噛み付いてる人は、あれだけ口では色々言っておきながら google highlightでboldに色つけるだけでごまかして逃げた人だからスルー推奨。
便利さでは firefoxの拡張 >>> google high light だからfirefoxユーザーならこのフィルタはいらないのでは。 オミトロンじゃどう頑張ってもリンク先のページで着色したりページ内検索することは出来ない。
何でいきなりFirefoxが出てくるのかわからないが、 もともとGoogleHighlightはOperaユーザが 色づけのJavascriptを移植してくれと依頼して出来たものだぞ。 たしかそのJavascriptの元になったのがGoogleToolbarだった。 Firefoxはいいブラウザだけど、ブラウザはそれだけじゃないし 必要ないなら切ればいいってだけだね。 このフィルタの利点は軽快さとブラウザを選ばない事。 proxomitoronさえ用意できればIEだろうがなんだろうが同じ環境で使えるのがいい。 あと、アイデアと実装のインパクトがすごかったな。 実際に腕に自信のあるひとが何人か挑戦したし、俺も感動した記憶がある。 そうえいばキャッシュページの着色は昔実装してる人が居たな。 あと、ページ内検索はJavascript追加でも出来るよ。
boldに色付けで終わったのはfirefox用のフィルタだったからでしょ? それとキャッシュページは元々着色されてたはず。 >ページ内検索 google highlightでは出来ないという結論になったんですよ。
・過去ログ読んで来い。全然違う。 ・キャッシュのページは昔は色がついてなかった。 ・無理にgoogle highlightでやる必要は無い。
フィルタ一つでそんなムキになるなおまえら
>>773 おまえが読んでこいよw 何言ってんだこいつ。
そもそも速度の議論と Google Highlight フィルタの作成とはまるで別個の話なのに 両者を結び付けて「だからスルー推奨」とか意味不明な論理展開をしている時点で ちょっと頭がアレな人かな?とオモタ。
ログあさってきたから見てくるといいよ。
http://pc7.2ch.net/test/read.cgi/software/1117374662/395- この一言につきる。
> 510 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2005/09/27(火) 12:36:00 ID:tSC0sS7y0
> 395氏のGoogleフィルターにはがっかり
> 散々エラそうな事を言っておきながら
>
> Match = "<b>"
> Replace = "<b style="color:red; background:#EEEEEE; font-size:large;">"
>
> と同等レベルとは
think信者は所詮この程度。 そろそろngidさんに頑張ってもらうか。
信者って言葉だしたな。あんたが悪意あってレスしてるのがよくわかったわ
“ここの
>>734 と過去スレの395氏とやらが同一人物であるか否かによらず”
速度の議論と Google Highlight フィルタの作成とはまるで別個の話、ってのは
いちいち言わないと分かんないかね。
>>734 と同一人物なんて言ってないよ?
速度の話で噛み付いてくる人がスルー推奨って言ってるだけで。
おやおや。
>>769 では【噛み付いて「(い)る」人】だったのが
>>782 では巧妙に【噛み付いて「くる」人】に摩り替わっていますね。
文脈がまるで異なってきますが。やれやれ。
784 :
名無しさん@お腹いっぱい。 :2008/03/10(月) 20:54:40 ID:mv5qnIJg0
スクリプト、コメント、アプレットは全て削除してそのあと広告削除するのが良いかな プログラムが必要ならばバイパスする
このスレに有効なフィルタリングを考えようか
同一IDが5回以上あるレスを削除
もう何がなんだか分からなくなったw
考えるな、感じるんだ!
そういえば遠慮のないもの言いがどうのこうのって2ちゃん批判してる奴が なんでコテまで付けて2ちゃんに常駐してるんだろう。 もう来なければいいのに。
ええと
すんません><
2ch dat Converter (2007/9/3)で#5と言ったようにレス番指定したときに、
>>1 を表示しないには、どうすれば良いですか?
間違えました(><) #5じゃなくて、#l5です。
↓知ってるがお前の態度が気に入らないのAA
( ゚д゚) _(__つ/ ̄ ̄ ̄/_ \/ /  ̄ ̄ ̄ ( ゚д゚ ) !! _(__つ/ ̄ ̄ ̄/_ \/ /  ̄ ̄ ̄ ̄
ID:g/jYlHCy0はやっぱり神聖か。
ID:g/jYlHCy0 このスレではコテ付けてください
, - ,----、 (U( ) | |∨T∨ <お願いします (__)_)
>>799 作者がこのスレ見てるって書いてるからそのうち作ってくれるかもよ。
下らないことで荒れてんじゃないよ
そんなことよりpart19の1000間際のレスとか面白いぜ
しかし、巡回タイミングが事が終わった後な為にログをまとめて見る状態になると 誰が必死なのか一目で解るのは面白いな
>>800 じゃあ待ってみます。
>>1 が巨大だと邪魔で…。
ISPが規制されると、datを取得して読み書きできる2ch dat Converterは
人大杉も回避できるし色々と便利なんです。
>ISPが規制されると 2chって参照自体を規制することもあるのか? それともまさか、そのフィルタ使うと書き込み規制も回避できる…わけないか
人大杉を知らない奴がいるとは。。
専ブラ使えば(ry ってのはこのスレ的にはなしなのかな
人大杉とISPの規制は違うだろ…
ああ、確かにごっちゃにしてるな。 ISP規制されたらオミトロン使っても書けないし。 串刺すとかすれば別だが。
812 :
↑ :2008/03/11(火) 01:48:14 ID:0GAjhws90
勿論閲覧ではなく、書き込みの話ね。
813 :
名無しさん@お腹いっぱい。 :2008/03/11(火) 04:46:32 ID:CBNBty6z0
ホスト名調査に失敗の状態を取得してキャッシュへのリンクを張るにはどうすればいいですか 404とかではないです
どなたかAmazonトラップを防止するフィルタ作っていただけないでしょうか
買物時以外はサインアウトする
すみません
>>814 ですが、mixiトラップ用のフィルタを流用しどうにか作成出来ました
画像にmixiのアドレスを.htaccessとかで指定して、 知らないうちに足跡に残すようにするスパイウェア紛いの行為。 今はもう繋がらないみたいだけど過去の例。 ここはたしかCSSに画像を仕込んでわかりづらくしてた。 > 129 名前:名無しさん@お腹いっぱい。 [sage] 投稿日:2007/01/02(火) 17:13:36 ID:Ny7Bu6X50 > 前フィルター投下してくれた人、ありがとう。 > 今日初めてmixiの足跡殺せたよ。 > フィルター入れといて良かった。 > > ↓アクセスする時は気をつけてくれ。 > www.nishishi.com/blog/2006/05/perl_use_strict.html > www.nishishi.com/pt/sp/mr.gif
てかフィルタ書くまでもなくAmazon側でトラップ無効化されてると思うけど。
これでgoo右上のフラッシュ広告が消えるんだけど段を詰めてくれないんだけど、どうしたらいい? m(_ _)m [Patterns] Name = "goo AD killer" Active = TRUE URL = "[^.]+.goo.ne.jp/" Limit = 7000 Match = "$NEST(<!-- ((h02|banner02|osusume|top_text|ad|ad_focus|pr)\0|Sniffer Code for Flash version=60) -->,<!-- /($TST(\0)|html.ng/cat=*) -->)"
>>820 [Patterns]
Name = "New HTML filter"
Active = TRUE
URL = "www.goo.ne.jp/css/top_15.css"
Limit = 256
Match = ".banner{margin:0 0 8px 0;display:block;}"
Replace = ".banner{display:none;}"
タイトルとかURLとか細かい検証は任せる
それだとcssファイルのパスが変わったりcssの書き方が変わっただけでマッチしなくなってしまうから フラッシュを表示させるためのタグのstyle属性をいじるか、html内にcssを埋め込んでimportantするほうが 仕様変更に強いフィルタになるとかならないとか。
DMMのTOPページはOKなんだが 作品の詳細サイトに行くと 必ず文字化けするんだが おまいらどうよ?
>>827 どこのページのことかよくわからなかったけど
一通り見ても化けない。
そのページをどのブラウザでどのフィルタ適用なのか書かないと
まともなレス付かないよ。
>>824 ポップアップで開く部分を全部
window.open(url, name, 〜);
↓
window.open(url, null);
みたいに変更したけど別窓で開いてしまうんだよなぁ。
行数制限が異様に厳しいので続く。
830 :
829 :2008/03/16(日) 18:12:52 ID:GR9PUa/K0
制御の流れは以下の感じで、大体追えたと思うんだけど。
javascriptの知識そんなに無いから、これ以上はよく分からない。
<a href="javascript:void(0)" onclick="launchGameday('" + gameID + "')">
↓
ttp://mlb.mlb.com/scripts/global.js: function launchGameday(params) {
:
popWin(/*baseURL+*/gamedayURL,'GamedayWin',gd_w,gd_h,'location=no,menubar=no,scrollbars=no,status=no,toolbar=no,resizable=yes');
↓
ttp://mlb.mlb.com/shared/scripts/util.js: function popWin(url,n,w,h,o) {
:
_pw_z=window.open(url,n,'width='+w+',height='+h+',left='+_pw_l+',top='+_pw_t+','+o);
}
>>825 Name = "aucfan"
Active = TRUE
URL = "(ap.|www.|)aucfan.com/"
Limit = 360
Match = "<iframe*</iframe>"
"|$NEST(<script, *(overture|urchin)*, </script>)"
"|</head>$SET(#=<style>\n<!--\n"
"#top_header_1, #CATEGORY_AD_FRAME { display: none; }\n-->\n</style>\n</head>)"
"|(<title>)\1*[%a1][%d7]-\2(</title>)\3$SET(#=\1\2\3)"
"|(class=$AV(keyword_input_box))\1$SET(#=\1 accesskey="q")"
"|(class=$AV(l_price_input_box))\1$SET(#=\1 accesskey="1")"
Replace = "\@"
ついでにタイトルを短めにして、ALT+Q と ALT+1 で検索と値段のとこにアクセスキーを設定してみた。
連番ウォーカー
proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/src/pr0051.txt
面白く、有用なフィルターありがとうございます
「$LST(***)」でなく、「
http://$LST (***)」に対応するようにしたいです
生半可の知識で全く歯が立ちません。よろしくお願いします
>>834 ありがとうございます。上手く動作しました。感謝です
\0とかまったく別のとこみてた…
>>838 インターネットオプション
接続
LANの設定
詳細設定
すべてのプロトコルに〜 のチェックを外す
Secure、FTP、Socks の各項目を真白にする
OK x 3回
じゃダメ?
>>839 レスありがとうございます。
proxomitronの使い方などはわかっているつもりなので
そのあたりは問題ないです。
firefoxでもダイアログが出てしまいます。
ただ、フィルタの編集とかは不得手というか正規表現などの知識がないので、
単純に
>>837 さんのレスをうまくフィルタに反映できていないかもしれません。。
cfgに直接書き込みできる形式でお願いできませんでしょうか
bgcolorじゃなくてbackgroundだった、まあそんな感じで
\0が2の時と3の時で置き換えを変える事が出来ますか?
844 :
↑ :2008/03/18(火) 12:52:51 ID:pPXvBy9b0
条件分岐という意味です。
>836 IEを窓から投げ捨てる。それがベスト。
>>841 そっか、ごめん。
>>840 さんの使って書いてみた。
[Patterns]
Name = "New HTML filter"
Active = TRUE
Multi = TRUE
URL = "$TYPE(htm)$URL(
http:// )"
Limit = 512
Match = "("
"<link\s(^(^[^>]++rel=$AV(stylesheet)))[^>]++href="
"|<img\s[^>]++src="
"|<[a-z]+\s[^>]++background="
")\0"
"$AV(
https://\1 )"
Replace = "\0"
http://\1 " "
>>843 出来ますよ〜。 マッチングコマンドの$TSTの説明を参照して下さい。
(
$TST(\0=2)$SET(9=中身は2です)
|
$TST(\0=3)$SET(9=中身は3です)
)
847 :
843 :2008/03/18(火) 14:15:40 ID:pPXvBy9b0
みんなUser-Agentなんにしてるの?
>>848 Opera/9.30 (Nintendo Wii; U; ; 2047-7; ja)
DoCoMo/2.0 P2102V(c100;TB)
>848 SuperFamicon(SNES)
>>848 Mozilla/4.0 (compatible; MSIE 4.0; MSN 2.5; Windows 95)
Nice site!
投稿者では無いのだが、Proxomitron入門スレッド 6で以下の質問に 付いてもめてます。此方の方の回答も参考にしたいのですが、 因みに俺は[^/]++microsoft.com/ [^/]++google.(com|co.jp)/ で 良いのではと 45ひよこ名無しさんsage2008/03/15(土) 03:20:10 ???P MicrosoftとGoogleの全てのサイトをBypassにしたいのですがURLの 数が厖大で極力少ない適切な記述方法を教えて頂けないでしょうか さしあたりMicrosoft UpdateとGoogleのメール、カレンダーの表示 障害で困って下ります。どうか宜しく御願いします。
virusmicrosoft.com/ usogoogle.com/
ドメイン名がいろいろあるから無理ぽがFAだと思います。 ホスト名ではなくIPアドレスで書かれた 場合のことも考慮しなきゃいけないし。 同じ質問はよくFWのスレでも見かけます。
GmailではSSLが使えるから、自分はSSLの方を利用する。 SSLに対してフィルタリングさせない設定だったらまったく問題ない。 ログウィンドウの中身をテキストにでも保存して、 ドメインを調査してみるという方法もありそうだがいかがか。 正規表現で書くよりも誤爆・誤動作の類は減ると思われる。
ちょっとタイミング逃したネタだが、 他の人も言っているようにThink氏のパラノイア的こだわりは 「フィルタ速度の話以外」においては結果的にいい効果をもたらすことが多い。 ここ数ヶ月のThink氏を見る限りちゃんと速度ネタは自重していると思う。 だから今後も自分はThink氏を「信じる」ことにするからよろしく。
信者うざす
便器の横の張り紙の 「いつもきれいに使っていただいてありがとうございます」 みたいなもんだ。わかるかなこのネタ。 今後もThink氏が自己の中でのみ留めておくべき探求心を 外へ垂れ流さないことを信じてるよ。
またお前か。
ちんこの高速化ネタ禁止な。
オチンチンを高速でしごくんだ!
アンチうぜえ
tes
>>856 live.com とかも必要ではないかと思うのだけれど。
テストしてないけど、どちらかお好きな方をどうぞ。 body#bhome img { display: none !important; } body#bhome div.photo, body#bhome a[href^="http://sys.uploader.jp/campaign/"] { display: none !important; }
>>871 こんなのはどうでしょ?
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www.uploader.jp"
Limit = 16
Match = "<!--aa-->"
Replace = "\k$STOP()"
>>871 訂正
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www.uploader.jp"
Limit = 240
Match = "<div\salign="center">$SET(0=<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())"
Replace = "\0"
876 :
871 :2008/03/23(日) 20:02:57 ID:rnklNppY0
*.images-amazon.com/ sys.uploader.jp/
>>876 [Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 64
Match = "*.images-amazon.com/|"
"sys.uploader.jp/"
又は
Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 240
Match = "<div\salign="center">$SET(0=<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())|"
"<!--aa-->$SET(0=\k$STOP())"
Replace = "\0"
のどちらかで如何でしょうか?
879 :
871 :2008/03/23(日) 21:31:21 ID:rnklNppY0
>>878 上のフィルタのMatchだと残ったゴミにhttp Text to Linkなどが誤爆して使いづらかったです
下のフィルタだと残念ながら肝心の「ダウンロード」リンクまで消えてしまいました
>>878 ご免なさい、また訂正。下側のフィルタは下記のように
[Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www(|[0-9]+).uploader.jp/"
Limit = 240
Match = "(</h1>|</table> )\1<div\salign="center">$SET(0=\1<div style="display:none">)|"
"<!--c(sr|an)-->*<!--/c(sr|an)-->|"
"<div\sid="footer">$SET(0=\k$STOP())|"
"<!--aa-->$SET(0=\k$STOP())"
Replace = "\0"
881 :
871 :2008/03/23(日) 22:23:33 ID:rnklNppY0
>>880 綺麗に消えました
ありがとうございました
www[0-9]+.uploader.jp/ で十分。 ところで、 (</h1>|</table> )\1<div\salign="center"> のようなものにマッチさせる場合、 (^(^</h1>|</table> )) 先頭をこのようにしているとマッチしない。 ずっと前から疑問に思っているんだけど、これはなぜだろう。
これからも疑問に思っていなさい。
Scott 曰く... だって「/」と「d」が同時に同じ場所に存在するなんてありえませんからね ;-) 。
ttp://msdn2.microsoft.com/ja-jp/library/ae5bf541 (VS.80).aspx
(?!pattern)
否定先読み検索を実行する部分式です。
pattern に一致しない文字列が始まる位置にある検索文字列と一致します。
一致した文字列は記憶されず、後で使用することはできません。
たとえば "Windows (?!95|98|NT|2000)" は、
"Windows 3.1" の "Windows" には一致しますが、
"Windows 2000" の "Windows" には一致しません。
先読み処理では、読み進まれた文字は処理済みとは見なされません。
一致の検出後、次の検索処理は先読みされた文字列の後からではなく、
一致文字列のすぐ後から開始されます。
>884
どうもありがとうございます。なんとなくですが理解できたような気がします。
肯定先読みという言葉は見たことがあるものの、
どういう概念なのかは知りませんでした。
否定先読みの方だけは、そういう言葉すら知らないうちから使っていたのですが…。
以下テスト用。
Match = "(^(^</h1> )) <"
<h1> </h1> <div>
にマッチさせてみる。
転載する場所を間違えたのでやり直し。 (?=pattern) 肯定先読みを実行する部分式です。 pattern に一致する文字列が始まる位置にある検索文字列と一致します。 一致した文字列は記憶されず、後で使用することはできません。 たとえば "Windows (?=95|98|NT|2000)" は、 "Windows 2000" の "Windows" には一致しますが、 "Windows 3.1" の "Windows" には一致しません。 先読み処理では、読み進まれた文字は処理済みとは見なされません。 一致の検出後、次の検索処理は先読みされた文字列の後からではなく、 一致文字列のすぐ後から開始されます。
「文字列を消費しない」という意味を 「マッチはしたけど取り込まない、置換対象としない」なんて理解(誤解)しているから こういうことになるんだろうな。 要するにゼロ幅の位置指定子なんだが。
理解を助ける為に、例えば文字列 "foobarbaz" について、 "|f|o|o|b|a|r|b|a|z|" という具合に、各文字間に仕切り線(これは文字ではない。 あくまで便宜的に表示したもの。この文字列の長さは9である)があるものと思うことにしよう。 この場合、肯定先読み "(?=baz)" ってのは 「"baz" にマッチする(けど、"baz" は取り込みや置換の対象とはしない)」 のではなく、 「その仕切り線に "baz" が続く、そのような仕切り線」にマッチする。 つまり上の例で言えば、7本目の仕切り線にマッチする。 肯定/否定先読みがマッチするのは、「(幅を持った)文字」ではなくて 「(ゼロ幅の)位置(便宜的に"|"で書き表したもの)」なのである。 前読みとか戻り読みとか呼ばれるのも同じ。 肯定戻り読み "(?<=foo)" ってのは、 「"foo" にマッチする(けど、"foo" は取り込みや置換の対象とはしない)」 のではなく、「"foo" に続く仕切り線」にマッチする。 つまり上の例で言えば、4本目の仕切り線にマッチする。 要するにだ、正規表現 "(?=foo)bar"(Proxomitron でいうところの "(^(^foo))bar")ってのは、 「その仕切り線に "foo" が続く、そのような仕切り線と、更にその仕切り線から続く "bar"」 を検索していることになる。 同時に同じ場所に "foo" と "bar" とが存在するわけなどなく、これは絶対にマッチしない。
難しいけどわかりやすいわ。 GJ!
くどいようだけど、"foo(?=bar)" がマッチするのは 「"foo" と、それに続く仕切り線。どのような仕切り線かというと、その後に "bar" が続くような、仕切り線」 なのであり、決して「"foobar" にマッチする。但し、"bar" の部分はいじらないものとする」というのではない。 後者のような捉え方をしていると、検索対象文字列を探索していくポインタ("|"で表そう)が 既に "foobar|" にまで進んでいるような勘違いを起こしてしまう。 この時、ポインタはあくまで "foo|bar" にとどまっているのである。 ポインタはそこにとどまりつつ(これが「文字列を消費しない」の意味。"bar" は消費されずに残る)、 その先を見通す(これがつまり「先読み」)。 マッチングが完了した時のポインタの位置(模式図) 正しい理解: Proxomitron の声 foo|bar (<おお、この先にお望み通り "bar" があるべ。無事マッチしたお^^) 誤った理解: Proxomitron の声 foobar| (<は〜るばる来たぜ "bar" の後〜♪ でも波線部分は置換しないお^^) ~~~
"foobarbaz" の "bar" だけ残そうと思って Match = "foo(^(^bar))baz" Replace = "" とやっても、決してマッチしないのがお分かり頂けるかと思う。 ダブルネガティブ表現 "(^(^...))" は「"..." を置換せずにおく」という意味の表現ではない。 あくまで位置指定子なのである。 検索表現 "foo(^(^bar))baz" の、"foo" を (1)、"(^(^bar))" を (2)、"baz" を (3) とすると、 foo|barbaz (<部分表現 (1) がマッチしたぞ。どれどれ、更に部分表現 (2) を試してみるか…) foo|barbaz (<ここから先 "bar" が続いてる!(2) もマッチした!次は (3) を試すぞ!) foo|barbaz (<…って、後続文字列が "bar" なんだから、(3) がマッチするわけないじゃん…) foob|arbaz (<結局全体としてマッチしなかったね。とっとと次行こう、次) foobarbaz| (<どんどん行くよ〜)
>>880 MicroAd の部分もけすことはできませんか
>>894 Proxomitronに疎い俺はそこが見やすかった。
しかしどこも表記が逆スラッシュなんだよな。
日本語環境に合わせて\でいいのに。
なんか理由があるんかな。
>>887 俺には前読みとはき違えてるようには見えんのだけど
どの辺でそう思いました?
ってか
>>885-886 の「〜検索文字列と一致します」って表現はゼロ幅だという
意味合いが読み取りにくくて紛らわしい文章だなあ。
先読みってそんなに難しいかね、否定が分かってればすぐ理解出来るものだと思う。
>>893 [Patterns]
Name = "uploader.jp"
Active = TRUE
URL = "www[0-9]+.uploader.jp/"
Limit = 256
Match = "</h1><div\salign="center">$SET(0=</h1><div style="display:none">)|"
"</table> <div\salign="center">$SET(0=</table> <div style="display:none">)|"
"<!--cs*sr-->|<!--ca*an-->|"
"<IFRAME*>|$NEST(<script,</script>)|$NEST(<noscript,</noscript>)|"
"<div\sid="footer">$SET(0=\k$STOP())|<!--aa-->$SET(0=\k$STOP())"
Replace = "\0"
僅かばかりの高速化
細かく解説していただきましてありがとうございます。 テキストファイルにコピペしておいて、またわからなくなったら読み返してみます。
>>899 ありがとう すべて綺麗に消すことができました
> ってか
>>885-886 の「〜検索文字列と一致します」って表現はゼロ幅だという
> 意味合いが読み取りにくくて紛らわしい文章だなあ。
「〜位置と一致します」と書くべきですよね。
本論とは関係ないけど、
>>892 のポインタ移動の説明はマズかったですね。
特に "foo|b" から "foob|" と進む部分。ここは一旦 "f|oob" とバックトラックするところでしょう。
.↓これより以前は処理済。ここに大しおり("V")を設置した上でポインタを進めて探索。
hoge|foobarbazfuga
.V ↓部分表現 "foo" がマッチ。ここに小しおり("v")を設置した上で、部分表現 "(^(^bar))" をテストする為に更にポインタを進める。
hogefoo|barbazfuga
.V .v ↓部分表現 "bar" がマッチ(小しおりの位置に部分表現 "(^(^bar))" がマッチ)することを確認。先読み完了。小しおりまで戻る。
hogefoobar|bazfuga
.V ↓部分表現 "baz" はマッチせず。結局、表現 "foo(^(^bar))baz" は表現全体としてはマッチしなかった。大しおりまで戻って1進む。
hogefoo|barbazfuga
.↓これより以前は処理済。この位置から改めてマッチングを試行していく。
hogef|oobarbazfuga
毎度毎度何気な〜くWebページを読んでいるその裏に、いちいちこういう
ポインタが前へ後ろへと細かく激しく行き来する「三歩進んで二歩下がる〜♪」な処理を
うんざりするほど繰り返した末にようやく1バイト前進するという
Proxomitron の涙ぐましい努力があるのかと思うと泣けてくる…。(´Д⊂ ホントニオツカレサマデス
>>904 [Patterns]
Name = "4gamer.net"
Active = TRUE
URL = "www.4gamer.net/"
Limit = 128
Match = "$NEST(<script,</script>)|$NEST(<noscript,</noscript>)|"
"<div class="ad_top">$SET(0=<div style="display:none">)|"
"<div class="hot_game_now">$SET(0=<div style="display:none">)|"
"<div class="support">$SET(0=<div style="display:none">)|"
"<div class="rectangle">$SET(0=<div style="display:none">)|"
"<div class="ad_premium">$SET(0=<div style="display:none">)|"
"<div class="contents_bottom_pr">$SET(0=<div style="display:none">)|"
"<div class="sidetop">$SET(0=<div style="display:none">)|"
"<div class="topics"> <div class="title">[%a5][%c8]$SET(0=<div style="display:none"><div class="title">)|"
"<div class="special">$SET(0=<div style="display:none">)"
Replace = "\0"
>>905 すっきりしました ありがとうございます
>>904 問題点を改善しました。上のフィルタは使わないでください
[Patterns]
Name = "4gamer.net"
Active = TRUE
URL = "www.4gamer.net/"
Limit = 40
Match = "
http://ad.adplan-ds.com\w+$SET (0=')|"
"class="ad_top$SET(0=style="display:none)|"
"class="hot_game_now$SET(0=style="display:none)|"
"class="support$SET(0=style="display:none)|"
"class="rectangle$SET(0=style="display:none)|"
"class="ad_premium$SET(0=style="display:none)|"
"class="contents_bottom_pr$SET(0=style="display:none)|"
"class="sidetop$SET(0=style="display:none)|"
"class="topics"> <div class="title">[%a5][%c8]$SET(0=style="display:none"><div class="title">)|"
"class="special$SET(0=style="display:none)"
Replace = "\0"
>>908 >>1 のWiki→フィルタ、リスト公開にList: JumpToっていうのがあるよ(リストで管理するやつだけど)
>>910 みたいなフィルタにURLマッチを入れると
単なる2度手間になって速度が落ちるのかな?
むしろ速度アップになるかと。
google、25%→30%
HTTP_ACCEPT_LANGUAGEを書き換えるヘッダフィルタはどう書けば良いですか? default.cfgを見ても、HTTP_REFERER:がReferer:になってたりよく分かりません(><) jaとenを切り替えたいです。
Accept-Languageで上手くいきましたすみません(><)
HTTP_REFERER はPerl等で使われる環境変数名 Referer: は本来のHTTPヘッダの名前 Out = TRUE Key = "Accept-Language: ja -> en (out)" Match = "ja" Replace = "en" これでおk
>>915 [HTTP headers]
In = FALSE
Out = TRUE
Key = "Accept-Language"
Match = "*"
Replace = "en"
enの場合はこんな感じ?
ニコニコスレでオミトロンのフィルタの自動アップデートアプリ作ってる。 ユーザーが増えると新しいアイデアがどんどん出てきていいね。
2ch dat converter使った場合、datファイルはどこにキャッシュ(テンポラリ?)されてるんでつか?
ウイルスコード貼ってあるスレ開けばノートンさんが教えてくれるんじゃない。
自己解決しますた
Yahooのトップページを開いたときに、 カーソルが検索ボックスに移らないようにするフィルタお願いします。 ツールバーに入力している時にいきなりカーソルが移動して困っています
focus()を上書きするんだ。
そこまでしてyahooを使いたがる理由がわからん。
出たw
よく見る定番だなww 「そこまでして○○○○を使いたがる理由がわからん。」 他に 「おい、専ブラ使っとけ」 「オミトロン切ってないんじゃないのか?」 「それぐらいググレよ」 「ここ質問スレじゃないんだけど」
おすすめフィルター設定(通常・高セキュリティなど)を書いてるサイトを教えてくれ
これはひどい
>>930 ありがとう、「Spooky仕様デフォルトフィルター」が通常と思って良いですか?
>>931 どこがひどいか【ポイント】だけ教えてくれ、もしくは、追加フィルターを教えてくれ
追加っつか、入れるなってことじゃね? 少なくともあの「Multi = TRUE」の使い方はありえんな。 意味を知らずにチェックしているとしか思えない。 正規表現でいうGlobalオプションと勘違いしてるんだろう。
どれを入れてどれを入れない方が良いのか それすら分からないヤツは使わない方が良いと思うぞ
>>935 ヒントありがとう、「Multi = TRUE」のあたりをチェックしなければ少なくても入れて良いみたいですね。
よかった。
馬鹿に物事伝えるのは難しいんだな・・・
>>937 難しいことをあきらめられる。良かったねそうなりたかった。
>>938 分からない事はすぐに他人に聞く
俺はそう言う人になりたかったよ。楽そうで良いね。羨ましいよ
オミトロンは最初のハードルこそ高いが ヘルプでしっかり勉強しフィルタを自作できるようになれば 100倍楽しくて100倍便利なソフトになる ガンガレ!!
テンプレも読まずに質問するのは勘弁してくれ 読んだ上で分からない事を質問するのは歓迎なんだが
まあ、初心者はネタ振られても普通にわからんよな。
誰か最強のdefault.cfgください
2chともあろうものがいつまでこの無差別板横断スパム野郎を放置しておくんだ
>>948 がお怒りなのでbooに放り込んだらがいしゅつだった
ホスト名調査に失敗ばかりだな。 貼る意味あるのか。
どこってわけでもないけど、ブログを見てたら一文ごとに改行してる人が多いですよね? そういうのを例えば2行以上の改行を詰めて表示させるフィルタがあったら欲しいです。
ソースが異なるので、場所によって対応が異なるとしか言えない。
ですよね・・ すみません。
俺が使ってるのでよければどうぞ Name = "2br cut" Active = TRUE URL = "$TYPE(htm)" Limit = 128 Match = "(<br[^>]+>)\0\s++$TST(\0)(\s++$TST(\0)|)" Replace = "\0"
スイーツのブログを\kするんだ
このpとstrongの量にはキレそうになるなw ざっと他のブログも見たが、確かに書いてる人毎に対応しないとどうしようもなさそうだ
>>956 ブログ普段みないからしらんかったがこれは酷いな
それにも対応させようとしたら泥臭くてなってしまった
Name = "2br cut [080405]"
Active = TRUE
Multi = TRUE
URL = "$TYPE(htm)"
Limit = 512
Match = "(<br[^>]+>)\0(\s++$TST(\0))+{1,*}"
"|(<br[^>]+>\s++|)(<(div|p)[^>]+>(<font[^>]+>|)(<strong[^>]+>|))\0(\s++<br[^>]+>|)"
"|(<br[^>]+>\s++|)((</strong>|)(</font[^>]+>|)</(div|p)>)\0(\s++<br[^>]+>|)"
Replace = "\0"
こんなものに逐一対応していたらきりがない。 /* Gecko用 */ @-moz-document url-prefix(http://ameblo.jp/nemolog0210/) { .subContents br { display: none !important; } .subContents > p { display: inline !important; } .subContents > p > strong { font-weight: inherit !important; } } /* IE6用。誤爆の恐れあり。 */ body#mainIndex .subContents br { display: none !important; } body#mainIndex .subContents p { display: inline !important; } body#mainIndex .subContents strong { font-weight: normal !important; }
おれは詰め詰めよりそれくらい改行されてるほうが見やすいけどなー。 スクロールがちょとめんどうだけど
横から戴きました
>>962 の言うことは分かる
だから俺は切り替えながら使わせていただきます
一文ごとに一画面分スクロールしないと次の文が出てこないとかいうのもあるしな
[#0:9]++だとうまくマッチしないけれども、[0-9]++でマッチするんだね。
数字が連続してたらそれら全てを一つの数として認識してマッチ試行するからじゃない?
>>965 [#0:9]は、文字ではなく数値としての0〜9
10以上はヒットしない
マウスジェスチャーで home を登録しとけばおk
乙
972 :
965 :2008/04/07(月) 00:39:24 ID:xbovtPLC0
973 :
968 :2008/04/07(月) 01:28:19 ID:I9/JYj0i0
どうやらCSSを書き換えて出来そうです CSSはスレ違いになるので他のスレに行きます スレ汚しすみませんでした
別にスレ違いでもないと思うけどな。 フィルタで対処する方が簡単、もしくは効率的ならフィルタでやればいいし、 CSSやJavaScriptを使わなければできないこともある。 要は目的が達成できればよくて、なおかつ非効率的でなければなおよし。
失礼します。
http://tv.yahoo.co.jp/vhf/tokyo/2008041004.html このページの番組紹介文を頭から20文字だけ残して
消すフィルターを作って頂けないでしょうか。
紹介文は、20文字未満の場合もあります。
時間と番組タイトルは残したいです。
私が調べた限りだと、
Match = "</a></b>*</small></td></tr>"
Replace = "</a></b></small></td></tr>"
こうするとタイトルを残して紹介文が全て消えます。
よろしくお願いします。
>>975 こんな感じでどうでしょ?
Match = "</a></b>\s([^>]+{0,40})\1*</small></td></tr>"
Replace = "</a></b> \1 </small></td></tr>"
977 :
975 :2008/04/07(月) 18:17:42 ID:YmL9riTw0
>>976 さん
望み通りになりました。
ありがとうございました。
978 :
名無しさん@お腹いっぱい。 :2008/04/08(火) 20:49:49 ID:7lLCmays0
あまりにも稚拙な質問にどうぞ激怒なさらないでくださいまし。 infoseekのトップページの右上に出てくる広告(楽天会員サービスの上)を 消すにはどうしたらよいでしょうか? ご教示くださいませ。<(_ _)>
顔文字止めた方がいいよ。ここに限らず2chでは。
あと1行目みたいな文とか、初心者ですが〜とかもむしろ逆効果
981 :
959 :2008/04/08(火) 22:19:34 ID:0x/L+LfE0
たぶん問題ないと思うけど修正したので一応、張っておきます Name = "2br cut [080408]" Active = TRUE Multi = TRUE URL = "$TYPE(htm)" Limit = 512 Match = "(<br[^>]+>)\0(\s++$TST(\0))+{1,*}" "|<br[^>]+>\s++((</strong>\s++|)(</font>\s++|)</(div|p)>)\0" "|((</strong>\s++|)(</font>\s++|)</(div|p)>)\0\s++<br[^>]+>" Replace = "\0"
>>981 乙
これはリストで適用した方がいいかもね〜
>>981 ありがとう。とりあえず大手のblogサイト専用で登録した。
見やすくなった。
フォントサイズの要望多いな。 テンプレ用にフィルタでも載せるか、 ユーザスタイルシートの適用方法でも書いた方がいいのか。
速攻ON-OFFできるフィルタの方が便利だよ。
なにをオンオフするの?
フォントサイズなんてCtrl押しながらマウスコロコロすりゃいいんじゃねーの?
1ページ開くたびにころころしろとは言えないな。 フィルタでやったほうがいいと思うけどこれくらいは自分で書けるようになってもらい。
>>983 とりあえず番組のタイトルと説明は
.title,.subtitle,.summary {
font-size: 200% !important;
}
で大きくなる。CSSで事細かく決められてる文字の大きさってフィルタだとどうやるのがいいんだろスマン
1. 対象サイトのbodyにclassを埋め込む。 2. 埋め込んだclass属性値を利用して、 好みの要素に font-size: inherit !important; とか font-size: 16px !important; とか font-size: 100% !important; とか。
Ignore smaller font-size style sheet
Firefoxじゃ消えたけど、operaってH1、H2、H3・・・項目まで細かくフォント指定できたよね。 どっかにファイルとして保存されてると思うから ちょっくら探して試してみるか・・・
994
995
996
997
998
999
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。