【SPAM】POPFileを語ろう【フィルタ】

このエントリーをはてなブックマークに追加
933名無しさん@お腹いっぱい。:04/04/26 14:55 ID:50DNdCGl
俺の場合、Hamをよこす英語圏の人が決まっているせいか誤認は全くない。

931にとってのHamに何かキーワードがあればもっと正確に振り分けてくれるんだろうが…
934名無しさん@お腹いっぱい。:04/04/26 15:04 ID:g2aG+nyq
>931
すまん、HAMってどういうメールの意味かワカラン。
有用なメールならばFromかSubjectのマグネットで引っ掛ければいいんじゃないか?
935名無しさん@お腹いっぱい。:04/04/26 15:15 ID:SSRuMVR2
>>934
hamってspamじゃない奴。
bsfilterなんかだと、Cleanなのをそう呼ぶみたいだよ。
936名無しさん@お腹いっぱい。:04/04/27 09:10 ID:3nAJ7YcT
「このメールは○○%の確率でspam」みたいな機能があればいいのに。
そうすれば正規表現使ってゴミ箱に入れる前にサーバから消せるし。
937名無しさん@お腹いっぱい。:04/04/27 09:54 ID:sgNcLAQ3
>>936
POPFileの判定ってのは、ローカルに取り込まないと使えないわけだが。
どうしても鯖でやらせたいのならspamassasin使うとかすればいいと思う。
938名無しさん@お腹いっぱい。:04/04/27 10:11 ID:NBZRQ3iN
ルールベースはメンテナンスが面倒なわりにミス率がいまいち
939名無しさん@お腹いっぱい。:04/04/27 12:20 ID:40Ar4GdB
スコアの表示なら本家の要望にあがっていたハズ
940名無しさん@お腹いっぱい。:04/04/27 17:12 ID:CZ3qQWJn
PopFileすばらしいね。いまんとこ精度99.4%くらいかな。
最初のうちは貯めていたSpamメールを自分宛てに再送信して鍛えたかな
941名無しさん@お腹いっぱい。:04/04/28 10:29 ID:wP7vZrx0
皆さんは貯めてたspamを一気にいっぱい食わせてるみたいですが、
その必要ってあるんですかね?
私はバージョンアップのたびにクリーンインストールしてますが、
それから来たspamを3通ぐらい学習させれば後はほぼ
100%認識してます。
942名無しさん@お腹いっぱい。:04/04/28 10:53 ID:gKWeL7wN
まぁ、いろんな環境のひとがいるからねぇ
943名無しさん@お腹いっぱい。:04/04/28 12:07 ID:out1H+Ru
必要があるっつか、それが楽しいからってとこかな。
育てゲーみたいでさ
944名無しさん@お腹いっぱい。:04/04/28 16:01 ID:DFkDKmR+
>>943
三日もすればこれ以上育たないところまで成長しちゃうけどね。笑
945名無しさん@お腹いっぱい。:04/04/29 04:24 ID:b8SqLKox
>>944
溜め込んでたSPAMを5000通ばかし食わせてみたんだけど無駄?
むしろ、無駄にでかくなった辞書操作に、ただ時間とメモリを食うようになっただけ?
946 :04/04/29 04:35 ID:UXdb3RMm
>945
無駄。過去レス見ればわかる
馬鹿じゃねーの。大体5000もspam
食わせないといけないフィルターなんかだったら
ユーザーになる奴なんか皆無だよ

50通から100通spam食わせれば完璧
947名無しさん@お腹いっぱい。:04/04/29 10:31 ID:gZv3Rx20
>>946
10通でも十分。
948名無しさん@お腹いっぱい。:04/04/29 11:57 ID:Jl++1ESQ
949名無しさん@お腹いっぱい。:04/04/29 15:07 ID:86A79F4D
>>948
早速入れてみた。しばらく様子見。
それと、bayes_unclassified_weightのデフォは100
950名無しさん@お腹いっぱい。:04/04/30 12:52 ID:BN37Z2Py
コレ入れてからSPAMやウイルスメールが少なくなったのですが
気のせいですか?
951名無しさん@お腹いっぱい。:04/04/30 13:16 ID:eO7eI39t
気のせいでございます。
952名無しさん@お腹いっぱい。:04/04/30 17:25 ID:OQnJyylB
>>950
気が触れたと思われますので、次スレをお願いします。
953名無しさん@お腹いっぱい。:04/04/30 18:10 ID:i/uNouf5
以前にnPOP(メールサーバに置いてあるメールを読むソフト)
での成功例が報告されていましたが、どなたか詳細を
教えていただけないでしょうか?

ちゃんと設定していると思うのですが、POPFileが割り当てる
はずの[spam]とか{no_spam]の文字列が、nPOPの件名一覧ウインドウで
subjectに つきません。(通常のsubjectのままです。POPFileを素通りして
いるような雰囲気です)

一応、nPOPでの設定を書いておきます。

 POP3サーバ  127.0.0.1
 ポート番号   110
 ユーザー名  ふだん使ってるメールサーバ : ユーザ名 : apop
 APOPを使って認証のチェックを外す

(v0.21.1に、APOP用パッチを当てて使用してます)
954名無しさん@お腹いっぱい。:04/04/30 19:02 ID:YPw/tQJ9
nPOPって、直でめる鯖を覗くから、ローカルに取り込んでラベリングするPOPFileとは
相容れないのとちがうんだろうか?
955名無しさん@お腹いっぱい。:04/04/30 19:47 ID:i/uNouf5
>>954

やっぱりそうなんですか、、、

nPOP側に[spam]とか[not spam]とかを追加した
subjectを渡してくれると、サーバ上のメールを削除するのに
楽かなあ、と思ったのですが、、、

理屈的には、でも、メールサーバ→POPFile→nPOPとなるわけですから、
nPOPにはヘッダが追加された情報が渡されると思ったのです。

やっぱり勘違いなのかな、、、
956名無しさん@お腹いっぱい。:04/04/30 20:25 ID:YPw/tQJ9
>>955
> 理屈的には、でも、メールサーバ→POPFile→nPOPとなるわけですから、
> nPOPにはヘッダが追加された情報が渡されると思ったのです。

えーと、以前、糞のようにVirus付spamに悩まされたときに、nPOPQを使って
直接鯖から消しまくったことがあって、そのときに、なぜかNAVがやかましく反応
したことがあったから、ヘッダなりMailの一部をとりこんでいることは間違いなさ
そうではあるんだよね。

でも、POPFileは基本的に、全文取り込んで判定するわけだから、そのへんの
仕様の違いなんじゃないのかなぁ、とか思うわけだったりする。
957名無しさん@お腹いっぱい。:04/04/30 20:56 ID:i/uNouf5
私なりに理解しているnPOPの動作は、
 「メールサーバに何かコマンドを送って、返ってきた情報を
 (nPOPディレクトリにある)MailBox0.datに書き出す」
です。
(この部分を勘違いしていたら、ごめんなさい)

だから、POPFile経由でメールを読みに行ったとしても、
subjectに[spam]とか[not spam]のラベルを付け足した情報がMailBox0.datに
書き出される、、、はずだと思っています。

、、、が、やっぱり違うんでしょうか???
958名無しさん@お腹いっぱい。:04/04/30 21:00 ID:YPw/tQJ9
>>957
本家のフォーラムに書いてみたらどないでせう。

つか、次スレどうする?(w
959名無しさん@お腹いっぱい。:04/04/30 21:34 ID:SWmOey84
残念ながらnPOPは試したことがないのだが、
メールサーバからメールのヘッダ部分を取得するメールチェッカで
tyomailっていうのを使っていたときはうまくいかなかった。
メールサーバからヘッダと本文、両方を取得するメールチェッカ
LookMailを試してみたのだが、LookMail上で巡回した時なら、
きちんとPOPFileを通して読めるようになったよ。
LookMailの設定で、subjectに[spam]がついているものは、非新着扱いにできるので、
HAMのみ新着メールとしてお知らせしてくれるので便利。

他にもBeckyで試してみたんだけど、
サーバからヘッダ部分のみ取得した時はPOPFileの分類が行われず、
本文まで取得した時、はじめて分類されるっぽい。
960名無しさん@お腹いっぱい。:04/04/30 22:51 ID:i/uNouf5
>>959

情報提供ありがとうございます!
、、、と思って、さっそくLookMailを使用してみたのですが、
これは直接サーバー上のメールを削除したりはできない
んですね。ざんねんです。

「POPFileがスパムと判定してラベルをつけたメールを、
実際のメールサーバー上から削除する」ための
楽チンな方法をご存じのかたいましたら、教えてください。

《ためしたこと》

・nPOP → POPFileを通しても、なぜかsubjectにラベルがつかない
・LookMail → subjectにPOPFileがつけるラベルが反映されるものの、
          サーバー上のメールを直接削除できない

#POPFileの話から脱線してますでしょうか?

961名無しさん@お腹いっぱい。:04/04/30 22:52 ID:kRt6BcPa
>>957
まだ翻訳途中なのですが、
http://popfile.sourceforge.net/cgi-bin/wiki.pl?JP_HowTos/Toptoo
が参考になるのではないかと思います。

サーバにあるメールから、ヘッダ情報だけを取り出す TOP というコマンドを
使っている場合、POPFile は振り分けやヘッダの変更をしません。
というのは、POPFile はヘッダだけでなく、本文もすべて読み込んだ上で
振り分けをおこなうからです。
おそらく nPOP ではこのコマンドを使っているために、件名が変更されない
のだと思われます。

この動きを変更するためには、詳細設定タブの、pop3_toptoo を 1 に変更
します。そうすると、TOP コマンドが送られてきた場合も、メールの内容を
すべて読み込んで振り分けをおこない、その結果を返すようになります。
(件名を変更する設定になっていれば、変更される)

ただし、この設定にした場合、メールチェックソフトがメールを読みにいく
たびに、それが「毎回」 POPFile にチェックされ、履歴に保存されることに
なるのでご注意ください(たくさんのメールをためているのでなければあまり
関係ないかもしれませんが)。
962名無しさん@お腹いっぱい。:04/04/30 23:15 ID:i/uNouf5
おおおお!
>>961
感動です!!
nPOPでもちゃんと反映されました!!
情報提供、ありがとうございます!
本当に感謝です。

これで、nPOPで[spam]ラベルがついたメールをソートして、
一気にサーバーから削除することができるようになりました!
、、、感動!!

長年悩まされていたspam整理から、やっと解放された、、、!
この感動というか、開放感というか、ストレス解消は、涙が出るほど
本気で嬉しい、、、10年以上使っているメールアドレスなので、、、!!

ひとつ質問ですが、
 >ただし、この設定にした場合、メールチェックソフトがメールを読みにいく
 >たびに、それが「毎回」 POPFile にチェックされ、履歴に保存されることに
 >なるのでご注意ください
と書かれていますが、これが原因で、POPFileの学習に影響が
出たりするのでしょうか?あまり好ましくないことなのでしょうか?
963961:04/04/30 23:19 ID:kRt6BcPa
>>962
POPFile の学習にはなにも影響はありません。
POPFile は、UI 上で、「手動で」振り分け先のバケツを変更したときにだけ
学習します。単にたくさんのメールを通しただけでは、なにも学習しません。
964名無しさん@お腹いっぱい。:04/04/30 23:25 ID:i/uNouf5
じゃあ、例えば、何度かnPOPで読み込ませてしまい、
POPFileの履歴に同じメールが何度も表示された
状態になってたとします。

Aというメールを[spam]から[not spam]へバケツ変更するのも、
表示されている箇所全て変更しなければいけない、、、ということでしょうか?

nPOPで3回読み込んだとします。
 
 A  [not spam]
 B  …
 C  …
 A  [spam]
 B  …
 C  …
 A  [not spam]
 B  …
 C  …

などと誤って手動設定して再分類した場合、学習成果に
影響は出るんでしょうか?(出るに決まってる、、、のかな??)
965961:04/05/01 00:07 ID:wFXXyvai
>>964
同じメールは、1回修正するだけで ok です。
ほかは放置するか、気になるなら削除しましょう。

同じメールを別のバケツに振り分けた場合は、影響が出ると思います。
上に書きましたように、ひとつ修正すればいいだけなので、同じメールを
別のバケツに分類してしまう、というのはあまり心配しなくてもいいと
思います。
966名無しさん@お腹いっぱい。:04/05/01 00:42 ID:DC/rw8CG
おおっ

気になりながら帰ってきたら、問題解決ですか。
967名無しさん@お腹いっぱい。:04/05/01 01:05 ID:zUAWrwiF
>>965

本当にありがとうございました。
マジ感謝です。

毎日毎日スパムを削除するのにウンザリしてました、、、。
明日からほとんど気にしなくて済みます。

メールが仕事に不可欠なのに、どんどんスパム
汚染されていってどうしていいやら、と本気でウンザリしてた
ところでした。

救世主だよ、このソフト。
(961さんのアドバイスも!)
968名無しさん@お腹いっぱい。:04/05/01 08:52 ID:AEJLvdRW
niftyのSPAMブロックサービス利用してるんだけど、結構賢くて最近POPFile
の活躍が少なくて寂しい・・・
969名無しさん@お腹いっぱい。:04/05/01 10:20 ID:0a9TElcu
スコアを表示させても全てのメールが0.99999だな・・・
970名無しさん@お腹いっぱい。:04/05/01 11:07 ID:EoKn7S6I
>>968
他のISPもベイズフィルタを導入汁。
971名無しさん@お腹いっぱい。:04/05/01 15:58 ID:fip01dUR
>>968
niftyのあれ結構いいよな。
といいながら今はPOPFileのテストのために
オフにしてあるわけだが。
972名無しさん@お腹いっぱい。:04/05/01 19:20 ID:6nH/i/VM
ニュースレター関係が、軒並みSPAM扱いされちゃうのは、仕方がない?
973名無しさん@お腹いっぱい。:04/05/01 19:59 ID:qiMcQhji
それは教育が足りない
974 :04/05/01 21:03 ID:GNozv++r
ゆとり教育の弊害
975名無しさん@お腹いっぱい。:04/05/02 17:31 ID:Y/8B55rI
昨日リセットして、180通・100%の精度

うちのはスパルタよ
976他力本願:04/05/03 17:43 ID:XNMibm8S
誰か上に出てきたアンチウィルスソフト毎の設定方法まとめてくれないかな…
977名無しさん@お腹いっぱい。:04/05/03 21:48 ID:bIm8TjGj
popfile入れてみた。それは具合良さげなんですけど、
NAVの電子メールスキャンをオンにして大きめなメールを
受信すると、サーバー側がタイムアウトになってしまう。
NAVがウイルススキャンのために全部受信したあと、popfile経由で
受信するのに結構時間がかかるので、そこでタイムアウトになってる模様。
とりあえずNAVの受信メールスキャンをオフにして対処してるけど、
なんか良い方法ないですかねぇ…?
メール鯖OCN、NIS2002付属のNAV、WinME、セレロン600+192MB。
マシン買い替えれって真っ先に書かれそう…
978名無しさん@お腹いっぱい。:04/05/03 22:49 ID:h3ukr9/B
>>977
マシン買い替えれ
979名無しさん@お腹いっぱい。:04/05/03 23:05 ID:XhrP/Dvp
NAVは重いし、このところのVirusMailの多さに、固まりまくり。
頭にきたので、数日前にAVGの7.0に乗り換えしました。
それ以降は、とりあえず、問題なし。
POPFileとの連携も軽々。
980名無しさん@お腹いっぱい。:04/05/03 23:07 ID:eO9vx8pW
>>977
Celeron400+192MB
Win2000+NAV2003+POPFile+Becky
OCN鯖
で普通に受信できまつよ?
メールソフト側のタイムアウトをいじってみては?
981名無しさん@お腹いっぱい。:04/05/03 23:22 ID:iAl24XCr
古いNAVは重いよ
982名無しさん@お腹いっぱい。
>>981
NAV2004だったんだけどね。