第二 tDiary.Net での調査分をお知らせします。
これを元に、tdiary のフィルタルールを書いたり、httpd のブロック設定を書いたりされた方はぜひお知らせください。
[追記] さて、第二では、とりあえず上記の IP アドレスを全部 Deny from につっこんでいるだけですが、あのリストの中身は「悪意のある発信元」+「踏台にされている (最近の時点での) オープンプロキシ」ということになるでしょう。 ですから、あのリストを眺めながら、「この IP は /24 で落そう」とか「この IP は /32 にしておこう」とかの判断が望ましいのでしょうね。 いずれにしてもDeny from ... が 400 行以上もあると、それはそれでパフォーマンスに影響を与えそうですし、何らかの整理は必要でしょう。
リファラリストの方は、単語で分割したうえで出現頻度の多い単語を tdiary のフィルタで落すとかの工夫がいいかな。 リファラ文字列を判定して httpd レベルで落してしまうと、「えっちな検索」経由での日記アクセスがブロックされたりするので、それはちょっとやりすぎなのかもしれません。ちなみに第二 では、
SetEnvIf Referer (XXXXXX[-.]|XXXX[-.]|XXXXXXX[-.]|XXX[-.]) spam (snip) Deny from env=spam
(XXX のところはえっちな単語がいろいろ) のように、'-' や '.' つきでマッチさせることで、えっちな検索のリファラではひっかかりにくいようにしています。
とかとか、このへんのアイデアや成果をお寄せくださるとなお嬉しいのであります。
長いですが参考までにb2evolutionの「spam排除」機能のリストです。(投稿できるのかな?) b2evolutionはIPアドレスでの制限はしないみたいです。個人レベルのコメントSPAMへの対応はやはりIPで制限しないとならないでしょうね。<br><br>(後略)
初めまして。<br>このリストでhttpdの設定やりましたー。という報告。。。
yohgaki さんのリストは長いのと、NG ワードが日記中に溢れるのがあれなのとで、http://kazuhiko.tdiary.net/tmp/black_yohgaki.txt に移動しました。
迷惑かもと思ったのですがこの手のリストは多めの方が役立つかなと思ったのですが、よく考えれば自分のサイトに貼ればよいのですよね orz
http://devlog.moonwolf.com/20041013.html#p01<br>からTrackBackしたのですが消えちゃいましたね(^_^;
あれ? 消した覚えはないけれどいつのまにか非表示になっていました。なぜだろう?
そうそう、うちも消えてました。<br>mod_rubyがらみかも。<br><br>トラックバックのプラグインってevalでメソッドの書き換えを<br>しているみたいなんですが、書き換えられたプロセスで、トラックバックのプラグインをロードする前にそのメソッドを<br>呼んでるところがあるとまずいのかな、と思いつつ調べてません。