さらば!迷惑メール(後編)
第2部
迷惑メールはこうかわせ
迷惑メールに網をかける
学習型フィルターで有名なのは「ベイジアンフィルター」だ。受け取ったメールを、ユーザーが迷惑/通常のメールの2通りに分類。これを繰り返すと2種類のサンプルを集めたデータベースができるので、単語ごとに各データベースにおける出現率を計算する。例えば「free」が含まれる確率は、迷惑メールでは80%、普通のメールでは20%だとすると※2、「free」は“迷惑メール度”が高い単語だ。新しいメールが届いたら、本文中の単語の“迷惑メール度”を基に「メール全体が迷惑メールである可能性」を計算。一定のしきい値を超えたら迷惑メールと断定する。
最近では本文中に無意味な単語を大量に入れておくなど、ベイジアンをかく乱する手法も編み出されている。そのため@niftyやインターネットイニシアティブ(IIJ)では、ベイジアンを含む複数のフィルターを併用している。BIGLOBEのサービスはベイジアンと異なり、ヘッダー情報から迷惑メールによくある構造を析出することでフィルタリングする。ぷららネットワークスも4月中にベイジアンフィルターの試験運用を開始予定だ。
一方、ルール型フィルターを提供するプロバイダーも多い。ルール型では、ユーザーが決めたルールにぴたりと合致するメールを、ユーザーが決めた方法で処理する。
条件にできる項目と、設定可能なルール数はサービスごとに異なる(右上表)。ルール型は、OutlookExpressなどメールソフトも搭載している。プロバイダーが提供している機能と、メールソフトの機能を見比べて、好みに合う方を使えばいい。プロバイダーのルール型は、迷惑メールをサーバー上で削除する。そのため、パソコンにダウンロードするメールの量が減るのがメリットだ。
この連載のバックナンバー
- ネットが使えなくなる日 (2005/08/08)
- さらば!迷惑メール(後編) (2005/07/25)
- さらば!迷惑メール(前編) (2005/07/13)



