DIAVIS-wiki
  • 追加された行はこの色です。
  • 削除された行はこの色です。
 >ベイズ理論に基づくスパム対策
 ベイズ理論に基づくスパム対策アプリケーションは、ポール・グラハム氏が2002年に発表した論文「A Plan for Spam」に端を発する。このアプローチはすぐに多くの開発者に受け入れられた。ベイジアンスパムフィルターは、ある特定の言葉がスパムの兆候を示し、ほかの言葉はメッセージがまともであることを示す、という考え方に基づいている。内容採点型のほかのタイプのフィルターもこの考え方を用いているが、ベイジアンフィルターの場合、スパムの兆候を示す言葉と特徴の独自のリストを生成し、手動で作成するリストを必要としないという利点がある。
  ベイジアンフィルターはまず、スパムだと分かっているメールの集まりと、まともなものだと分かっている別のメール群を調べる(事前情報)。これら2組の内容――メール本文だけでなく、ヘッダ情報、メタデータ、単語の組み合わせ、フレーズ、さらには使用する色の指定情報を表すHTMLコードまで――を比較する。この結果から、以後受信するメールがスパムか否かを効果的に判断するための、言葉つまりトークンのデータベースを構築する。
  ベイジアンフィルターは、メッセージの文脈全体に配慮する。例えば、スパムメッセージの件名にはよく「無料」という単語が含まれているが、まともなメッセージにもこの単語が使われることがある。ベイジアンフィルターはこの単語に気付くが、メッセージ内のほかのトークンも調べる。なぜなら、大事なメールを間違えてスパムと判定すること(偽陽性の判断)は、スパムの一部をまともなメールとして通してしまうよりも問題が大きいからだ。
 
 > 英国の牧師、トーマス・ベイズ(1702〜1761)は、「An Essay Towards Solving a Problem in the Doctrine of Chances」の著者として知られている。1763年、ベイズの死後に発表されたこの論文は、今日「ベイズの定理」として知られる、ある事が起きる確率を、関係はあるが別の事象に基づいて予測する方程式を示している。
 
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS