После этого применяем формулу Байеса, смысл которой заключается в том, что она позволяет «обратить» построенную таблицу вероятностей и говорить о вероятности того, что текст представляет собой СПАМ при условии, что в нем встретилось данное слово.

Многофакторные фильтры.

Современные системы фильтрации СПАМа являются многофакторными. Письмо проверяется многочисленными методами, каждый из которых дает ту или иную оценку, решение принимается на основе некоторой интегральной величины (рассчитываются доверительные интервалы с применением вероятностных схем).

Современные антиспам-продукты, особенно некоторые коммерческие решения, дают замечательный уровень фильтрации, порядка 95%-99% при практически полном отсутствии ложных срабатываний.

В чем недостаток таких фильтров?