Байесовские фильтры позволяют решить часть этих проблем.

Во-первых, они позволяют отказаться от произвольных «словарных профилей» (в известном смысле эти профили создаются автоматически).

Во-вторых, они построены на хорошо определенной вероятностной модели. Допущения этой модели известны, что позволяет целенаправленно улучшать качество фильтров.

В-третьих, байесовские фильтры автоматически могут учитывать и наиболее распространенные способы «зашумления» текста.

Принцип работы байесовского фильтра весьма прост. На основании анализа двух массивов текстов, один их которых является СПАМом, а второй — обычным текстом, вычисляются относительные частоты, с которыми различные слова встречаются в этих двух массивах.

На основании полученных частот вычисляются вероятности того, что данное слово встретится в тексте, принадлежащем массиву «СПАМ». То есть на этом этапе анализа создается таблица, которая говорит, что, если текст является СПАМом, то, например, вероятность того, что в нем встретится слово «sexy» равна 0,96.