Статистические фильтры, такие как Байесовские фильтры или какая-то некачественная версия, используемая некоторыми фильтрами спама, просты в реализации. Плюс к этому есть много онлайн-документации.
Большим недостатком является то, что он не может действительно обнаружить неизвестные вещи. Вы обучаете его большой выборке известных данных, чтобы она могла классифицировать новые входящие данные. Но вы можете перевернуть традиционный спам-фильтр вверх ногами: научите его распознавать законные данные вместо незаконных, чтобы все, что он не распознал, было аномалией.