У меня похожая проблема с одним из приложений, которые мне нужны. Я называю людей, которые предоставляют нежелательные данные "клоунами", и собираю набор правил, которые идентифицируют потенциальных клоунов. Первоначальный набор правил был довольно простым (вероятно, похожим на ключевые слова, которые у вас есть сейчас). Набор правил со временем расширился как на основе моих собственных наблюдений, так и на основе советов коллег.
Обратите внимание, я указал, что я идентифицирую потенциальных клоунов. Таблицы, которые могут содержать данные клоуна, получают столбец IsClown, который может представлять состояния «не проверено», «потенциальный клоун», «не клоун», «является клоуном». У меня есть автоматический процесс, который проверяет все новые данные. Если этот процесс соответствует одному или нескольким правилам, запись помечается как «потенциальный клоун», и человек проверяет записи с помощью простого пользовательского интерфейса, либо переводя состояние «не клоун», либо «является клоуном».
Будет ли это работать для вас, зависит от того, насколько хорошо правила могут быть определены и от количества данных, которые вы рассматриваете. Это работает для меня, поэтому думал, что я поделюсь.