Я ищу лучшие практики для выполнения строгой (белого списка) проверки / фильтрации отправленного пользователем HTML.
Основная цель - отфильтровать XSS и аналогичные программы, которые можно вводить через веб-формы. Вторичная цель состоит в том, чтобы ограничить разрыв содержимого HTML, введенного нетехническими пользователями, например, через WYSIWYG-редактор, который имеет представление HTML.
Я подумываю об использовании HTML Purifier или обкатке своего собственного с помощью анализатора HTML DOM для прохождения процесса, такого как HTML (грязный) -> DOM (грязный) -> фильтр -> DOM ( чистый) -.> HTML (чистый)
Можете ли вы описать успехи с этими или другими более эффективными стратегиями? Любые подводные камни, на которые стоит обратить внимание?