Я хочу написать веб-приложение, которое позволяет пользователям вводить любой HTML-код, который может находиться внутри элемента <div>
. Затем этот HTML-код будет отображаться другим пользователям, поэтому я хочу убедиться, что сайт не открывает людей для атак XSS.
Есть ли в Python хорошая библиотека, которая будет очищать все атрибуты обработчика событий, <script>
элементы и другие фрагменты Javascript из HTML или дерева DOM?
Я собираюсь использовать Beautiful Soup для упорядочения HTML-кода, чтобы он не содержал закрытых тегов и тому подобного. Но, насколько я могу судить, у него нет предварительно упакованного способа убрать весь Javascript.
Если на каком-то другом языке есть хорошая библиотека, это тоже может сработать, но я бы действительно предпочел Python.
Я много раз искал в Google и охотился на pypi, но не смог найти ничего очевидного.
Относящиеся