Я обновляю сайт, который содержит много недопустимого HTML, который выглядит примерно так:
<p>I was written by someone who knows a little, but not enough,
HTML, & now I need to be cleaned.</p>
Мне нужно иметь возможность преобразовать этот HTML, чтобы сделать его действительным.Преобразование должно быть умным и не портить содержание.Есть ли что-то, что легко выполнит эту работу в больших масштабах?