Я ищу алгоритмы и структуры данных, которые можно использовать для исправления неработающего HTML.Я знаю, что для этого существует множество встроенных инструментов на каждом языке.Но я хочу научиться этому.Некоторые подходы, которые я могу придумать, -
- Использование регулярных выражений - кажется наивным подходом
- Создание DOM - но как дерево DOM будет создано с поврежденным html?
ОБНОВЛЕНИЕ: Это более общее обсуждение, которое я ожидаю.Но если вы ссылаетесь на какие-либо инструменты в C, C ++, Python или Java, то я в порядке.
спасибо