Я пытаюсь разобрать HTML, используя TouchXML . Тем не менее, кажется, что данные, которые я хочу проанализировать (я не контролирую источник, он загружен из Интернета), частично искажены - я получаю различные ошибки во время анализа. Поэтому мне кажется, что я должен использовать встроенную поддержку tidy для исправления HTML, но я не могу найти какую-либо документацию или информацию о том, как его включить или успешно связать libtidy с моим проектом.
Если у кого-нибудь есть какая-либо информация о том, как это сделать, это будет высоко ценится. В качестве альтернативы, если есть другой инструмент, который я мог бы использовать для этого - скажите мне!