Я использую VC ++ 2010 Express и пытаюсь включить HTML Tidy для очистки строк кода HTML.Я хочу обработать HTML как строку (НЕ из файла) и сохранить обработанный очищенный HTML в строку (НЕ в файл).Проект представляет собой проект C ++ для форм Windows, компилятор - /CLR.
Я пытался, чаще, чем хочу признаться, присоединить Tidy к моему проекту различными способами.Я терпел неудачу в каждой попытке, и я просто не уверен, куда идти отсюда.Самым многообещающим был .NET-упаковщик под названием TidyManaged, но я не смог найти никакой документации, объясняющей, как использовать его с C ++ (похоже, он предназначен для C #).Различные оболочки C ++ не работают для меня вообще.Кажется, в документации крайне не хватает того, как заставить их работать.
Также я готов принять решение, которое вообще не использует tidy, а какой-то другой эквивалентный инструмент для очистки HTML.Меня беспокоит возраст Tidy (август 2000 г.) и его эффективность для современных более новых стандартов XHTML.
Кроме того, если это возможно, я хочу включить библиотеку C в свой код напрямую, не полагаясь нана DLL, но я не знаю, как заставить это работать или даже если он может работать.
Любые предложения о том, как это сделать, будет принята с благодарностью, учитывая, что это HTML, мыречь идет здесь (часто искаженный HTML и XHTML), а не XML.
Заранее спасибо!
PS - я новичок в C ++: /