У меня есть приложение C #, которое получает HTML-файл.Я хочу разобрать и проверить это.На выходе он вернет список ошибок или что мой html действителен.
Кто-нибудь знает, как я могу это сделать?
Я бы запустил локальный экземпляр службы проверки разметки W3C и связался бы с ним через API
Вы можете использовать HTML Tidy. Для .NET есть оболочка с именем TidyManaged
В версии 1.0 (!) Microsoft.mshtml.dll есть неясная DLL-библиотека, и это единственный способ в рамках работать с DOM.Если HTML является XHTML и допустимым XML, то вы можете использовать XML, но в противном случае это единственный шанс.
Это относится к вашему вопросу:
Ищем синтаксический анализатор C # HTML