Я анализирую html-файл с помощью html-пакета agility, чтобы извлечь данные таблицы из html-файла. Но есть некоторые html-файлы, в которых нет конечных тегов, которые являются необязательными, или нет начального тега, который также является необязательным. Таким образом, пакет agility html не анализирует эту html-страницу надлежащим образом. затем с опцией TestFX-->TestFX HTML Tidy-->TiDy clean document
и приведите содержимое в порядок, как это. А теперь этот файл. Если я проанализирую пакет гибкости html, он будет проанализирован правильно.
Оптимизация HTML-страницы с помощью блокнота ++ - лучший вариант.
Так что я не знаю, но пользователь не может сделать это так, как сначала он / она делает страницу аккуратной с помощью notepad ++, а затем идти дальше. Что мне делать?
РЕДАКТИРОВАТЬ Я использовал hidml tidy pack, но в некоторых случаях есть файл, который проверен, который не анализируется, но если я делаю эту страницу аккуратной в notepad ++, то она анализируется.