Какой лучший HTML-пакет? Есть ли какая-либо опция в пакете HTML agility, чтобы сделать HTML-страницу аккуратной? - PullRequest
4 голосов
/ 22 марта 2010

Я использую пакет гибкости html для анализа html табличной информации . Теперь есть некоторый html контент с отсутствующими конечными тегами и с такой страницы из-за отсутствующих конечных тегов html пакет agility не анализирует информацию должным образом. Поэтому я хочу вставить конечные теги там, где есть отсутствующих конечных тегов , поэтому html agility упаковать информацию о разборе правильно. Итак, чтобы вставить отсутствующие конечные теги, что мне делать? Должен ли я написать свой собственный код для этого или использовать html tidy pack для этого?

Если html tidy pack, то какой самый лучший html tidy pack , и как использовать его, если это возможно, в качестве примера? А если мой собственный код , то на что это может быть похоже?

Есть ли какая-либо опция в html agility pack , которая позволяет нам сначала создать html-страницу tidy , а затем разобрать веб-страницу.

1 Ответ

7 голосов
/ 24 марта 2010

В Html Agility Pack я не смог найти ни одной опции, которая делает html страницу аккуратной. Есть одна опция, которая вставляет отсутствующие закрывающие теги, но работает только на некоторых html страницах. Эта опция в html agility Pack:

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;

Я также пытался использовать регулярные выражения для этого, но он также работает только для некоторых HTML-страниц.

Итак, я нашел лучший HTML-пакет :

http://www.devx.com/dotnet/Article/20505/1763/page/2.

Мы можем видеть там: как импортировать dll и как использовать этот аккуратный пакет, также доступен пример кода. Это вообще здорово. Он может вставить пропущенные закрывающие теги 1015 * и сделать вашу HTML-страницу аккуратной.

Спасибо за помощь всем ..

...