Разбор якорных тегов с использованием asp.net - PullRequest
0 голосов
/ 06 января 2010

При анализе множества html в простом текстовом формате, regex - лучший способ извлечь и изучить все теги привязки или есть что-то встроенное в .net lib?

Ответы [ 2 ]

1 голос
/ 06 января 2010

регулярное выражение хорошо. Однако я нахожу, что HTML-пакет agility немного более щадящий, и это то, что я бы использовал в этой ситуации.

1 голос
/ 06 января 2010

RegEx, вы приятель здесь. В BCL нет встроенного анализатора HTML.

Если ваш ввод XHTML (или XML-совместимый), вы можете использовать XML и XPath. Загрузка документа в XmlDocument и выбор всех a узлов.

...