Игнорирование ошибок разбора с помощью Html Agility Pack? - PullRequest
1 голос
/ 31 мая 2011

Я пытаюсь проанализировать одну страницу с YouTube ... которая на самом деле не свободна от синтаксических ошибок. Html Agility Pack кричит об этих ошибках и ничего не возвращает в результате.

http://codepaste.net/gh3hco

1 Ответ

1 голос
/ 31 мая 2011

Я не пробовал этого, но, основываясь на предложении на их форуме , вы можете использовать HTML Tidy или Tidy.NET , чтобы сначала очистить HTML. При желании вы можете найти ошибочные теги и удалить их на этапе предварительной обработки.

...