HTML Agility для извлечения тегов PHP - PullRequest
2 голосов
/ 10 августа 2010

Какой синтаксис следует использовать с HTML Agility Pack для извлечения всех

тегов из файла Php ..?

HtmlNodeCollection tags = htmlDoc.DocumentNode.SelectNodes("//??php");

Выдает исключение (недопустимый токен).

Пробовалубегать?с ??и \?

Спасибо

1 Ответ

0 голосов
/ 10 августа 2010

HTML Agility Pack подавляет узлы с ? в имени. Самым простым вариантом, вероятно, является просмотр строки HTML перед загрузкой в ​​объект документа и замена экземпляров <? на <php и так далее. Это не обрабатывает неприятные случаи, такие как наличие строкового литерала на странице с "& lt?" но на самом деле, как часто это происходит?

...