Синтаксический анализ тега C # HTML - PullRequest
4 голосов
/ 23 октября 2008

Мне нужно проанализировать большой объем текста, который использует HTML-теги для форматирования,

Например:

<font face="fontname" ...>Some text</font>

В частности, мне нужно определить, какие символы будут отображаться с использованием каждого шрифта, используемого в тексте. Мне нужно иметь возможность обрабатывать такие вещи, как теги шрифта внутри другого тега шрифта.

Мне нужно использовать C # для этого. Есть ли какой-то класс синтаксического анализатора C #, чтобы сделать это проще? Или я должен был бы написать это сам?

Спасибо!

Ответы [ 3 ]

3 голосов
/ 23 октября 2008

Я не использовал его, но я видел HTML Agility Pack , часто упоминаемый для этого типа вещей.

0 голосов
/ 23 октября 2008

Вы можете загрузить HTML в Internet Explorer, а затем запросить у DOM теги шрифта (или стиль CSS).

Не знаю, является ли это лучшим вариантом с точки зрения производительности.

0 голосов
/ 23 октября 2008

Не уверен, применимо ли это к вашей ситуации, поскольку я не знаю, для чего предназначено использование, но как насчет использования шаблонов XSLT?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...