Нажмите на Trident / Gecko / Chrome, чтобы отобразить HTML в текст? - PullRequest
1 голос
/ 30 марта 2012

Я пытаюсь разобрать свой выход из электронных писем HTML, чтобы сохранить их содержимое в виде понятного необработанного текста.

HtmlAgilityPack, кажется, хорошо принят, но оставляет мне большую часть анализа / интерпретации, и мыговорящий HTML выглядит довольно беспорядочно.

С другой стороны, если я загружаю образец электронного письма в формате HTML в IE / Firefox / Chrome, все они получают правильный синтаксический анализ, и простое копирование / вставка дает мне нужный текст.

Кажется, есть способы подключиться к Trident из C # с помощью Windows.Forms.WebBrowser, но мой проект, основанный на командной строке, это был бы довольно хакерский способ действий.

Так что мой вопросв двух словах: есть ли не графический способ использовать Trident / Gecko / Chrome для разбора HTML в текст?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...