Я пытаюсь разобрать свой выход из электронных писем HTML, чтобы сохранить их содержимое в виде понятного необработанного текста.
HtmlAgilityPack, кажется, хорошо принят, но оставляет мне большую часть анализа / интерпретации, и мыговорящий HTML выглядит довольно беспорядочно.
С другой стороны, если я загружаю образец электронного письма в формате HTML в IE / Firefox / Chrome, все они получают правильный синтаксический анализ, и простое копирование / вставка дает мне нужный текст.
Кажется, есть способы подключиться к Trident из C # с помощью Windows.Forms.WebBrowser, но мой проект, основанный на командной строке, это был бы довольно хакерский способ действий.
Так что мой вопросв двух словах: есть ли не графический способ использовать Trident / Gecko / Chrome для разбора HTML в текст?