Есть ли инструмент или библиотека, похожая на wkhtmltopdf, для преобразования html в текстовые документы? - PullRequest
0 голосов
/ 04 января 2012

Он должен быть в состоянии обрабатывать CSS и JavaScript, так как страница содержит диаграммы "highcharts" для JavaScript.

Это не должен быть внешний процесс, библиотека тоже была бы отличной.

В основном мне нужно иметь возможность создавать текстовый документ, содержащий высокие графики в виде изображений, а также текст и другие графические элементы.

Любые идеи были бы великолепны.

1 Ответ

0 голосов
/ 04 января 2012

Посмотрите на это в качестве примера

Это во многом зависит от характера HTML-документа, который вы пытаетесь преобразовать.Один простой способ - использовать автоматизацию Word, чтобы открыть документ .html, а затем сохранить его как документ .doc.

        object readOnly = false;
        object isVisible = true;
        object missing = System.Reflection.Missing.Value; // Values we don't care about
        object fileName = "C:/webpage.htm";
        object newFileName = "C:/webpage.doc";       

        Microsoft.Office.Interop.Word.Application word = new Microsoft.Office.Interop.Word.Application();

        // word.Visible = true; // To see what's happening

        Microsoft.Office.Interop.Word.Document document = word.Documents.Open(ref fileName, ref missing, ref readOnly, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing);

        document.Activate();

        object saveFormat = Microsoft.Office.Interop.Word.WdSaveFormat.wdFormatDocument;

        document.SaveAs(ref newFileName, ref saveFormat, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing);

        document.Close(ref missing, ref missing, ref missing);

Примечание

  • Необходимо добавитьссылка на Microsoft.Office.Interop.Word или что-то подобное
  • Количество ссылка отсутствует аргументов зависит от того, какую версию Word вы используете
  • Вы должны использовать полныйпути в имени файла, так как экземпляр Word начинается из системной папки.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...