Лучший способ экспортировать HTML в Word без установленного MS Word? - PullRequest
14 голосов
/ 28 августа 2008

Можно ли экспортировать простую HTML-страницу в Word (формат .doc, а не .docx) без установки Microsoft Word?

Ответы [ 11 ]

11 голосов
/ 28 августа 2008

Если у вас есть только простые HTML-страницы, как вы сказали, их можно открыть с помощью Word.

В противном случае есть некоторые библиотеки, которые могут это сделать, но у меня нет опыта работы с ними.

Моя последняя идея заключается в том, что если вы используете ASP.NET, попробуйте добавить application/msword в заголовок, и вы можете сохранить его как документ Word (это не будет настоящий документ Word, только HTML, переименованный в документ, чтобы иметь возможность открыть).

4 голосов
/ 09 февраля 2009

Существует инструмент под названием JODConverter, который подключается к открытому офису для демонстрации конвертеров форматов файлов, есть версии, доступные в виде веб-приложения (в tomcat), которое вы публикуете, и инструмент командной строки. Я запускаю html и успешно конвертирую в .doc и pdf, это довольно большой проект, еще не запущенный, но я думаю, что буду его использовать. http://sourceforge.net/projects/jodconverter/

3 голосов
/ 04 февраля 2012

Существует проект с открытым исходным кодом под названием HTMLtoWord , который позволяет пользователям вставлять фрагменты правильно сформированного HTML (XHTML) в документ Word в виде форматированного текста.

HTMLtoWord документация

2 голосов
/ 13 июня 2012

Если вы работаете в Java, вы можете конвертировать HTML в настоящий контент docx с помощью кода, который я выпустил в docx4j 2.8.0 . Я говорю «реальный», потому что альтернативой является создание HTML altChunk , который использует Word для фактического преобразования (при первом открытии документа).

См. Различные образцы с префиксом ConvertInXHTML . Процесс импорта ожидает правильно сформированный XML, поэтому вам, возможно, придется сначала привести его в порядок.

2 голосов
/ 28 августа 2008

Хотя можно создать файл Microsoft Word ".doc", вероятно, было бы проще и более портативным сделать файл ".rtf".

1 голос
/ 28 августа 2008

Если это просто HTML, все, что вам нужно сделать, это изменить расширение на .doc, и Word откроет его, как будто это документ Word. Однако, если есть изображения, которые нужно включить, или javascript для запуска, это может стать немного сложнее.

1 голос
/ 28 августа 2008

Я предполагаю, что из тега "C #" вы хотите добиться этого программным путем.

Попробуйте Aspose.Words для .NET .

1 голос
/ 28 августа 2008

Ну, есть много сторонних инструментов для этого. Я не знаю, станет ли это проще, чем это.

Примеры:

Также найден vbscribt , но я предполагаю, что для этого нужно, чтобы у вас было установлено слово.

0 голосов
/ 13 апреля 2016

используйте эту ссылку для экспорта в слово, но здесь изображение не будет работать:

http://www.jqueryscript.net/other/Export-Html-To-Word-Document-With-Images-Using-jQuery-Word-Export-Plugin.html

0 голосов
/ 08 сентября 2014

Вы можете открыть html файлы с помощью Libreoffice Writer. Затем вы можете экспортировать как PDF из меню Файл. Также браузеры могут экспортировать html как файл PDF.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...