как сделать постформатирование для преобразования DOC / DOCX в HTML? - PullRequest
4 голосов
/ 05 июня 2011

В настоящее время я использую OpenOffice (командная строка) и JODConvertor для преобразования документов Word (как .doc, так и .docx) в HTML для веб-приложения, которое я размещаю. Он отлично работает, за исключением одной проблемы - файлы HTML не отформатированы должным образом с точки зрения полей. Еще хуже то, что поля несовместимы для операционных систем (MacOS и Windows) и браузеров.

Есть ли другой инструмент, который выполняет постформатирование (я думаю, что это включает переписывание CSS преобразованного HTML-документа), во многом как Google Docs?

Я не пытаюсь быть еще одним Документом Google, я просто хочу имитировать их процесс постформатирования (точнее, форматирование ширины полей), чтобы пользователи могли загружать и хранить документы HTML на моем собственном сервисе. Мне нужно, чтобы это был автоматизированный процесс, независимый от любых сторонних сайтов (я знаю, что у Google есть API, называемый googlecl, но он требует аутентификации, и вы становитесь зависимыми от их серверов и сервисов; не говоря уже о том, что у вас есть квота ).

Если кто-либо знает о каком-либо другом методе, кроме маршрута OpenOffice, я открыт для предложений.

1 Ответ

0 голосов
/ 25 июня 2011

Кажется, вам лучше всего добавить в JODConverter функцию, которая позволит вам вставлять свой собственный CSS во время экспорта.Что-то вроде следующего для всех страниц:

body {
     margin: 50px !important;
 }

Либо убедите сопровождающего JODConverter, либо возьмите код и взломайте его вместе.Желаем удачи.

...