Каков наилучший способ преобразования документа Microsoft Word в XHTML? - PullRequest
1 голос
/ 20 ноября 2008

Я хотел бы программно конвертировать документ Microsoft Word в XHTML. Выбор языка - PHP, поэтому я буду признателен за любые предложения с PHP.

Первоначальная идея - попытаться преобразовать файл doc в odt, а затем использовать класс PHP Odt2Xhtml , чтобы перевести его в формат XHTML.

Есть ли лучший способ сделать это?

Ответы [ 4 ]

5 голосов
/ 20 ноября 2008

Если вы используете Linux, одним из способов будет установка OpenOffice на сервер.

Примеры инструкций для установки без головы (то есть без пользовательского интерфейса) можно найти здесь .

Затем вы можете использовать хорошее CLI-приложение, такое как unoconv , выполняемое через shell_exec, для выполнения ваших преобразований через PHP.

2 голосов
/ 20 ноября 2008

Самый надежный способ - использовать COM, чтобы Word мог сохранить документ как HTML .

Я не знаю, может ли Word генерировать XHTML напрямую; в противном случае Google показывает множество вариантов для этого преобразования.

0 голосов
/ 14 мая 2009

phpLiveDocx предлагает действительно простой способ преобразования документов Microsoft Word.

Подробнее на сайте проекта:

http://www.phplivedocx.org

Вы также можете использовать phpLiveDocx для объединения текстовых данных с шаблонами MS Word и сохранения полученного документа в DOC, DOCX, RTF, PDF или TXT.

Компонент готов к работе на предприятии и был написан для Zend Framework.

0 голосов
/ 27 марта 2009

См. http://www.codeplex.com/OpenXMLViewer, который включает в себя XSLT, который вы можете адаптировать, что я и сделал в docx4j. Обратите внимание, что XSLT не для слабонервных!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...