Управление документом Microsoft Word Office 2007 .docx из PHP - PullRequest
1 голос
/ 22 июля 2010

Мне нужна опция из PHP для манипулирования документом .docx (Microsoft Office 2007).

Мне нужно:

  1. Читать внутренний текст
  2. Преобразовать в .html
  3. Для просмотра их в браузере.
  4. Для замены текста.

Я знаю, что могу использовать Word Automation, создавая COM-объект MicrosoftWord, но он слишком медленный, нестабильный, и мне нужно установить его на сервере.

Есть ли какая-нибудь библиотека или код, который может это сделать из PHP?

Ответы [ 5 ]

2 голосов
/ 22 июля 2010

Для этого есть авторы PHPExcel PHPWord .

1 голос
/ 30 июля 2010

Docx - это просто ZIP-файл, содержащий несколько файлов XML и встроенные медиа-файлы, например изображения. Благодаря этому вы можете легко читать и редактировать документ. Просто распакуйте его, откройте файл word / document.xml, прочитайте и запишите и перепакуйте файлы.

Преобразование в HTML может быть затруднено. Но вы найдете эскиз первой страницы в docProps / thumbnail.jpeg.

Обратите внимание, что вам придется ознакомиться со структурой XML для выполнения любых сложных изменений. Существует краткий XML-документ docProps / app.xml, в котором есть некоторые метаданные для файла, поэтому не забудьте обновить его. Читайте больше из Википедии: http://en.wikipedia.org/wiki/Office_Open_XML

0 голосов
/ 21 декабря 2013

Существует также класс PHP для слияния нового контента в существующий файл .docx. Это доступно здесь: http://www.tinybutstrong.com/. Документация довольно хорошая, а также много примеров, и все это бесплатно и с открытым исходным кодом. Это требует знакомства с понятиями .docx.

0 голосов
/ 11 ноября 2013

Вы можете работать с внутренним форматом напрямую.

DOCX - это просто zip-файл, внутри которого есть word / document.xml, содержащий фактический документ.

Довольно просто разархивировать файл, прочитать то, что вы ищете, document.xml, str_replace (), сохранить его и повторно заархивировать каталог, что облегчает, ускоряет и облегчает слияние почты для слова. документы. Это также работает для других офисных форматов.

Вот официальные документы по внутренней структуре для получения дополнительной информации.

0 голосов
/ 21 декабря 2012

Вы можете взглянуть на PHPDocX Я считаю, что это все, что вы просите.

  1. Вы можете заменить переменные в шаблоне или просто текст из существующего документа Word.
  2. Он предлагает довольно много вариантов конвертации.
  3. Вы также можете извлечь текст.
...