Как можно использовать LiveDocx в PHP для чтения файлов .doc и .docx, чтения текста в нем и сохранения в HTML? - PullRequest
3 голосов
/ 08 декабря 2010

Допустим, у нас есть файлы .doc & .docx. Я хочу использовать LiveDocx в PHP для загрузки файлов, чтения их содержимого и удаления текста из него. Затем сохраните его в строку HTML.

Можно ли это сделать?

Я искал документацию, и кажется, что LiveDocx загружает только файлы шаблонов .doc и .docx!

Ответы [ 4 ]

0 голосов
/ 06 мая 2011

Когда вы выполняете преобразование документов в LiveDocX, вам нужно выполнить почтовое слияние, а затем получить документ.Даже если вы не вставляете никакого нового контента, вам нужно сделать почтовое слияние, которое заменяет фиктивный заполнитель фиктивным контентом.

Итак, процесс, который я бы предложил:

1)Установите ваш исходный документ как локальный шаблон2) Объединить фиктивное поле с фиктивным содержимым3) Получить ваш документ в формате HTML4) Используйте сервер сценариев для удаления html и оставьте только контент (что-то вроде, удалите все между тегами HEAD, затем strip_tags на остальных) 5) Вы должны оставить свой контент в виде простой строки - яне уверен, что это будет слишком значимым, но может быть полезно для создания чего-то вроде поисковых индексов.

0 голосов
/ 12 апреля 2011

Я думаю, вы можете использовать TextControl, который улучшает phpLiveDocx Ссылка TextControl

Используя это, вы также можете импортировать PDF и DOCX

0 голосов
/ 13 апреля 2011

Вы можете сохранить с помощью внешних библиотек и просто получить текст из XML в файлах: http://www.webcheatsheet.com/PHP/reading_the_clean_text_from_docx_odt.php

0 голосов
/ 12 апреля 2011

Я думаю, вы можете найти то, что вам нужно в этом примере .

Я могу ошибаться, но я думаю, что они называют их "шаблонными" файлами, потому что они act как шаблон, но все еще нормальные документы .doc / .docx.Я предлагаю вам просто попробовать запустить этот пример.

...