Вы правы - imagemagick не будет обрабатывать форматы MS Office, потому что он обрабатывает только преобразование формата изображения.
Для PDF-файлов можно просто напрямую использовать imagemagick:
convert -density 400 filename.pdf filename.jpeg
Он выдаст вам файлы:
- имя файла [0] .jpg
- имя файла [2] .jpg
- ...
- имя файла [N-1] .jpg
Где N - количество страниц в вашем документе.pdf2ps
добьется того же, но вам придется поиграться с параметрами командной строки, чтобы получить то же качество вывода.
Для продуктов MS Office я помню, что есть какое-тоAPI, который позволяет получить доступ к функциям пакета (это был MS Office 2007 из памяти), например, к открытию файла и его экспорту в PDF.Если вы можете получить вещи в PDF, то вы можете использовать метод, описанный выше, чтобы преобразовать его в изображения.Некоторые негативные моменты:
- Это было много лет назад на моей предыдущей работе, и я не могу вспомнить, как именно это называлось или как его использовать.
- Я помню выводФорматирование PDF было не очень хорошим (не на 100%, как на экране), но оно читаемо.Возможно, это улучшилось с тех пор, как я последний раз использовал его.
- Я смутно помню, как он запускал окно Excel в фоновом режиме, поэтому это не совсем решение для командной строки (может быть непригодно для серверов)