Библиотек Perl, которые я использовал для обработки файлов Microsoft Office, довольно не хватало, и мне еще предстоит найти библиотеки, которые хорошо справляются с обработкой расширений Office 2007 и Office 2010 (укажите в комментариях одну из них, есливы знаете об одном!)
Если у вас есть компьютер с Microsoft Office, вы можете использовать win32ole для управления приложением Office из unix.Я делал это раньше с Ruby: http://rubyonwindows.blogspot.com/2007/03/automating-excel-with-ruby.html
Вот модуль perl для использования win32 OLE: http://metacpan.org/pod/Win32::OLE
Я лично не рекомендую подход OLE, потому что он имеет многоголовные боли (как будто вы должны оставить Office запущенным на ПК, чтобы сценарий unix работал, брандмауэр Windows почти случайным образом заблокирует сценарий unix, когда ваш компьютер будет обновлен с помощью исправлений).но вот Java-программа, которая будет использовать OpenOffice и GhostScript для выполнения пакетных преобразований за вас: http://www.codeproject.com/KB/java/PDFCM.aspx