Я использовал PHP и COM (только на серверах Windows) для чтения файлов документов.
Извлечение текста из документов Word через PHP и COM
$word = new COM("word.application") or die ("Could not initialise MS Word object.");
$word->Documents->Open(realpath("Sample.doc"));
# Extract content.
$content = (string) $word->ActiveDocument->Content;
echo $content;
$word->ActiveDocument->Close(false);
$word->Quit();
$word = null;
unset($word);
Я думаю, вам придется использовать Windows Servers, чтобы сделать это правильно. Или вы можете конвертировать документ в формат OpenOffice и попробовать? Более подробная информация о PHP COM доступна здесь. http://us3.php.net/manual/en/book.com.php