Если вы хотите остаться в мире открытого исходного кода, OpenOffice 3 должен иметь возможность обрабатывать файлы .docx. Есть проект по реализации API для многих языков, я не знаю, насколько он полон или сложен.
В PHP есть скрипт , который может конвертировать из .docx в обычный текст. То есть если вам не страшно, что все документы на русском языке). Это может быть другой вариант (запуск сценария php с помощью системного вызова и анализ результатов из файла)