Как отмечается в комментариях, этот вопрос довольно хорошо охвачен старым вопросом.
Короче говоря: вам нужно будет сохранить соответствующие извлеченные данные из этих файлов в базе данных для Sphinx,и, вероятно, для полнотекстового поиска PostgreSQL.Sphinx теперь может также понимать текстовые файлы (если столбец базы данных указывает на файл), но для этого все равно потребуется другой инструмент для извлечения данных из PDF, DOC, XLS и др.