Я хочу написать (или использовать существующий) веб-сервис, который принимает MS WORD и файл PDF, извлекает его содержимое и возвращает его в виде текста.
Кто-нибудь знает о такой услуге или как ее написать?
Для преобразования текста в текст вы можете использовать antiword и передать его вывод клиенту.
antiword
Для PDF есть PdfTk - его операция dump_data может быть полезной.