СЛОВО и PDF в текстовый веб-сервис - PullRequest
3 голосов
/ 24 мая 2011

Я хочу написать (или использовать существующий) веб-сервис, который принимает MS WORD и файл PDF, извлекает его содержимое и возвращает его в виде текста.

Кто-нибудь знает о такой услуге или как ее написать?

1 Ответ

0 голосов
/ 24 мая 2011

Для преобразования текста в текст вы можете использовать antiword и передать его вывод клиенту.

Для PDF есть PdfTk - его операция dump_data может быть полезной.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...