Разбор / Преобразование старых документов Word?(msword2 / 5) - PullRequest
0 голосов
/ 14 мая 2018

У нас есть действительно старые документы .doc.Обычно мы используем tika (наше приложение обычно извлекает текст, а затем конвертирует PDF / A), но, очевидно, msword2 (и msword5) не поддерживаются в настоящее время .Единственной альтернативой, которую я нашел, была командная строка Libreoffice.Есть ли что-нибудь еще?

Найти это довольно сложно, так как все остальные, похоже, ищут "старое", как в 1995 году <, а не <1991 </p>

1 Ответ

0 голосов
/ 16 мая 2018

Мы рассмотрели проблему немного подробнее, и, похоже, единственный ответ заключается в том, что нам нужно использовать некоторую версию библиотеки libwps (которую использует тот же LibreOffice).

Мы рассмотримплюсы и минусы использования командной строки Libreoffice или самой библиотеки и, вероятно, просто создадут микросервис для нашего приложения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...