У нас есть действительно старые документы .doc.Обычно мы используем tika (наше приложение обычно извлекает текст, а затем конвертирует PDF / A), но, очевидно, msword2 (и msword5) не поддерживаются в настоящее время .Единственной альтернативой, которую я нашел, была командная строка Libreoffice.Есть ли что-нибудь еще?
Найти это довольно сложно, так как все остальные, похоже, ищут "старое", как в 1995 году <, а не <1991 </p>