Мне нужно извлечь объекты из документов Word и PDF. Документы могут быть объемом от 10 до 20 страниц. Имеются ли масштабируемые библиотеки / API, которые мы можем подключить к нашему конвейеру обработки? Любое сравнительное исследование различных решений будет полезно.