Я много гуглил, но, похоже, общего решения нет, или мои ключевые слова неадекватны.
У нас есть несколько больших PDF-файлов порядка нескольких тысяч страниц, каждый из которых описывает какое-то устаревшее программное обеспечение. Вместо того, чтобы постоянно искать с помощью Ctrl + F или сохранять каталог с номерами страниц, мне было интересно, есть ли какой-нибудь интерактивный инструмент, который может позволить нам предварительно пометить текст в документах, а затем отфильтровать по тем же тегам, чтобы уменьшить количество избыточность. Это не обязательно должно быть специально для PDF-файлов, но было бы неплохо, если бы оно работало для них, документов Word или хотя бы в виде открытого текста. Без этого, я думаю, мы потратим пару человеко-месяцев на переваривание устаревшей архитектуры.
Если у вас есть другие идеи по управлению этим большим количеством документации, я был бы рад их услышать, спасибо.