Серия очень длинных документов, в которых мне нужно легко пометить текст для последующей фильтрации; Как это может быть сделано? - PullRequest
0 голосов
/ 03 июля 2018

Я много гуглил, но, похоже, общего решения нет, или мои ключевые слова неадекватны.

У нас есть несколько больших PDF-файлов порядка нескольких тысяч страниц, каждый из которых описывает какое-то устаревшее программное обеспечение. Вместо того, чтобы постоянно искать с помощью Ctrl + F или сохранять каталог с номерами страниц, мне было интересно, есть ли какой-нибудь интерактивный инструмент, который может позволить нам предварительно пометить текст в документах, а затем отфильтровать по тем же тегам, чтобы уменьшить количество избыточность. Это не обязательно должно быть специально для PDF-файлов, но было бы неплохо, если бы оно работало для них, документов Word или хотя бы в виде открытого текста. Без этого, я думаю, мы потратим пару человеко-месяцев на переваривание устаревшей архитектуры.

Если у вас есть другие идеи по управлению этим большим количеством документации, я был бы рад их услышать, спасибо.

...