Делайте то, что предлагает Чарльз, при создании нового имени файла, но вы можете рассмотреть другой подход к синтаксическому анализу PDF-файла, чтобы уменьшить количество pdfregs, каналов и greps, которые вы делаете для каждого файла.У меня нет pdfgrep в моей системе, и я не знаю, как выглядит ваш входной файл, но если мы используем этот входной файл:
$ cat file
foo
ID #: M13
foo
Date Of Birth: 05 21 1996
foo
Second ID: V27
foo
и grep -E
вместо pdfgrep
, то вот какЯ бы получил информацию из входного файла, просто прочитав его один раз с помощью pdfgrep
и проанализировав этот вывод с помощью awk
вместо того, чтобы читать его несколько раз с помощью pdfgrep
и используя несколько каналов и greps
для извлечения информации, которую вы получили.need:
$ grep -E -i '(ID #|Second ID|Date Of Birth): ' file |
awk -F': +' '{f[$1]=$2} END{print f["ID #"], f["Second ID"], f["Date Of Birth"]}'
M13 V27 05 21 1996
Учитывая, что вы можете использовать тот же подход read
для сохранения вывода в переменных (или массиве).Очевидно, вам может понадобиться выполнить команду awk в зависимости от того, как на самом деле выглядит ваш вывод pdfgrep
.