Когда вы запускаете $ pdf-> stringify выше, он возвращает содержимое файла в виде строки, но тогда вы ничего с этим не делаете.Однако, если вы распечатаете его, он не даст вам текстовое представление, которое вам нужно, поскольку это просто оригинальные байты PDF в строке.
Аналогично, установка $ pagenum в 10 не имеет последствий дляОстальная часть программы как переменная никак не связана ни с объектом $ pdf, ни с $ page.
Я думаю, что самый простой вариант - не пытаться делать это с PDF :: API2, а искатьо том, можете ли вы сначала запустить что-то вроде pdftotext из xpdf или poppler, а затем прочитать в выводе.
Если нет, то на странице Perl Monks есть несколько предложений http://www.perlmonks.org/?node_id=810721, и многие другие в Googleпод "Perl извлекать текст из PDF".Есть даже предыдущий вопрос SO на Как мне извлечь текст из файла PDF в Perl? .
Удачи!