Этот PDF действительно особенный, каждая страница содержит текст обеих страниц. На первой странице текст со второй страницы находится справа от границы правой страницы, а на второй странице текст с первой страницы слева от границы левой страницы. Кроме того, содержимое другой соответствующей страницы дополнительно находится за пределами области клипа.
Я увеличил поля страницы (поле мультимедиа, поле кадрирования, ...) первой страницы справа и второй страницы слева, а затем пометить весь текст ( Ctrl-A ), чтобы показать даже текст вне области клипа, и вы увидите:
Для извлечения текста, который извлекает текст только в видимых областях, вы должны ограничить свою процедуру извлечения текста полем кадрирования соответствующей страницы.