Просто предупреждение для тех, кто может надеяться извлечь данные: PDF - это контейнер, а не формат. Если исходный документ не содержит фактического текста, в отличие от растровых изображений текста или, возможно, даже более уродливых вещей, чем я могу себе представить, ничто, кроме распознавания текста, не может вам помочь.
Кроме того, по моему печальному опыту, нет никакой гарантии, что все приложения, создающие документы в формате PDF, ведут себя одинаково, поэтому данные в вашей таблице могут или не могут быть прочитаны в нужном порядке (в результате док был построен). Будь осторожен.
Возможно, лучше, чтобы пара аспирантов расшифровывала данные для вас. Они дешевые: -)