Примечание: не совсем ответ, но некоторые предложения.
Мне кажется, что Crystal Reports недостаточно точно соответствует спецификации PDF.
Я бы удостоверился, что CR полностью обновлен / исправлен, и попробую создать другой файл, убедившись, что «тегирование» включено - тегирование определяет структуру макета. У меня нет удобной копии CR, но вам, возможно, придется определить шаблон дистиллятора, чтобы использовать его, чтобы при печати в PDF вы могли выбрать этот вариант работы.
Вы также можете сказать, что это плохой PDF-файл, используя Preflight в Acrobat, он говорит, что нет структуры тегов, и вы можете сделать это вручную (нарисовать рамки вокруг каждого элемента ...). Кроме того, что нет установленного языка, и он как-то совместим с Acrobat 1.3? который больше не поддерживается и должен быть 4 на самом низком уровне?
Если у вас есть «хороший» pdf, вы можете экспортировать его в xml / word и импортировать его в Excel. Кроме того, с помощью Acrobat 8+ вы можете выделить инструмент выбора, щелкнуть правой кнопкой мыши и выбрать «Открыть как электронную таблицу». Возможно, вам удастся просто выделить весь документ, хотя я надеюсь, что XML-подход будет лучшим.
Able2Extract делает некоторую OCRing и хитрую нечеткую логику не только для определения тегов / разметки, чтобы она была экспортируемой, но также избегает любых проблем со шрифтами, кодировкой и т. Д. - по крайней мере, насколько мне известно.
В редком случае, когда вы не можете получить новый файл, тогда экспорт в обычный текст / доступный, похоже, генерирует хороший плоский текстовый файл. Вы можете написать vbscript для его анализа (добавив разделитель) и импортировать его в excel.