Преобразование проблемных PDF с разделителями в Excel - PullRequest
0 голосов
/ 19 августа 2010

Я пытаюсь преобразовать этот PDF с разделителями в Excel (или другой формат с разделителями). Используя Adobe Acrobat 9, я пытаюсь сохранить и скопировать его) в формате Excel, но при этом выдается сообщение об ошибке "ПЛОХОЙ PDF; ошибка при обработке шрифтов. [348]" .

Я открыт для любого решения, которое создаст файл с разделителями - от Adobe Acrobat до программирования и других приложений. Единственное ограничение - у меня нет бюджета на покупку чего-либо (например, Able2Extract).

Ответы [ 2 ]

0 голосов
/ 10 января 2012

Таким образом я смог экспортировать свои изображения и шрифты без необходимости покупать дополнительное программное обеспечение для преобразования.перейдите в Advanced, PDG Optimizer, выберите все нужные параметры в ЛЕВОЙ КОЛОННЕ и там, где написано СДЕЛАТЬ СОВМЕСТИМОСТЬ С, выберите Acrobat 8.0 и более поздние версии, ОК .... вы на пути к успеху

0 голосов
/ 19 августа 2010

Примечание: не совсем ответ, но некоторые предложения.

Мне кажется, что Crystal Reports недостаточно точно соответствует спецификации PDF.

Я бы удостоверился, что CR полностью обновлен / исправлен, и попробую создать другой файл, убедившись, что «тегирование» включено - тегирование определяет структуру макета. У меня нет удобной копии CR, но вам, возможно, придется определить шаблон дистиллятора, чтобы использовать его, чтобы при печати в PDF вы могли выбрать этот вариант работы.

Вы также можете сказать, что это плохой PDF-файл, используя Preflight в Acrobat, он говорит, что нет структуры тегов, и вы можете сделать это вручную (нарисовать рамки вокруг каждого элемента ...). Кроме того, что нет установленного языка, и он как-то совместим с Acrobat 1.3? который больше не поддерживается и должен быть 4 на самом низком уровне?

Если у вас есть «хороший» pdf, вы можете экспортировать его в xml / word и импортировать его в Excel. Кроме того, с помощью Acrobat 8+ вы можете выделить инструмент выбора, щелкнуть правой кнопкой мыши и выбрать «Открыть как электронную таблицу». Возможно, вам удастся просто выделить весь документ, хотя я надеюсь, что XML-подход будет лучшим.

Able2Extract делает некоторую OCRing и хитрую нечеткую логику не только для определения тегов / разметки, чтобы она была экспортируемой, но также избегает любых проблем со шрифтами, кодировкой и т. Д. - по крайней мере, насколько мне известно.

В редком случае, когда вы не можете получить новый файл, тогда экспорт в обычный текст / доступный, похоже, генерирует хороший плоский текстовый файл. Вы можете написать vbscript для его анализа (добавив разделитель) и импортировать его в excel.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...