PDF Источник данных в Informatica - PullRequest
1 голос
/ 21 апреля 2009

Как Informatica обращается с неструктурированными источниками данных, такими как PDF? Если табличный отчет хранится в формате PDF, можем ли мы считать его из PDF в виде табличных данных (как таблица данных в .NET)?

Ответы [ 3 ]

2 голосов
/ 21 апреля 2009

Вариант неструктурированных данных Informatica PowerCenter

Забавно, что вы упомянули об этом, я работал в начинающей компании, которая изобрела основную технологию, до приобретения Informatica.

0 голосов
/ 16 апреля 2012

Вам необходимо использовать продукт обмена данными Informatica B2B, который обрабатывает неструктурированные данные. Этот продукт предлагает функции для обработки всех видов неструктурированных данных не только в формате PDF, но также в Word, Excel, Star Office, AFP, PostScript, PCL и HTML. Вам придется использовать Informatica B2B Data Transformation.

Вот быстрая ссылка для вашей справки.

http://www.informatica.com/us/products/b2b-data-exchange/b2b-data-transformation/

0 голосов
/ 21 апреля 2009

PDF на самом деле довольно структурирован внутри. Более поздние пересмотры спецификации PDF могут обеспечить готовность данных к внешней обработке, но основная цель документов PDF - описать документ для печати, чтобы все виды сред и устройств могли распечатать документ с похоже насколько возможно.

От создателя PDF-файла во многом зависит, будут ли предоставлены какие-либо дополнительные данные, кроме того, где печатать текст и строки для формирования таблицы.

...