Как разобрать файл .xfa - PullRequest
1 голос
/ 11 октября 2008

Надеюсь, что у кого-то есть информация о том, как анализировать файл xfa. Я могу хорошо разбирать CSV или XML-файлы, но пришел XFA, и я не знаком с форматом. Выглядит как тело с разделителями табуляции с метаданными столбца вверху.

Кто-нибудь имел дело с этим раньше или может подсказать мне, как их анализировать?

Я использую vb.net, но язык любого решения не слишком актуален.

Очень ценится.

Ответы [ 4 ]

1 голос
/ 06 июля 2009

В оригинальном сообщении говорится, что содержимое выглядит как «тело с разделителями табуляции с метаданными столбца вверху». Форма XFA выглядит не так - формы XFA обычно используют расширение * .xdp и представляют собой XML.

1 голос
/ 18 апреля 2009

Я думаю, вы могли бы говорить об этом: http://en.wikipedia.org/wiki/XFA_forms

Эта страница была разработана для работы с этим шаблоном: http://www.w3.org/1999/05/XFA/xfa-template-19990614

Этой информации должно хватить, чтобы мяч перекатился. Если это не помогает, вы всегда можете проанализировать сам файл на наличие паттернов и перейти оттуда. Я не вижу, что это слишком сложно.

В любом случае, я надеюсь, что это поможет.

P.S. Если бы вы могли предоставить ссылку на этот .xfa, мы, возможно, могли бы вам помочь.

1 голос
/ 18 октября 2008

Ммм, похоже, никто не имеет понятия. Проблема в том, что .xfa не выглядит как «стандартное» расширение: в конце концов, любой может создавать собственные имена расширений, от .xyz до .something ...

Я немного осмотрелся, не удивительно ('x') формат XML с этим расширением, не намного.

Может помочь указание, откуда берется этот тип файла, какие данные он содержит. Или нет.

Вы описываете файл как простой TSV (значения, разделенные табуляцией) с заголовком. С токенайзером или каким-либо регулярным выражением разобрать довольно просто, поэтому я не уверен, где вы застряли.

0 голосов
/ 13 мая 2009

Проверьте страницу Adobe:

http://partners.adobe.com/public/developer/xml/index_arch.html

(Архитектура форм Adobe XML, в настоящее время 1400 страниц)

Пусть LiveCycle / Acrobat проанализирует его для вас.

...