Шаг «Получить данные XML» в Пентахо не может иногда читать один и тот же XML-файл - PullRequest
0 голосов
/ 01 мая 2018

Я использую чайник Pentaho для работы ETL. В задании один из этапов (Получить данные XML) не может когда-либо читать / анализировать XML-файл. Когда-то один и тот же XML-файл не выдавал никаких исключений, а иногда выкидывал. Список ошибок приведен ниже -

  • 1) Ошибка в строке 1 документа файл: /// D: /softwares/pdi-ce-6.0.1.0-386/data-integration/UTF-8: тип элемента "Доверие" должен завершаться соответствующим конечным тегом "".
  • 2) org.dom4j.DocumentException: ошибка в строке -1 документа: Преждевременный конец файла. Вложенное исключение: преждевременный конец файла.

Тем не менее, я не нахожу никаких проблем в XML-файле. Может ли кто-нибудь помочь по этой теме?

1 Ответ

0 голосов
/ 02 мая 2018

Я не нашел основную причину, но нашел решение. XML-файл, который анализировался на шаге, находился внутри zip-файла. Перед синтаксическим анализом xml-файла на шаге java разархивировался zip-файл. Вместо того, чтобы разархивировать zip-файл, я непосредственно проанализировал xml-файл внутри zip-файла. Это решает проблему, и об ошибке больше не сообщается.

...