Pentaho Spoon - проверка формата входного файла с фиксированной шириной - PullRequest
1 голос
/ 10 июня 2011

Я пытаюсь обработать входной файл фиксированной ширины в Пентахо и проверить формат.Файл будет представлять собой смесь строк, чисел и дат.Тем не менее, при попытке обработать числовое поле с неправильным символом (который я ожидал выдаст ошибку), он просто читает первую часть числа и игнорирует неверный символ.

Я могу воссоздать эту проблемус очень простым входным файлом, содержащим одно поле:

enter image description here

Я указываю ожидаемый числовой формат вместе с начальной позицией и длиной: enter image description here

Вкл.выполняя преобразование, я ожидал, что «Q» вызовет ошибку, вместо этого отображается следующий результат, просто читая первые две цифры «67» и дополняя остальные, чтобы соответствовать указанному формату:

enter image description here

Если входной файл отформатирован правильно, он работает отлично, но в противном случае он должен выдать ошибку.Любые предложения будут потрясающими.Спасибо!

1 Ответ

1 голос
/ 15 июня 2011

Просто к сведению, если кто-то наткнется на этот вопрос после того, как затронет те же проблемы, что и я.

Мне удалось создать обходной путь, прочитав все значения на шаге «Ввод текстового файла» в виде строк, а затем с помощью шага «Проверка данных», снабженного проверкой регулярных выражений, чтобы убедиться, что числа были правильно отформатированы перед синтаксическим анализом с типом чисел с следующий шаг «Выбор значений».

Это займет немного больше времени для каждой области, но это было самое надежное решение, которое я мог придумать.

Спасибо

...