Сбой задания по обработке данных с SCAPIException CDICO2060E - PullRequest
0 голосов
/ 04 февраля 2020

Я строю свой первый проект в Watson Studio, и задание по очистке данных не выполняется со следующей ошибкой:

ERROR: Failed to execute the flow. Error: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 2.0 failed 1 times, most recent failure: Lost task 0.0 in stage 2.0 (TID 2, localhost, executor driver): com.ibm.connect.api.SCAPIException: CDICO2060E: The metadata for the select statement could not be retrieved Sql syntax error: THE DATA TYPE, LENGTH, OR VALUE OF ARGUMENT 1 OF RID IS INVALID. SQLCODE=-171

SQL, которое он выполняет, содержит следующее: FROM \"SCHEMA\".\"VIEW_NAME_A\" WHERE MOD(COALESCE(RID(\"SCHEMA\".\"VIEW_NAME_A\"), 0), 3) = 0

Задание было построено из соединения DB2 for Z / OS -> Объект подключенных данных -> Поток обработки данных, где после того, как поток выглядел хорошо, он был сохранен, а затем было создано задание. Который не удался на казни SCHEMA.VIEW_NAME_A - это представление, построенное из сложного запроса, объединяющего две или более таблицы.

У меня есть другой поток обработки данных для более простой таблицы представления, где ее задание (созданное таким же образом) работает успешно. Запрос для этого представления - только одна таблица.

Я не совсем понимаю, почему Watson Studio построил этот запрос для задания, выполняемого с помощью этого оператора WHERE, и я не могу ничего найти о нем.

У кого-то есть идея, как исправить или обойти эту проблему?

1 Ответ

0 голосов
/ 05 февраля 2020

Watson Studio извлекает исходные данные, используя несколько запросов, которые разделяют данные, и это предложение WHERE пришло из его алгоритма разделения. Очевидно, его стратегия разбиения для z / OS не работает должным образом, когда источником является сложное представление. Я прошу прощения за неудобства и не могу придумать подходящий обходной путь. Мы исправим проблему как можно скорее.

...