Я пишу в пакетном конвейере Google Dataflow с использованием Python SDK, и я столкнулся с ошибкой конвейера, которая, по-видимому, не имеет журналов в Stackdriver. Ошибка возникает при работе beam.combiners.ToList()
в наборе данных ~ 300 МБ.
Выходные данные Stackdriver:
Задание не выполнено из-за сбоя рабочего элемента 4 раза. Посмотрите в предыдущих записях журнала причины каждого из 4 сбоев. Для получения дополнительной информации см. https://cloud.google.com/dataflow/docs/guides/common-errors. Задание было выполнено на следующих работниках:
Однако я не могу найти журналов, объясняющих, почему это не удается. Я бегу python3 .6 и apache_beam == 2.19.0. Я также использую --experiments=shuffle_mode=service
, что, я не уверен, связано.
Каковы мои дальнейшие шаги по отладке?