Question

Я использую Spark 2.4.4 на AWS EMR и после длительной задержки записи файла партера в S3 произошла длительная задержка. Я проверил, что процесс записи S3 должен быть завершен за несколько секунд (файлы данных и файл _success находятся в S3). Но это все еще задержалось около 5 минут, чтобы начать следующие работы.

Я видел, как кто-то сказал, что это называется "Паркетный налог". Я попробовал предложенные исправления из этих статей, но все еще не могу решить проблему. Кто-нибудь может мне помочь? Огромное спасибо.

Spark написать паркетную работу завершена, но есть долгая задержка, чтобы начать новую работу

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Spark написать паркетную работу завершена, но есть долгая задержка, чтобы начать новую работу

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы