Question

У меня есть работа Spark, которая читает файл CSV и выполняет несколько объединений и переименовывает столбцы.Размер файла в МБ

x = info_collect.collect () * Размер 1003 * x в python составляет около 100 МБ

, однако я получаю сбой памяти, проверяя Ганглу, что память увеличивается на 80 ГБ.Я понятия не имею, почему коллекция 100 МБ может вызвать скачок памяти.

Может кто-нибудь посоветуете совет?

pyspark собирать, заставляя память снимать 80GB

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

pyspark собирать, заставляя память снимать 80GB

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов