Spark 2.3 утечка памяти на исполнителя - PullRequest
0 голосов
/ 25 мая 2018

Я получаю предупреждение об утечке памяти, которое в идеале было ошибкой Spark до версии 1.6 и было устранено.

Режим: Автономная IDE: Версия PyCharm Spark: 2.3 Версия Python: 3.6

Нижеэто трассировка стека -

2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3148
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3152
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3151
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3150
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3149
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3153
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3154
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3158
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3155
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3157
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3160
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3161
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3156
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3159
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3165
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3163
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3162
2018-05-25 15:00:05 WARN  Executor:66 - Managed memory leak detected; size = 262144 bytes, TID = 3166

Есть понимание, почему это может произойти?Хотя моя работа успешно завершается.

Редактировать: Многие говорили, что это дубликат 2-летнего вопроса, но в ответе говорится, что это была ошибка Spark, но при проверке в Jira Spark она говорит, что она решена.

Вопрос в том, что так много версий спустя, почему я все еще получаю то же самое в Spark 2.3?Я обязательно сниму вопрос, если он покажется излишним, с каким-то правильным или логичным ответом на мой запрос.

1 Ответ

0 голосов
/ 13 марта 2019

Согласно SPARK-14168 предупреждение связано с тем, что он не потребляет весь итератор.Я столкнулся с той же ошибкой, когда брал n элементов из RDD в оболочке Spark.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...