«Невозможно выделить память» при запуске нового задания Flink - PullRequest
0 голосов
/ 25 ноября 2018

Мы запускаем Flink на кластере из 3 ВМ.Каждая виртуальная машина имеет около 40 Go оперативной памяти.Каждый день мы прекращаем некоторые работы и начинаем новые.Через несколько дней запуск нового задания отклоняется с ошибкой «Невозможно выделить память»:

Предупреждение о виртуальной машине 64-разрядного сервера OpenJDK: INFO: ошибка os :: commit_memory (0x0000000340000000, 12884901888, 0);error = «Невозможно выделить память» (errno = 12)

Расследования показывают, что объем оперативной памяти диспетчера задач постоянно увеличивается, вплоть до превышения разрешенного значения 40 Go, хотя задания отменяются.

У меня нет (пока) доступа к кластеру, поэтому я попробовал провести несколько тестов на автономном кластере на своем ноутбуке и контролировал ОЗУ диспетчера задач:

  • С помощью jvisualvm я могу видеть всеработает как задумано.Я загружаю память задания, затем очищаю ее и жду (несколько минут), пока ГБ не запустится.Куча освобождается.
  • В то время как с top память - и остается - высокой.

enter image description here

Вв тот момент, когда мы перезапускаем кластер каждое утро, чтобы учесть эту проблему с памятью, но мы больше не можем себе этого позволить, поскольку нам понадобятся задания, работающие 24/7.

Я почти уверен, что это не Flinkвопрос, но может ли кто-нибудь указать мне правильное направление о том, что мы здесь делаем неправильно?

1 Ответ

0 голосов
/ 28 ноября 2018

В автономном режиме Flink может не высвобождать ресурсы по вашему желанию.Например, ресурсы, удерживаемые статическим членом в экземпляре.

Настоятельно рекомендуется использовать YARN или K8s в качестве среды выполнения.

...