Ядро Tensorflow уничтожается автоматически из-за чрезмерного потребления оперативной памяти (как на локальной машине, так и в Google Colab) - PullRequest
0 голосов
/ 11 октября 2019

Описание:

Я пытаюсь запустить алгоритм сегментации облака PointNet для готового набора данных, доступного в этом репозитории: https://github.com/charlesq34/pointnet.git

Внутри ipythonЗаписная книжка (в Jupyter Lab или Colab), я выполнил следующие команды, чтобы воспроизвести ошибку:

!git clone https://github.com/charlesq34/pointnet.git
cd pointnet/sem_seg/
!sh download_data.sh
!python train.py --log_dir log6 --test_area 6

Как вы видите, данные загружаются из их собственного сценария загрузки, и я не изменяю их сценарий втак или иначе. Но когда я запускаю их скрипт, API-интерфейс tenorflow потребляет всю доступную память, а затем ядро ​​убивается. Подробные сообщения об ошибках, прикрепленные ниже:

tcmalloc: large alloc 3477749760 bytes == 0xdc31c000 @  0x7fecb71fc1e7 0x7fecb2fa4d51 0x7fecb3009a84 0x7fecb3009bc3 0x7fecb30a9ade 0x7fecb30aa344 0x7fecb30aa492 0x4f8925 0x4f98c7 0x4f6128 0x4f9023 0x6415b2 0x64166a 0x643730 0x62b26e 0x4b4cb0 0x7fecb6df9b97 0x5bdf6a
(23585, 4096, 9)
(23585, 4096)
tcmalloc: large alloc 2992029696 bytes == 0x1b13e2000 @  0x7fecb71fc1e7 0x7fecb2fa4d51 0x7fecb3009a84 0x7fecb3009bc3 0x7fecb309718a 0x7fecb30975d8 0x4f9ba9 0x4f6128 0x4f9023 0x6415b2 0x64166a 0x643730 0x62b26e 0x4b4cb0 0x7fecb6df9b97 0x5bdf6a
(20291, 4096, 9) (20291, 4096)
(3294, 4096, 9) (3294, 4096)
...
...
...
...
...
**** EPOCH 000 ****
----
tcmalloc: large alloc 2992029696 bytes == 0x7feb5a4c4000 @  0x7fecb71fc1e7 0x7fecb2fa4d51 0x7fecb3009a84 0x7fecb3009bc3 0x7fecb309718a 0x7fecb30975d8 0x4f9ba9 0x4f7a28 0x4f876d 0x4f98c7 0x4f7a28 0x4f876d 0x4f98c7 0x4f7a28 0x4f876d 0x4f98c7 0x4f6128 0x4f9023 0x6415b2 0x64166a 0x643730 0x62b26e 0x4b4cb0 0x7fecb6df9b97 0x5bdf6a
^C

Я перепробовал множество предложений по аналогичным проблемам в Stackoverflow и не получил разрешения. В частности, я попытался сделать следующее:

  1. Уменьшить размер пакета по умолчанию
  2. Изменить оптимизатор по умолчанию (от адам до импульса)

Однако ни один из этихпредложения помогли мне решить эту проблему. Будем благодарны за любую помощь.

Обновление:

К этой ссылке прилагается автономный блокнот ipython: Colab Notebook

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...