Question

Я размещаю некоторые массивы с плавающей запятой (довольно большие, т.е. 9 000 000 элементов) на GPU, используя cudaMalloc((void**)&(storage->data), size * sizeof(float)).В конце моей программы я освобождаю эту память, используя cudaFree(storage->data);.

Проблема в том, что первое освобождение действительно медленное, около 10 секунд, тогда как остальные почти мгновенные.

Мой вопрос заключается в следующем: что может вызвать эту разницу?Является ли освобождение памяти на GPU обычно таким медленным?

Eric · Answer 1 · 29 января 2010

Как отмечалось на форумах NVIDIA, это почти наверняка проблема с тем, как вы синхронизируете вещи, а не с cudaFree.

Anycorn · Answer 2 · 29 января 2010

не должно быть таким медленным, в Linux с cuda 2.2 это занимает доли секунды. Вы пытались запустить профилировщик хоста и устройства, чтобы понять, почему именно медленный? сколько отдельного распределения вы выполняете ?, которое имеет некоторое наказание, но не такое большое.

Освобождение памяти CUDA мучительно медленно

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Освобождение памяти CUDA мучительно медленно

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов