Вопросы с тегом cuda

0 голосов

2 ответов

Можно ли заставить tennsflow-gpu работать на MacBook Pro с High Sierra?

Я пытаюсь установить tenorflow-gpu на моем MacBook Pro и перепробовал почти все, о чем кратко...

a-robot / 08 июня 2018

0 голосов

1 ответ

Запуск ошибки времени выполнения в ядре CUDA

В CUDA мы не можем исключать;но - мы можем и действительно иногда достигаем исключительных ситуаций...

einpoklum / 08 июня 2018

0 голосов

1 ответ

Матричный векторный продукт CUDA повышает производительность с использованием листов и общей памяти

Здравствуйте, я работаю в ядре CUDA о матричном векторном продукте.Я хочу улучшить...

Francis / 07 июня 2018

0 голосов

1 ответ

Керасы с Tensorflow Backend - ошибка импорта

Я только что установил tenorflow-gpu с python3.Когда я попробовал это, я получил ошибку ниже. Код:...

Belkacem Thiziri / 07 июня 2018

0 голосов

2 ответов

Как я могу сравнить множество векторов друг с другом в CUDA (эффективно)

Intro Я пытаюсь написать программу, которая сравнивает векторы друг с другом.Мне нужно, чтобы он...

John Mansell / 07 июня 2018

0 голосов

1 ответ

Можно ли предварительно выделить массив с помощью gpuArray и получить разрешение на запись в него в настройках mexcuda?

Я написал фрагмент кода в MatLab (2018a), который является гибридом между стандартным кодом Matlab...

Floris SA / 07 июня 2018

0 голосов

1 ответ

CUDA-эквивалент glDispatchComputeIndirect

Что является наиболее близким и эффективным эквивалентом простой цепочке последовательностей...

iam / 07 июня 2018

0 голосов

0 ответов

объект push_back на thrust :: device_vector

Я пытался использовать thrust :: device_vector для хранения структуры, и она работала нормально,...

Glacier11 / 06 июня 2018

0 голосов

1 ответ

неверный порядковый номер устройства на cudaMemPrefetchAsync

Я запускаю игрушечный образец CUDA на моем GeForce 1080 Ti (Pascal) на Windows 10 и CUDA 9.2. Цель...

Regis Portalez / 06 июня 2018

0 голосов

1 ответ

Сбой thrust :: binary_search во время выполнения с политикой выполнения, указывающей поток пользователя

thrust::binary_search segfaults для всех, кроме потока по умолчанию, насколько я могу судить.Я не...

Martin W / 05 июня 2018

0 голосов

1 ответ

Ошибка cuda :: cub при вызове функции __host__ из функции __device__ не допускается

Я использую cub :: DeviceReduce :: Sum для вычисления суммирования вектора, но он выдал ошибку:...

ztdep / 05 июня 2018

0 голосов

2 ответов

CUDA - единая память (по крайней мере, Паскаль)

Я хотел бы получить некоторые пояснения об объединенной памяти, как она действительно работает и...

S-sonic / 04 июня 2018

0 голосов

1 ответ

реализация кода Python на GPU от Spyder

Согласно знаниям with tf.device('/GPU') может использоваться для реализации тензорного...

9113303 / 04 июня 2018

0 голосов

1 ответ

dot_product с CUDA_CUB

__global__ void sum(const float * __restrict__ indata, float * __restrict__ outdata) { unsigned int...

ztdep / 04 июня 2018

0 голосов

1 ответ

Могу ли я убедиться, что NVCC удалось разместить массив в регистрах?

Ядро CUDA с некоторым локальным массивом фиксированного размера может быть скомпилировано так,...

einpoklum / 03 июня 2018

0 голосов

1 ответ

Cuda создать текстуру объекта из черно-белого изображения

Я пытаюсь обработать видео, кадр за кадром.Для этого я хочу создать текстуру, содержащую текущий...

octavio / 02 июня 2018

0 голосов

1 ответ

CUB сокращение с использованием 2D сетки блоков

Я пытаюсь составить сумму, используя метод сокращения CUB. Большая проблема: я не уверен, как...

Antonio B. Oliveira Junior / 02 июня 2018

0 голосов

1 ответ

Как преобразовать значение __CUDACC_VER__ в триплет MAJOR, MINOR, BUILD?

Когда более новая (CUDA 9) версия nvcc встречает __CUDACC_VER__, она сдается и говорит вам что-то...

einpoklum / 01 июня 2018

0 голосов

1 ответ

__shfl_down и __shfl_down_sync дают разные результаты

Меня смущают __shfl_down и __shfl_down_sync, они дают разные результаты. __global__ void...

ztdep / 01 июня 2018

0 голосов

2 ответов

Как включить поддержку графического процессора pytorch в Google Colab?

Как я могу включить pytorch для работы на GPU? Я успешно установил pytorch в google colab notebook:...

Stepan Yakovenko / 31 мая 2018

0 голосов

4 ответов

Какие комбинации версий TensorFlow и CUDA совместимы?

Я заметил, что некоторые новые версии TensorFlow несовместимы со старыми версиями CUDA и cuDNN

Fábio / 31 мая 2018

0 голосов

1 ответ

Неправильный просмотр псевдокода CUDA?

Я пытаюсь реализовать псевдокод операции prefix-sum (scan), приведенной в документации CUDA

hexpheus / 31 мая 2018

0 голосов

1 ответ

Порядок выполнения в ядрах CUDA или OpenCL - для оптимизации доступа к памяти

Есть ли какой-нибудь намек относительно порядка выполнения ядер? Допустим, я начинаю обработку...

Artyom / 31 мая 2018

0 голосов

1 ответ

Как проверить переполнение целочисленной арифметики в CUDA?

В CUDA, как я могу определить, была ли моя последняя целочисленная арифметическая операция...

einpoklum / 30 мая 2018

0 голосов

1 ответ

Невозможно вызвать CUDA с половинной точностью с хоста

Я пытаюсь выполнить работу FP16, которая будет иметь и процессор, и графический процессор.Я...

XapaJIaMnu / 30 мая 2018