Я пытаюсь установить tenorflow-gpu на моем MacBook Pro и перепробовал почти все, о чем кратко...
В CUDA мы не можем исключать;но - мы можем и действительно иногда достигаем исключительных ситуаций...
Здравствуйте, я работаю в ядре CUDA о матричном векторном продукте.Я хочу улучшить...
Я только что установил tenorflow-gpu с python3.Когда я попробовал это, я получил ошибку ниже. Код:...
Intro Я пытаюсь написать программу, которая сравнивает векторы друг с другом.Мне нужно, чтобы он...
Я написал фрагмент кода в MatLab (2018a), который является гибридом между стандартным кодом Matlab...
Что является наиболее близким и эффективным эквивалентом простой цепочке последовательностей...
Я пытался использовать thrust :: device_vector для хранения структуры, и она работала нормально,...
Я запускаю игрушечный образец CUDA на моем GeForce 1080 Ti (Pascal) на Windows 10 и CUDA 9.2. Цель...
thrust::binary_search segfaults для всех, кроме потока по умолчанию, насколько я могу судить.Я не...
Я использую cub :: DeviceReduce :: Sum для вычисления суммирования вектора, но он выдал ошибку:...
Я хотел бы получить некоторые пояснения об объединенной памяти, как она действительно работает и...
Согласно знаниям with tf.device('/GPU') может использоваться для реализации тензорного...
__global__ void sum(const float * __restrict__ indata, float * __restrict__ outdata) { unsigned int...
Ядро CUDA с некоторым локальным массивом фиксированного размера может быть скомпилировано так,...
Я пытаюсь обработать видео, кадр за кадром.Для этого я хочу создать текстуру, содержащую текущий...
Я пытаюсь составить сумму, используя метод сокращения CUB. Большая проблема: я не уверен, как...
Когда более новая (CUDA 9) версия nvcc встречает __CUDACC_VER__, она сдается и говорит вам что-то...
Меня смущают __shfl_down и __shfl_down_sync, они дают разные результаты. __global__ void...
Как я могу включить pytorch для работы на GPU? Я успешно установил pytorch в google colab notebook:...
Я заметил, что некоторые новые версии TensorFlow несовместимы со старыми версиями CUDA и cuDNN
Я пытаюсь реализовать псевдокод операции prefix-sum (scan), приведенной в документации CUDA
Есть ли какой-нибудь намек относительно порядка выполнения ядер? Допустим, я начинаю обработку...
В CUDA, как я могу определить, была ли моя последняя целочисленная арифметическая операция...
Я пытаюсь выполнить работу FP16, которая будет иметь и процессор, и графический процессор.Я...