tl; dr: Почти наверняка нет преимущества.
cudaMemcpyDefault
был добавлен IIRC, когда графические процессоры стали легко идентифицировать пространство памяти путем проверки адреса («Унифицированная виртуальная адресация»). Перед этим вам нужно было указать направление. См., Например, документацию CUDA 3, доступную здесь . Ищите cudaMemcpyKind в справочнике по API - нет по умолчанию, просто H2H, H2D, D2H и H2H.
Когда это изменение, я думаю, nVIDIA имело смысл не перегружать функцию или называть ее по-другому, а просто добавлять другое постоянное значение для новой возможности.
Я не уверен на 100%, что нет никакой разницы, это просто очень разумно; и, судя по анекдотическому личному опыту, я не видел никаких преимуществ / различий. Конечно, копирование не происходит быстрее.